据一项全球估计,现在有超过2亿个家庭拥有智能扬声器,可通过语音控制互联网访问。将此添加到安装在许多智能手机上的会说话的虚拟助手中,更不用说厨房用具和汽车了,其中包括大量的Alexas和Siris。
由于交谈是人类的基本组成部分,因此很容易想到这些助手应被设计为像我们一样交谈和举止。尽管这将为我们提供一种与设备进行交互的相关方式,但是要复制真正逼真的人类对话非常困难。而且,研究表明,使机器听起来像人一样是不必要的,甚至是不诚实的。取而代之的是,我们可能需要重新考虑我们如何以及为什么与这些助手互动,并学会拥抱他们成为机器的好处。
语音技术设计师经常谈论“人性”的概念。人工语音开发的最新发展已导致这些系统的语音模糊了人机之间的界限,听起来越来越像人。还努力使这些界面的语言看起来更人性化。
也许最著名的是Google Duplex,该服务可以通过电话预订约会。为了增加系统的类人性,Google在其助手的语音输出中加入了诸如“ hmm”和“ uh”之类的语音-我们通常用来表示我们正在收听对话或打算很快开始讲话的声音。在Google Duplex的情况下,使用它们是为了听起来自然。但是,为什么听起来自然或更像人的声音如此重要?
追求使系统听起来像我们一样行为和行为的目标,可能源于我们用来推动这些系统设计的流行文化灵感。数十年来,通过机器说话的想法使我们着迷于文学,电视和电影,通过2001年的HAL 9000这样的角色:《太空漫游》或《她的萨曼莎》。这些角色描绘了与机器的无缝对话。就Her而言,甚至在操作系统与其用户之间都有一个爱情故事。至关重要的是,所有这些机器都能听起来和回应我们认为人类的方式。
试图实现类似于我们与机器之间的对话的过程中存在着有趣的技术挑战。为此,亚马逊最近启动了Alexa大奖,旨在“创造能够在,体育,政治,技术和时尚等一系列时事和热门话题上与人类进行协调和互动的社交机器人。”本轮竞赛要求团队在其中一个机器人与人类交互器之间进行20分钟的对话。
像科学领域中的其他挑战一样,这些巨大的挑战显然会促进最先进的技术水平,带来计划内和计划外的收益。然而,当努力使机器具有与其他人一样与我们进行真正对话的能力时,我们需要考虑与人的口头交流实际上是为了什么,以及这是否与我们希望与机器进行的对话相同。
我们与其他人交谈,以完成工作并建立和维护彼此的关系,而且通常这两个目的交织在一起。然而,人们将机器视为服务于有限目的的工具,对与我们每天与他人进行的机器建立这种关系的胃口不大。
用听起来像我们的机器进行自然对话可能成为不必要和繁重的目标。它使人们对像我们这样能够真正沟通和理解的系统产生不切实际的期望。与Amazon Echo或Google Home进行过交互的任何人都知道,使用现有系统是不可能的。
这很重要,因为人们需要了解如何让系统执行某些操作,因为仅语音的界面具有有限的按钮和视觉效果,因此很大程度上取决于系统所说的内容和说明方式。界面设计的重要性意味着,人性本身不仅可能令人质疑,而且具有欺骗性,尤其是如果用来欺骗人们以为他们正在与另一个人进行交互的情况下尤其如此。即使他们的意图是发出清晰的声音,科技公司也需要考虑对用户的潜在影响。
超越人类
我们可以接受而不是一直拥抱人类,而不是接受我们可能希望与机器进行的交互类型的技术和哲学方面的根本限制。
我们应该受到人类对话的启发,而不是将其作为互动的公认黄金标准。例如,将这些系统视为表演者,而不是像人类一样的对话者,可能是帮助创建更具吸引力和表达力的界面的一种方法。在某些情况下,可能需要合并特定的对话元素,但是我们需要考虑是否需要像人一样的对话交互,而不是将其用作默认设计目标。
很难预测未来会是什么样的技术,以及社会观念将如何围绕我们的设备发生变化和发展。也许人们会与机器对话,与机器人成为朋友并征求他们的意见会很好。
但是我们目前对此表示怀疑。在我们看来,这与上下文有关。并非所有的交互和接口都是相同的。可能需要某些语音技术来建立和促进某种形式的社交或情感联系,例如在特定的医疗保健应用中。如果这是目标,那么让机器更适当地针对该目的进行对话就很有意义-也许听起来很人性化,以便用户获得正确的期望类型。
然而,这并不是普遍需要的。至关重要的是,这种与人相似的事物应该与系统在对话中可以实际完成的工作联系起来。使得系统没有像人类一样交谈的能力,弊大于利。