AI人工智能助手的未来主要是音频,而不是视觉
在将人工智能融入人们日常生活的竞赛中,科技公司们正在试验各种AI驱动的设备。从智能眼镜和吊坠到AI驱动的口袋设备,各公司似乎在尝试各种方案,看看哪些会受欢迎。然而,在对视觉和触觉界面的执着中,可能忽视了AI设备革命中最自然且最即时的赢家:我们的耳朵。
基于音频的AI不仅仅是便利的问题;它代表了我们感知和互动方式的根本改变。许多AI服务提供语音交互,但只有少数主要科技公司通过耳塞进行对话:三星最新的Galaxy Buds3 Pro配备了用于实时翻译的Galaxy AI,而Nothing Ear则将ChatGPT作为语音助手集成进来。谷歌的下一代Pixel Buds也可能会整合Gemini AI。
然而,与众多AI集成的视觉界面相比,基于音频的选项和服务相对有限,这令人惊讶。尤其是考虑到对话比打字更自然,听声音比阅读文字更具情感共鸣。这也是为什么我认为别针、吊坠和眼镜不会成为AI助手的最终归宿。
基于音频的AI的优势
屏幕需要我们的视觉集中,这往往会打断我们与周围物理世界的互动。智能眼镜虽然具有创新性,但在社会接受度和实际可穿戴性方面面临挑战,因为它们通常比较笨重。需要不断地看或触摸设备来与AI互动,会在我们和环境之间制造出一道障碍,可能会妨碍而不是增强我们的日常体验。
相比之下,基于音频的AI助手提供了一种更自然且无缝的生活整合方式。说话和聆听的行为本质上比触摸屏幕更高效、更直观。随着自然语言处理技术的不断进步,与AI的对话变得越来越流畅。例如,OpenAI已经开始为ChatGPT Plus用户推出其“高级语音模式”,承诺能够进行更自然、实时的对话,并具备情感检测和响应能力。
语音交互比在屏幕上打字或导航视觉界面更直观、更不具侵扰性且更加轻松。
此外,我们已经对音频设备感到十分舒适。耳机和耳塞在日常活动中已变得无处不在,不仅用于听音乐,还用于有声读物、播客和电话通话。人们各个年龄段都佩戴这些设备。对于音频技术的这种现有舒适感,为AI助手的整合提供了完美的基础。
希望利用这一趋势的一款产品是即将推出的Iyo One。这款设备不需要任何屏幕。Iyo宣称,这些无线耳塞提供的AI可以在你锻炼时进行指导,提醒你购物清单上的内容,并在嘈杂环境中选择性地隔离音频。他们将这种集成了多项功能、基于语音的界面称为“音频计算”。
基于音频的AI助手提供了更多的
可访问性
此外,AI助手还提供了显著的无障碍优势。对于视力受损的用户来说,这些设备提供了一种不依赖屏幕的自然交互方式。对于行动不便的人来说,语音指令往往比打字或点击更方便。基于音频的AI对于有阅读困难或阅读障碍的人来说也是一个改变游戏规则的工具,提供了一种更容易访问和处理信息的途径。
然而,仍然有许多问题需要解决。可信信息的问题至关重要,因为AI幻觉——即AI生成虚假或无意义信息的情况——仍然是一个重大问题。隐私是另一个关键考虑因素:大家如何确保这些设备只在大家希望的时候监听和响应?许多人已经在家中遇到了智能音箱的这一问题。此外,过度依赖AI助手的更深层次风险也需要关注,这可能会影响人们的独立思考和行动能力。
AI关系
现实模仿艺术,人们的现实正在逐渐接近2013年电影《Her》中描绘的未来世界。尽管面临诸多挑战,但显然人们正在追求——或者说快速接近——一个类似2013年电影《Her》的现实。这部科幻电影描绘了一个男人爱上一个由斯嘉丽·约翰逊配音的基于耳塞的AI系统的故事。影片探讨了人类与AI之间可以形成的深厚情感联系,这些AI一旦远远超越了图灵测试,其情感联结也变得更加深刻。影片的基调并不像你所期望的那样充满反乌托邦色彩。十年前,这种描绘可能显得过于牵强,但在今天看来,这一切并非遥不可及。
听觉比视觉更容易让人产生情感依赖
科幻与现实之间的界限正在迅速模糊,很多人其实已经看到人们与AI形成深厚情感纽带的例子。在日本,大约有4000名男性通过Gatebox设备签发的证书“结婚”了AI全息图,这种设备的价格约为1000美元。最近,ChatGPT甚至模仿了斯嘉丽·约翰逊的声音(也许是无意的)为其虚拟角色“Sky”配音。当OpenAI因潜在的法律问题被迫移除这一功能时,许多用户表达了强烈的不满,因为他们已经对这个声音产生了依赖。
这表明人们更容易对具有声音的事物产生情感依赖,声音在情感联结中扮演着重要角色。无论是通过电影《Her》中斯嘉丽·约翰逊的迷人嗓音,还是通过如今人们与AI助手互动的日常经历,声音的力量在情感联结方面是不容忽视的。
2023年2月很多人就看到了类似但更强烈的反应,当时生成式AI聊天机器人Replika修改了其软件,移除了某些亲密功能,包括情色角色扮演、表达爱意以及虚拟的拥抱和亲吻等行为。许多用户因此经历了类似于失去真实关系的显著心理困扰。由于用户的强烈抗议,Replika很快为现有用户恢复了这些功能。
这次事件进一步证明了人们与AI之间可以形成深厚的情感联结。用户对Replika所表现出的情感依赖,甚至达到了当这些功能被移除时引发心理困扰的程度。这不仅体现了AI在现代生活中的深度融合,也揭示了人类情感的复杂性,以及人类与技术之间日益模糊的界限。
AI擅长模拟关怀,但它能真正回馈 情感上的脆弱吗?
显然,随着探索人类与AI关系的新领域,许多伦理问题也随之而来。从关怀伦理的角度来看,AI非常擅长模拟关注并提供无评判的倾听。然而,至少可以说,对AI能否真正回馈情感或表现出真实的脆弱性持怀疑态度。此外,与人类关系不同,用户可以随时忽略或关闭AI,而无需承担任何后果。这一切虽然令人安慰,但实际上是一种令人信服的幻觉,和人类关系中的相互付出本质上是不同的。
无论你是否喜欢, AI都将进入无线耳机设备
随着人们展望未来的AI互动,很明显,AI助手应当存在于人们的耳朵中,而不是屏幕上。这不仅仅是一种技术偏好,更是反映了人类自然交流和建立联系的方式。语音互动比在屏幕上打字或浏览视觉界面更直观、更不具侵扰性且更加轻松。
AI助手不可避免地会在大家的耳朵中找到它们的位置,但大家必须防止真正人类连接的流失。文本为基础的AI互动在某些特定情境下仍然会有其地位,例如代码生成,以及对于听力障碍用户来说,音频界面显然存在障碍。然而,对于大多数人来说,他们的大多数互动可能会被基于音频的AI所取代。然而,赋予AI一个声音,人们正在开启新的亲密和感情维度,使这些互动更加引人入胜。AI陪伴的轻松和舒适可能导致哲学家Shannon Vallor所称的“道德技能退化”,可能会削弱人们驾驭人际关系的能力。
AI或许起初存在于屏幕上,但随着它继续提高理解情境和自然对话的能力,耳朵将成为这种新型互动的主要界面。人们必须以审慎的态度迎接这个未来。挑战在于不要被音频助手的新颖和吸引力所淹没,同时保持那些任何算法都无法复制的本质人类连接。