Phonak推出人工智能驱动的嘈杂环境中的实时语音分离
Phonak 是 Sonova 旗下的一个品牌,最近基于其最新的 Infinio 平台推出了一系列新的助听器产品。作为 Infinio 家族的一部分,这些助听器有多个支持蓝牙的型号,但仍不支持 LE Audio。其中,Audéo Sphere Infinio 被誉为全球首款配备专用实时 AI 芯片用于语音与噪音分离的助听器。借助全新的 Phonak ERA 处理器和专用的 NPU(神经处理单元),新的 Audéo Sphere Infinio 助听器能够增强来自任何方向的语音理解。
在背景噪音中理解语音仍然是听力损失者面临的最大挑战。根据 Sonova 的说法,这项 Phonak 技术能够从任何方向提供前所未有的语音清晰度,在噪音中的信噪比(SNR)提高了 10dB,达到了无与伦比的水平。
基于传统外观的 Infinio 平台,Phonak 现在推广其 Audéo Sphere Infinio 型号,以解决噪音中的语音理解问题。这实际上是所有消费技术公司正在探索和实施的自适应可听设备的相同方法——使用 AI 进行语音分离和增强。Sonova 表示,其新的 Infinio 平台提供了新的 Phonak ERA 芯片,处理能力比现有的助听器行业芯片更强,克服了行业当前对实时自适应算法所需的处理能力的限制。
在新的 Audéo Sphere Infinio 型号中,ERA 处理器由一个名为 Deepsonic 的专用、专有的 NPU 芯片补充,该芯片处理基于 AI 的实时处理,以过滤噪音并进行语音与噪音分离,然后根据用户的特定需求进行语音增强。Sonova 表示,通过这一实施,与市场上现有的助听器(包括 Phonak 的助听器)相比,用户理解来自任何方向的语音的可能性增加了两到三倍。
Phonak 还表示,Deepsonic 芯片不仅提供实时 AI 处理,以立即将语音从背景噪音中分离出来,而且与现有技术不同,它还提供动态的实时调整,使用户能够从任何方向进行对话。该芯片的深度神经网络(DNN)架构能够处理 450 万个神经连接,经过超过 2200 万个声音样本的训练。具有21倍的内存和4倍的能效,这款芯片比现有的助听器芯片强大53倍,能够执行每秒 77 亿次操作。
作为参考,目前可供消费者使用的可听设备平台包括 Greenwaves GAP9 超低功耗处理器,能够每秒执行高达 500 亿次操作(或 50 Giga-operations)。为了对比,Qualcomm 的 Snapdragon X Elite 计算平台(笔记本电脑级别)包含一个能够每秒执行 45 万亿次操作的神经处理单元。
“我们非常激动地将 Audéo Sphere Infinio 带给我们的用户。这不仅仅是一款助听器;它是任何在嘈杂环境中听力有困难的人的游戏规则改变者,”Sonova 听力设备集团副总裁 Robert Woolley 说。”有了我们专有的 ERA 和 Deepsonic AI 芯片,我们达到了一个新的语音清晰度水平,我们为此感到自豪。这一创新突显了我们致力于提供最佳音质和用户体验的决心。”
这种技术专门用于新的 Phonak Audéo Sphere Infinio 型号。在这一公告中,Phonak 还推出了其他几款不具备这种技术的耳道接收器助听器,这些型号仅受益于新的 ERA 芯片升级。此外,还有 Virto R Infinio,这是 Phonak 的首款可充电定制入耳式助听器(如上图所示),虽然没有受益于公司最新的 AI 驱动技术,但在外形上可能是一个有趣的替代选择。
由于某些原因,这些针对医疗专业人士处方的产品仍然是一个复杂的迷宫,包含太多选择和多层不同的技术,最终并未真正惠及需要助听器的人。