Sensory 推出第二代嵌入式语音转文本 (STT) 解决方案

Sensory宣布推出第二代TrulyNatural嵌入式语音转文本（STT）解决方案，该公司认为，与任何其他语音转文本技术相比，该解决方案提供了最高的精度与尺寸比。这位语音人工智能和语音识别技术先驱表示，在基准测试中，TrulyNatural STT的体积比业界领先和公共领域的语音引擎小了一个数量级，但精度却更高。

TrulyNatural STT和Truly Natural“lite”是Sensory的旗舰级语音转文本技术，以提供高精度、实时响应和强大的嵌入式语音用户界面性能而闻名，且无需依赖云连接。这使得它非常适用于网络可用性不可靠或数据隐私至关重要的应用程序和产品。在此2.0版更新中，Sensory提供了一个新的软件开发工具包（SDK），其模型更小、精度更高，扩大了语言覆盖范围，并增强了Windows平台的兼容性。

为满足日益增长的需求，Sensory已将TrulyNatural STT的兼容性扩展至基于Windows的平台。Windows兼容性为开发各种应用程序的开发人员和集成商提供了新的可能性，这些应用程序包括消费电子、医疗、工业、汽车、企业、政府等更多领域。

Sensory的TrulyNatural Embedded Speech-to-Text（STT）2.0包括先进的声学模型和语言模型，提供了更高的精度和更快的响应时间。这些模型采用最先进的类似Transformer的架构，以降低词错率（WER），并在嘈杂环境中提供更强的鲁棒性。

TrulyNatural STT现在在部署方面提供了更大的灵活性，支持更广泛的硬件配置。无论是在GPU、高性能多核CPU上运行，还是利用Arm Neon和Helium技术等加速器，TrulyNatural都经过优化，以提供最佳的语音用户体验。

Sensory的TrulyNatural语音转文本（STT）引擎的体积比竞争对手的引擎小8倍，同时提供更高的精度。通过Sensory的TNL SDK提供，TrulyNatural支持40多种语言的模型，大小从20MB到200MB不等。通过集成自然语言理解（NLU）模型和动作查找表，开发人员可以在35MB以下的空间内创建一个完整的语音助手。

将Sensory的唤醒词技术与其特定领域的小型语言模型（SLM）相结合，意味着Sensory能以仅35MB的大小提供特定领域的语音助手！而且，Sensory的唤醒词和语音转文本（STT）还可以连接到在设备或云端运行的大型语言模型（LLM）。TrulyNatural STT技术能够独立于云端运行，确保用户和数据隐私。嵌入式模型消除了与基于云的解决方案相关的延迟问题，提供了始终可用且无幻觉的流畅、响应迅速的用户体验。

TrulyNatural STT还具有高度可定制性，支持多种语言、方言和特定领域的词汇。它现在支持近40种语言和地区变体，包括：阿拉伯语、丹麦语、荷兰语、英语（美国、英国、儿童）、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、马来语、普通话、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、土耳其语和乌克兰语。

Sensory一直处于语音人工智能创新的前沿，20多年来一直在提供先进的语音识别和生物识别解决方案。Sensory的技术已集成到全球数百万台设备中，为从手机和消费电子产品到汽车和工业系统的各种应用程序提供支持。

AI(146)Sensory(1)STT(1)

{{userData.name}}

Sensory 推出第二代嵌入式语音转文本 (STT) 解决方案

Resemble AI新一代AI音频检测模型Detect-2B准确率达94%

“角色能否脱离人类而鲜活存在？”知名配音员对AI配音提出质疑

数字工作站 n-Track更新，增加AI音干分离功能

AI 语音初创公司 ElevenLabs 获得 8000 万美元融资，推出克隆语音市场

1000名艺术家通过空荡的录音室环境声音专辑反对AI

元宇宙声音最新进展：Meta构建AI模型提供逼真声音！

免费 – Tritik Timee 延迟插件

Kilohearts推出免费的去削波Clipper插件

Sound Variety 推出免费 Windows Tube Compressor 插件 FeenstaubTC

Sound Magic 发布 GraphicQ 并附带免费立体声版本

免费插件-KazrogKClipZero

Reason Studios 重新发布 ReCycle 免费软件

LancasterAudio&AuroraDSP发布Pulse2免费IR加载插件

Fors 发布 Sala 免费混响效果插件

韩美合拍科幻大片《编号17》声音制作幕后

Sonbile 发布pure:bundle AI 驱动去嘶音插件

声音设计在拟音中的三种应用片例周周片儿296期

UVI 推出 PX WaveFrame，80年代风现代数字采样插件

影视声音制作响度经典套件 NUGEN Audio Loudness Toolkit使用介绍

有意思的配件 myVolts将推出The Alchemist电源中心

Imaginando 更新免费 DLYM 插件

RODE发布Ambisonic麦克NT-SF1 2018 NAB Show® 第二日

SSG Audio 推出母带处理 AI 插件

Pro Tools 2024.6更新！更强大更便捷

iZotope RX11正式发布！新功能一览中字视频

AI音乐音干分离工具大盘点系列四基于在线独家

Techivation 发布AI驱动的动态共振抑制器插件

记住这些Pro Tools Zoom缩放技巧及快捷方式，成为音编快手

免费雷雨生成器，真香！

常见Pro Tools 错误代码含义及修复（1）

就这么屌，与ChatGTP-4o对话就完成角色配音

第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频