Sensory 推出第二代嵌入式语音转文本 (STT) 解决方案
Sensory宣布推出第二代TrulyNatural嵌入式语音转文本(STT)解决方案,该公司认为,与任何其他语音转文本技术相比,该解决方案提供了最高的精度与尺寸比。这位语音人工智能和语音识别技术先驱表示,在基准测试中,TrulyNatural STT的体积比业界领先和公共领域的语音引擎小了一个数量级,但精度却更高。
TrulyNatural STT和Truly Natural“lite”是Sensory的旗舰级语音转文本技术,以提供高精度、实时响应和强大的嵌入式语音用户界面性能而闻名,且无需依赖云连接。这使得它非常适用于网络可用性不可靠或数据隐私至关重要的应用程序和产品。在此2.0版更新中,Sensory提供了一个新的软件开发工具包(SDK),其模型更小、精度更高,扩大了语言覆盖范围,并增强了Windows平台的兼容性。
为满足日益增长的需求,Sensory已将TrulyNatural STT的兼容性扩展至基于Windows的平台。Windows兼容性为开发各种应用程序的开发人员和集成商提供了新的可能性,这些应用程序包括消费电子、医疗、工业、汽车、企业、政府等更多领域。
Sensory的TrulyNatural Embedded Speech-to-Text(STT)2.0包括先进的声学模型和语言模型,提供了更高的精度和更快的响应时间。这些模型采用最先进的类似Transformer的架构,以降低词错率(WER),并在嘈杂环境中提供更强的鲁棒性。
TrulyNatural STT现在在部署方面提供了更大的灵活性,支持更广泛的硬件配置。无论是在GPU、高性能多核CPU上运行,还是利用Arm Neon和Helium技术等加速器,TrulyNatural都经过优化,以提供最佳的语音用户体验。
Sensory的TrulyNatural语音转文本(STT)引擎的体积比竞争对手的引擎小8倍,同时提供更高的精度。通过Sensory的TNL SDK提供,TrulyNatural支持40多种语言的模型,大小从20MB到200MB不等。通过集成自然语言理解(NLU)模型和动作查找表,开发人员可以在35MB以下的空间内创建一个完整的语音助手。
将Sensory的唤醒词技术与其特定领域的小型语言模型(SLM)相结合,意味着Sensory能以仅35MB的大小提供特定领域的语音助手!而且,Sensory的唤醒词和语音转文本(STT)还可以连接到在设备或云端运行的大型语言模型(LLM)。TrulyNatural STT技术能够独立于云端运行,确保用户和数据隐私。嵌入式模型消除了与基于云的解决方案相关的延迟问题,提供了始终可用且无幻觉的流畅、响应迅速的用户体验。
TrulyNatural STT还具有高度可定制性,支持多种语言、方言和特定领域的词汇。它现在支持近40种语言和地区变体,包括:阿拉伯语、丹麦语、荷兰语、英语(美国、英国、儿童)、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、韩语、马来语、普通话、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、西班牙语、瑞典语、土耳其语和乌克兰语。
Sensory一直处于语音人工智能创新的前沿,20多年来一直在提供先进的语音识别和生物识别解决方案。Sensory的技术已集成到全球数百万台设备中,为从手机和消费电子产品到汽车和工业系统的各种应用程序提供支持。