AI文生语音逼真度再突破！ChatTTS：开源对话式高可控的语音合成模型

AI文生语音逼真度再突破！ChatTTS：开源对话式高可控的语音合成模型 - 第1张这几天爆火的AI人工智能文本生成语音开源模型 ChatTTS（Text To Speak）不知大家看了没有，对很多人从GitHub下载源码再到电脑进行配置可能比较麻烦，现在官网ChatTTS.com上线了，完全免费使用。

ChatTTS 是一个用于日常对话的生成语音模型，是专为 LLM 助手等对话场景设计的文本转语音模型，它支持英语和中文。模型经过 100,000+ 小时的中英文训练。HuggingFace 上的开源版本是一个 40,000 小时的预训练模型，没有 SFT。

ChatTTS 很适合处理通常分配给大型语言模型LLMs的对话任务。它可以为对话生成响应，并在集成到各种应用和服务时提供更自然流畅的互动体验。项目团队致力于提高模型的可控性，添加水印，并将其与LLMs集成。这些努力确保了模型的安全性和可靠性

Chattts亮点：

对话式 TTS：ChatTTS 针对基于对话的任务进行了优化，可实现自然且富有表现力的语音合成。它支持多位发言者，从而促进互动对话。
细粒度控制：该模型可以预测和控制细粒度的韵律特征，包括笑声、停顿和感叹词。
更好的韵律：ChatTTS 在韵律方面超越了大多数开源 TTS 模型。提供预训练模型以支持进一步的研究和开发。

除了笑声，还能控制其他东西吗？能控制其他情绪吗？

目前发布的模型中，token 级别的控制单元只有 [laugh]、[uv_break] 和 [lbreak]。在未来的版本中，可能会开源具有额外情绪控制功能的模型。

免责声明

此 repo 仅用于学术目的。它旨在用于教育和研究用途，不得用于任何商业或法律目的。作者不保证信息的准确性、完整性或可靠性。此 repo 中使用的信息和数据仅用于学术和研究目的。数据来自公开来源，作者不对数据主张任何所有权或版权。

ChatTTS 是一款功能强大的文本转语音系统。然而，负责任地、合乎道德地使用这项技术非常重要。为了限制 ChatTTS 的使用，在 40,000 小时模型的训练过程中添加了少量高频噪音，并使用 MP3 格式尽可能压缩音频质量，以防止恶意行为者将其用于犯罪等目的。同时，作者内部训练了一个检测模型，并计划在未来将其开源。

同期录音网测试

我们从网络上找来一段文字输入进去，

“现在有那么多所谓学配音的广告，一期一期的割韭菜，来看看chattts吧，还需要吗？”，共生成了五段语音，最后一段为男声。

AI文生语音逼真度再突破！ChatTTS：开源对话式高可控的语音合成模型 - 第2张

听了这五段，我们认为作者自称“文生语音天花板”一点不夸张，在我们没有更细致调整的前提下，这些比较随机生成的语音已经基本没有AI味，虽然品质有些差强人意，但作者也特别说明了，是在模型训练中加入了高频噪音以及使用MP3压缩质量。

AI人工智能特别是生成式AIGC的大发展一定会改变现有影视制作方方面面。聚焦AI音频技术，请访问同期录音网“AI音频技术频道”

ChatTTS(1)文生语音(1)逼真(1)

{{userData.name}}

AI文生语音逼真度再突破！ChatTTS：开源对话式高可控的语音合成模型

除了笑声，还能控制其他东西吗？能控制其他情绪吗？

目前发布的模型中，token 级别的控制单元只有 [laugh]、[uv_break] 和 [lbreak]。在未来的版本中，可能会开源具有额外情绪控制功能的模型。

免责声明

同期录音网测试

我们从网络上找来一段文字输入进去，

Vicoustic发布Ultra Beat XL 声学面板

8月声音制作课：强大师资力量，打造专业音频制作人才！

免费插件-单声道 Hitshaper Mono

谷歌V2A视频生成音频工具的能力分析

Sonarworks SoundID 多通道校准已用于 RME

创造“加菲猫家族”激昂的声音

boomlibrary推出动漫精品音效库

Koma Elektronik众筹电磁合成器

Apogee 以旧换新优惠

高信噪比 MEMS 麦克风将在生成式AI音频起到关键作用

《恶魔之地》的声音制作上

独家专访：音效剪辑范文锐详解好莱坞声音制作《GT赛车：极速狂飙》

里程碑作品《现代启示录》首映40周年杜比全景声重装发行

CAS第54届年度声音混音奖提名公布-电视类

后18奥斯卡观察：声创团队如何在《霓裳魅影》中设计声音

Valhalla 免费回声Echo插件

免费自然声音音效库 99sounds免版权

同期录音网启动双域名电影声音FilmSound.cn登场

2BPlayed 发布 Slimverb 限时免费

Pro Tools 新全系永久版&续订版强势回归！|同期录音网“来团”第22期

AATON被法院破产清算，官网只剩公告！

免费雨声音效库，声音人的必备！

电影声音研学中心年度总结 22-23

比拼肥波的免费均衡EQ插件，限免，快来！

就这么屌，与ChatGTP-4o对话就完成角色配音

第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频

{{userData.name}}

除了笑声，还能控制其他东西吗？能控制其他情绪吗？

目前发布的模型中，token 级别的控制单元只有 [laugh]、[uv_break] 和 [lbreak]。在未来的版本中，可能会开源具有额外情绪控制功能的模型。

免责声明

同期录音网测试 我们从网络上找来一段文字输入进去，

Vicoustic发布Ultra Beat XL 声学面板

8月声音制作课：强大师资力量，打造专业音频制作人才！

免费插件-单声道 Hitshaper Mono

谷歌V2A视频生成音频工具的能力分析

Sonarworks SoundID 多通道校准已用于 RME

创造“加菲猫家族”激昂的声音

boomlibrary推出动漫精品音效库

Koma Elektronik众筹电磁合成器

Apogee 以旧换新优惠

高信噪比 MEMS 麦克风将在生成式AI音频起到关键作用

《恶魔之地》的声音制作 上

独家专访：音效剪辑范文锐详解好莱坞声音制作《GT赛车：极速狂飙》

里程碑作品《现代启示录》首映40周年 杜比全景声重装发行

CAS第54届年度声音混音奖提名公布-电视类

后18奥斯卡观察：声创团队如何在《霓裳魅影》中设计声音

Valhalla 免费回声Echo插件

免费自然声音音效库 99sounds免版权

同期录音网启动双域名 电影声音FilmSound.cn登场

2BPlayed 发布 Slimverb 限时免费

Pro Tools 新全系永久版&续订版强势回归！|同期录音网“来团”第22期

AATON被法院破产清算，官网只剩公告！

免费雨声音效库，声音人的必备！

电影声音研学中心年度总结 22-23

比拼肥波的免费均衡EQ插件，限免，快来！

就这么屌，与ChatGTP-4o对话就完成角色配音

第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频

同期录音网测试

我们从网络上找来一段文字输入进去，

《恶魔之地》的声音制作上

里程碑作品《现代启示录》首映40周年杜比全景声重装发行

同期录音网启动双域名电影声音FilmSound.cn登场