震惊!AI从文本提示生成任何可以想象的声音
就在下午我们刚发布了AI文生语音逼真度再突破!ChatTTS:开源对话式高可控的语音合成模型。
而看过同期录音网文章的朋友一定知道,在几个月前SORA发布后的这个内容:AI视频生成声音,这么秒就来了!
ElevenLabs刚刚官宣公开了应用这种基于AI人工智能的工具,能够从基于文本的输入中生成“任何可以想象到的声音”。Sound Effects 托管在该公司的网站上,允许用户输入他们正在寻找的声音类型的描述,并快速生成可下载的音频文件。
带大家到ElevenLabs.io/sound-effects,登入官网首先是几十个可听的案例,还不错。
然后看看官网上这些惊人的言语!
- Generate any sound imaginable from a text prompt从文本提示中生成任何可以想象的声音
只要一句话描述,即可生成各类音效、短曲目、人物声音等,直接从文本描述中创建独特的音效,简化音频制作流程
-
Your search for great sound effects ends here
对出色音效的搜索到此结束!
不要再挖掘无穷无尽的不太正确的音效库和列表了。只要你能描述它,我们就能生成它。
这是第一个完全无限制的文本转音效AI人工智能模型推出。ElevenLabs的AI Audio 模型可以根据文本提示生成音效、短乐器曲目、音景和各种人物声音。现在可供所有用户使用。下面官方宣传视频中听到的所有声音均由 ElevenLabs 生成。
该工具旨在帮助创作者(包括电影和电视工作室、视频游戏开发商和社交媒体内容创作者)快速、经济且大规模地生成丰富而身临其境的音景。
该服务旨在为大型拟音和音效库提供一种快速且经济实惠的替代方案,并承诺能够创建用户可能需要的任何声音,包括长达 22 秒的器乐曲目。一旦生成了声音,就可以通过进一步的文本提示来完善它,其中包括额外的细节或变化——该公司举了一个例子,从脚步声请求开始,然后通过描述鞋子或表面的类型来微调结果。
音效可以免费使用,尽管ElevenLabs表示,任何希望发布使用其免费套餐创建内容的人都必须通过在其作品标题中包含“elevenlabs.io”来归因于它们。免费用户还受到每月 10,000 个字符的文本条目限制。还提供一系列付费选项,为用户生成的内容提供商业许可。更多信息可以在ElevenLabs网站上找到。
Instant Generation即时生成
使用ElevenLabs的音效生成器,将拥有触手可及的无限多种选择。只需描述你的需求,就可以获得适用于任何用例的音频。
Precise Control 精确控制
从“脚步声”开始,通过描述鞋子的类型(靴子、细高跟鞋、运动鞋)或环境(沙子、雪、树叶)来微调你的音频。
Royalty Free免版税
作为套餐的一部分,所有的付费订阅都包括一个全面的商业许可证。
Highest Quality Audio最高品质的音频
电影制片厂、500 强公司和顶级媒体机构信任以最低的延迟提供最高质量的音频。
PS:网页提供免费测试,每次输入一次文本可生成四个文件,文件可以下载,但是MP3格式品质较差。同期录音网抓紧时间做了一些测试:
免费下载是MP3格式,能听出来品质并不是很好。门声一般,但综合这6个各有特色,门把手,合页声有的存在,但“教堂的门被打开”其实我们给AI设计隐藏了一个陷阱,6个声音基本都加了混响,说明AI已经明白教堂的空间需要有混响处理。
“在酒吧里唱歌的一个男人”,抛开质量,AI生成的声音基本满足“在酒吧”要求,如果时间够长,完全可以作为酒吧场景的画外或者群杂中的酒后歌声使用。很快速搞定!
常见问题:
生成的内容可以用于商业目的吗?
我们有一个免费生成声音效果的层级。每当发布平台上生成的任何内容时,免费套餐订阅者都必须通过在标题中包含“elevenlabs.io”来归属 ElevenLabs。任何带有内容商业使用许可的付费帐户都不需要此类归属。你需应对上传到平台上并在平台上生成的所有文件负责,以及在其他地方发布这些文件的后果。
我可以生成哪些类型的声音?
可以以任何您喜欢的方式使用我们的音效生成器。可以使用雷暴、狮吼和门铃等文本提示生成标准音效。还可以使用吉他循环、爵士萨克斯独奏和音乐技术循环等提示生成长达 22 秒的器乐曲目。
该模型还可以使用“女人唱着’在沙滩上跳舞,我们看着白昼结束’”和“食人魔说’远离小人类’”等提示创建各种角色声音,甚至可以将声音与提示链接在一起,例如“一个快乐的老妇人说,’我为你感到骄傲!’然后笑了”。当然,你可以为你生成有趣的音效,比如放屁的声音。
多少钱?
根据每代的持续时间控制参数收费。如果设置了由我们计算的最佳持续时间,会向您收取 200 个字符的费用,如果想自己控制持续时间,会收取每秒 40 个字符的费用,设置为持续时间(在所有四代中计算一次)。
是否对每个请求都收费?
我们按每个请求收取角色配额,而不是按下载收费。这意味着每次您单击“生成”时,您都会产生请求的角色成本。如果您认为自己被错误地收费,或者即使您被收费也从未获取请求的文件,请联系 team[at]elevenlabs[dot]io。
结尾的话:
尽管肯定还有诸多问题,但面对如此强大的AI音频工具,且这还是早期初代,我们自己也产生了很多的疑问?
音效库会消失么?也许不久;拟音师的工作还需要么?短期内应该还不会;配音人的工作?很危险了。
快去试试吧,如果有什么想法欢迎留言!整个影视声音制作的巨变应该就在今年。
欢迎访问我们的“AI音频技术频道”,转给更多的朋友!