加载中…
  • 双域名启用:电影声音
  • 加入VIP会员,看更多内容vip
  • Pro Tools国际认证课
  • S短片节-声音人的节日
  • 购物车
  • 我的帐户

{{userData.name}}

个人中心
后台
{{item.count}}
{{textHint.loading}}
  • {{data.name}}({{data.count}}){{data.name}}
投稿
  • 资讯
    • 限免/优惠
    • 奖项
    • 行业
    • 电影声音研学中心
    • 软件新闻
    • 硬件新闻
  • 学知
    • 中国声音
    • 声音人
    • 声音制造
    • 声音设计
    • 声景与实地录音
    • 声音艺术
    • 游戏声音
    • 影视音乐
  • 技术
    • 来团
    • #AI音频技术频道#
      • 音干分离
    • 麦克风频道
      • 同期麦克风
      • 无线麦克风
      • 后期麦克风
      • 麦克风知识
      • 麦克风综合讯息
    • 前期/同期硬件
      • 录音机
    • 后期技术
      • 后期硬件
        • 音频接口
        • 监听耳机/音箱
        • 调音Mixer / 控台 Control
      • 后期软件
        • 音频插件 Plug-in
          • 免费 限时 Free
          • EQ 均衡类
          • Dynamics 动态类
          • Reverb/Delay混响及延迟
          • DeNoise 音频修复类
          • Effect 效果类
          • Meter 计量 显示 测量类
          • SoundField 声场 空间类
          • Instrument 乐器类
          • modulate Harmonic pitch 调制 谐波 移调类
          • others 其它类
        • DAW
          • ProTools
        • Krotos声音设计
      • 音效
      • 空间音频/沉浸声/全景声
      • VR/AR/XR声音
    • 周边配件
    • 综合
  • 专题
    • 24-25颁奖季
    • 纪录片声音制作
    • 短片声音制作
    • 23-24颁奖季
    • NAB2024
当前位置:首页-#AI音频技术频道#,软件新闻-正文

OpenAI展示语音克隆新技术,应对AI语音的挑战和机遇

#AI音频技术频道#, 软件新闻1年前002.04K0

上周末,(各AI公司都喜欢在周末发布重大消息。)OpenAI 在官方博客分享一个名为“Voice engine 语音引擎”模型的预览,该模型仅需使用单个 15 秒音频样本,然后通过文本输入来生成与原始说话者非常相似的自然语音,即,我们经常提到的“AI语音克隆”技术。

“Voice Engine”在音色、语音连贯性以及自然度、清晰度方面在目前的同类产品中“遥遥领先”。

OpenAI展示语音克隆新技术,应对AI语音的挑战和机遇 - 第1张

OpenAI于 2022 年底开始开发Voice Engine,并用它来支持text-to-speech文本转语音 API 以及 ChatGPT Voice and Read Aloud语音和朗读中可用的预设语音。与此同时,由于考虑到克隆合成语音滥用的可能性,采取谨慎和知情的方式来进行更广泛的发布。OpenAI希望就合成声音的负责任部署以及社会如何适应这些新功能展开对话。

早期应用

为了更好地了解这项技术的潜在用途,OpenAI开始与一小群值得信赖的合作伙伴私下测试它,该小组开发的应用程序留下了深刻的印象。这些小规模部署有助于为OpenAI提供方法、保障措施和思考如何将语音引擎用于各个行业的良好效果。一些早期的例子包括:

  • 通过自然、富有感情的声音为无法阅读者和儿童提供阅读帮助。

    Age of Learning 是一家致力于儿童学业成功的教育技术公司,一直在使用Voice Engine来生成预先编写的画外音内容。他们还使用语音引擎和 GPT-4 创建实时、个性化的响应来与学生互动。

     

  • 翻译视频和播客等内容,以便创作者和企业可以用自己的声音流利地接触世界各地的更多人。HeyGen 是这一技术的早期采用者,这是一家国内创办的人工智能视觉讲故事平台,他们使用语音引擎进行视频翻译,因此可以将演讲者的声音翻译成多种语言并覆盖全球观众。当用于翻译时,语音引擎会保留原始说话者的语音特色和母语口音。

    据说去年短视频疯传的霉霉说中文,郭德纲说英文等都是HeyGen制作的。

  • 通过改善偏远地区的基本服务交付,覆盖全球社区。Dimagi 正在为社区卫生工作者构建工具,以提供各种基本服务,例如为母乳喂养母亲提供咨询。Dimagi 使用语音引擎和 GPT-4 以少数族的主要语言(包括斯瓦希里语)或更非正式的语言提供交互式反馈。

  • 支持语言表达障碍人群,例如为患有言语障碍的人士提供治疗应用,以及为有学习需求的人士提供教育增强服务。Livox 是一款人工智能替代通信应用程序,为增强和替代通信 (AAC) 设备提供支持,使残疾人能够进行通信。

     

  • 帮助患有突发性或退化性言语疾病的患者恢复声音。Lifespan 的诺曼·普林斯神经科学研究所是布朗大学医学院一个非营利性卫生系统。他们一直在试点一个项目,为患有语言障碍的肿瘤或神经病因的个人提供语音引擎,恢复了一名因血管性脑肿瘤而失去流利言语的年轻患者的声音项目。

     

     

     

构建安全语音引擎

OpenAI特别提到了AI语音的安全性问题,生成难以分辨的语音存在严重风险,这在“选举年”尤其值得关注,正在与来自政府、媒体、娱乐、教育、民间社会等领域的美国和国际合作伙伴合作,以确保在建设过程中吸收他们的反馈。

  • 为当前Voice Engine合作伙伴制定了严格的使用政策:
    禁止在未经同意或合法权利的情况下冒充其他个人或组织;
    需要原始发言者的明确和知情同意;
    不允许开发人员为个人用户创建自己的声音;
    必须公开听到的声音是人工智能生成的。

  • OpenAI还实施了一套安全措施,包括添加水印以追踪语音引擎生成的任何音频的来源,以及主动监控其使用方式。

  • 另外对语音技术的广泛部署伴随着语音认证,以验证原始说话者是否有意将其语音添加到服务中,以及禁止语音列表,以检测并防止创建过于相似的语音添加到公众人物。

展望未来

OpenAI展示语音克隆新技术,应对AI语音的挑战和机遇 - 第2张

“语音引擎 Voice Engine”是OpenAI致力于了解技术前沿并公开分享人工智能的承诺的延续。根据对人工智能安全的态度和自愿承诺,选择预览但目前不广泛发布这项技术。希望语音引擎的这次预览既能强调其潜力,又能激发增强社会抵御力的需求,以应对越来越令人信服的生成模型带来的挑战。具体来说,鼓励社会采取以下措施:

  • 逐步淘汰基于语音的身份验证作为访问银行账户和其他敏感信息的安全措施
  • 探索保护人工智能中个人声音使用的政策
  • 教育公众了解人工智能技术的能力和局限性,包括欺骗性人工智能内容的可能性
  • 加速开发和采用追踪视听内容来源的技术,在真人或人工智能互动时始终清晰可见

     

OpenAI还提到,重要的是世界各地的人们都了解这项技术的发展方向,无论最终是否广泛部署它。

这意味着未来很有可能人类都不再将语音作为识别其它人真实性的一个感知手段,这不仅对创作甚至对人类和社会发展都产生深远影响。

PS:今天的第二篇文章是另一款开源语音合成产品,内容同样精彩!

更多AI音频内容,请访问同期录音网“AI音频技术频道”
https://www.locationsound.cn/aiaudio
OpenAI展示语音克隆新技术,应对AI语音的挑战和机遇 - 第3张

文章目录

  1. 早期应用
  2. 构建安全语音引擎
  3. 展望未来
OpenAI(5)语音克隆新技术(1)

相关文章

  • OpenAI 的 Sora 将直接生成带有音频的视频

    OpenAI 的 Sora 将直接生成带有音频的视频

    AI生成式视频Sora在全世界及…
    locationsound locationsound 02.38K00
  • OpenAI 发布新型音频模型,听起来比以往任何时候都更像人类

    OpenAI 发布新型音频模型,听起来比以往任何时候都更像人类

    OpenAI发布了一套新的音频模…
    locationsound locationsound 062100
  • AI视频生成声音,这么秒就来了!

    AI视频生成声音,这么秒就来了!

    恐怕今年这个甲辰龙年春节大家都过…
    locationsound locationsound 06K00
  • OpenAI试图向好莱坞证明 AIGC会增强传统电影制作

    OpenAI试图向好莱坞证明 AIGC会增强传统电影制作

    据报道,OpenAI首席执行官山…
    locationsound locationsound 01.73K00

最新文章

  • 免费!AI辅助的多段压缩
    免费!AI辅助的多段压缩
    免费 限时 Free, 音频插件 Plug-in
  • 免费立体声宽度插件
    免费立体声宽度插件
    免费 限时 Free, 音频插件 Plug-in
  • BlepFX 发布 filtrr 免费非线性梯形滤波器插件
    BlepFX 发布 filtrr 免费非线性梯形滤波器插件
    资讯
  • 插件联盟与 Brainworx 推出免费独立母带软件 bx_mastering Studio
    插件联盟与 Brainworx 推出免费独立母带软件 bx_mastering Studio
    资讯
  • 限免大福利!SoundToys免费混响!
    限免大福利!SoundToys免费混响!
    资讯
  • 免费插件 – OrpheusFX RoomLite
    免费插件 – OrpheusFX RoomLite
    资讯
  • 免费 – Tritik Timee 延迟插件
    免费 – Tritik Timee 延迟插件
    资讯
  • Kilohearts推出免费的去削波Clipper插件
    Kilohearts推出免费的去削波Clipper插件
    资讯
  • Sound Variety 推出免费 Windows Tube Compressor 插件 FeenstaubTC
    Sound Variety 推出免费 Windows Tube Compressor 插件 FeenstaubTC
    免费 限时 Free, 音频插件 Plug-in
  • Sound Magic 发布 GraphicQ 并附带免费立体声版本
    Sound Magic 发布 GraphicQ 并附带免费立体声版本
    免费 限时 Free, 音频插件 Plug-in

没有相关内容

更多文章

  • 免费下载:GOYO语音分离器 – AI降噪插件
    免费下载:GOYO语音分离器 – AI降噪插件
    #AI音频技术频道#, DeNoise 音频修复类, 免费 限时 Free, 行业1.28W
  • 生长计划-《椰子树的高度》 10月5日釜山电影节世界首映!
    生长计划-《椰子树的高度》 10月5日釜山电影节世界首映!
    中国声音, 奖项, 电影声音研学中心4.44K
  • IM·2024|两岸青年影展观众预约通道正式开启!
    IM·2024|两岸青年影展观众预约通道正式开启!
    电影声音研学中心, 行业1.68K
  • RODE同时发布6款新产品!
    RODE同时发布6款新产品!
    麦克风频道2.40K
  • Acon Digital Extract:Dialogue v1.5 发布
    Acon Digital Extract:Dialogue v1.5 发布
    #AI音频技术频道#, DeNoise 音频修复类, 软件新闻3.66K
  • 艾美提名-《真探》中寂静紧张的声音是如何产生的?(上)
    艾美提名-《真探》中寂静紧张的声音是如何产生的?(上)
    声音制造2.14K

没有相关内容

热门文章(一年内)

  • SSG Audio 推出母带处理 AI 插件
    SSG Audio 推出母带处理 AI 插件
    2.34W
  • Pro Tools 2024.6更新!更强大更便捷
    Pro Tools 2024.6更新!更强大更便捷
    1.08W
  • AI音乐音干分离工具大盘点 系列四 基于在线 独家
    AI音乐音干分离工具大盘点 系列四 基于在线 独家
    1.02W
  • Techivation 发布AI驱动的动态共振抑制器插件
    Techivation 发布AI驱动的动态共振抑制器插件
    8.87K
  • 常见Pro Tools 错误代码含义及修复(1)
    常见Pro Tools 错误代码含义及修复(1)
    8.65K
  • 免费雷雨生成器,真香!
    免费雷雨生成器,真香!
    8.37K
  • 姗姗来迟,Pro Tools 2024.10发布
    姗姗来迟,Pro Tools 2024.10发布
    6.71K
  • 常见Pro Tools 错误代码含义及修复(2)
    常见Pro Tools 错误代码含义及修复(2)
    6.38K

没有相关内容

蛇年大吉!

分类推荐

没有相关分类

标签精选

  • Pro Tools
  • AI
  • 奥斯卡
  • Zoom
  • 杜比全景声
  • 声音设计
  • iZotope
  • 声音制作
  • 拟音
  • Avid

没有相关分类

最新视频

  • 就这么屌,与ChatGTP-4o对话就完成角色配音
    就这么屌,与ChatGTP-4o对话就完成角色配音
    11个月前
  • 第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频
    第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频
    1年前

没有相关内容

联系我们

请加微信个人号:locationsound

关于

  • 联系
  • 关于我们
  • 支持我们
  • 加入我们

扫一扫关注公众号

扫一扫
"Copyright © 2015-至今 同期录音网 ICP备2021023776-2
138 次查询在 1.974 秒, 使用 49.47MB 内存