Adobe 新的 AI音频技术 分解音频
音频质量差一直是视频创作者面临的一个挑战:无论是业余爱好者还是专业电影制作者,都需要解决由风噪干扰、麦克风位置不佳、人群噪音和其他声音干扰引起的音频问题,其中任何一个因素都可能导致视频无法使用。虽然这个问题从历史上看并不容易解决,但利用人工智能进步的激动人心的新解决方案将彻底改变音频处理方式,让每个人都能更轻松地创作出高质量的作品。
Adobe 推出了 Project Sound Lift,这是一项由人工智能驱动的技术,可将语音录音分离为视频中不同的声音、非语音声音和其他背景噪音。Project Sound Lift 是一种一键式解决方案,可帮助用户在各种场景中轻松处理音频录音,利用人工智能独立增强、转换和控制语音和声音。Adobe 的 Enhance Speech 技术(现已在 Premiere Pro 等 Adobe 应用程序中提供)已集成到 Project Sound Lift 中,以进一步改变创作者制作和控制录音室质量音频内容的方式。
Project Sound Lift 由 Adobe Research 的语音 AI 研究人员开发,在日本 MAX 上作为 Adobe“Sneaks”展示的一部分宣布,Adobe 工程师和研究科学家在会上预览了原型创意和技术,每个创意和技术都展示了未来成为 Adobe 产品重要元素的潜力,受到全球数百万用户的信赖。
虽然之前的音频 AI 模型通常需要清晰、独特的输入声音(例如没有背景噪音或回声的单个扬声器或声音事件),但现实世界的录音很少满足这些条件:它们可能包含噪音、混响、多个扬声器和其他通常无法控制的声音事件。这种限制阻碍了音频 AI 在日常录音中的应用,并使非专业人士难以使用通常复杂的音频工具。
Project Sound Lift 现在可以分离日常生活场景中的声音和环境声音,所要做的就是将音频文件导入到Premiere Pro中,然后选择希望工具过滤掉的声音。有很多选项可供选择,包括掌声、笑声、闹钟、演讲、人群、交通、打字等等,Project Sound Lift 将自动检测每个声音,并输出包含背景噪音和想要优先排序的音轨(例如某人的声音或乐器的声音)的单独文件,每个音轨都可以单独控制,以增强视频的质量和内容。
Project Sound Lift 的“抢先预览”提供了激动人心的例子,展示了创新如何开启创造力的新时代——人工智能正在扩大对强大的新工作流程的访问,并释放我们最富有想象力的想法。