生成式AI人工智能可能会出现在 Pro Tools 中
一项名为“媒体内容创作中的数据驱动自动建议”的专利首次于2021年提交,强烈表明生成式人工智能可能会在某个时间点集成到Avid的Pro Tools中。Avid在去年再次重申他们致力于使用人工智能的承诺。这项技术旨在在制作过程中提供上下文相关的AI生成建议,这可能会显著改变音频专业人士的工作方式。
专利中概述的关键特征
该专利的早期部分指出:
“尽管自动完成功能已在生产力软件应用中得到广泛应用,但这一功能并未扩展到其他类型的应用中。因此,有必要将自动完成所带来的生产力效益,如效率和节省时间,提供给其他软件应用领域,特别是用于创作创造性内容的应用程序领域,如乐谱编写应用程序和数字音频工作站。”
该专利描述了一种系统,该系统为媒体内容创作的各个阶段提供AI驱动的自动建议。这些建议并非随机产生,而是根据项目的现有内容或更广泛的数据集提供上下文相关的建议。这可能包括从编曲和混音到创造性声音设计的任何内容,这一点很有趣。
“可以提供其他与自动建议相关的自定义设置,例如,当接受一个建议后,是否自动推进选定为自动建议数据源的进行中的部分作品,如选项框314所示。在所示的用户界面中,已通过其图形样式或符号(例如,具有独特的阴影、颜色、粗体、字体类型)在用户界面中区分了已融入作品316中的素材与自动建议素材318。
在显示每个新建议后,用户可以使用诸如按钮320和322之类的用户元素来接受建议或请求新的自动建议。
用户402与托管创造性内容应用程序406的计算机404进行交互,该应用程序可以是乐谱编写应用程序或数字音频工作站应用程序。创造性内容应用程序与一个或多个本地或远程建议数据源408、410进行数据通信。数据源可以是特定作曲家或流派的音乐数据库,也可以是大型通用音乐集合。可以组合多个数据源以创建主数据源,或者可以单独使用每个数据源来提供用于自动建议的数据的不同方面。例如,一个数据源可以提供旋律,另一个可以提供和声,而第三个可以提供节奏。举一个具体的例子,用户可以让自动建议生成听起来像披头士的旋律,以巴赫的风格进行和声,并伴有现代作曲家如Brian Ferneyhough的节奏。”
正如人们所见,该专利中提到的特别有趣的特点是能够生成风格多样的输出。例如,该系统可以生成听起来像披头士的旋律,以巴赫的风格和声,并且节奏类似于现代作曲家Brian Ferneyhough。这种风格化的操作允许高度定制化和多样化的创造性输出,这在经常需要融合不同音乐风格的专业环境中可能特别有用。作为一个音乐概念,它听起来可能有些混乱,但这并不是他们所用例子的重点。
Joseph Plazak
该专利的发明人是约瑟夫·普拉扎克(Joseph Plazak),他是Avid的产品负责人和高级首席软件开发人员。他在Avid科技公司工作了7年,并在LinkedIn上有一份令人印象深刻的简历。
对Pro Tools用户的影响
对于一些用户来说,这可能意味着生产力和创造可能性的显著提升。AI系统可以简化常规任务,使用户能够更多地专注于工作的创造性方面。想象一下,只需付出极少的努力,就能够快速生成复杂的和弦进行、独特的旋律,甚至与项目风格一致的完整编曲。
然而,这也可以帮助经验较少的用户获得高质量的结果,否则将需要多年的训练。这些总是围绕着媒体创作中AI使用的一些担忧。
此外,该系统建议混音调整和声音设计元素的能力有助于保持顺畅的创作流程,减少在创意和技术任务之间不断来回切换的需要。这对于那些时间紧迫的工作者来说尤其有价值。
再次强调,关键在于专业人士并不希望AI来完成创造性任务,而是希望AI能完成单调的工作,这样可以专注于创意。
宏观视角
将生成式AI整合到Pro Tools中可能会代表行业的一次重大变革。虽然这项技术将提供新的创意工具,但也要求专业人士考虑他们愿意将多少控制权交给AI。系统生成风格准确的建议的能力非常强大,但最终,用户仍然保留对如何使用这些建议的最终决定权。
这一发展也引发了对音乐制作未来的思考。尽管它可能会民主化高水平制作技术的获取,使得经验较少的用户也能更容易地实现专业水准的效果,但它也挑战了音乐制作中传统的创造力和著作权的观念。
Pro Tools 2024.6
尽管该专利于2021年首次提交,可能仍处于现实世界实施的早期阶段,但将生成式AI作为Pro Tools核心功能的潜力是显而易见的。
对于音频专业人员来说,这可能意味着更高效的工作流程、更广泛的创意能力以及探索新风格流派的机会。另一方面,它在帮助的同时也可能对专业音频产生负面影响。