公开测试:谷歌AI人工智能工具文本生成音乐的 MusicLM
谷歌创新的AI人工智能工具 MusicLM 旨在根据文本提示和哼唱生成高质量音乐,现已可供公众探索和实验。
据谷歌称,MusicLM 只需输入“晚宴上的深情爵士乐”之类的提示即可运行。然后,该模型会生成所请求歌曲的两个不同版本,允许用户投票选出他们喜欢的版本,并为人工智能模型的改进做出贡献。
MusicLM 模型已经在包含 500 万个音乐片段的数据集上进行了训练,总计 24 kHz 的音乐长达 280,000 小时,令人震惊。
在今年一月份的首次发布中,Google 通过来自丰富字幕的引人入胜的示例展示了 MusicLM 卓越的音频生成功能。
谷歌强调,MusicLM 是一种实验性工具,无论是一位成熟的音乐家还是刚刚开始音乐之旅,它都可以释放你的创造力。
该公司分享了一段研讨会视频,展示了 MusicLM 的实际应用,其中包括一位声音艺术家、一位谷歌艺术与文化常驻艺术家和一位专门的谷歌研究员之间的合作。
正如谷歌研究人员强调的那样,未来的发展可能会集中在歌词生成、增强文本调节、提高声音质量以及对高级歌曲结构(如前奏、主歌和副歌)进行建模。
一月份,谷歌不仅推出了该工具,还发布了一篇研究论文,深入研究了将这一创新变为现实的复杂开发过程。虽然它扩展了可用于协助人类完成创造性音乐任务的工具范围,但该研究论文承认与其使用和底层模型相关的一些风险。
这些风险包括训练数据中存在的偏见的潜在反映,这引发了关于音乐生成是否适合代表性不足的文化的问题以及对文化挪用的担忧。
此外,本文强调了负责任的模型开发、对记忆进行深入研究以及采用优先考虑语义建模的方法的重要性。
有趣的是,谷歌公开发布 MusicLM 的同时,首席执行官桑达尔·皮查伊 (Sundar Pichai) 宣布了一项重大人工智能推动计划,其中包括对各种谷歌产品进行一系列人工智能驱动的更新,标志着他们人工智能之旅中令人兴奋的转折点。包括谷歌将 Bard 升级到了最先进的语言模型 PaLM 2,该模型拥有先进的数学和推理能力以及编码能力。
MusicLM 的发布正值人们对音乐中使用生成式人工智能(尤其是版权侵权)的担忧日益增加之际。业界正在密切关注人工智能生成音乐的影响,最近病毒版本的“Heart on My Sleeve”就是一个例子,其中人工智能生成的声音模仿了 Drake 和 The Weeknd 的声音。