OpenAI 的 Sora 将直接生成带有音频的视频
AI生成式视频Sora在全世界及影视专业业内确实引起来巨震,一开始我们还在冷眼旁观,没几天就被打脸,AI视频生成声音,这么秒就来了!,最近在接受《华尔街日报》采访时,OpenAI 的首席技术官 Mira Murati 介绍了该技术的最新情况,让声音人再次震惊的是,音频直接就被生成了。
什么是Sora?
最顶级的AI公司OpenAI 的Sora 可以根据文本描述生成长达一分钟的视频。此外,Sora 可以生成具有多个角色、特定类型的运动以及主体和背景准确具有细节的复杂场景。人工智能还将在单个生成的视频中创建多个镜头。
Sora 什么时候可用?
目前,Sora仅供有限数量的视觉艺术家、设计师和电影制作人使用。然而,Murati表示,Sora今年将向所有人开放,而且可能只有“几个月”。此外,Murati 表示,OpenAI 打算让 Sora 最终能够直接整合音频,使视频更加逼真。不过,除了“最终”之外,这个目标目前没有时间表。
Sora生成巨大耳朵的AI怪人,一定具有异常的听力,而这是怎样的声音?
将可编辑视频
Murati 还告诉《华尔街日报》,OpenAI 希望用户能够编辑 Sora 生成的内容。她说:“我们正试图弄清楚如何将这项技术用作人们可以编辑和创建的工具。这也意味着,如果 AI 不准确,可以更正生成的视频。
训练Sora
公司用于训练生成式人工智能的数据来源始终是一个热门话题。然而,Murati不想透露具体细节,但表示这是“公开可用或许可的数据”。OpenAI 还与 Shutterstock 建立了合作伙伴关系,Murati 证实在创建 Sora 时使用了该网站的内容。
运行成本高昂
Sora显然是一项复杂的技术,Murati说,因此,为它供电“要昂贵得多”。然而,OpenAI 希望 Sora 的成本与 DALL-E 大致相同。(DALL-E 是 OpenAI 的文本到图像生成器)。
假冒伪造
围绕生成式人工智能的最大担忧之一是深度伪造问题。在美国,今年尤其有争议,因为有总统选举。然而,Murati表示,Sora将无法制作以公众人物为主角的视频。DALL-E 生成的图像也有类似的限制。此外,Sora 视频将被直接加水印,以表明它们是由 AI 生成的。
我们的想法
即使在开发的早期阶段,Sora 似乎也能够制作非常逼真的视频。虽然许多人渴望开始使用这项技术,但令人欣慰的是,OpenAI 正在实施政策来控制 Sora 创建的视频。生成式人工智能有可能成为一种有用的工具,但也存在被滥用的重大风险。