OpenAI 的视频生成器 Sora 令人惊叹，但也很可怕

Gizmodo

2024-02-21 14:54:13

4.05W

OpenAI 发布了其首屈一指的人工智能文本到视频生成器，其结果令人难以置信。

OpenAI于星期四推出了其首款文本到视频生成器Sora，展示了这一人工智能模型的惊人逼真的视频，引人注目。Sora现已提供给少数研究人员和创意人士测试，之后将进行更广泛的公开发布，这可能给电影行业和我们的集体深度伪造问题带来灾难性影响。

OpenAI在一篇博客文章中表示：“Sora能够生成具有多个角色、特定类型动作和主题及背景的准确细节的复杂场景。” “该模型不仅理解用户在提示中要求的内容，还了解这些事物在物理世界中的存在方式。”

Sora是OpenAI进入AI视频生成领域的首次尝试，这增加了该公司的AI驱动的文本和图像生成器ChatGPT和Dall-E。它的独特之处在于，它不仅是一种创意工具，更像是一个“数据驱动的物理引擎”，正如英伟达高级研究员吉姆·范所指出的那样。Sora不仅仅生成图像，而且根据这些计算确定其环境中物体的物理性质，并生成视频。

要使用Sora生成视频，用户只需输入几个句子作为提示，就像AI图像生成器一样。你可以选择逼真的照片风格或动画风格，在短短几分钟内产生令人震惊的结果。

Sora是一种扩散模型，意味着它通过从模糊、充满静态的视频开始，逐渐将其平滑成你下面看到的精致版本。Midjourney和Stable Diffusion的图像和视频生成器也是扩散模型。

然而，我必须指出的是，OpenAI的Sora要好得多。Sora生成的视频更长、更动态，而且比竞争对手更流畅地结合在一起。Sora感觉就像是创造了真正的视频，而竞争对手的模型则感觉像是人工智能图像的定格动画。OpenAI再次用一个视频生成器引发了人工智能领域的另一场战火，使竞争对手相形见绌。

Sora生成的视频不可否认地令人难以置信。这些视频如果由真正的电影制作团队或动画师制作，可能需要数小时的时间。Sora很可能会对电影行业产生颠覆性影响，就像ChatGPT和AI图像生成器震惊了编辑和设计界一样。它是一种令人惊叹但又令人担忧的技术，对于视频创作者的工作安全性而言，这是一种双重的挑战。

OpenAI表示还有一些需要解决的问题，包括不理解因果关系。Sora可能会生成一个人吃掉饼干的视频，但之后，饼干可能没有咬痕。OpenAI还表示，该模型缺乏空间意识。它可能会混淆左右，不理解一个人或物体如何与场景互动。

安全性也是一个主要关注点，特别是考虑到最近几个月人工智能技术被滥用来创建深度伪造视频的情况。OpenAI表示将建立工具来帮助检测误导性内容，以及应用现有技术来拒绝有害的文本提示。然而，考虑到人们如何绕过当前人工智能模型的保护措施，这些努力能否成功还是值得怀疑的。

#OpenAI##人工智能风险##人工智能##人工智能危机#

免责声明：本文观点来自原作者，不代表Hawk Insight的观点和立场。文章内容仅供参考、交流、学习，不构成投资建议。如涉及版权问题，请联系我们删除。

阿里版ChatGPT“通义千问”面世邀测火速入局欲占得先机

美银预测：四季度三大半导体股票领头反弹

文生视频模型Sora问世！OpenAI估值暴涨成全球第三大独角兽

OpenAI今年营收有望达到34亿美元同比翻番

英伟达黄仁勋将在高盛会议透露Blackwell去向

博通与英伟达争夺AI网络技术市场

Gizmodo

未来在这里

关注

OpenAI 的视频生成器 Sora 令人惊叹，但也很可怕

阿里版ChatGPT“通义千问”面世邀测 火速入局欲占得先机

美银预测：四季度三大半导体股票领头反弹

文生视频模型Sora问世！OpenAI估值暴涨成全球第三大独角兽

OpenAI今年营收有望达到34亿美元 同比翻番

英伟达黄仁勋将在高盛会议透露Blackwell去向

博通与英伟达争夺AI网络技术市场

阿里版ChatGPT“通义千问”面世邀测火速入局欲占得先机

OpenAI今年营收有望达到34亿美元同比翻番