sora是什么？一款划时代的视频智造软件

敖游

2024-04-12

来源：遨游建站

OpenAI，是一家位于美国旧金山的人工智能研究公司，现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。核心宗旨在于“创建造福全人类的安全通用人工智能（AGI）”。使命是建立安全有益的AGL，确保通用人工智能造福全人类。OpenAI以大模型为核心开创了AI领域的新一轮创新范式，成为引领通用人工智能领军企业。

OpenAI最早为非营利组织，于2015年底由包括萨姆·奥尔特曼（Sam Altman）、彼得·泰尔（Peter Thiel）、里德·霍夫曼（Reid Hoffman）和埃隆·马斯克（Elon Musk）等创办。2016年，发布首个产品，即一款开源强化学习工具包——OpenAI Gym和Universe。随着2018年埃隆·马斯克的退出以及大模型对资金超乎预期的需求，2019年3月，OpenAI从非营利性转变为“封顶”的营利性。同年7月，微软与OpenAI合作，注资10亿美元，共同研发新的Azure AI超算技术。2021年，设立初创企业基金，拟投资1亿美元支持AI初创公司。2022年11月，OpenAI全新聊天机器人模型ChatGPT问世，给AIGC的应用带来了更多的希望，产品上线仅5天用户数量突破100万。2024年2月，文生视频大模型Sora问世，在全球内容创作行业卷起新的风暴，成为人工智能发展进程中的“里程碑”，使OpenAI估值不到10个月增加近两倍，或达800亿美元。

2023年，公司收入突破16亿美元。微软是最大的投资者，拥有OpenAI股份49%。OpenAI跻身全球TOP50网站，位列福布斯《2023云计算100强榜单》榜首。以企业估值7100 亿列2024年·胡润全球独角兽榜第3。

作为 OpenAI 推出的全新视频AI编辑软件，Sora 最近受到了许多用户的关注。

sora官网：https://openai.com/sora

2024年2月16日，OpenAI在其官网上面正式宣布推出文本生成视频的大模型 Sora。 Sora能够根据简单的文本描述，生成高达60秒的高质量视频，使得视频创作变得前所未有的简单和高效。Sora的应用范围非常广泛，从教育教学、产品演示到内容营销等，都可以通过Sora来实现高质量的视频内容创作。

一、Sora 是什么

那么，Sora 到底是什么呢？官方给出的释义：Creating video from text（从文本创建视频）。Sora是一个智能的视频编辑生成应用软件，可以帮助用户更加方便的轻松生成各类视频。它是 OpenAI发布的首个文本生成视频模型“Sora”，该模型通过接收文本指令，即可生成长达60秒的短视频。

二、Sora 的优势和不足

2.1 现实世界拟真

教人工智能理解和模拟运动中的物理世界，目标是训练模型，帮助人们解决需要现实世界交互的问题。

让机器能够像人类一样，对世界产生一个全面而准确的认知。这一特性使得AI视频生成更流畅、更符合逻辑。

这个可以看文章后面官网的视频，基本上看不出来是AI制作的，很逼真。

2.2 长视频能力

Sora 可以生成长达一分钟的视频，同时保持视觉质量并遵守用户的提示。

这个能力应该是当前所有文本生成视频模型所不具备的，在 Sora 没出来之前，文本生成视频领域的大哥应该是 Runway，但是Runway也只能生成4秒长的视频，用户可以将其最多延长至16秒，是AI生成视频在2023年所能达到的最长时长纪录。

为啥生成视频难?视频一秒目前大概是16帧左右，两秒就要生成32张图片，而且图片之间还要有连贯的逻辑。

2.3 多角色、更细节、更准确

Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。

该模型不仅了解用户在提示中要求的内容，还了解这些东西在物理世界中的存在方式。