sora是什么?一款划时代的视频智造软件

敖游
2024-04-12
来源:遨游建站

OpenAI,是一家位于美国旧金山的人工智能研究公司,现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。核心宗旨在于“创建造福全人类的安全通用人工智能(AGI)”。使命是建立安全有益的AGL,确保通用人工智能造福全人类。OpenAI以大模型为核心开创了AI领域的新一轮创新范式,成为引领通用人工智能领军企业。

OpenAI最早为非营利组织,于2015年底由包括萨姆·奥尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·马斯克(Elon Musk)等创办。2016年,发布首个产品,即一款开源强化学习工具包——OpenAI Gym和Universe。随着2018年埃隆·马斯克的退出以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶”的营利性。同年7月,微软与OpenAI合作,注资10亿美元,共同研发新的Azure AI超算技术。2021年,设立初创企业基金,拟投资1亿美元支持AI初创公司。2022年11月,OpenAI全新聊天机器人模型ChatGPT问世,给AIGC的应用带来了更多的希望,产品上线仅5天用户数量突破100万。2024年2月,文生视频大模型Sora问世,在全球内容创作行业卷起新的风暴,成为人工智能发展进程中的“里程碑”,使OpenAI估值不到10个月增加近两倍,或达800亿美元。

2023年,公司收入突破16亿美元。微软是最大的投资者,拥有OpenAI股份49%。OpenAI跻身全球TOP50网站,位列福布斯《2023云计算100强榜单》榜首。以企业估值7100 亿列2024年·胡润全球独角兽榜第3。


作为 OpenAI 推出的全新视频AI编辑软件,Sora 最近受到了许多用户的关注。


sora是什么?一款划时代的视频智造软件


sora官网:https://openai.com/sora


2024年2月16日,OpenAI在其官网上面正式宣布推出文本生成视频的大模型 Sora。 Sora能够根据简单的文本描述,生成高达60秒的高质量视频,使得视频创作变得前所未有的简单和高效。Sora的应用范围非常广泛,从教育教学、产品演示到内容营销等,都可以通过Sora来实现高质量的视频内容创作。


一、Sora 是什么


那么,Sora 到底是什么呢?官方给出的释义:Creating video from text(从文本创建视频)。Sora是一个智能的视频编辑生成应用软件,可以帮助用户更加方便的轻松生成各类视频。它是 OpenAI发布的首个文本生成视频模型“Sora”,该模型通过接收文本指令,即可生成长达60秒的短视频。


二、Sora 的优势和不足


2.1 现实世界拟真

教人工智能理解和模拟运动中的物理世界,目标是训练模型,帮助人们解决需要现实世界交互的问题。

让机器能够像人类一样,对世界产生一个全面而准确的认知。这一特性使得AI视频生成更流畅、更符合逻辑。

这个可以看文章后面官网的视频,基本上看不出来是AI制作的,很逼真。

2.2 长视频能力

Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。

这个能力应该是当前所有文本生成视频模型所不具备的,在 Sora 没出来之前,文本生成视频领域的大哥应该是 Runway,但是Runway也只能生成4秒长的视频,用户可以将其最多延长至16秒,是AI生成视频在2023年所能达到的最长时长纪录。

为啥生成视频难?视频一秒目前大概是16帧左右,两秒就要生成32张图片,而且图片之间还要有连贯的逻辑。

2.3 多角色、更细节、更准确

Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。

该模型不仅了解用户在提示中要求的内容,还了解这些东西在物理世界中的存在方式。

2.4 情感丰富、多镜头

Sora 模型对语言有深刻的理解,使其能够准确地解释提示并生成表达生动情感的引人注目的角色。

Sora 还可以在单个生成的视频中创建多个镜头,以准确保留角色和视觉风格。

2.5 复杂场景难模拟、空间细节容易混淆——弱点

Sora 目前难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

Sora 模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。

2.6 检测误导内容

Sora 团队还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断视频何时由 Sora 生成。

文本分类器将检查并拒绝违反我们使用政策的文本输入提示,例如那些请求极端暴力、色情内容、仇恨图像、名人肖像或他人 IP 的提示。

还开发了强大的图像分类器,用于查看生成的每个视频的帧数,以帮助确保在向用户显示视频之前,这些视频符合我们的使用政策。

其实这是所有AIGC工具的通病,这个也是合规的重要评判标准之一。





三、Sora怎么使用


3.1、使用Sora前的准备工作

在开始之前,确保您已经拥有了OpenAI账目,并获得了Sora的访问权限。准备好您想要转化成视频的文本描述,记住越详细越好。

3.2、Sora使用步骤之文本描述

登录您的OpenAI账户,找到Sora的使用界面。在指定区域输入您的文本描述,可以是一个故事概述、场景描述或是具体的动作指令。

3.3、Sora使用步骤之生成视频

完成文本描述和自定义设置后,点击“生成视频”按钮。Sora将开始处理您的请求,这可能需要几分钟时间。完成后,您可以预览生成的视频。


需要注意的是,截止2024年2月16日,OpenAI只向部分专业用户开放了Sora的访问权限。普通用户只能观看其发布的演示视频。


阅读264
分享
写评论...