新Sora发布!生成视频最长20秒,AI视频赛道拥挤加剧
创始人
2024-12-11 09:14:19
0

在首次公开展示过去近10个月后,当地时间12月9日,OpenAI终于宣布正式向用户开放AI视频生成模型Sora,并发布新的高端加速版本Sora Turbo。南都记者从发布会上了解到,Sora分辨率最高支持1080p,生成视频最长20秒,有三种常见画面比例供用户选择。在文图生成视频的基础功能之外,此次Sora全面升级交互页面,新增storyboard等功能,进一步提高用户体验和视频质量。

今年2月,OpenAI首次推出文生视频大模型Sora,迅速引发AI圈的关注。Sora展示的全新影像画面精细生动,远胜于此前生成式AI所生产的动画内容。不过初次展示后,Sora一直未对公众开放,仅面向部分人开启小范围测试。

12月9日,OpenAI CEO山姆·奥特曼(Sam Altman)以及Sora团队的数名负责人进行了一场近20分钟的直播。Sora的神秘面纱终于被揭开。

OpenAI发布会

据直播介绍,Sora分辨率最高支持1080p,生成的视频长度为5至20秒,用户可选择横向(16:9)、正方形(1:1)、竖向(9:16)三种常见画面比例。

在直播的演示环节,相关负责人介绍了Sora的新亮点。一方面,用户不仅能更轻松地通过文本提示生成视频,还能基于图片和已有视频生成新内容,比如延续一段视频的后续画面等。

另一方面,Sora新上线了最重要的创意工具之一——storyboard(故事板)。该功能相当于以时间轴的形式,将一段视频“切”成多段,用户可以为每个“切口”提供更详细的场景描述或图片参考,Sora根据这些提示生成整段视频,以此达到用户精确控制生成视频内容和风格走向的目的。

此外,Sora还支持用户对生成视频进行重新切割(Re-cut),保留其中满意的部分,延展、混合、重新生成其它部分。在高级编辑功能中,Remix(重混)支持用户对生成视频进行改编,可通过1-8级强度调节控制改编程度,Loop(循环)、Blend(混合)功能可实现场景循环、场景融合,Style presets(风格预设)可预设生成视频的总体风格。

在定价方面,Sora主要提供两种方案。月收费20美元的ChatGPT Plus用户可免费使用Sora,每月最多生成50个720p视频,时长为5秒。每月支付200美元的ChatGPT Pro用户最多可生成500个高级视频,不限次数享受“慢速”生成视频的权限,分辨率高达1080p,持续时间为20秒,并且下载的视频无水印。

Sora收费方案

值得一提的是,生成视频的清晰程度会影响配额的消耗,用户每次生成的视频分辨率越高,被消耗的配额越多。OpenAI方面表示,目前正针对不同类型的用户定制更多元的价格方案,计划在明年年初推出。

OpenAI官网显示,Sora目前支持155个国家及地区的用户使用,但不包括英国、大部分欧洲,以及中国大陆等。

发布会结束后不久,大量用户争相涌入Sora尝试新工具,导致服务器多次崩溃。奥特曼发文提醒用户,由于需求超出预期,Sora注册通道已被暂时关闭,视频生成速度将在一段时间内变慢。

南都记者注意到,Sora功能让人眼前一亮的同时,有些硬伤也无法完全忽视。在发布会的演示过程中,可以看到一些不符合物理逻辑的技术“翻车”痕迹。

比如,在展示storyboard功能时,负责人要求Sora生成一只鹤从水里抓出鱼的视频。可以看到鹤头在进入水中时,迸溅的水花非常夸张,与真实情况不符,显得画面有些不自然;还有部分画面中,鹤喙还未碰到水面,水花就已经扬起,违背了物理规律。

发布会上的演示画面

Sora团队负责人阿迪亚·拉梅什(AdityaRamesh)在直播中表示,启动Sora项目是为了构建真正深入了解世界及其物理规律的AI系统,目前的Sora并不完美,会犯错误,但它已经达到了非常有利于增强人类创造力的阶段,“我们迫不及待想知道世界会开始用Sora创造什么。”

Sora从初次展示到正式发布,历经十个月。这段时间里,国内外科技企业纷纷涌入视频大模型赛道,并且取得了重大进展。

在国外,Runway、Luma AI等专攻视频赛道的企业推出了先进的AI视频模型,Pika、HeyGen曾声称产品可以超越Sora。就在OpenAI发布会前几日,亚马逊云科技发布了Nova Reel文生视频大模型,谷歌面向企业开放生成式AI视频模型Veo。国外这一赛道可谓挤满了新老选手,竞争激烈。

国内也有着相似情形,据不完全统计,目前已发布或已在内测的国内视频生成产品已超过10个。快手可灵、字节即梦、Minimax旗下海螺AI、阿里巴巴通义万相等都是该领域的代表产品,阿里云、生数科技、智谱AI等今年也发布了视频生成模型,腾讯混元近日宣布上线视频生成能力。

随着Sora Turbo的正式加入,可以预见AI视频生成这一新兴市场的角逐将更为激烈。在其商业化形势仍不明朗的情况下,谁能在新时代引领全球视频生成大模型行业,也许很快就能有答案。

采写:南都记者 樊文扬

相关内容

智谱开源GLM 5.2,成...
截至9:57,成长100(980080)跌2.95%,权重股中际旭...
2026-06-26 14:30:51
开源固件Coreboot推...
IT之家 6 月 26 日消息,据科技媒体 Phoronix 昨天...
2026-06-26 14:30:03
我国将加快推进开源体系建设
在今日(6月25日)北京举行的2026开放原子开源生态大会上,工业...
2026-06-26 00:49:39
微信生态AI持续上新
6月23日,腾讯公关总监张军在社交平台透露,企业微信即将推出名为“...
2026-06-25 09:25:58
AI下乡 联通兴农——联通...
央广网广州6月25日消息(记者郑少纯)6月23日,中国联通广东分公...
2026-06-25 09:25:15
搜狐AI健康 | 真人医生...
图说 / 蚂蚁旗下健康AI产品蚂蚁阿福近期正式推出“医生把关”功能...
2026-06-24 09:57:21

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...