业界首个!豆包新模型搅动AI视觉
创始人
2025-02-10 18:17:27
0

2月10日,A股视觉认知概念股午后大幅走强,创业板星宸科技直线拉升涨停,全志科技、富瀚微、虹软科技等纷纷大幅冲高。

消息面上,豆包发布视频生成实验模型“VideoWorld”。据介绍,不同于Sora、DALL-E、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,仅通过“视觉信息”即可认知世界,也就是说,VideoWorld可通过浏览视频数据,让机器掌握推理、规划和决策等复杂能力。团队实验发现,仅300M参数量下,VideoWorld已取得可观的模型表现。

目前,该项目代码与模型已开源。

现有模型大多依赖语言或标签数据学习知识,很少涉及纯视觉信号的学习。VideoWorld选择去掉语言模型,实现了统一执行理解和推理任务。

怎么做到的?

豆包大模型团队称,VideoWorld基于一种潜在动态模型(Latent Dynamics Model,LDM),可高效压缩视频帧间的变化信息,在保留丰富视觉信息的同时,压缩了关键决策和动作相关的视觉变化,显著提升知识学习效率和效果

在不依赖任何强化学习搜索或奖励函数机制前提下,VideoWorld达到了专业5段9x9围棋水平,并能够在多种环境中,执行机器人任务。

但该模型并不完美,其在真实世界环境中的应用,仍面临着高质量视频生成和多环境泛化等挑战。这一点最直观体现在,视频中存在大量冗余信息,会大大影响模型的学习效率,使得视频序列的知识挖掘效率显著落后于文本形式,不利于模型对复杂知识的快速学习。

大模型的视觉理解能力一直是AI前沿研究方向之一。对人类而言,与语言相比,“用眼睛看”是门槛更低的认知方式。正如李飞飞教授9年前TED演讲中提到“幼儿可以不依靠语言理解真实世界”。

AI视觉学习,简单来说,需要大模型理解物品/空间/场景的整体含义,并根据识别内容进行复杂的逻辑计算,根据图像信息更细腻地表述并创作。

AI视觉学习能力提升,有望催发更多的AI应用。长城证券此前发布研报称,国内AI大模型多模态能力正持续提升,如快手可灵AI大模型、字节豆包AI大模型等视频生成的效果正在持续提升,包括精准语义理解、一致性多镜头生成、动态运镜等。受益于底层技术能力的升级,国内AI应用持续迭代,token调用量持续增长,AI应用有望从中受益。

来源:科创板日报

相关内容

比魔兽更魔幻---北京人形...
图 开源直播现场 图 人形机器人世界模型概览图 来自论文《WOW...
2025-10-17 16:20:00
视觉中国拟战略投资凌川科技...
近日,视觉中国与凌川科技签署投资框架协议并达成战略合作,双方将在A...
2025-10-17 15:47:13
美团:七成外卖订单低价,A...
【美团公布外卖数据并展示大模型餐饮应用,AI助力餐饮降本增效】10...
2025-10-17 15:18:51
引智聚才 布局AI未来 昌...
2025年10月15日,昌平区“昌聚工程”人才政策宣讲会暨AI发展...
2025-10-17 11:50:52
“AI教母”李飞飞的全新世...
World Labs联合创始人兼CEO李飞飞(图片来源:彭博) “...
2025-10-17 11:15:58
“镜”显神通 AI眼镜如何...
今年上半年,中国消费级AI眼镜市场销量同比增长了73%,创下历史新...
2025-10-17 11:15:15

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...