业界首个!豆包开源VideoWorld:纯视觉模型颠覆AI认知!
创始人
2025-02-13 15:49:07
0

要点快读

豆包,作为字节跳动旗下的智能AI产品,它提供聊天机器人。在A股市场,人工智能(AI)题材的热度持续升温,尤其是豆包概念股,在DeepSeek概念股之后,成为了市场上的新宠。目前,该项目代码与模型已开源。受此消息影响,周一豆包概念股掀潮停潮。

豆包发布视频生成实验模型“VideoWorld”,该项目代码与模型已开源。

国内AI公司豆包科技宣布开源视频生成大模型“VideoWorld”,该模型突破性实现仅凭视觉信号理解世界**,无需任何文本标注数据。据技术白皮书显示,VideoWorld在视频预测、场景重建等任务中准确率超90%,标志着AI视觉认知进入“纯视觉时代”。

VideoWorld由豆包大模型团队联合北京交通大学、中国科学技术大学共同提出。其核心基于一种潜在动态模型,能高效压缩视频帧间的变化信息,结合自回归Transformer架构和矢量量化-变分自编码器,让机器可仅通过浏览视频数据就能掌握推理、规划和决策等复杂能力。

不同于Sora、DALL-E、Midjourney等主流多模态模型,VideoWorld在业界首次实现无需依赖语言模型,仅通过“视觉信息”即可认知世界。这无疑是AI视觉技术的又一重要突破:

技术范式革命:抛弃传统“文本-视觉”对齐训练,直接通过视频流学习物理规律,模型通用性提升10倍(MIT对比实验);成本坍缩:省去天量文本标注费用,训练成本降低80%(豆包披露数据),中小企业可快速部署;场景爆发:自动驾驶、工业检测、元宇宙等需高精度环境理解的场景迎来落地加速期。

豆包现阶段共发布俩个AI视觉模型,一个是上文提到发布的VideoWorld模型,还有一个是12月份发布的视觉理解模型。豆包视觉理解模型是字节跳动在2024年12月18日的火山引擎FORCE原动力大会上发布的。

对于豆包开源VideoWorld大模型,你有什么看法呢?欢迎在评论区留言分享你的观点。

相关内容

AI不是侵权“挡箭牌”
王 铎作 名人声音被AI“克隆”,是侵权吗?由AI生成的视频文案与...
2026-04-18 11:14:46
Meta押注AI数字人 正...
来源:环球市场播报 Meta正在打造人工智能版马克・扎克伯格,可代...
2026-04-18 11:12:52
AI应用向好,计算机ETF...
4月13日,AI应用向好,计算机ETF国泰(512720)收涨超1...
2026-04-13 21:58:04
4月13日石大胜华涨5.1...
证券之星消息,4月13日石大胜华(603026)涨5.17%,收盘...
2026-04-13 21:49:25
奥克股份等成立新公司,含A...
公开资料显示,近日,江苏极拓奥克能源科技有限公司成立,经营范围包含...
2026-04-13 14:02:40
AI内容迈入“出海”窗口期...
AI内容生产正以超出预期的速度完成从“技术验证”到“商业规模化”的...
2026-04-13 13:56:57

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...