► 文 观察者网 张广凯
今天,百度真的放大招了。
11月13日,「百度世界2025」大会在北京召开,已经让人期待了几乎一整年的百度最新基座大模型——文心5.0终于亮相,其展现出来的实力也完全对得起大家的等待。作为新一代原生全模态大模型,早在上周,文心5.0已经登上LMArena文本排行榜全球并列第二、中国第一。
同时,百度在数字人、AI搜索、垂直类Agent应用,以及Robotaxi领域的最新进展也集中发布,尤其是此次发布的全球首个可商用的自我演化智能体“伐谋”,其在最近三个相关的全球公开测试上都表现惊艳,甚至实现了全榜单的SOTA,在此前AI从未解出的难题上完成了突破。
可以看到,百度AI最大的优势是以全栈自研为基底,推动应用生态的全面发展,同时探索赋能产业。这不仅符合当下“人工智能+”时代发展的需求,也是百度长期以来的战略目标。
中国AI相比于美国的差异化发展路径也再次得到验证。在坚持自主创新,激发原始创新的基础上,中国AI企业深植于产业链、依托海量数据和复杂场景的模式体现出独特优势,既帮助百度自身AI能力全面演进,也让AI真正内化于全社会生产和生活场景。
正如百度创始人李彦宏所说:只有当AI被内化为一种原生的能力,才能真正在各行各业实现效果的涌现,进而引爆一场全面的生产力革命,推动经济增长,让「智能红利」转化成「社会红利」。
属于百度的SOTA时刻
今天上午,李彦宏在百度世界大会上正式发布了原生全模态大模型文心大模型5.0。文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。
尤其是在多模态领域,不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路线是采用统一的自回归架构进行原生全模态建模,理解与生成一体化。从训练开始便融合语言、图像、视频、音频等多模态数据,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。
MoE架构上,文心5.0采用了超稀疏混合专家架构,进行庞大的全模态训练,在保持模型强大能力的同时有效提升推理效率。
文心5.0的能力已经在全球主流榜单上得到验证。早在今天正式发布之前,上周一个版本名称为ernie-5.0-preview-1022的预览版本已经登上了LMArena排行榜,其文本能力排行榜中国第一、全球并列第二位置。该模型在创意写作、复杂长问题理解、指令遵循等方面表现突出,榜单排行超过GPT-5-high等多款国内外主流模型。
此外,百度还拿下了另一项意义重大的SOTA。
上个月,一篇百度副总裁沈抖等人署名的论文悄然出现在预印本平台arxiv上,该论文提出了一个名为FM Agent的通用多智能体框架,登顶OpenAI机器学习工程权威基准MLE-Bench,拿下SOTA成绩,超越微软R&D Agent和OpenAI展示的AIDE系统。
据介绍,该框架创新性地结合了大型语言模型(LLM)的推理能力和大规模进化搜索,以自动化方式在运筹优化、机器学习、GPU内核优化和数学问题等多个领域解决复杂的现实世界挑战,可运用于交通管理、金融风控、农田灌溉、生产线调度等诸多实际场景。
在今天的百度世界大会上,FM的真身「伐谋」也正式亮相。李彦宏指出,伐谋是一款「自我演化」的智能体,最主要的应用场景就是找「全局最优」。正如其名字的来源「上兵伐谋」,伐谋智能体并非依赖算力来暴力计算解决方案,而是试图实现战略级的规划和推演。
具体来说,伐谋可谓一个「产业大脑」,可运用于交通、能源、金融、物流等领域,作用就是在这些高度复杂的场景中,让AI自我学习,找到人类难以计算的最优解。
大会现场展示的一个典型的应用场景,是海上风电平台设计。在普通人看来,海上风电设施或许就像是海面上长出的一片平静森林,表面上井然有序,但实际上,海上风电项目需协调风机、海缆、升压站等设施的布局,如何在有限的平台空间上最高效地规划出错综复杂的能源管道,是一个全球公认的难题。
中国能源建设集团广东院数字工程研究院与百度合作,将伐谋应用到海上风电设计、电缆桥架布置中。相比于传统的人工设计,伐谋的加入既能快速产出高质量的优化方案,又能对动态调整的约束和目标有极强的适应能力,而且这套能力还可以快速迁移到不同类型的管道布置场景中。这不仅节省了大量成本和近一周的工期,更重要的是,它把工程师从繁重的体力劳动中解放出来,让他们能专注于更宏观的创造性问题。
另一个场景是交通信号灯的控制。鄂尔多斯伊金霍洛旗,新老城区跨河通勤需求旺盛,早晚高峰拥堵频发,引入百度智能云SaaS信控平台后,用AI调控红绿灯配时方案,车均延误降低13%,百度智能云SaaS信控平台在百度FM的赋能下,实现算法自主迭代,找到城市缓堵治理的最优解,车均延误再降低50%。
中国拥有41个工业大类、207个工业中类、666个工业小类,是全世界唯一拥有联合国产业分类中全部工业门类的国家,有最完整的产业链。伐谋就是为这些专业应用场景所准备,能够拿下全球最佳成绩,可谓是合情合理。
这也再次证明了中国AI企业向全社会、全产业赋能的强大能力,而AI企业也同样受益于中国海量数据和复杂应用场景的优势,在实用能力上完成对美国的弯道超车。
垂类场景持续渗透
除了全新智能体伐谋之外,百度数字人和智能体产品的全场景覆盖优势也日益强化。
百度世界大会上,李彦宏宣布,慧播星数字人技术向全行业开放。目前,慧播星数字人已率先落地巴西市场,与Kwai平台深度合作。慧播星数字人后续计划出海到东南亚及美国等重点国家,并积极拓展至Shopee、Lazada等主流平台。
本次双11,慧播星数字人GMV同比提升91%,开播直播间数同比增长了119%,83%的开播主播使用过数字人。
百度还发布新一代数字人「实时互动型数字人」,现场展示其「多模一体实时生成」的核心技术。「实时互动型数字人」可实现实时响应、声情并茂、明察善断。未来,实时互动型数字人将在法律咨询、情感咨询、教育规划等需要高信任、高并发的服务场景中发挥更大价值,成为人与服务之间的高效连接。
智能体方面,百度独树一帜的无代码编程智能体「秒哒」升级到2.0版本,并首次推出海外版MeDo,荣登全球产品榜Product Hunt榜首。
文库网盘GenFlow也来到了3.0版本,截至目前,GenFlow3.0已拥有2000万的用户量,成为全球最大的通用Agent。基于百度文库的全新能力,百度文库还在海外推出了一站式AI学习办公平台Oreate,在短时间内达到120万海外用户规模。
在看家本领搜索引擎方面,百度也是全球AI化改造最激进的,不仅由AI生成文字结果,还加入了大量视频、图片等富媒体内容。李彦宏指出,百度搜索绝大部分的搜索结果由AI生成,而首条结果的富媒体覆盖率已达70%。“你现在搜索10个问题,7个答案都是富媒体的,不是一条条的文字链接,而是一个图片、一个视频、一个直播,甚至是一个数字人!”
不只是AI,更是“人工智能+”
作为国内最早把战略重心向AI转移的互联网企业之一,百度一向以“全栈”布局见长。
过去,人们通常把“全栈”理解为软硬件的一体化。在这个层面上,百度继续拿出了新的成绩,百度正式发布新一代昆仑芯和超节点产品天池。其中,昆仑芯M100 针对大规模推理场景优化设计,提供极致性价比,将于2026年上市;昆仑芯M300面向超大规模多模态模型的训练和推理需求提供极致性能,将于2027年上市。同步发布的天池256超节点与天池512超节点将于明年正式上市,单个天池512超节点就能完成万亿参数模型训练。
不过,随着AI落地应用的持续深化,我们今天看到的“全栈”,更应该理解为场景的全栈。从AI重塑的互联网产品体验,到伐谋这样的「产业大脑」,再到萝卜快跑带来的出行方式变革……百度AI从语言世界走向物理世界,正在一手改造产业,一手改造生活,逐渐内化于人类社会的全场景。
AI带给人类的下一个震撼的“GPT时刻”是什么?Robotaxi无疑是最有力的候选之一。如果说大模型对很多人来说还只是存在于电脑、手机里的工具,那么Robotaxi将会真正让人感受到“内化”于物理世界的AI。
百度继续成为全球实际运营规模最大的Robotaxi服务商。目前,萝卜快跑每周订单量超25万单,且100%为全无人订单。从累计服务单量来看,萝卜快跑全球订单超过1700万单。萝卜快跑自动驾驶总里程已超过2.4亿公里,其中全无人驾驶里程已突破1.4亿公里。
而在产业层面,最新数据显示,2025上半年我国大模型相关项目呈现爆发式增长态势:中标项目累计达 1810个,金额突破64亿元,中标项目数超2024全年,市场需求持续释放。在竞争格局方面,百度智能云表现尤为突出,以 48个中标项目和 5.1亿元中标金额,稳居「双第一」,并在金融、能源、政务、制造等重点行业中持续领跑。
近期,亚马逊等美国科技巨头以AI替代人类职位的做法引起广泛讨论。随着AI技术突飞猛进,怎样的AI企业才是负责任的企业?事实上,以百度为代表的中国企业已经提供了一个很好的范本。
通过不断赋能产业和生活,中国AI企业的目的从不是替代人类,而是成为人类的合作伙伴,这也正是中国“人工智能+”行动的终极目标。在这一过程中,企业与社会的利益实现了双赢,中国社会巨量和开放的数据为AI企业提供了取之不竭的进化动力,而AI技术也在不断为人类拓展着美好生活的可能性。
下一篇:没有了