蚂蚁开源全模态大模型Ming-Flash-Omni 2.0 性能对标Gemini 2.5 Pro
创始人
2026-02-11 15:19:44
0

2月11日,蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。

上证报中国证券网讯(记者 温婷)2月11日,蚂蚁集团开源发布全模态大模型Ming-Flash-Omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。

Ming-Flash-Omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。用户只需用自然语言下指令,即可对音色、语速、语调、音量、情绪与方言等进行精细控制。

蚂蚁集团在全模态方向已持续投入多年,Ming-Omni系列迭代三个版本,此次将Ming-Flash-Omni 2.0开源,意味着其核心能力以“可复用底座”的形式对外释放,为端到端多模态应用开发提供统一能力入口。用户也可通过蚂蚁百灵官方平台Ling Studio在线体验与调用。

据百灵模型负责人周俊介绍,全模态技术的关键在于通过统一架构实现多模态能力的深度融合与高效调用。开源后,开发者可基于同一套框架复用视觉、语音与生成能力,显著降低多模型串联的复杂度与成本。未来,团队将持续优化视频时序理解、复杂图像编辑与长音频生成实时性,完善工具链与评测体系,推动全模态技术在实际业务中规模化落地。

相关内容

投资8年,覆盖硬科技全链,...
在最新财报发布前夕,资本市场对美团的目光多少带着些审视。 经历了2...
2026-03-29 16:53:17
两份重磅报告,讲清AI时代...
人大重阳网综合报道:2026年3月29日,中国人民大学全球领导力学...
2026-03-29 14:55:03
带着Chance AI勇闯...
一个艺术小白、科技编辑怎么就闯进了 Art Central? 这周...
2026-03-29 13:46:29
140万亿Token之后:...
文 | 孙永杰 近日,当国家数据局披露“日均Token调用量突破...
2026-03-29 10:52:27
AI,正在“杀死”哪些软件...
作者 |定焦One 王璐 2026年,AI对软件行业的冲击明显加...
2026-03-29 09:53:40
淘宝推“龙虾版”生意管家,...
3月底,淘宝天猫将上线一款名为“龙虾版”的生意管家。这个命名意在强...
2026-03-28 23:22:36

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...