性能超DeepSeek-V3.2!国产大模型又开源了,限时免费用
创始人
2025-10-27 16:14:31
0

智东西

作者 | 李水青

编辑 | 心缘

智东西10月27日报道,刚刚,MiniMax发布并开源MiniMax-M2,一款为Max可视化编程和智能体工作流构建的轻量级模型。

▲MiniMax-M2在Hugging Face的开源界面截图

MiniMax-M2聚焦智能体的效率提升,是一款总参数达2300亿个的MoE(混合专家)模型,其中活跃参数达100亿个,兼顾编程和智能体任务以及通用智能。

在权威基准测评中,MiniMax-M2的测试成绩赶超Gemini 2.5 Pro、DeepSeek-V3.2等领先模型,接近GPT-5(thinking)模型性能,据称可提供匹敌这些模型的端到端工具使用性能,同时部署和扩展更便捷

▲MiniMax-M2的基准测试概况

具体来看,MiniMax-M2有以下几大亮点:

1、智能提升。根据知名分析机构Artificial Analysis的基准测试,MiniMax-M2在数学、科学、指令遵循、编程和智能体工具使用方面展现出具竞争力的通用智能。其综合得分在全球开源模型中排名第一。

2、高级编程。MiniMax-M2专为端到端开发人员工作流程而设计,擅长多文件编辑、编码-运行-修复循环以及测试验证修复。在Terminal-Bench和(Multi-)SWE-Bench风格的任务中展现了其在跨语言终端、IDE和CI中的实用有效性。

3、智能体性能。MiniMax-M2能够规划并执行跨Shell、浏览器、检索和代码运行器的复杂、长周期工具链。在类似BrowseComp的评估中,它能够持续定位难以发现的漏洞来源,保持证据的可追溯性,并优雅地从不稳定的步骤中恢复。

4、高效设计。MiniMax-M2拥有100亿个激活参数,可为交互式智能体和批量采样提供更低的延迟、更低的成本和更高的吞吐量,这与向高度可部署的模型转变契合,这些模型在编程和智能体任务中仍然表现出色。

以下更全面的评估测试了端到端编程和智能体工具的使用情况,涉及编辑真实的代码库、执行命令、浏览网页以及交付实用的解决方案等方面。MiniMax-M2在Multi-SWE-Bench、Terminal-Bench、ArtifactsBench、BrowseComp等多项测试中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型。

▲MiniMax-M2的基准测试具体情况

Artificial Analysis统计的基准测试如下,MiniMax-M2在LiveCodeBench(LCB)、IFBench、AA Intelligence等多项测试中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型。

▲Artificial Analysis基准测试具体情况

目前,用户可以在MiniMax Agent上体验MiniMax-M2,在限定时间内免费用

▲MiniMax Agent限免使用

体验地址:

https://agent.minimax.io/

智东西第一时间对MiniMax-M2进行了体验,当输入提示词:“模拟一个旋转六边形内弹跳球。”MiniMax-M2能够成功实现这一物理模拟,且提供了比较直观的小球轨迹效果及参数控制面板设计。这期间等待数分钟,主要是其调用智能体对基本控制功能、面板参数调试、高级功能、网站显示等进行了数次的测试调试。

▲MiniMax Agent生成的小球实验模拟

体验链接:

https://en6x2um63xa4.space.minimaxi.com/

当我把题目难度提高,输入提示词:“模拟一个旋转六边形内弹跳球,有两个球体积相同,球a的质量是球b的2倍。”只见MiniMax-M2模拟的小球冲出了六边形,与预期有一些出入,不过整个网站可调参数和呈现内容变得更加丰富。或许这一题目对一个轻量级模型来说还是有难度。

▲MiniMax Agent生成的小球实验模拟

体验链接:

https://bwr3exu4k4ph.space.minimaxi.com/

另外,MiniMax-M2 API已在MiniMax开放平台上线,同样限时免费。MiniMax-M2模型权重现已开源,允许本地部署和使用。

API地址:

https://platform.minimax.io/docs/guides/text-generation

模型权重开源地址:

https://huggingface.co/MiniMaxAI/MiniMax-M2

相关内容

这些AI工作站看似PC,实...
生成式AI的兴起推动了对能在本地硬件上运行或训练模型的AI工作站的...
2026-03-26 01:40:28
【AI+CAM】西门子:A...
这是AIE加速工业进化【AI+CAM的现状和未来】系列的第1篇,首...
2026-03-26 01:35:35
OpenAI推出开源工具助...
OpenAI周二宣布发布一套提示词工具,帮助开发者构建对青少年更安...
2026-03-26 01:33:50
AI如何加速成为新质生产力...
来源:科技日报 我国企业推出的开源大模型下载量全球第一,规上制造业...
2026-03-25 18:14:57
当AI也开始“说谎”,我们...
从日常消费决策到行业信息参考,AI大模型早已成为公众获取信息、做出...
2026-03-25 18:14:35
月之暗面创始人杨植麟:AI...
聚焦中关村论坛·瞰见创新力量 红星资本局3月25日消息,2026中...
2026-03-25 18:09:09

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...