连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪
创始人
2025-06-22 15:43:44
0

图片来源:视觉中国

蓝鲸新闻6月21日讯(记者 朱俊熹)大模型“六小龙”中趋于沉寂的其他几家同行相比,MiniMax用连续5天的上新,带来了久违的热闹场面。自6月17日起,MiniMax一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。

其中,MiniMax-M1是MiniMax推出的首个推理模型,官方介绍称是基于年初的MiniMax-Text-01模型开发得到的。一位AI算法工程师对蓝鲸科技记者表示,半年时间内从基础模型通过强化学习训练出推理模型,属于正常的节奏。“不论是训练还是强化学习的方式,给业界的感觉就是MiniMax沿着DeepSeek R1的路又走了一遍。”

有媒体转述M1模型发布后,MiniMax创始人、CEO闫俊杰在社交媒体上表示,“第一次感觉到大山不是不能翻越。”

MiniMax-M1模型延续了此前MiniMax-01系列基模的架构创新,即在MoE架构的基础上引入了闪电注意力机制(Lightning Attention)。和传统的注意力机制相比,闪电注意力机制就像在阅读长文时能让模型快速锁定重点,并不时浏览章节标题以把握整体脉络,从而减少计算和内存消耗,更适用于长上下文的处理。

上述技术从业者表示,尽管MiniMax在一月份释出了这一独创的混合架构,但目前各家大模型厂商依然按照各自的方式进行模型的迭代。“基础模型的训练还是以稳定为主,如果更改架构的话,重新训练一旦效果不佳,可能会影响行业生态位。”

图片来源:MiniMax

得益于模型的混合架构,M1在长文本方面具备显著优势。该模型支持目前业内最高的100万上下文的输入,与闭源模型中谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万token的推理输出。MiniMax还提出了新的强化学习算法CISPO,通过裁剪重要性采样权重,使强化学习训练中的“重要性评分”更合理,能够帮助模型更快、更稳地进步。

最终M1的强化训练过程实现了“超出预期”的高效。据MiniMax介绍,整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美元,较最初预期少了一个数量级。

和同样强调长上下文能力的字节豆包大模型1.6相似,MiniMax-M1也采用了分区间定价的方式。0-32k的输入长度内,输入0.8元/百万token,输出8元/百万token;32k-128k输入长度,输入1.2元/百万token,输出16元/百万token;最长的128k-1M输入长度,输入2.4元/百万token,输出24元/百万token。

MiniMax、字节等厂商此前也都强调过,长上下文的发展有助于促进智能体时代的到来。前述技术从业者解释称,Agent(智能体)的使用场景可以很复杂,例如Deep Research功能涉及大量超长文章的检索,长上下文能力自然越强越好。随着模型能力增强、MCP等外部基础设施逐步成熟,现在是Agent发展长上下文能力的好时机。

此次MiniMax推出的Agent包括通用智能体和一款视频创作Agent。通用的MiniMax Agent能够完成长程复杂任务,官方称在研发过程中是按照“靠谱的人”这一标准来设计和要求的,具体包括编程、多模态及MCP扩展。其中,多模态标准指的是支持长文本、视频、音频、图片等的全面理解,还应内置生图、生音频、生视频等能力。

Hailuo Video Agent这款视频创作智能体瞄准的是零门槛的Vibe Videoing。目前开放的第一阶段提供Agent视频模版,用户根据提示输入文字或图片,就可以一键生成创意短片。按照MiniMax的构想,第二阶段的半自定义视频Agent将支持用户在视频生成的任一环节进行自由编辑,第三阶段则实现完全形态的端到端视频Agent。

多模态向来是MiniMax的一大竞争优势。此次“上新周”发布的视频模型Hailuo 02在Artificial Analysis Video Arena评测榜上排名第二,仅次于字节的Seedance 1.0,但领先谷歌的Veo 3 Preview。收官日发布的语音设计工具则支持定制生成多语言、任意声音与情绪的语音,由5月发布的语音模型MiniMax Speech 02提供支持。

随着新模型与产品的亮相,MiniMax也公布了相应的付费方案。通用Agent采用积分制,优惠期内基础会员每月19美元,获得的5000积分大约可完成15个任务,Pro会员每月69美元,获得的20000积分对应的大约是60个任务。视频Agent则在MiniMax的视频平台海螺AI上提供,同样设有不同等级的付费方案。这些都为MiniMax带来了新的产品营收路径,通过多点变现进一步完善其商业化版图。

图片来源:海螺AI

从当前来看,大模型“六小龙”已走向各异。零一万物不再继续训练超大模型,百川智能放弃金融聚焦医疗,阶跃星辰开始收敛产品转向Agent方向,月之暗面相比基模推出的更多是编程、视觉语言等垂直模型。如果要踏上IPO之路,智谱、MiniMax等“小龙”们仍然面临着一份复杂的商业化答卷有待完成。

相关内容

WAIC回顾:当前国内AI...
21世纪经济报道记者 董静怡 上海报道 大模型时代,AI产业链的投...
2025-08-06 20:17:47
AI助手、多模创作等再升级...
QuestMobile《2025年AI应用市场半年报》8月6日的报...
2025-08-06 20:14:40
美国不甘落后!启动ATOM...
快科技8月6日消息,据报道,面对中国在开源人工智能(AI)领域的迅...
2025-08-06 19:41:28
开源回归!六年后OpenA...
封面新闻记者 边雪 2025年8月5日,人工智能领域迎来一个重要时...
2025-08-06 18:42:07
OpenAI终于变得“Op...
图片来源:视觉中国 蓝鲸新闻8月6日讯(记者 朱俊熹)OpenAI...
2025-08-06 18:15:21
“爆炒蚬子”惹事了:肉壳分...
“爆炒蚬子”是一道大连家常菜,近日大连金石滩某餐厅却因这道菜引来了...
2025-08-06 18:15:20

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...