连发推理模型、Agent和多模态,MiniMax不想掉出一梯队|AI创世纪
创始人
2025-06-22 15:43:44
0

图片来源:视觉中国

蓝鲸新闻6月21日讯(记者 朱俊熹)大模型“六小龙”中趋于沉寂的其他几家同行相比,MiniMax用连续5天的上新,带来了久违的热闹场面。自6月17日起,MiniMax一周内相继发布了新的推理模型、视频生成模型、Agent、语音设计等产品。

其中,MiniMax-M1是MiniMax推出的首个推理模型,官方介绍称是基于年初的MiniMax-Text-01模型开发得到的。一位AI算法工程师对蓝鲸科技记者表示,半年时间内从基础模型通过强化学习训练出推理模型,属于正常的节奏。“不论是训练还是强化学习的方式,给业界的感觉就是MiniMax沿着DeepSeek R1的路又走了一遍。”

有媒体转述M1模型发布后,MiniMax创始人、CEO闫俊杰在社交媒体上表示,“第一次感觉到大山不是不能翻越。”

MiniMax-M1模型延续了此前MiniMax-01系列基模的架构创新,即在MoE架构的基础上引入了闪电注意力机制(Lightning Attention)。和传统的注意力机制相比,闪电注意力机制就像在阅读长文时能让模型快速锁定重点,并不时浏览章节标题以把握整体脉络,从而减少计算和内存消耗,更适用于长上下文的处理。

上述技术从业者表示,尽管MiniMax在一月份释出了这一独创的混合架构,但目前各家大模型厂商依然按照各自的方式进行模型的迭代。“基础模型的训练还是以稳定为主,如果更改架构的话,重新训练一旦效果不佳,可能会影响行业生态位。”

图片来源:MiniMax

得益于模型的混合架构,M1在长文本方面具备显著优势。该模型支持目前业内最高的100万上下文的输入,与闭源模型中谷歌Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万token的推理输出。MiniMax还提出了新的强化学习算法CISPO,通过裁剪重要性采样权重,使强化学习训练中的“重要性评分”更合理,能够帮助模型更快、更稳地进步。

最终M1的强化训练过程实现了“超出预期”的高效。据MiniMax介绍,整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美元,较最初预期少了一个数量级。

和同样强调长上下文能力的字节豆包大模型1.6相似,MiniMax-M1也采用了分区间定价的方式。0-32k的输入长度内,输入0.8元/百万token,输出8元/百万token;32k-128k输入长度,输入1.2元/百万token,输出16元/百万token;最长的128k-1M输入长度,输入2.4元/百万token,输出24元/百万token。

MiniMax、字节等厂商此前也都强调过,长上下文的发展有助于促进智能体时代的到来。前述技术从业者解释称,Agent(智能体)的使用场景可以很复杂,例如Deep Research功能涉及大量超长文章的检索,长上下文能力自然越强越好。随着模型能力增强、MCP等外部基础设施逐步成熟,现在是Agent发展长上下文能力的好时机。

此次MiniMax推出的Agent包括通用智能体和一款视频创作Agent。通用的MiniMax Agent能够完成长程复杂任务,官方称在研发过程中是按照“靠谱的人”这一标准来设计和要求的,具体包括编程、多模态及MCP扩展。其中,多模态标准指的是支持长文本、视频、音频、图片等的全面理解,还应内置生图、生音频、生视频等能力。

Hailuo Video Agent这款视频创作智能体瞄准的是零门槛的Vibe Videoing。目前开放的第一阶段提供Agent视频模版,用户根据提示输入文字或图片,就可以一键生成创意短片。按照MiniMax的构想,第二阶段的半自定义视频Agent将支持用户在视频生成的任一环节进行自由编辑,第三阶段则实现完全形态的端到端视频Agent。

多模态向来是MiniMax的一大竞争优势。此次“上新周”发布的视频模型Hailuo 02在Artificial Analysis Video Arena评测榜上排名第二,仅次于字节的Seedance 1.0,但领先谷歌的Veo 3 Preview。收官日发布的语音设计工具则支持定制生成多语言、任意声音与情绪的语音,由5月发布的语音模型MiniMax Speech 02提供支持。

随着新模型与产品的亮相,MiniMax也公布了相应的付费方案。通用Agent采用积分制,优惠期内基础会员每月19美元,获得的5000积分大约可完成15个任务,Pro会员每月69美元,获得的20000积分对应的大约是60个任务。视频Agent则在MiniMax的视频平台海螺AI上提供,同样设有不同等级的付费方案。这些都为MiniMax带来了新的产品营收路径,通过多点变现进一步完善其商业化版图。

图片来源:海螺AI

从当前来看,大模型“六小龙”已走向各异。零一万物不再继续训练超大模型,百川智能放弃金融聚焦医疗,阶跃星辰开始收敛产品转向Agent方向,月之暗面相比基模推出的更多是编程、视觉语言等垂直模型。如果要踏上IPO之路,智谱、MiniMax等“小龙”们仍然面临着一份复杂的商业化答卷有待完成。

相关内容

“金融+AI”,又一互联网...
又一家互联网“大厂”入局。 近日,京东金融在AI服务领域落下关键一...
2025-06-22 22:11:59
连发推理模型、Agent和...
图片来源:视觉中国 蓝鲸新闻6月21日讯(记者 朱俊熹)与大模型“...
2025-06-22 15:43:44
华为云发布盘古大模型5.5...
2025年华为开发者大会(HDC 2025)在东莞篮球中心隆重开幕...
2025-06-21 15:12:54
AI多场景上线为医生“打工...
6月20日,由南方医科大学卫生健康管理研究院与广东省医院协会联合主...
2025-06-21 15:12:10
微软 Win11 Linu...
IT之家 6 月 20 日消息,在今年 5 月的微软 Build ...
2025-06-21 13:12:08
兰剑智能:公司自主研发的仓...
每经AI快讯,有投资者在投资者互动平台提问:公司提到正在布局接入开...
2025-06-20 18:43:15

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...