刚刚,小米“小身材”MiMo大模型开源!
创始人
2025-04-30 16:45:56
0

4月30日,据“Xiaomi MiMo”公众号消息称,小米开源首个为推理而生的大模型“Xiaomi MiMo”,通过联动预训练到后训练,全面提升推理能力。

据介绍,在数学推理(AIME24-25)和代码竞赛(Live Code Benchv5)公开测评集中,参数规模仅7B的MiMo,超越了OpenAI的闭源推理模型o1-mini,以及阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B在数学与代码领域的强化学习潜力显著领先。

我们了解到,MiMo推理能力的提升,得益于预训练和后训练阶段在数据和算法等多层面的创新。预训练阶段,重点是让模型接触更多推理模式数据,为此着重挖掘富推理语料,合成约200B tokens推理数据,并进行三阶段训练,逐步提升训练难度,总训练量达25T tokens。

目前,MiMo-7B全系列已开源4个模型至Hugging Face。MiMo来自新成立不久的“小米大模型Core团队”的初步尝试。#大模型# #人工智能# #大厂# #科技造福人类# #小米# #雷军# #MiMo# #开源# #参数# #科技的力量# #开发# #科技数码新鲜事儿#

相关内容

以数据替代经验 用AI赋能...
以数据替代经验 用AI赋能生产 探秘全球首家正极材料零碳工厂的“智...
2026-06-23 07:54:11
华为AI通信专利获授权:设...
【CNMO科技消息】随着人工智能技术加速向终端设备普及,如何让不同...
2026-06-22 20:32:22
刚刚,百度开源拿下全球第一...
新智元报道 【新智元导读】百度开源Unlimited OCR!3...
2026-06-22 20:30:12
全球首个!京东全栈开源Jo...
一场火灾发生的瞬间,监控系统可以实时发出警报;独居老人在家摔倒,A...
2026-06-22 17:47:51
美图“追风”AI
4款新品和4款升级版产品,美图近日拿出的8款产品,覆盖设计师社区、...
2026-06-22 17:47:06

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...