刚刚,小米“小身材”MiMo大模型开源!
创始人
2025-04-30 16:45:56
0

4月30日,据“Xiaomi MiMo”公众号消息称,小米开源首个为推理而生的大模型“Xiaomi MiMo”,通过联动预训练到后训练,全面提升推理能力。

据介绍,在数学推理(AIME24-25)和代码竞赛(Live Code Benchv5)公开测评集中,参数规模仅7B的MiMo,超越了OpenAI的闭源推理模型o1-mini,以及阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B在数学与代码领域的强化学习潜力显著领先。

我们了解到,MiMo推理能力的提升,得益于预训练和后训练阶段在数据和算法等多层面的创新。预训练阶段,重点是让模型接触更多推理模式数据,为此着重挖掘富推理语料,合成约200B tokens推理数据,并进行三阶段训练,逐步提升训练难度,总训练量达25T tokens。

目前,MiMo-7B全系列已开源4个模型至Hugging Face。MiMo来自新成立不久的“小米大模型Core团队”的初步尝试。#大模型# #人工智能# #大厂# #科技造福人类# #小米# #雷军# #MiMo# #开源# #参数# #科技的力量# #开发# #科技数码新鲜事儿#

相关内容

同比激增536.8%!AI...
文|DataEye研究院 昨日,QuestMobile发布了《2...
2025-05-09 18:45:50
英伟达开源代码大模型 基于...
5月9日,英伟达宣布开源其代码推理模型,包含32B、14B和7B三...
2025-05-09 16:47:23
Meta 开源 Llama...
IT之家 5 月 9 日消息,Meta AI 公司最新推出 Lla...
2025-05-09 14:47:29
【云智科技「前成」大模型】...
近日,云智科技自研的「前成」大模型正式通过国家网信办“生成式人工智...
2025-05-09 14:20:27
腾讯混元视频生成工具全新开...
上证报中国证券网讯 据腾讯混元5月9日消息,全新多模态定制化视频生...
2025-05-09 14:18:52
世界首个AI多人游戏全面开...
新智元报道 编辑:定慧 好困 【新智元导读】 刚刚,全球首个AI...
2025-05-09 14:17:38

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...