又创新高,阿里通义开源模型Qwen2.5进入大模型盲测全球前十
创始人
2024-09-29 18:50:42
0

文 丨 陈清

出品丨鳌头财经

9月29日消息,基准测试平台Chatbot Arena日前公布最新大模型盲测榜单,10天前发布的阿里通义千问开源模型Qwen2.5再次闯入全球十强,其大语言模型Qwen2.5-72B-Instruct排名LLM榜单第十,是前十唯一的中国大模型;Qwen系列视觉语言模型Qwen2-VL-72B-Instruct排名Vision榜单第九,是得分最高的开源大模型。

同一时间,全球开源社区基于Qwen系列二次开发的衍生模型数量突破7.43万,超越Llama系列衍生模型的7.28万。通义千问Qwen成长为世界最大的生成式语言模型族群,在Hugging Face社区的开源模型权威榜单Open LLM Leaderboard上,Qwen系列及其衍生模型包揽了前十全部座次。

不论是模型性能还是生态影响力,Qwen都创造了中国开源大模型的历史。

Qwen2.5-72B-Instruct排名Chatbot Arena大语言模型榜单第十

Chatbot Arena是由开放研究机构LMSYS Org推出的大模型性能测试平台,自2023年5月推出以来一直是世界顶级大模型的最重要竞技场。平台目前集成了全球70多个大模型,采用匿名方式将大模型两两组队,交给用户进行盲测,用户根据真实对话体验对模型能力进行投票。

9月19日发布的Qwen2.5迅速进榜,旗舰模型Qwen2.5-72B-Instruct得分位列LLM榜单第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中国大模型;同天开源的视觉语言模型Qwen2-VL-72B-Instruct闯入Vision榜单第九,略逊于GPT-4o、Gemini-1.5-Pro等闭源模型,是成绩最好的开源模型。此前Qwen系列已有多款开源模型闯入Chatbot Arena榜单。

Chatbot Arena官方发文,Qwen2-VL-72B-Instruct是排名最高的开源视觉语言模型

Qwen2.5的发布在海内外开源社区引发一场狂欢,这套开源模型涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,几乎所有尺寸的模型都实现了同等规模业界最佳性能,发布10天下载量超过150万。有国外开发者称赞通义千问称得上是真正的“开放AI”;有用户测评发现Qwen2.5从0.5B到72B都是SOTA水平,于是发起话题:“大家都用Qwen2.5替换了那些常用模型?”

海外开源社区盛赞Qwen2.5

相关内容

【一周连连看】推动大模型从...
Hi,假期快乐。 本周,你将看到: 1、AI暑期营火了 2、硅谷,...
2026-06-21 20:19:17
CBVI:2026 中国品...
CBVI:2026 中国品牌AI可见度指数 China Brand...
2026-06-21 19:12:58
AI 知识付费“出海”:一...
文 | wiwi AI 浪潮里,最先赚到钱的人,未必是最懂 AI...
2026-06-21 14:04:50
阿里合伙人调整:AI科学家...
阿里巴巴(HK09988,股价104.9港元,市值2.01万亿港元...
2026-06-21 12:06:30
原创 ...
目前 iOS 微信又上线了新功能:小微。 我们进入微信主界面,之前...
2026-06-20 18:26:20
聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...