Artificial Analysis发布全新Coding Agent基准 智谱GLM-5.1取得全球开源SOTA
创始人
2026-05-13 11:44:51
0

全球权威评测机构Artificial Analysis今日发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA主流基准上的表现。其中,智谱GLM-5.1(在Claude Code中运行)取得开源第一。

Artificial Analysis在官方推文中点明了这一新榜单的“含金量”:“当开发者使用AI编程时,他们不仅在选择模型,也在将其与特定的Agent harness搭配使用。只有对这一组合进行基准测试,才能真正理解并比较不同模型的真实性能。”

从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。

相关内容

Robo.ai 宣布任命阿...
迪拜2026年5月13日-- 阿联酋纳斯达克上市公司Robo.ai...
2026-05-13 11:47:17
Artificial An...
全球权威评测机构Artificial Analysis今日发布全新...
2026-05-13 11:44:51
AI会取代哪些职业?多个A...
新华社北京5月11日电 当前,人们日益担忧人工智能(AI)将影响就...
2026-05-12 00:35:27
【好评中国】AI漫评:中国...
特约评论员/丁铁 5月9日,工业和信息化部发布我国造船业最新数据。...
2026-05-11 22:27:40
刚刚,重磅发布!AI,大利...
AI迎来重磅利好政策。 5月11日,据广州市人民政府网站,广州市人...
2026-05-11 22:26:07
AI开始“接管”东南亚商家...
AI正在从“帮商家提高效率”,变成“直接替商家做生意”。 近日,移...
2026-05-11 22:25:48

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...