谷歌发布开源 LMEval 框架：打破 AI 模型比较壁垒_linux资讯_linux办公网

谷歌发布开源 LMEval 框架：打破 AI 模型比较壁垒

创始人

2025-05-27 15:20:51

0次

IT之家 5 月 27 日消息，科技媒体 The Decoder 昨日（5 月 26 日）发布博文，报道称谷歌推出开源框架 LMEval，为大语言模型和多模态模型提供标准化的评测工具。

评测新型 AI 模型一直是个难题。不同供应商使用各自的 API、数据格式和基准设置，导致跨模型比较耗时且复杂。

而谷歌最新推出的 LMEval 开源框架直击这一痛点，研究人员和开发者只需设置一次基准，就能展开标准化的评测流程，大幅简化了评测工作，节省了时间和资源。

LMEval 还通过 LiteLLM 框架抹平了 Google、OpenAI、Anthropic、Ollama 和 Hugging Face 等平台之间的接口差异，确保测试跨平台无缝运行。

LMEval 不仅支持文本评测，还涵盖图像和代码等领域的基准测试，且新输入格式可轻松扩展，框架支持是非题、多选题和自由文本生成等多种评估类型。同时，该框架能识别模型采用的“规避策略”，即故意给出模糊回答以避免生成有风险内容。

Google 还引入了 Giskard 安全评分，展示模型规避有害内容的表现，百分比越高代表安全性越强。测试结果存储在自加密的 SQLite 数据库中，确保数据本地化且不会被搜索引擎索引，兼顾了隐私与便捷。

LMEval 具备增量评估功能，无需在新增模型或问题时重新运行整个测试，仅执行必要的新增测试即可，并采用多线程引擎并行处理多项计算，有效降低了计算成本和时间消耗。

谷歌还开发了 LMEvalboard 可视化工具，通过雷达图展示模型在不同类别中的表现。用户可深入查看具体任务，精准定位模型错误，并直接比较多个模型在特定问题上的差异，图形化展示一目了然。

Google 时间 LMEval 评测 LiteLLM 模型测试壁垒搜索引擎框架谷歌基准

上一篇：【万字长文】大模型开源开发全景与趋势解读

下一篇：原创 Windows 11成为Linux最好的活广告

相关内容

SIGCOMM 2026 ...

论文作者均来自北京大学王选计算机研究所，第一作者为吴将凯博士，第二...

2026-06-26 18:43:57

工信部就《开源鸿蒙设备统一...

工信部将申请立项的《开源鸿蒙设备统一互联接入与控制接口》等3项行业...

2026-06-26 18:37:55

智谱开源GLM 5.2，成...

截至9：57，成长100（980080）跌2.95%，权重股中际旭...

2026-06-26 14:30:51

开源固件Coreboot推...

IT之家 6 月 26 日消息，据科技媒体 Phoronix 昨天...

2026-06-26 14:30:03

搜狐AI健康 | 真人医生...

图说 / 蚂蚁旗下健康AI产品蚂蚁阿福近期正式推出“医生把关”功能...

2026-06-24 09:57:21

城市词元工厂落地　焕新AI...

（图片来源：摄图网）（记者杜峰）近日，在四川自贡举行的“202...

2026-06-23 19:15:39

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯（记者魏蔚）9月20日，阿里云无影AI云电脑在2024云栖大会上展出，该版本基于最新的终端...

MWC2025荣耀多款AI技术... 人民财讯3月6日电，2025世界移动通信大会（MWC 2025）上，荣耀MagicBook Pro ...

原创 2... #春日生活好物种草季#近年来，笔记本电脑市场迎来技术爆发期，尤其在手机厂商跨界入局后，轻薄本在性能、...

摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息，摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...

摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息，作为国产GPU的杰出代表，摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...

微软 Azure AI 语音服... IT之家 8 月 23 日消息，微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...

谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息，谷歌于 8 月 27 日发布博文，宣布旗下 Gemini AI 支持...

青云QingCloud Kub... 日前，青云科技宣布开源 Thanos 的企业级发行版 Whizard，为企业带来真正高可用、可扩展、...

Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大的mac卸载工具，以帮助您完全卸载...

AMD锐龙AI 9 HX 37... 2024年6月3日，AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...