智谱GLM-4.6V系列多模态AI大模型发布并开源,API降价50%
创始人
2025-12-08 20:15:56
0

IT之家 12 月 8 日消息,智谱 AI 今日官宣发布并开源 GLM-4.6V 系列多模态大模型,包括:

  • GLM-4.6V(106B-A12B):面向云端与高性能集群场景的基础版;
  • GLM-4.6V-Flash(9B):面向本地部署与低延迟应用的轻量版。

作为 GLM 系列在多模态方向上的一次重要迭代,GLM-4.6V 将训练时上下文窗口提升到 128k tokens,在视觉理解精度上达到同参数规模 SOTA,并首次在模型架构中将 Function Call(工具调用)能力原生融入视觉模型,打通从「视觉感知」到「可执行行动(Action)」的链路,为真实业务场景中的多模态 Agent 提供统一的技术底座。

在性能优化之外,GLM-4.6V 系列相较于 GLM-4.5V 降价 50%,API 调用价格低至输入 1 元 / 百万 tokens,输出 3 元 / 百万 tokens。

同时,GLM-4.6V-Flash 免费开放使用

GLM-4.6V 即日起融入 GLM Coding Plan,针对用户 8 大类场景定向开发了专用 MCP 工具,模型可自主调用最匹配的接口。

智谱 AI 介绍称,传统工具调用大多基于纯文本,在面对图像、视频、复杂文档等多模态内容时,需要多次中间转换,带来信息损失和工程复杂度。GLM-4.6V 从设计之初就围绕「图像即参数,结果即上下文」,构建了原生多模态工具调用能力:

  • 输入多模态:图像、截图、文档页面等可以直接作为工具参数,无需先转为文字描述再解析,减少链路损耗。
  • 输出多模态:对于工具返回的统计图表、渲染后网页截图、检索到的商品图片等结果,模型能够再次进行视觉理解,将其纳入后续推理链路。

模型原生支持基于视觉输入的工具调用,完整打通从感知到理解到执行的闭环。这使得 GLM-4.6V 能够应对图文混排输出、商品识别与好价推荐、以及辅助型 Agent 场景等更复杂的视觉任务。

GLM-4.6V 在 MMBench、MathVista、OCRBench 等 30+ 主流多模态评测基准上进行了验证,较上一代模型取得显著提升。在同等参数规模下,模型在多模态交互、逻辑推理和长上下文等关键能力上取得 SOTA表现。其中,9B 版本的 GLM-4.6V-Flash 整体表现超过 Qwen3-VL-8B,106B 参数 12B 激活的 GLM-4.6V 表现比肩 2 倍参数量的 Qwen3-VL-235B。

智谱 AI 开放了 GLM-4.6V 的模型权重、推理代码与示例工程,IT之家附开源地址如下:

  • GitHub:https://github.com/zai-org/GLM-V
  • Hugging Face:https://huggingface.co/collections/zai-org/glm-46v
  • 魔搭社区:https://modelscope.cn/collections/GLM-46V-37fabc27818446

相关内容

智谱GLM-4.6V系列多...
IT之家 12 月 8 日消息,智谱 AI 今日官宣发布并开源 G...
2025-12-08 20:15:56
瞭望 | AI4S重塑科研...
在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学...
2025-12-08 18:16:14
从“工具”到“体验”:企业...
过去几年,中国数字经济迈入高速迭代期。无论是人工智能的产业应用,还...
2025-12-08 16:15:41
中信建投:AI大模型与应用...
瑞财经 严明会 近日,中信建投指出,DeepSeek V3.2发布...
2025-12-08 15:17:11
自变量机器人参与成立Rob...
2025年深圳国际人工智能展览会上,一台名为“小量”的机器人正有条...
2025-12-08 14:16:12
直播预告|开放模型时代:中...
在全球AI浪潮中,开源不仅是一种协作方式,更成为推动技术民主化、加...
2025-12-08 13:15:39

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...