豆包大模型团队发布并开源UI-TARS-1.5,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
上一篇:AI早报 | 智谱获2亿元追加投资;马斯克的Grok新增“记忆”功能
下一篇:【法眼观察】对利用AI技术造谣者“零容忍”