字节跳动开源了多模态AI Agent UI-TARS的最新1.5版本。与上一代相比,1.5版本在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。在计算机使用方面,OSworld测试得分为42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最高水平38.1;Windows Agent Arena得分为42.1,远超之前的29.8。
上一篇:安切洛蒂:巴萨看似更强 但将皇马描绘成决赛中的弱势方略显夸张
下一篇:AI时代,阅读该如何平衡深与浅