2月26日消息,今天凌晨3点,微软在官网开源了多模态AI Agent基础模型——Magma。与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,例如,用户可以用Magma来自动下电商订单、查询天气;也可以自动操作实体机器人,或者下真实象棋时获得帮助。
此外,Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。(钛媒体)
上一篇:早资道 | 阿里万相视觉生成大模型正式开源;微信支持在电脑上收红包
下一篇:DeepSeek开源第三弹,300行DeepGEMM代码开源!仅支持英伟达Hopper架构运算,代码库设计非常简洁