观点网讯:3月27日,美团正式发布并全面开源原生多模态大模型LongCat-Next及其核心组件——离散原生分辨率视觉分词器(dNaViT)。
据介绍,该模型打破了当前大模型以“语言为中心”的传统拼凑式架构,将图像、语音与文本统一映射为同源的离散Token。通过纯粹的“下一个Token预测”(NTP)范式,新模型让视觉与语音成为AI的“原生母语”,标志着美团LongCat团队在通往物理世界AI的道路上取得重要进展。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
上一篇:原创 AI时代:为啥现在的教育还要拼“爹妈”,芬兰教育也不例外?
下一篇:中关村硬科技嘉年华开幕,国内首个全开源桌面Agent亮相|聚焦2026中关村论坛