观点网讯:8月13日,阿里巴巴旗下的通义团队宣布开源音频语言模型Qwen2-Audio,并入选国际顶级会议ACL2024。
Qwen2-Audio作为Qwen2系列开源家族的新成员,具备直接处理语音问答的能力,无需依赖文本输入。该模型能够分析人声、自然音和音乐等音频信号。在多个权威测评中,Qwen2-Audio的表现达到了行业领先水平。
此外,通义团队还发布了一套新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。
来源:观点网
上一篇:Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
下一篇:CPU反超NPU,llama.cpp生成速度翻5倍!LLM端侧部署新范式T-MAC开源