阿里通义宣布开源音频语言模型Qwen2-Audio，推出模型测评基准_linux资讯

阿里通义宣布开源音频语言模型Qwen2-Audio，推出模型测评基准

创始人

2024-08-14 13:11:56

0次

新浪科技讯 8月13日上午消息，阿里通义大模型再次宣布开源新模式，Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入，直接进行语音问答，理解并分析用户输入的音频信号，包括人声、自然音、音乐等。据悉，该模型在多个权威测评中明显超越先前最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准，相关论文已入选本周正在举办的国际顶会ACL 2024。

据介绍，Qwen2-Audio是通义团队在音频理解模型上的新一步探索，相比前一代模型Qwen-Audio，新版模型有了更强的声音理解能力和更好的指令跟随能力。Qwen2-Audio具备语音聊天和音频分析两种使用模式，前者是指用户可以用语音向模型发出指令，模型无需自动语音识别（ASR）模块就可理解用户输入；后者是指模型能够根据用户指令分析音频信息，包括人类声音、自然声音、音乐或者多种信号混杂的音频。Qwen2-Audio能够自动实现两种模式的切换。

Qwen2-Audio支持超过8种语言和方言，如中文、英语、法语、意大利语、西班牙语、德语、日语，粤语。通义团队还同步开源了基础模型 Qwen2-Audio-7B 及其指令跟随版本Qwen2-Audio-7B-Instruct，用户可以通过Hugging Face、魔搭社区ModelScope等下载模型，也可以在魔搭社区“创空间”直接体验模型能力。（文猛）

责任编辑：江钰涵

指令用户语言测评基准模型语音 Qwen 音频 -Audio 魔搭社区通义阿里

上一篇：AMD 6.65 亿美元收购 Silo AI；Genie 击败 Devin、GPT-4，刚获 250 万美元融资丨AI情报局

下一篇：Soul vs C.ai，AI社交赛道的下一个龙头会是谁

阿里通义宣布开源音频语言模型Qwen2-Audio，推出模型测评基准

相关内容

热门资讯