阿里通义宣布开源音频语言模型Qwen2-Audio,推出模型测评基准
创始人
2024-08-14 13:11:56
0

新浪科技讯 8月13日上午消息,阿里通义大模型再次宣布开源新模式,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。据悉,该模型在多个权威测评中明显超越先前最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。

据介绍,Qwen2-Audio是通义团队在音频理解模型上的新一步探索,相比前一代模型Qwen-Audio,新版模型有了更强的声音理解能力和更好的指令跟随能力。Qwen2-Audio具备语音聊天和音频分析两种使用模式,前者是指用户可以用语音向模型发出指令,模型无需自动语音识别(ASR)模块就可理解用户输入;后者是指模型能够根据用户指令分析音频信息,包括人类声音、自然声音、音乐或者多种信号混杂的音频。Qwen2-Audio能够自动实现两种模式的切换。

Qwen2-Audio支持超过8种语言和方言,如中文、英语、法语、意大利语、西班牙语、德语、日语,粤语。通义团队还同步开源了基础模型 Qwen2-Audio-7B 及其指令跟随版本Qwen2-Audio-7B-Instruct,用户可以通过Hugging Face、魔搭社区ModelScope等下载模型,也可以在魔搭社区“创空间”直接体验模型能力。(文猛)

责任编辑:江钰涵

相关内容

当趣网络科技申请 AI 交...
金融界 2025 年 5 月 14 日消息,国家知识产权局信息显示...
2025-05-14 11:17:16
Manus免费开放注册:下...
今天,曾炒至10万的Manus免费开放注册了。 符合这两年AI资讯...
2025-05-14 11:17:14
AI“一键成片”,是创新还...
本报讯 AI“一键成片”功能生成多个未被授权的短视频供用户使用,开...
2025-05-14 11:16:31
布局AI生态 字节系大模型...
5月13日,字节跳动旗下火山引擎开启上海站的大模型巡展活动,一批新...
2025-05-14 08:46:47
原创 ...
1 总台主持团化身AI体验官 演绎AI生活 近日,一条集结陈伟鸿、...
2025-05-14 06:48:06
巨人网络与字节跳动旗下火山...
5月13日,巨人网络与字节跳动旗下火山引擎开展AI领域的合作,社交...
2025-05-13 21:51:38

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...