阿里通义大模型继续开源,Qwen2系列开源家族新增音频语言模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行语音问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。
通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。
上一篇:CentOS服务器如何安装DHCP服务
下一篇:长江证券:OpenAI推出API新功能“结构化输出”,国内厂商发力开源多模态