4月29日未来图灵发现,阿里云发布新版Qwen3系列模型并全部开源8款「混合推理模型」。
据介绍,本次开源包括2个MoE模型和6个dense模型,参数量从0.6B到235B。与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等其他顶级模型相比,旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评估中取得了有竞争力的结果。通义千问还表示,Qwen3模型推理能力大幅提升,在数学、代码和逻辑推理等评测中,达到同规模业界SOTA水平。
此前,4月28日,阿里通义千问开源负责人林俊旸在X平台发文暗示,Qwen3模型有望于4月29日正式发布。而在4月29日凌晨,模型在通义千问正式上线。
据悉,Qwen3系列模型曾在阿里巴巴旗下Model Scope(魔搭)社区短暂上线,包含Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款型号,均采用ApacheLicense2.0开源协议。