阿里云宣布Qwen2开源性能超美国开源模型Llama3_linux资讯

阿里云宣布Qwen2开源性能超美国开源模型Llama3

创始人

2024-07-22 23:13:59

0次

6月7日消息，阿里云今日宣布，比美国开源Llama3和中国闭源模型们更强的Qwen2今日开源，免费下载。阿里云表示：历经数月努力，我们很高兴迎来了Qwen系列模型从Qwen1.5到Qwen2的重大升级。这一次，我们为大家带来了：

* 5个尺寸的预训练和指令微调模型, 包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B；

* 在中文英语的基础上，训练数据中增加了27种语言相关的高质量数据；

* 多个评测基准上的领先表现；

* 代码和数学能力显著提升；

* 增大了上下文长度支持，最高达到128K tokens（Qwen2-72B-Instruct）。

Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务；Qwen2-7B-Instruct几乎完美地处理长达128k的上下文；Qwen2-57B-A14B-Instruct则能处理64k的上下文长度；而该系列中的两个较小模型则支持32k的上下文长度。

目前，上述Qwen2系列模型已在Hugging Face和ModelScope上同步开源。

阿里云强调，此次采用不同的模型许可。除了Qwen2-72B依旧使用此前的Qianwen License外，其余模型，包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B以及Qwen2-57B-A14B在内，均采用Apache 2.0的许可。我们希望本次开放程度的提升能够加速Qwen2在全球各地的落地及商业应用。

免责声明：

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证，并在此声明不承担信息可能产生的任何责任、任何后果。

2、本号非商业、非营利性，转载的内容并不代表赞同其观点和对其真实性负责，也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误，负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网，所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品，请与我们取得联系，我们会及时修改或删除。

美国阿里云系列信息声明长度模型上下文 Qwen 性能消息资讯 Qwen2

上一篇：心动公司早盘涨逾7% 近日获开源证券维持买入评级

下一篇：开发者盛赞微软开源 MS-DOS 4，但指出开源方式存在不足

阿里云宣布Qwen2开源性能超美国开源模型Llama3

相关内容

热门资讯

阿里云宣布Qwen2开源 性能超美国开源模型Llama3

相关内容

热门资讯

阿里云宣布Qwen2开源性能超美国开源模型Llama3