阿里云发布开源模型Qwen2
创始人
2024-07-28 06:11:24
0

北京商报讯(记者 魏蔚)6月7日,阿里云发布开源模型Qwen2-72B。通义千问团队披露,Qwen2系列包含5个尺寸的预训练和指令微调模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B为混合专家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分组查询注意力)机制。在中英文之外,模型训练数据中增加了27种语言相关的高质量数据。Qwen2还增大了上下文长度支持,Qwen2-72B-Instruct能够完美处理128k上下文长度内的信息抽取任务。

相关内容

美股收盘:三大指数齐创新高...
财联社9月12日讯(编辑 史正丞)昨夜今晨,伴随着大致符合预期的美...
2025-09-12 08:16:45
刚刚!美联储,降息大消息
【导读】美国通胀数据稳定,美联储2025年进一步降息的可能性增加 ...
2025-09-12 06:17:07
韩鹏:泽卡、克雷桑、高准翼...
直播吧9月11日讯 中超第24轮,泰山客场挑战申花,据望岳新闻报道...
2025-09-11 19:15:40
九寨沟一酒店大堂出现蝮蛇,...
▲社交平台传出的毒蛇照片 日前,一则“九寨沟一酒店大堂惊现毒蛇...
2025-09-11 17:45:45
王坚外滩大会分享:代码开源...
9月11日上午,2025 Inclusion・外滩大会在上海黄浦世...
2025-09-11 17:45:39
王兴兴最新发声:AI“干活...
9月11日,宇树科技创始人、CEO王兴兴在2025外滩大会上发表观...
2025-09-11 17:16:58

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...