最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数
创始人
2024-08-29 16:16:19
0

IT之家 8 月 29 日消息,Zyphra 于 8 月 27 日发布博文,宣布推出 Zamba2-mini 1.2B 模型,共有 12 亿参数,声称是端侧 SOTA 小语言模型,在 4bit 量化下内存占用低于 700MB。

IT之家注:SOTA全称为 state-of-the-art,并不是特指某个具体的模型,而是指在该项研究任务中,目前最好 / 最先进的模型。

Zamba2-mini 1.2B 虽然尺寸不大,但媲美包括谷歌 Gemma-2B、Huggingface 的 SmolLM-1.7B、苹果的 OpenELM-1.1B 和微软的 Phi-1.5 等更大模型。

在推理任务中,Zamba2-mini 的卓越性能尤为显著,与 Phi3-3.8B 等模型相比,Zamba2-mini 的首次令牌时间(从输入到输出第一个 token 的延迟)是此前的二分之一,内存占用减少了 27%。

Zamba2-mini 1.2B 主要通过高度优化的架构实现,融合了不同神经网络设计的优势,既能保持大型密集变压器的高质量输出,又能以更小模型的计算和内存效率运行。

与前代 Zamba1 相比,Zamba2-mini 的关键进步之一是集成了两个共享注意力层(attention layers)。

这种双层方法增强了模型在不同深度保持信息的能力,从而提高了整体性能。在共享注意力层中加入旋转位置嵌入也略微提高了性能,这表明 Zyphra 致力于在模型设计中进行渐进而有影响力的改进。

Zamba2-mini 是在一个包含三万亿个 token 的海量数据集上进行预训练的,该数据集来自 Zyda 和其他公开来源。

这个庞大的数据集经过了严格的过滤和重复处理,以确保获得最高质量的训练数据,并在退火(annealing)阶段对其进一步完善,其中包括在 1000 亿个质量极高的 tokens 上进行训练。

Zyphra 已承诺使 Zamba2-mini 成为 Apache 2.0 许可下的开源模型。

IT之家附上参考地址

相关内容

港股AI上市潮背后:这家游...
港股AI板块迎来上市潮,智谱AI和MiniMax等相继登陆港交所。...
2026-01-13 23:18:29
原创 ...
AI伴侣称得上是目前整个AI赛道为数不多经过验证的品类,然而在短暂...
2026-01-13 22:19:36
张文宏最新发声:拒绝把AI...
“在我们医院,我拒绝把AI引入病历系统”,1月10日,在香港举行的...
2026-01-13 19:17:48
宝信软件申请基于Linux...
国家知识产权局信息显示,上海宝信软件股份有限公司申请一项名为“一种...
2026-01-13 18:46:13
治好信贷AI的选择困难症
AI大模型如今在互联网上风头正劲,能写代码、作诗画图,甚至能高分通...
2026-01-13 18:45:52

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...