火速!寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源
创始人
2025-09-29 21:46:07
0

快科技9月29日消息,今天,DeepSeek宣布正式发布DeepSeek-V3.2-Exp模型。

新版本在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

就在同一天,寒武纪宣布已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。

开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。

寒武纪一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。

此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。

针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

寒武纪表示,依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。

相关内容

AI内容泛滥,“倒逼”长视...
春节至今,不到一个月的时间,影视娱乐行业迎来了两次重大事件。 一是...
2026-03-13 19:47:28
老板电器发布全球首款AI烹...
运营商财经网 赵鑫雨/文 当下,AI眼镜赛道热度飙升,科技巨头与创...
2026-03-13 19:45:57
谁来定义AI“懂物理”?
作者:王嘉翌 博士研究生 | 中国科学院大学 培养单位:中国...
2026-03-13 09:07:58
OpenClaw震动开源生...
今天分享的是:OpenClaw震动开源生态 报告共计:26页 20...
2026-03-13 09:07:32
打开AI短剧,我尴尬症犯了...
文 | 胡炜(新京报传媒研究院) “以前看短剧不用带脑子。现在看短...
2026-03-13 09:05:54
AI新物种,迎来生态破局时...
中国AI硬件大爆发, 谁在打通“技术-销量”闭环 文|徐鑫 编|任...
2026-03-12 22:50:51

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...