DeepSeek“开源周”，连续掏出两大核心武器_linux资讯_linux办公网

DeepSeek“开源周”，连续掏出两大核心武器

创始人

2025-02-25 12:49:58

0次

今天是DeepSeek“开源周”第二日，DeepSeek宣布开源DeepEP，第一个用于MoE模型训练和推理的开源EP通信库。

昨天，DeepSeek则开源了代码库Flash MLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化。

MoE（混合专家架构）和MLA（多头潜在注意力机制）被认为是DeepSeek以低成本实现杰出表现的核心原因。

简单理解，MoE架构是由多个专注于垂直技能的专家模型分工协作来实现最终输出结果，训练成本和推理成本更低。有消息称，GPT-4就使用了MoE架构，由8个220B模型组成。但MoE架构的缺点之一是会增加通信成本。

DeepEP通信库就是针对通信环节的优化，其特点包括：高效、优化的全员沟通；节点内和节点间均支持 NVLink 和 RDMA；用于训练和推理预填充的高吞吐量内核；用于推理解码的低延迟内核；原生 FP8 调度支持；灵活的 GPU 资源控制，实现计算-通信重叠。

MLA则是让模型预测更远位置的token，从而增强语义理解能力。DeepSeek的Flash MLA专为英伟达Hopper GPU打造了高效MLA解码内核，特别针对变长序列进行了优化。

推理架构 DeepSeek 通信核心模型训练内核支持解码 MoE 开源周 Flash

上一篇：绿联NAS搭建macOS最新系统，无痛白嫖苹果

下一篇：刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

相关内容

部队官兵应该如何使用AI？...

武警广西总队某支队引导官兵正确使用AI—— 莫让“AI帮手”成泄密...

2026-07-12 23:29:42

工信部警示Claude C...

2026年7月8日，工业和信息化部网络安全威胁和漏洞信息共享平台发...

2026-07-12 10:40:54

AI智能体加速落地

今年以来，国内AI智能体不再局限于技术展示和辅助工作，加快走进实体...

2026-07-12 10:35:10

原创 ...

每天 110 万次「一键修复」背后，藏着什么？撰文|蓝洞商业赵...

2026-07-11 22:56:48

本地部署AI热潮来袭，三星...

当OpenClaw龙虾在深夜自动梳理千份合同，当LLM大模型在桌面...

2026-07-11 17:25:59

开源模型赢了 Token ...

作者｜褚杏娟周一，Decagon CEO Jesse Zh...

2026-07-11 17:19:47

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯（记者魏蔚）9月20日，阿里云无影AI云电脑在2024云栖大会上展出，该版本基于最新的终端...

MWC2025荣耀多款AI技术... 人民财讯3月6日电，2025世界移动通信大会（MWC 2025）上，荣耀MagicBook Pro ...

摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息，作为国产GPU的杰出代表，摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...

原创 2... #春日生活好物种草季#近年来，笔记本电脑市场迎来技术爆发期，尤其在手机厂商跨界入局后，轻薄本在性能、...

微软 Azure AI 语音服... IT之家 8 月 23 日消息，微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...

摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息，摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...

谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息，谷歌于 8 月 27 日发布博文，宣布旗下 Gemini AI 支持...

Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大的mac卸载工具，以帮助您完全卸载...

青云QingCloud Kub... 日前，青云科技宣布开源 Thanos 的企业级发行版 Whizard，为企业带来真正高可用、可扩展、...

8月20日基金净值：前海开源中... 证券之星消息，8月20日，前海开源中国稀缺资产混合A最新单位净值为1.43元，累计净值为1.43元，...