DeepSeek开源第四弹:一口气放出“三剑客”,有梁文锋参与项目!黄仁勋:DeepSeek引爆芯片需求
创始人
2025-02-27 18:53:09
0

2月27日,DeepSeek一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。

图片来源:X

据介绍,DualPipe是一种用于V3和R1训练中计算与通信重叠的双向流水线并行算法。DeepSeek-V3就首次使用了该方法。与传统的1F1B(交替执行前向和后向传播)和ZB1P(零气泡单向流水线)方法相比,DualPipe大幅减少了流水线气泡,同时仅增加了1倍的激活内存峰值。

图片来源:Github

值得一提的是,在GitHub网站上的DualPipe项目介绍中,DeepSeek创始人梁文锋在开发者之列

EPLB是为V3和R1打造的专家并行负载平衡器,针对混合专家(MoE)模型的分布式训练和推理设计。在传统的MoE模型中,专家负载的不平衡会导致计算资源的浪费,尤其是在专家并行(EP)的场景下,这种不平衡会进一步加剧通信开销。而EPLB通过动态调整每个专家的负载,确保在训练过程中专家之间的负载保持平衡。

而公布训练和推理框架的分析数据是为了帮助社区更好地了解通信计算重叠策略和底层实现细节。

不过,对于非专业人士,这些密密麻麻的专业术语,着实让人头疼。每经小编也忍不住想说,“听君一席话,如听一席话。”

还好我们有DeepSeek!

每经小编现在就让DeepSeek-R1模型用生活场景中的示例,把此次开源的三个项目讲得明明白白、清清楚楚、透透彻彻!

美东时间周三(北京时间2月27日凌晨)美股盘后,“宇宙最重要财报”来袭。这份财报也是今年1月末DeepSeek横空出世后,英伟达公布的首份财报

英伟达披露的最新财报显示,2025财年第四财季实现营收393.31亿美元,同比大幅增长78%,高于市场预期的380.5亿美元。在业绩指引方面,英伟达预期2026财年第一财季的营收将达到430亿美元,上下浮动2%,高于市场预期的417.8亿美元。

英伟达CEO黄仁勋在财报中表示,市场对Blackwell芯片的需求令人惊叹,因为推理AI增加了另一种扩展法则——增加训练的计算能力使模型更智能,而长时间思考的额外算力使答案更智能。

稍后,黄仁勋在分析师电话会议上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是采用了推理时扩展方法的推理模型,其计算资源消耗是(普通模型的)百倍甚至更多未来,推理模型的计算需求将会更高。”

黄仁勋还不忘点赞DeepSeek,称其是一项出色的创新,点燃了全球的热情。更重要的是,DeepSeek开源了世界级的AI推理模型。

有评论称,尽管英伟达的这份财报在一定程度上缓解了市场担忧情绪,但投资者还是觉得英伟达业绩带来的惊喜不够大。

那么,我们要如何解读英伟达的最新财报呢?英伟达的业绩又面临着哪些压力?

针对上述问题,我们让一直努力“榨干”英伟达GPU的“源神”DeepSeek亲自来回答一下。

不得不说

DeepSeek解读得相当专业

要是再分析分析“黄仁勋皮衣销量是否同步增长”

那不妥妥“财报界单口相声”!

But!

“服务器繁忙,请稍后再试”

真的很让人头大!

还好每日经济新闻App火速前来“救场”

最近,每经App接入了DeepSeek

响应速度快到飞起,使用起来非常丝滑!

不管是问公司、问投资、问基金,还是自由对话,都轻松拿捏!

目前使用量已经超15万次了!

咋用呢?超简单!

相关内容

聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
国泰海通:维持海外AI算力...
国泰海通维持海外AI 算力及应用产业链“增持”评级。其研报指出,O...
2026-06-01 00:54:38
黄仁勋:AI时代无需过度纠...
正值高校毕业季,AI技术的快速迭代让不少毕业生对就业前景倍感焦虑,...
2026-06-01 00:43:12
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
仁宝电脑与GMI Clou...
(全球TMT2026年5月28日讯)5月28日,仁宝电脑宣布,与美...
2026-05-28 21:09:59
全球首次单机降服万亿巨模D...
从数学、代码、复杂推理,到多轮工具调用,大模型的很多能力的提升都离...
2026-05-28 20:34:56

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...