DeepSeek开源周第三日 发布高性能通用矩阵乘法库
创始人
2025-02-26 11:51:24
0

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。

编辑 姜樊

校对 刘军

相关内容

敦煌九色鹿“活”了:AI文...
新春伊始,人民网·梦幻灵境AI展演中心(武汉)迎来一位特殊的“文化...
2026-02-21 10:51:10
中国AI全栈技术崛起引发全...
近期,OpenAI首席执行官萨姆·奥尔特曼对中国人工智能领域的全栈...
2026-02-21 08:51:29
Ubuntu 26.04 ...
Canonical 工程师 Utkarsh Gupta 代表 Ub...
2026-02-21 07:49:54
港股马年开市:AI、机器人...
澎湃新闻记者 孙铭蔚 2026年马年首个交易日,港股三大股指低开低...
2026-02-20 23:19:13
派遣5000人前往各国!美...
【文/观察者网 熊超然】在人工智能(AI)这条赛道上,目睹中国强势...
2026-02-20 20:19:23
私募最新调研图谱出炉!百亿...
春节前夕,在市场各方静待长假之际,私募机构却并未停歇,悄然展开了一...
2026-02-20 14:50:07

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...