新榜讯 12日晚,DeepSeek发布了新论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度)。此论文由北京大学与DeepSeek携手完成,合著作者中出现梁文锋的名字。论文提出了条件记忆(conditional memory)概念,通过引入可扩展的查找记忆结构,在同等参数、同等算力条件下,大幅提升了模型在知识调用、推理、代码、数学等任务方面的表现。与此同时,DeepSeek还开源了相关记忆模块Engram。