Deepseek AI 模型升级推出 2.5 版,合并 Coder和 Chat
创始人
2024-09-06 09:21:08
0

IT之家 9 月 6 日消息,DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级,升级后的新模型为 DeepSeek V2.5。

图源: Linux.do论坛网友截图

DeepSeek 官方昨日(9 月 5 日)更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。

官方表示为向前兼容,API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。

新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。

新模型更好地对齐了人类的偏好,在写作任务、指令跟随等多方面进行了优化:

  • ArenaHard winrate 从 68.3% 提升至 76.3%
  • AlpacaEval 2.0 LC winrate 从 46.61% 提升至 50.52%
  • MT-Bench 分数从 8.84 提升至 9.02
  • AlignBench 分数从 7.88 提升至 8.04

新模型在原 Coder 模型的基础上进一步提升了代码生成能力,对常见编程应用场景进行了优化,并在标准测试集上取得了以下成绩:

  • HumanEval: 89%
  • LiveCodeBench (1-9 月): 41%

IT之家注:Deepseek AI 模型由杭州深度求索人工智能推出,该公司成立于 2023 年。

官方介绍如下:

专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,DeepSeek(深度求索)团队仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并且在 2024 年 1 月率先开源国内首个 MoE 大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。

相关内容

为什么是小鹏,看起来更像一...
(本文系紫金财经原创稿件,转载请注明来源) 最近,小鹏汽车一年一度...
2025-11-12 10:16:01
科股早知道:AI编程有望成...
1、火山引擎正式发布豆包编程模型,AI编程有望成为B端最先崛起的A...
2025-11-12 08:46:08
Zen 7 首度现身 AM...
IT之家 11 月 12 日消息,AMD 在最新的财务分析日(Fi...
2025-11-12 07:45:16
业内探索以“物理AI”驱动...
人民网北京11月11日电 (记者孙阳)近年来,人工智能(AI)浪潮...
2025-11-11 19:15:21
科学与健康|“医学+AI”...
新华社北京11月11日电 题:“医学+AI”视角看健康中国新图景 ...
2025-11-11 18:16:53
华西证券:关注工业智造相关...
瑞财经 严明会 近日,华西证券研报表示,通用高频场景基本完成布局,...
2025-11-11 18:16:17

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...