Deepseek AI 模型升级推出 2.5 版,合并 Coder和 Chat
创始人
2024-09-06 09:21:08
0

IT之家 9 月 6 日消息,DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型已经合并升级,升级后的新模型为 DeepSeek V2.5。

图源: Linux.do论坛网友截图

DeepSeek 官方昨日(9 月 5 日)更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。

官方表示为向前兼容,API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。

新模型在通用能力、代码能力上,都显著超过了旧版本的两个模型。

新模型更好地对齐了人类的偏好,在写作任务、指令跟随等多方面进行了优化:

  • ArenaHard winrate 从 68.3% 提升至 76.3%
  • AlpacaEval 2.0 LC winrate 从 46.61% 提升至 50.52%
  • MT-Bench 分数从 8.84 提升至 9.02
  • AlignBench 分数从 7.88 提升至 8.04

新模型在原 Coder 模型的基础上进一步提升了代码生成能力,对常见编程应用场景进行了优化,并在标准测试集上取得了以下成绩:

  • HumanEval: 89%
  • LiveCodeBench (1-9 月): 41%

IT之家注:Deepseek AI 模型由杭州深度求索人工智能推出,该公司成立于 2023 年。

官方介绍如下:

专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,DeepSeek(深度求索)团队仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并且在 2024 年 1 月率先开源国内首个 MoE 大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。

相关内容

中外专家等在上海聚焦AI伦...
中新网上海7月29日电 (记者 陈静)随着AI技术的迅猛发展,全球...
2025-07-29 23:15:07
原创 ...
文/杨剑勇 信息科技以惊人的速度发展,并在每次科技变革中,都会涌现...
2025-07-29 23:13:09
万亿模型Kimi K2开源...
从“堆料”到“调度”:万亿参数如何学会只派精锐 深夜的北京,月之...
2025-07-29 22:43:10
阿里通义大模型迎“周年庆”...
“三年前,在世界人工智能大会(WAIC)上,我们正式发布了通义大模...
2025-07-29 22:43:04
阿里AI三连发重磅亮相世界...
IT时报记者 贾天荣 “我们正迎来‘Agent优先’时代。”7月...
2025-07-29 18:43:41
美国AI“雄心”面临系统性...
美国政府上周发布行动计划,宣称要以简化监管、鼓励创新等举措推动美国...
2025-07-29 10:43:21

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...