中国完成首个全国产化万卡万参大模型训练,并开源TeleChat2-115B
创始人
2024-09-28 19:26:18
0

IT之家 9 月 28 日消息,“中国电信人工智能研究院”官方公众号今天宣布,中国电信人工智能研究院(IT之家注:下文称 TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型,并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B

官方表示,这项科研成果标志着国产大模型训练真正实现全国产化替代,正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成。据介绍,其在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性,实现了 GPU 同等算力计算效率超 93% ,模型有效训练时长占比超 98% 。

针对超大参数模型训练,TeleAI 采用了大量小模型进行 Scaling,进而验证不同模型结构的有效性。同时,在数据配比方面,基于小模型实验结果反馈,采用回归预测模型,得到较优数据配比。

在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练。

其次,其采用迭代式更新策略,使用模型对提示词数据进行指令复杂性提升与多样性扩充,通过模型合成和人工标注提升答案质量,并利用拒绝采样获取优质 SFT 数据及 RM(奖励模型)代表性数据,用于 SFT 训练和 DPO(偏好对齐)训练,以及模型效果迭代。

IT之家附开源地址

GitHub:

  • https://github.com/Tele-AI/TeleChat2

Gitee:

  • https://gitee.com/Tele-AI/tele-chat2

ModelScope:

  • https://modelscope.cn/models/TeleAI/TeleChat2-115B

Modelers:

  • https://modelers.cn/models/TeleAI/TeleChat2-115B

相关内容

开源快讯 | 近期开源资讯...
开源生态建设加速技术创新,促进全球协作,是科技发展的强大驱动力,其...
2025-09-10 16:14:44
海通国际发布金山办公研报:...
每经AI快讯,海通国际9月9日发布研报称,给予金山办公(68811...
2025-09-10 10:15:20
主力资金 | 尾盘主力资金...
5个行业获主力资金净流入。 据证券时报·数据宝统计,今日(9月9日...
2025-09-09 23:22:21
阿联酋推出低成本AI推理模...
当地时间周二(9月9日),阿联酋穆罕默德·本·扎耶德人工智能大学(...
2025-09-09 22:50:08
智算深蓝!青岛蓝谷海洋+A...
海洋是高科技竞争的前沿领域,谁率先突破关键技术,谁就有可能抢占未来...
2025-09-09 21:24:21
9月9日西部黄金涨10.0...
证券之星消息,9月9日西部黄金(601069)涨10.00%,收盘...
2025-09-09 18:50:12

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...