AI创新潮涌,中国电信技术攻坚与多元应用齐飞
创始人
2024-11-15 12:20:12
0

中国电信在人工智能领域动作频频,展现出强大的创新实力。星辰语义大模型正是由中国电信创新研发并不断迭代突破。TeleChat2系列是在星辰语义大模型TeleChat发布以来推出的第二代版本。近日,权威大模型评测基准SuperCLUE发布最新《中文大模型基准测评2024年10月报告》。其中,由中国电信打造的星辰语义大模型TeleChat2,作为央企大模型代表,凭借出色效果,综合能力位列大模型第一梯队。TeleChat2在理科“工具调用”维度排名前二,在Agent智能体总榜排名并列第二。

TeleChat2-35B则以更小参数量和更佳效果获得开源模型排行榜铜牌,综合效果超过Llama-3.1-70B-Instruc和 Llama-3.2-90B-Instruct等较大参数模型。

今年9月,TeleAI正式发布并开源了首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 TeleChat2-115B,近日又进一步开源了TeleChat2-3B、7B和35B,以适配不同场景的应用需求,构建了全尺寸大模型开源布局。

提升模型效果,展现优秀能力

本次最新的SuperCLUE10月报告覆盖43个国内外有代表性的大模型,采用多维度、多层次的综合性测评方案,由理科、文科和Hard任务三大维度构成,评测题目总量超过2900道。理科任务方面,TeleChat2展现了极强的函数调用能力,在工具调用维度排名前二。文科任务方面,TeleChat2在语言理解、长文本等维度表现突出。Hard任务方面,TeleChat2在指令遵循维度表现优异,展现了优秀的复杂推理能力。

为了提高模型性能,TeleAI团队在数据维度和后训练阶段进行了优化。在数学能力方面,通过抽取知识点合成问答数据,并结合数学RM(奖励模型)筛选高质量数据。在代码能力方面,抽取高质量代码函数合成功能实现代码,并通过单元测试确保代码质量。对于指令遵循能力,通过指令进化构建大量数据并进行脚本校验,从而大幅提升模型效果。在后训练阶段,通过模型微调、权重融合和DPO(直接偏好优化)进一步提升效果。微调阶段,使用IFD(指令跟随难度)和 RFT(拒绝采样微调)筛选数据,并迭代优化模型。权重融合阶段,结合多个模型的优势获得新权重。DPO优化阶段,专注于中等难度问题,迭代补齐模型能力。

不仅如此,TeleChat2系列模型还完成了Agent能力建设,重点加强了模型在指令跟随、任务拆解、工具调用等方面的能力和表现。在10月的SuperCLUEAgent总榜中,TeleChat2排名并列第二。

TeleAI团队构建了一个基于图结构和MutltiAgent(多智能体)的框架,通过细分工具场景,创建详细的依赖关系图,从而提升训练数据的真实性和复杂度。

同时,利用MultiAgent的增强交互多样性,并通过规则检查,确保交互合理。此外,团队还将工具调用能力分为多个阶段,为每个阶段设计多样化数据,以避免模型仅学习表面格式,这使得模型效果提升了约15%。

为产业持续输送领先的技术能力,加速应用落地

TeleAI始终积极通过开源推动大模型技术创新和国产化进程,并为产业持续输送领先的技术能力,加速应用落地。早在今年前半年,就陆续开源了1B、7B、12B和52B参数的第一代TeleChat系列模型。最近,TeleChat2系列也已完成 3B、7B、35B和115B模型开源,逐步构建了全尺寸开源布局,并吸引了国内外广大开发者的讨论和使用。

凭借卓越的性能和开源生态贡献,星辰语义大模型在 Gitee开源社区获得了“GVP-Gitee最有价值开源项目”。前不久,星辰大模型还被中国信息通信研究院(信通院)授予“可信开源大模型成熟度能力”认证和“2024年度央国企开源项目典型案例”称号。

目前,星辰语义大模型系列已在政务服务、智慧教育、经营分析、公文写作等领域广泛应用落地。在政务场景,星辰语义大模型已应用于智能知识库、智能受理助手、智能分类助手、智能客服机器人、智能语音坐席助手等,助力政务工作提升工作效率。在教育领域,星辰语义大模型落地教育听力机,辅助学生进行英语口语对话练习、中英文写作、中文诗歌创作等,提升他们的学习兴趣和个性化体验。在智慧办公场景,基于星辰语义大模型的超强语义理解和总结能力,星辰慧记一站式会议助手能够一键提炼会议纪要,实现会后总结秒生成,推动企业更高效、更智能发展。这表明,凭借不同的参数配置和灵活的架构设计,TeleChat2系列模型可灵活适配于不同应用场景、不同资源配置、不同延时条件、不同响应速度的多样化需求。

在本次参选SuperCLUE10月榜单的43个大模型企业中,TeleAI是唯一的央企大模型机构,同时TeleChat2系列大模型是基于全国产化万卡集群和国产深度学习框架训练完成。

在这背后,不仅体现了中国电信在技术创新上的实力与担当,也为推动我国人工智能产业的发展注入了强大动力。

(记者 张颖洁)

相关内容

具有“开源精神”的投研团队...
导读:2025年大概率是人工智能真正的元年。在这一年的春节前后,D...
2025-08-01 18:12:04
一次美国自驾,看清中美AI...
文 | 南七道 2025年7月,我和好友吕伟胜,在美国自驾400...
2025-08-01 12:43:45
大模型落地冷热之局:工业何...
除了工业场景固有的复杂性和严肃性,工业AI与物理世界紧密关联,涉及...
2025-08-01 12:13:29
AI+金融,如何跨越大模型...
文|光锥智能 当AI大模型已开始走向千行百业之时,备受看好的金融...
2025-08-01 12:13:13
聚势启新·共筑AI安全——...
2025年7月28日,在2025世界人工智能大会期间,全球领先的专...
2025-08-01 12:12:53
AI眼镜有望成为AI应用的...
据媒体报道,Meta CEO马克·扎克伯格(Mark Zucker...
2025-08-01 09:41:33

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...