科大讯飞“AI+机器人”产品全新升级
创始人
2025-10-29 19:45:13
0

当大模型的认知能力与具身智能的控制能力相融合,AI便从数字世界走进物理世界,机器人不再是“冰冷的机械”,而是成为我们“会思考、懂情绪的伙伴”。

10月28日,2025科大讯飞全球1024开发者节“AI+机器人”专场中,讯飞机器人超脑平台焕新升级,带来多人多模态降噪技术、高情商智能对话体验、连续指令精准响应、软硬件一体低门槛接入、具身智能全栈解决方案等核心技术突破。

同时,多位行业专家与大赛团队来到1024直播间,共同探讨机器人产业的创新机遇与应用前景,展示具身智能开发者的最新实践,释放AI赋能机器人生态的澎湃动能。

从“能动”到“能懂”

机器人交互的未来猜想

从春晚舞台上的灵巧舞者,到工厂生产线上的24小时“打工人”,机器人正以前所未有的速度渗透到公众视野和产业肌理之中。具身智能浪潮下,一个更深层次的挑战已然浮现:如何让机器人从“能动”真正进化到“能懂”?

当天,在一场关于机器人产业的深度对话中,36氪资深媒体人王玉阳(主持人)与讯飞机器人超脑平台负责人刘可为、杭州飞阔科技联合创始人刘炳政、北京人形/天工机器人大模型负责人鞠笑竹三位行业专家,共同探讨了这一产业热点背后的现实图景与未来路径。

从“能动”到“能懂”已成为人机交互的现实瓶颈。整个机器人产业正处于关键的行业探索期,核心命题是实现从实验室里的技术可行,跨越到实际场景下的稳定可用。过去的机器人,如工厂里的喷漆臂,只是执行固定、重复的指令。而现在的人形机器人,本质区别在于具备了自主决策的能力。它不再是简单地执行编码,而是要像人一样,实现感知、认知、决策、行动的完整闭环。

然而,在机器人运动能力飞速发展的同时,人机交互的体验却远远滞后。大众时常觉得机器人听不清,或者根本没发现用户在对它说话。

刘可为介绍,出现这一问题的原因仍是技术成熟度和场景适配的不足。要实现顺畅对话,机器人必须攻克至少四大难关:能在多人中精准判断谁在说话;能在嘈杂环境中听清说的是什么;能深度理解用户的真实意图;最后还要能做出高情商的回复。

仅仅是“能听得清”这第一步,就已困难重重。传统麦克风阵列技术高度依赖人与设备间相对固定的位置,一旦机器人与人一起移动,这套方法便会失效。刘炳政表示,机器人自身高速运动产生的噪声,以及它自己发声形成的回声干扰,都是业界亟须解决的难题。

从愿景到落地,打造机器人交互生态。在机器人产业中,交互是所有厂商的核心需求。但机器人厂商往往各自聚焦于本体、运控或场景落地,很少有精力去攻克人机交互这个既枯燥又具有极高技术挑战的领域。

讯飞机器人超脑平台正是在这一产业背景下应运而生。平台的理念是推动一个良性发展的产业格局,让大家做各自最擅长的事情。为此,平台提供了完整的一体化解决方案:

全链路能力一体化:平台将语音降噪、识别、理解、合成等全链路能力进行一体化集成。开发者无需再自行串联复杂的技术链路,同时平台保持开放,支持客户接入定制化的技能或第三方模型。

软硬一体化交付:针对机器人复杂的声学结构与集成难题,平台提供软硬一体的服务方式。例如通过智能语音背包等方案,机器人本体厂商无需进行复杂的声学结构改造,即可快速具备强大的交互能力,极大降低了接入成本。

作为平台语音交互链路的第一批用户,鞠笑竹表示,北京人形机器人创新中心深度集成了科大讯飞的交互链路,双方在合作中共同解决问题,推动技术落地。通过这种方式,科大讯飞正作为生态底座,帮助机器人产业真正迈过交互鸿沟,实现从“能动”到“能懂”的智慧进化。

展望未来,机器人的形态将呈现底层趋同、表层分化的趋势。人形机器人作为“皇冠上的明珠”,将持续牵引产业技术进步。个性化、情感化的交互体验将迎来质的飞跃,机器人有望自主探索学习,进化为聪明、有温度的智能伙伴。

机器人超脑平台全新升级

重构人机交互新体验

讯飞机器人超脑平台以讯飞超脑2030为技术底座,面向机器人厂商提供以多模态感知交互能力和大模型大脑为核心的AI服务,通过软硬件一体的形式助力厂商快速集成,让机器人快速具备能听会说、能理解、会行动的能力。目前,平台已服务122家整机机器人厂家和400家泛机器人企业,广泛应用于服务、工业、特种等多个领域。

基于已有的产业基础与技术沉淀,本次平台升级聚焦真实场景交互痛点与行业发展需求,带来多项核心进展:

多人多模态降噪技术突破:从单人多模态交互升级至开放场景下的多人多模态降噪,在-10信噪比、三人三米外多点噪声环境中,交互成功率达90%,三人语音分离率达87%。

高情商智能对话体验:从语音识别、对话理解到语音合成,通过情绪数据针对性训练,实现细腻情绪感知与表达,打造高情商的对话体验;区别于语音单模态理解,多模态理解结合了语音、手势行为和情绪等信息,任务理解准确性相对提升20%,交互延迟控制在1.6秒。

连续指令精准响应:支持单轮交互中多个连续指令的拆分与理解,响应延迟≤1.2秒,可适配客户定制指令集,无需强命令词即可控制机器人。

具身智能全栈解决方案:联合安徽聆动通用机器人科技有限公司推出LDT系列产品,搭建1:1真实场景训练场,提供从数据采集、模型训练到推理部署、效果评测的全流程服务。

软硬件一体低门槛接入:推出录音、语音交互、多模态交互及机器人主控的全系列模组,含智能语音背包等产品,适配人形机器人、机器狗等不同形态,大幅降低开发门槛。

从技术升级到场景落地,讯飞机器人超脑平台以多人多模态降噪技术升级与具身智能全栈方案为核心,赋能机器人快速实现自然高效的人机交互与物理世界适配能力,携手生态伙伴共推机器人产业智能化发展。

从思考到行动

具身智能开发者应用实践

从技术探索到应用落地,机器人加速推动AI走进物理世界。在行业实践中,将会遇到哪些挑战和困难?

杭州飞阔科技创始人李一言与联合创始人郭云飞来到1024直播间,分享了他们关于机器人创业的故事。作为高中同学,他们从拼装高达积木结识,并共同决定在具身智能领域打造一家有影响力的企业。飞阔的目标是赋予机器人会思考的大脑,让它从被动执行,走向主动感知和预判,从看懂场景听懂需求到交付结果。

通过大模型的智能决策能力,与本体制造商形成能力互补。凭借机器人头部安装的深度相机,拥有看见世界的能力。更为关键的是,多模态融合的天枢小背包则为他们提供了“聪明的大脑”,在直播间,安装了天枢智能背包的机器人,展示了如何成为展厅专属智能向导。

智元机器人语音交互负责人蔡文聪来到直播间,与科大讯飞产品专家共同探讨如何让人形机器人实现听懂与做到的技术话题。从语音识别、语音理解和动作控制的打通,机器人要求保证低延迟和高准确。科大讯飞致力于让机器人听懂,而智元专注让机器人做得到,具备天然的技术互补。

针对展厅、展会等高噪场景,如何去除噪声影响,精准识别用户指令?蔡文聪分享了与科大讯飞联合打造的技术方案 —— 通过摄像头拍摄到用户的唇形变动,结合麦克风阵列的语音识别,实现多模态语音识别与交互,提升机器人语音交互准确性。同时,结合真实场景下的噪音采集和数据训练,进一步优化降噪效果,打造在商场等开放环境,也能丝滑交互,表演唱跳RAP的效果。

AI开发者大赛路演

探索人机共生新未来

自2018年首届赛事至今,科大讯飞AI开发者大赛见证了AI创新从算法突破到产业落地的跃迁。今年,在“AI+机器人”的赛道上,参赛团队们将大模型能力注入具身智能、智能物流等领域,让AI真正赋能机器人,使人机共生的愿景,从概念走向现实。

杭州飞阔科技是面向早教与陪伴场景的AI儿童硬件赛道的冠军团队,作为人工智能具身领域的场景化解决方案提供商,自主研发的“FLY·天枢系统”具备自动建图、自主导航、自主避障、多模态语音交互和视觉识别等功能,支持多品牌机器人快速接入、无需改动硬件即可部署。同时,他们也是讯飞的生态投资企业,双方共同开发了语音背包系列产品。

金大智能创新科技是“基于情感感知与个性化陪伴的AI产品创新与应用赛道”冠军团队,他们坚持以AI技术为核心,专注人工智能机器人产品的研发与创新。基于自有的技术中心和生产工厂,实现从“创意到爆品”的高效转化,加速产品上市节奏,致力于成为机器人企业的「研产销合伙人」。目前团队已在AI教育、虚拟人、宠物机器人等领域推出多款产品。

合肥焕智科技作为科大讯飞江苏产业加速中心联合推优团队,致力于智能物流系统的研究,专注工业车辆的无人驾驶控制器,物流机器人,多车调度系统,自动化仓储,物流控制系统及智能物流整体解决方案的研发、生产销售和服务。依托讯飞AI技术,真正实现“AI+物流”,为工业企业构建“超脑”系统,让AI技术在智能物流领域实际落地。

精彩继续 共赴AI的星辰大海

10月30日—11月1日,2025科大讯飞全球1024开发者节将持续通过线上直播带来更多精彩内容,围绕大模型在教育、企业出海等领域的落地应用,分享行业前沿观点,展示产业生态创新实践。

11月2日—11月6日,线下盛会将正式开启,2025科大讯飞全球1024开发者节主论坛、开发者生态发布会、科博展、行业论坛、城市峰会、AI开发者大赛十佳团队展演及年度颁奖盛典等活动将如期举办。

以开源共建生态繁荣,科大讯飞正与全球开发者携手共创共享,共同见证“更懂你的AI”持续解放生产力、释放想象力!

*文中数据来源于实际应用

(科大讯飞)

相关内容

海康威视:物联感知+AI技...
证券之星消息,海康威视(002415)10月28日在投资者关系平台...
2025-10-29 21:16:12
科大讯飞“AI+机器人”产...
当大模型的认知能力与具身智能的控制能力相融合,AI便从数字世界走进...
2025-10-29 19:45:13
免费AI搜索引擎优化工具哪...
上周,朋友跟我抱怨:"我们产品在Google排名挺靠前,可Chat...
2025-10-29 17:14:24
AtomGit全新开启:共...
日前,“共建·共智·共享——AtomGit全新升级暨人工智能开源社...
2025-10-29 16:15:08
AI原生影视工作室,定义未...
作者|尖椒 “今天与地球视频直播的计划绝不能受影响,让我再试一次!...
2025-10-29 15:44:18
荣旗科技等成立新公司,含A...
人民财讯10月29日电,企查查APP显示,近日,宏旗荣锂科技(苏州...
2025-10-29 15:15:02

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...