智能硬件正从传统的屏幕交互向人工智能原生界面转变,这一变革为行业带来了新的发展机遇。10月28日,在科大讯飞全球1024开发者节“AI+智能硬件”专场上,讯飞AIUI交互平台实现持续升级,围绕语音、视觉、语义理解等多模态能力展开深度融合,展示了全新的语音大模型、交互大模型、类人记忆系统及儿童专属交互方案,致力于与各方共同构建门槛更低、效率更高的智能交互新范式。
在AI开发者大赛展演现场,来自全球3万余支参赛团队的优胜者登台亮相,带来了智能眼镜、AR头显、智慧交通、四足机器人等前沿创新成果,展现出AI与智能硬件融合的无限想象空间。
秒级响应 深度懂你
AIUI人机交互平台升级
2025年,AIUI开放平台升级至大模型极速超拟人交互阶段,不仅支持超多轮连续对话、AI人格、共情交互、长时记忆、驱动数字人等能力,还可接入三方智能体、开源及私有大模型,全链路响应耗时仅1.6秒,为智能硬件语音交互带来颠覆性体验变革。
AIUI以全双工交互重塑自然对话体验。创新融入大模型VAD技术,依托上下文语义精准识别用户对话意图,实现流畅连续交互;还具备情感贯穿能力,能通过捕捉语气、语调预判用户情绪,让大模型输出更具情商的回复;同时搭配超拟人合成技术,让机器回应满含人情味。
在场景化交互方面,AIUI基于千万级精标文本数据与音频数据,打造出适用于人机交互的场景交互大模型;结合深度优化的工程链路,设备的意图理解能力显著增强,还采用更贴近真实沟通习惯的渐进式对话模式,确保交互过程精准且高效。
AIUI构建了强大的类人记忆系统,让硬件成为“成长的陪伴搭子”。该系统具备10轮以上的对话记忆能力,能总结用户喜好并生成个性画像,从而给出更贴合用户需求的友好回复;更能记录关键事件并将其转化为长时记忆,推动硬件从单纯的机器向有温度的伙伴进化。
针对大模型可能导致语音交互链路耗时增加的问题,AIUI通过全流式对接和特定任务的小模型训练,将链路耗时优化到1.6秒,真正让交互过程变得流畅丝滑,带来更快的交互体验。
在具体场景落地中,AIUI开放平台已展现出强大的赋能价值。在机器人领域,讯飞机器人超脑平台面向人形、仿生等各类机器人,提供视听融合的感知交互能力;其首创的机器人智能“语音背包”方案,可让机器人即插即用、“轻松开口”。在儿童领域,平台打造了童声识别引擎和童语理解模型,能提供准确的语音识别与理解能力;该模型以儿童科学成长理论为基石,在保证内容健康的同时对孩子进行积极引导,助力孩子在趣味交互中全面成长。
如今,AIUI正成为万千智能硬件的交互中枢,让更懂用户的AI伙伴走进千行百业。
拟人交互 灵活定制
解码AIUI平台新特性
讯飞AIUI人机交互开放平台,是以自然语言理解为核心,能提供从“录音降噪-语音识别-大模型理解-语音合成”全链路能力与解决方案的一站式技术平台。自2023年起,在大模型的加持下,平台能力持续升级,目前,平台单次对话交互轮数较此前上涨5倍,对话字数翻倍,家庭和儿童场景的硬件产品交互量也显著增长,涨幅分别达60%和700%,这两大场景已成为平台深度覆盖的核心领域。
基于AIUI平台的升级,智能硬件不仅能与用户聊天,还能听懂并执行指令,再加上大模型的助力,AIUI的智能化水平进一步提升,在直播中,平台的新特性也得以全面展示。
交互体验全面升级:平台深度融合大模型技术,支持多款模型灵活接入。其中,专为儿童设计的交互大模型,具备情绪理解、话题引导与童言适配能力;整体交互轮次与对话自由度显著提升,带来更自然的沟通体验。
角色自定义更灵活:平台提供覆盖全风格的95种音色库,从小孩到长辈、可爱到沉稳的风格均有包含。用户可自定义角色人设、音色与回复风格,结合声音复刻技术,能直接打造品牌专属的AI IP形象。
工具与智能体强化赋能:平台已集成问答库、智能体工作流、外部工具接入等核心能力。可支持设备指令控制、知识精准问答与多任务串联,真正实现从“能聊天”到“懂执行、有知识、会思考”的能力跨越。
从大模型驱动的流畅交互到灵活的角色自定义,从精准的知识问答到多元的智能体赋能,再到家庭陪伴、儿童教育及智能硬件开发等领域,讯飞AIUI开放平台始终以更智能、更灵活的语音交互能力全程赋能。
AI开发者大赛路演
见证创新力量的崛起
从2018年首届赛事至今,科大讯飞AI开发者大赛已共建超过580道高质量赛题,累计吸引全球超18万支团队角逐。在AI+智能硬件的赛道上,参赛团队们将大模型能力融入现实应用,在智能眼镜、AR头显、智慧交通、四足机器人等领域,探索AI赋能智能硬件的无限潜能,也为未来的人机共生打开了更多想象的空间。
南京魔数团信息科技,成为问鼎“基于增强现实与多模态交互技术的AI智能眼镜产品赛道”的冠军团队。针对AR硬件落地应用周期长的问题,他们聚焦B端市场,推出了Teamhelper+AI开发平台,通过集成常用应用和标准化SDK封装等方式,减少开发时间和成本,提高落地效率。目前,产品体系已全面融合AI能力,兼容全球主流大模型,助力AR眼镜实现交互效率和服务变革。
上海火离科技,是今年AI开发者大赛评委会联合推优的团队,他们在AR行业拥有丰富产品与技术积累。聚焦工业级和消费级产品创新,在工业场景研发了AR头戴设备,用AI技术打造外挂大脑,赋能一线员工;在青少年防近视场景,则推出了健康护眼的儿童专属AI终端,通过将屏幕放大到桌面距离解决近距离观看问题。
智丽显示技术深圳团队,则是今年“大模型赋能下的智慧交通创新应用赛道”的冠军团队,他们开发了FSHD场序显示技术。该技术以成熟的国产供应链和全新的理论构架为基础,在保留LCD低成本优势的同时,将亮度、色彩、分辨率提升至接近OLED水平,可应用于AR/VR、车载HUD、投影机等场景。
香港中文大学纪祥团队,作为2025AI开发者大赛评委会联合推优团队,带来了Spark生态赋能四足机器人巡检与孪生操控系统项目,致力于打造基于星火多场景模型矩阵赋能四足机器人校园安全巡检和孪生操控平台。在边缘端,他们打造了多地形低成本的四足机器人平台,实现多地形自主巡检和基于雷达的自主导航。在云端,引入星火模型矩阵,实现多模型的调度。在网页端,打造机器人云孪生控制平台,实现机器人的远程控制和数据在线评估存储。
精彩继续
共赴AI的星辰大海
10月29日—11月1日,2025科大讯飞全球1024开发者节将持续通过线上形式带来更多精彩内容,围绕大模型在机器人、教育、企业出海等领域的落地应用,分享行业前沿观点,展示产业生态创新实践。
11月2日—11月6日,线下盛会将正式开启,2025科大讯飞全球1024开发者节主论坛、开发者生态发布会、科博展、行业论坛、城市峰会、AI开发者大赛十佳团队展演及年度颁奖盛典等活动将如期举办。
从开源共建生态繁荣,科大讯飞正与全球开发者携手共创共享,共同见证“更懂你的AI”持续解放生产力、释放想象力!
*文中数据来源于实际应用
(科大讯飞)