AI小龙阶跃星辰押注多模态模型,布局汽车、手机等应用场景
创始人
2025-02-22 20:21:36
0

2月21日,在“AI大模型六小龙”中一向低调的阶跃星辰在上海举办首届Step UP生态开放日。在开放日上,“开源”“多模态”“Agent”“视觉推理”等关键词被阶跃星辰创始人、CEO姜大昕频繁提及。

姜大昕提到,除了开源阶跃星辰近期发布的两款多模态大模型文生视频模型Step-Video-T2V和语音模型Step-Audio,阶跃星辰还将在3月份开源图生视频。

面向2025年这个Agent元年,阶跃星辰押注的方向是多模态与视觉推理模型。阶跃星辰官宣将智能终端Agent视为大模型技术落地的核心突破点,并重点布局汽车、手机、具身智能、IoT等关键应用场景。

多个核心模型已开源,即将开源图生视频模型

按照姜大昕的规划,阶跃星辰实现AGI的技术路线是模拟世界、探索世界和归纳世界。遵循着这样的路径,从2023年4月成立至今,阶跃Step系列模型矩阵已经发布了11款多模态大模型,覆盖语音识别、语音生成、多模态理解、图像及视频生成的全面能力。另外在今年1月,阶跃星辰发布了Step R-mini,成为Step系列的首款推理模型,进一步拓展了大模型的能力边界。

阶跃星辰创始人、CEO姜大昕在Step UP生态开放日上。

近期阶跃星辰发布了两款多模态大模型文生视频模型Step-Video-T2V和语音模型Step-Audio。其中,Step-Video-T2V参数量达到300亿,可直接生成 204帧、分辨率540P的高质量视频。而Step-Audio是行业内首个产品级的开源语音交互模型,该模型在汉语水平考试中的表现尤为突出。目前,两个模型皆已开源,姜大昕还预告,阶跃星辰将在3月份开源图生视频。

南都记者关注到,由DeepSeek引发的开源热正在席卷行业。近期,百度宣布百度文心大模型4.5将开源,月之暗面也首次在其关于注意力机制的论文中公布了相关代码。2月21日午间,DeepSeek还宣布从下周开始将开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”。

Agent爆发元年,押注多模态与视觉推理模型

姜大昕还提到,阶跃星辰内部正在研发相关视觉推理模型。“目前,视觉理解模型还停留在系统一也就是快思考的模型,然而视觉和文本一样,遇到复杂问题还是需要思维链和慢思考能力的。比如(导航时)沿着蓝色箭头行走我能到达哪个商店。我们要解决这个问题,就需要一步步跟着蓝色箭头移动,这是一个慢思考的过程。”

在姜大昕看来,2025年被称为Agent爆发元年,而阶跃星辰重点发展的慢思考和多模态能力也正是Agent发展的关键因素。“智能体的发展依赖于两大关键要素:一是多模态能力,让智能体充分地感知和理解世界,这样一来就能更好地理解用户的任务;二是推理能力,使智能体能够进行长思维链的慢思考,主动规划、尝试、反思,通过不断纠错提供准确的答案。现在机器的思考能力比较弱,只能思考几十秒钟,最多几分钟,随着模型能力的增强,思考的时间越来越长,范围越来越宽广,也意味着我们距离AGI的目标越来越近。”

另外,为赋能Agent应用开发者,阶跃星辰在此次大会上还发布了全新升级版的“繁星计划”。该项计划旨在为Agent应用开发者提供模型、算力、资本、数据和企业孵化等全方位支持。据悉,该计划自2024年7月正式启动以来,已涌现出20多个优质AI创业项目,其中包括国内首个面向C端用户的AI电商应用物圆以及冲上App Store美食类畅销榜前三名的胃之书。

布局智能汽车、手机、具身智能、IoT四大核心场景

在生态开放日上,阶跃星辰官宣将智能终端Agent视为大模型技术落地的核心突破点,并重点布局汽车、手机、具身智能、IoT等关键应用场景。

面向智能汽车,阶跃星辰宣布与吉利汽车集团、智能科技公司千里科技深化技术合作,共同推动“AI+车”的深度融合。千里科技董事长印奇在现场强调,“通过AI大模型、端到端智驾、驾舱融合等技术的突破,智能汽车的体验将实现从量变到质变的跨越。期待与吉利、阶跃一起,在模型优化、产品定义和软硬件研发等领域全面合作,共同打造更安全、更舒适的智能出行体验”。

OPPO智能助理部部长、小布助手负责人万玉龙在现场表示,随着新一代AI 技术与移动终端的深度融合,手机已经逐步进化为能够理解用户意图、提供主动服务,甚至预判用户需求的智能助理。

阶跃星辰官宣与手机厂商深度共建,将Agent技术深度集成到手机中,共同打造更好的交互体验。据介绍,基于阶跃Step系列多模态模型,目前OPPO已打造了“一键问屏”和“一键全能搜”两大创新性AI手机功能。用户使用小布助手App,可以通过多模态视觉跟AI交互,实现拍照问答、文档问答、识屏问答等多种功能。此外,用户只需对小布助手下达指令,AI就可以独立进入各种APP端完成任务,比如一键搜所有。

在具身智能方面,阶跃星辰宣布与智元机器人战略合作,共同探索AI+具身机器人应用场景;面向IoT终端,阶跃星辰通过生态开放的方式,与包括TCL在内的一系列IoT平台和设备厂商紧密协作,推动设备间的智能化升级和体验的无缝连接。

采写:南都记者 林文琪

相关内容

聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
国泰海通:维持海外AI算力...
国泰海通维持海外AI 算力及应用产业链“增持”评级。其研报指出,O...
2026-06-01 00:54:38
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
洞见DeepInsight...
天眼新闻
2026-06-01 00:37:37
德勤:聚焦AI驱动产业变革...
上证报中国证券网讯(记者 汪友若)5月27日,“2026德勤中国高...
2026-05-28 21:01:39
科大讯飞进军AI眼镜,内置...
新京报贝壳财经讯(记者罗亦丹)5月28日,科大讯飞在澳门威尼斯人金...
2026-05-28 20:46:43

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...