印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配
创始人
2026-02-02 19:20:37
0

智东西

作者 | 王涵

编辑 | 心缘

智东西2月2日报道,今日,阶跃星辰Step 3.5 Flash开源并上线,该模型在Agent场景和数学任务上能力逼近闭源模型,能够胜任复杂、长链条任务,是阶跃星辰迄今最强的开源基座模型

Step 3.5 Flash开源页面(来源:Hugging Face)

就在上周,阶跃星辰宣布由旷视科技联合创始人、千里科技董事长印奇正式出任董事长,并完成华勤、腾讯等参投的超50亿元B+轮融资。这也是印奇履新后,阶跃星辰在开源模型领域的首个大动作。

在智能密度对比图中可以看出,Step 3.5 Flash以约200B的参数量,取得了81.0的分数,在所有模型中智能密度最高。在单请求代码类任务中,Step 3.5 Flash的推理速度最高可达到350TPS。

智能密度对比图

Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计1960亿参数),在保证模型能力的同时提升推理效率。

包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配。

开源地址:

GitHub:

https://github.com/stepfun-ai/Step-3.5-Flash/tree/main

Hugging Face:

https://huggingface.co/stepfun-ai/Step-3.5-Flash

一、性能全面逼近闭源大模型,最高推理速度达350TPS

在基准测试成绩上,推理能力方面,Step 3.5 Flash在AIME 2025、IMOAnswerBench、HMMT 2025等数学竞赛级任务中分别取得了97.3、88.8、96.2的分数,均排名第二,Step 3.5 Flash开启Parallel Thinking后的增强性能排名第一

在编码能力上,Step 3.5 Flash在LiveCodeBench-V6测试中得分86.4,排名第三,开启Parallel Thinking后,其仅次于Gemini 3.0 Pro。

在智能Agent能力上,Step 3.5 Flash在BrowseComp测试中得分69.0,仅次于kimi K2.5;在xbench-DeepSearch测试得分54.0,仅次于GPT-5.2 xhigh

基准测试成绩

该模型采用稀疏混合专家(MoE)架构,总参数量达1960亿,单个token仅需激活约110亿参数

针对长文本处理场景,Step 3.5 Flash三路多Token预测(MTP-3)技术,Step 3.5 Flash在典型使用场景中实现了每秒100-300个token的生成吞吐量,在单请求代码类任务中峰值可达350TPS

在长上下文任务中,模型仅聚焦关键信息区域,降低冗余计算开销,可支撑256K长度的长文本理解与生成。

据官方介绍,Step 3.5 Flash专为智能体任务构建,集成了可扩展的强化学习框架以实现持续的自我改进。

该模型通过采用3:1滑动窗口注意力(SWA)比例,即每层全注意力层配以三层SWA层。这种混合方法确保模型在处理海量数据或长代码库时性能稳定,同时降低了标准长上下文模型通常所需的计算开销

针对可访问性优化,Step 3.5 Flash可以在高端消费级硬件,如Mac Studio M4 Max、NVIDIA DGX Spark等上安全运行,确保数据私密性的同时不牺牲性能。

二、几秒算出等差数列,还能一句话搭建可视化平台

智东西第一时间上手体验,首先数学方面,我们先考考Step 3.5 Flash一个把很多大模型都难倒了的问题:9.9和9.11谁大?Step 3.5 Flash几乎立刻就给出了思考过程和正确答案,但是在回答中出现了将9.9误输出为99.9的错误。

9.9和9.11比大小

那再复杂一些的数学题呢?阶跃星辰官方给出案例,Step 3.5 Flash可以快速计算复杂数学题并输出正确答案。

Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³+2³+…+10³的和;1!+2!+3!+4!+5!的和;2^10+3^5的和;√144+∛125+⁴√16的和。

快速计算复杂数学题

在智能体编程方面,Step 3.5 Flash可以基于一段文字prompt自动编程输出可视化平台结果。

我们让Step 3.5 Flash生成一个模拟海浪平台,可以看到,其生成的可视化平台可以调节海浪的频率和形态,还可以调整摄像头的位置,生成效果基本符合要求。

生成模拟海浪平台

官方给出了一个生成气象情报仪表盘的例子:

Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制WebGL 2.0引擎,可实时处理超过15000个动态节点及WebSocket遥测数据流。

生成结果显示,Step 3.5 Flash展现出了构建低延迟数据管道与高性能地理空间可视化系统的能力

生成气象情报仪表盘

Step 3.5 Flash也原生支持多智能体架构,其中一个主智能体通过自主规划和动态路由来协调复杂任务。

这个分层框架会派遣专门的“搜索”和“验证”智能体,通过并行工具调用循环来处理信息检索和事实核查。为确保精确性,一个“总结”智能体会将每个子智能体的执行轨迹整合为结构化反馈,使主智能体能够综合生成最终连贯的响应。

多智能体深度研究

Step 3.5 Flash还可以端云结合,简化本地端执行流程。例如,用户提出对比Mac Mini M4在各平台的价格。

Step 3.5 Flash作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。随后Step 3.5 Flash汇总结果,识别出拼多多为最低价平台,并提供购买指南。

这种云端规划显著降低了本地Step-GUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率。

对比Mac Mini M4在各平台的价格

结语:Agent能力成为新战场

无论是阶跃星辰Step 3.5 Flash的开源,还是此前月之暗面Kimi K2.5的发布,都指向了Agent的能力,阶跃星辰官方还透露已经开启Step 4模型的训练,同样是Agent基础模型。

Agent要求模型具备深度的逻辑推理、任务拆解、规划执行和工具调用能力,对模型“大脑”的性能要求更高。

模型大脑的技术迭代加速了AI技术的实用化进程,或将催生更强大的生产力工具,并可能围绕智能体形成新的竞争格局。

相关内容

现场直击 | 构建 AI ...
导语 在生成式 AI 时代,AI 正从底层重构生产力与商业逻辑,而...
2026-02-02 19:47:09
凌云光:公司AI产品已开始...
凌云光在互动平台表示,公司基于“AI+视觉”核心技术,深度布局工业...
2026-02-02 19:21:32
AI Nest:承接市场热...
近日,硅谷明星产品clawdbot引发的“本地AI+数据自治”热潮...
2026-02-02 19:20:51
印奇挂帅后,阶跃星辰最强开...
智东西 作者 | 王涵 编辑 | 心缘 智东西2月2日报道,今日,...
2026-02-02 19:20:37
AI赋能、政策护航 中国微...
近段时间以来,中国微短剧可是已经“火”出了国门。最新的海外应用下载...
2026-02-02 16:18:04
Soul App开源实时数...
每经AI快讯,2月2日,据Soul社交公众号消息,Soul App...
2026-02-02 16:18:01

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...