2025重塑AI宇宙 | 美国顶级VC Bessemer AI报告
创始人
2025-08-17 08:16:44
0

编者注:蒋宇捷(@jiangyujie),信天创投管理合伙人,专注于出海AI产品的投资与孵化。

Bessemer最新AI报告中,研究了20家高增长、具备持久竞争力的AI创业公司,包括表现突出的Perplexity、Abridge和Cursor等。其将新一代AI的到来被比作“宇宙大爆炸”:新的星系、超新星、闪耀之星与暗物质正在形成,孕育出一个全新的AI宇宙。

2025年是AI创业者群星闪耀的一年——企业收入高速增长,高阶智能体不断涌现,垂直领域的AI应用筑起坚固护城河,AI Agent对传统软件生态发起了前所未有的冲击,多模态技术催生了无数新机遇。

行业被重新洗牌——新的机会在哪里?哪些领域已进入加速通道,又有哪些依旧挑战重重?希望以下内容能为你带来启发与思考。

内容来源

Bessemer Venture Partners(BVP)成立于1911年,是美国最早VC之一, 总部位于美国硅谷门洛帕克(Menlo Park),BVP 管理资产超过200亿美元,以长期投资和布局多个技术与产业领域闻名。投资覆盖阶段广泛,从Seed、成长基金,到Impact和 Growth buyout(BVP Forge)。投资领域是重点投资人工智能、云计算、消费者互联网、企业软件、医疗保健和金融服务等,已投项目包括Anthropic、LinkedIn、Pinterest、Shopify、Yelp、PagerDuty等。

五大核心要点

1. AI进入“第一道光”阶段,爆发两类创业“明星”:超新星&闪耀星

三年过去,AI从ChatGPT引爆的“大爆炸”逐渐形成早期星系,基础公司、最佳实践和成功模式开始清晰,但仍有大量“暗物质”未知。

两类AI创业明星:超新星&闪耀星

o 超新星(Supernovas):从种子轮到年化收入(ARR)1亿美元只需1年多,但留存脆弱、毛利低。

o 闪耀星(Shooting Stars):4年从300万美元ARR增长到1亿美元,毛利健康、PMF扎实,更具可持续性。

新时代基准:Q2T3(四倍、四倍、三倍、三倍、三倍)取代SaaS时代的T2D3。

2. 系统从记录走向行动(Systems of Record → Systems of Action),记忆与上下文成为新护城河

AI正颠覆传统企业系统(如CRM、ERP),实现数据自动采集、自动执行,实施周期从数月缩短到数小时。

持久记忆和语义理解让AI产品形成情感与功能上的锁定,切换成本极高。

3. 垂直领域AI加速渗透,浏览器成为智能体主战场

医疗、法律、教育、房地产、家政等“技术迟钝”行业快速采用AI,ROI清晰、价值即刻显现

Agentic AI的未来可能在浏览器层运行——从被动导航工具变成可直接执行任务的操作界面。

4. 生成式视频或将在2026迎来爆发,AI原生社交平台或诞生新巨头,巨头反击AI并购潮将至

成本骤降、可控性提升,将广泛应用于娱乐、营销、教育、零售。

情感型AI交互、长记忆、生成内容能力可能催生新一代社交生态。

大型SaaS公司通过收购补齐AI短板,尤其是垂直AI和AI基础设施领域。

5. 企业级AI评估和数据溯源成为刚需

公共榜单失去参考价值,企业转向私有化、业务场景化评估,确保性能可信、可解释、可合规

金句

“There is no cloud without AI anymore.”

云服务已离不开AI

“Speed matters more than ever—but direction matters most.”

速度比以往重要,但正确方向更关键

“Memory and context are the new moats.”

记忆和上下文是AI应用新的护城河

“Systems of action are replacing systems of record.”

行动系统正在取代记录系统

“Build the gravity that holds your galaxy together.”

让产品有足够引力来凝聚属于你的星系

以下为正文。

引言

如果说2023年是AI的“大爆炸”(ChatGPT的大规模发布),那么2025年就像是“第一道光”,显现出一批基础性公司集群、构建的最佳实践和创业的成功模式。

我们极其确信AI正在推动有史以来最大的技术变革浪潮如果衡量创业公司现实的最直接指标是收入增长,我们已经更新了基准,并聚焦于20家令人惊叹的AI创业公司,以帮助定义优秀AI创业公司的标准。

当然,AI时代并非对创业公司和投资者都是好消息。一些增长信号可能具有误导性。并非所有产品都能提供真正价值,用户留存可能很脆弱,特别是当迁移成本很低时。单纯的早期高速增长,如今的意义已经远不如从前。

有前景的领域正在吸引比过去多2-3倍的竞争对手。除此之外,SaaS巨头们正在觉醒(https://www.bvp.com/atlas/intercoms-playbook-for-becoming-an-ai-native-business),认识到AI的重要性。包括我们投资组合中的许多公司,如Intercom已经推出了年收入超过1亿美元的AI产品。

我们同样仍处在一个高度不可预测的时期,无论是模型上下文协议(Model Context Protocol,MCP)、AI浏览器,还是本报告中我们称之为“暗物质”的许多其他领域,其发展带来的影响依然让我们摸不着头脑,只能对AI宇宙中部分领域的演化做出模糊的猜测。

但有一点是确定的——如今, 已经不存在无AI的云计算了

我们已向AI原生创业公司投资了超过10亿美元,几乎每家传统SaaS公司都在将AI融入其产品和运营之中。

这份AI现状报告旨在:

- 分享我们优秀AI创业公司的最新基准

- 巡览基础设施、开发者工具、横向AI、垂直AI和消费者AI的路线图,同时标出每个领域正在形成星座的稳定星系

- 揭示"暗物质"——有重大未解问题的重要领域

- 提出我们对未来一两年的五大预测

一、AI基准:2025年“优秀”创业公司的样子

基准测试一直是评估创业公司的不完美方式——但在AI时代,它们更不可靠。尤其是,一些AI创业公司实现了前所未有的增长速度,驱使每个AI创始人都开始思考到底什么才算好。我们因此更新了基准,承认一些AI创业公司实际上是正在玩异常完全不同的游戏。

两类AI创业公司的故事和新的"T2D3"

为了制定新的基准测试,我们研究了20家高增长、具备持久竞争力的AI创业公司,包括表现突出的Perplexity、Abridge和Cursor。虽然所有这些AI明星都表现出惊人的增长,但仔细研究表明,在AI时代有两种不同类型的惊人表现:超新星和闪耀星。

AI超新星

超新星是增长速度堪比软件历史上任何公司的AI创业公司。这些企业往往从种子轮起步,在商业化的第一年就冲到1亿美元的ARR,有时甚至更快。这类公司既是我们看到的最令人兴奋、也是最令人胆寒的类型。几乎可以肯定的是,这样的数字往往出现在收入看似脆弱的情况下——要么是因为快速采用背后隐藏着低转换成本,要么是因为产品具备巨大新颖性,但未必与长期价值相匹配。它们的应用功能往往与核心基础模型非常接近,因此可能被贴上“套壳”的标签。而在竞争炽热的领域中,利润率往往被压缩到接近零甚至为负,因为创业公司会用尽一切手段争夺赢者通吃的机会。

平均而言,我们调查的十家AI超新星创业公司在商业化第一年达到约4000万美元ARR,第二年达到约1.25亿美元。当然,ARR数字并不总能保证企业健康成长。可持续增长依赖于强劲的留存率、用户参与度和资本效率。平均而言,这些AI超新星的毛利率只有25%,经常在短期内为了分销而牺牲利润。尽管毛利率较低,这些AI超新星似乎展现了惊人的113万美元人效,比典型SaaS基准高4-5倍。这种收入效率可能意味着,长期来看,它们有潜力在规模化后成为极其高效的企业。

AI闪耀星

相比之下,闪耀星更像是杰出的SaaS公司:它们快速找到PMF,保持和扩大客户关系,同时维持强劲的毛利率—虽然比传统SaaS同行略低,但这是由于更快的增长速度和一定的模型成本所致。它们平均增长速度超越以往的SaaS前辈,但增长率仍然感觉锚定在扩展组织的传统瓶颈上。这类公司或许还没有频繁登上头条,但深受客户喜爱,并且正走在创造软件历史的道路上。

平均而言,这些闪耀星型公司在第一年可达到约300万美元ARR,随后实现同比4倍增长,毛利率约60%,第一年人效约16.4万美元。

如果T2D3(三倍、三倍、两倍、两倍、两倍)定义了SaaS时代的增长节奏,那么AI闪耀星的轨迹更贴近Q2T3(四倍、四倍、三倍、三倍、三倍)。这意味着它们的增长明显快于传统SaaS,但仍比爆发式的AI超新星更接近SaaS的增长基准。

虽然我们喜欢超新星,但我们相信这个时代将不是由少数异类定义,而是成百上千颗闪耀星。闪耀星型公司才是AI创业者最重要的对标目标

关于这些新基准给AI创业者的核心启示:我们分享这些看似“离谱”的新基准,是为了展示当下最杰出AI创业公司的真实状况。话虽如此,打造一家标志性的AI公司并不意味着必须一夜之间实现四倍增长。许多最强的公司依然会走一条更为审慎的道路,这条路会受到产品复杂度和竞争格局的共同影响。

然而,速度比以往任何时候都更重要。AI已经释放出更快的产品开发、市场推广(GTM)和分发能力——让“Q2T3”(四倍、四倍、三倍、三倍、三倍)成为一个雄心勃勃但日益可实现的增长基准。已经有数十家创业公司证明了这是可能的——而我们相信,你也可以做到!

当然,我们还没有看到完整的五年数据,所以未来也许会发现这些公司并不能真正做到连续三年三倍增长,但“Q2 T1 D2”听起来可就没那么响亮了。

二、AI宇宙路线图

在Bessemer跟踪的每条路线图中,我们都看到,在过去一年里,AI技术栈的许多要素已经显著清晰化,促成了若干早期“星系”的形成。我们将在各条路线图中,对这些星系进行逐一盘点,同时指出那些仍然充满未知、只能对其未来走向做出猜测的“暗物质”领域。

I. AI基础设施

正在形成的星系:模型层

先从最显而易见的部分开始:OpenAI、Anthropic、Gemini、Llama和xAI等少数几家厂商,依然在基础模型领域占据主导地位,不仅不断推动模型性能的进步,同时也在探索纵向一体化的发展路径。如今已很明显,这些大型实验室的目标早已不仅是提供基础模型及模型开发工具——它们正逐步推出用于编程、计算机操作以及MCP集成的智能体(agents)。与此同时,算力成本正持续、可预测地下降,这得益于软件创新和端到端硬件优化的共同作用。

在开源模型方面,Kimi、DeepSeek、Qwen、Mixtral和Llama等最新代表,也持续展现出开源生态的强劲竞争力,经常在效率和特定任务表现上匹敌甚至超越闭源模型。

在研究层面,我们正看到一波新的创新浪潮:

· Google近期发布的Mixture-of-Recursions论文(https://www.alphaxiv.org/abs/2507.10524v1),通过自适应深度的方法,平衡推理吞吐量与少样本推理准确率,挑战了现有的规模化假设。

· Mixture-of-Experts架构正在被重新激活,并引入了新的专家组合方式。

· 推理阶段技术(如推理时强化学习Test-time RL和自适应推理AdaptiveReasoning)正快速升温,尤其有望在垂直领域实现重大突破。

这些模型层面的创新只是更大规模“重构平台化”趋势的一部分。

随着企业构建AI原生和AI嵌入式产品,一条全新的基础设施层已经出现——涵盖模型、算力、训练框架、编排(orchestration)以及可观测性(observability)。我们在2024年的AI基础设施路线图(https://www.bvp.com/atlas/roadmap-ai-infrastructure)中已经强调过这种演化趋势。这个专业化的技术栈为构建者提供了速度与灵活性,但也正在加速走向一体化捆绑,因为厂商不断向相邻领域延伸,以掌控更多技术栈环节。虽然至今已取得显著进展,但我们认为,AI基础设施的快速演进远未到终点。

AI基础设施的第二幕

AI的第一个时代由重大算法突破定义——反向传播、卷积网络、Transformer等。该领域主要依靠算法改进与规模化方法取得进展,相应地,基础设施也遵循这一思路,推动了在基础模型、算力能力和数据标注等领域巨头的崛起。

但下一章的意义,可能会更加深远。

正如OpenAI的姚舜宇(Shunyu Yao)最近所说(https://ysymyth.github.io/The-Second-Half/):“AI的下半场——从现在开始——将把重点从‘解决问题’转向‘定义问题’。”

在AI基础设施的第二幕中,行业将从展示AI能解决问题,转向构建能够以经验、清晰度和明确目的来定义、衡量并解决问题的系统。

大型实验室正从单纯追逐基准测试的提升,转向设计能够与现实世界高效交互的AI。企业(https://www.forbes.com/sites/kirimasters/2025/07/24/walmart-reveals-ai-roadmap-that-points-to-a-world-without-search-bars/)也正从概念验证(POC)阶段走向生产级部署。

这些变化正在为新一波基础设施工具奠定基础——它们不仅为规模化或效率而生,更是为了让AI扎根于运营环境、真实世界经验与持续学习

新兴方向示例:

· 强化学习环境与任务编排:通过Fleet、Matrices、Mechanize、Kaizen、Vmax和Veris等平台实现,因为单靠人工标注数据已不足以支撑生产级AI。

· 新型评估与反馈框架:如Bigspin.ai、Kiln AI、Judgement Labs,可实现持续、具体的反馈闭环。

· 复合型AI系统:不再只关注模型的原始算力,而是结合知识检索、记忆、规划和推理优化等组件。

我们正处于这一转变的起点——从“AI作为概念验证”走向“AI作为能够定义问题并适应性演进的系统”,并深度嵌入到真实世界的使用场景之中。

暗物质:AI的“苦涩教训”

Rich Sutton的“苦涩教训”(http://www.incompleteideas.net/IncIdeas/BitterLesson.html)提醒我们,AI领域中最有效的进展,长期以来都来源于利用算力和通用型学习,而非依赖人工打造的特征或人为设计的启发式规则。

当AI基础设施进入下一个阶段,一个悬而未决的问题是:在实践者努力将上下文、理解力和领域专长融入AI系统、以确保其在真实世界中具备实用性的过程中,哪些技术最终会被证明最有效、最具可扩展性。

II, 开发者平台与工具

正在形成的星系:AI工程已成为软件开发的核心组成部分

在基础设施栈之外,AI已经显然彻底改变了软件开发方式。自然语言正在成为新的编程接口,模型能够直接执行这些指令。在这一范式转变中,软件开发的基本原则正在发生变化——提示词(prompts)现在就是程序,大语言模型(LLM)成为一种全新的计算机

AI不只是推动了开发工具的渐进式演进,而是引入了一整套全新的软件开发方式。我们将在即将发布的路线图《面向软件3.0的开发者工具》中详细探讨这一领域。

今天的问题不再是你的团队是否使用AI,而是你能否将AI协调编排为一个复合、高速运转的系统。这种软件开发模式,正像是AI原生开发的“成形星系”。最优秀的工程团队,不仅仅是在用AI写代码——而是在构建能够学习、适应,并在每一次迭代中更快交付的系统。

正在形成的星系:模型上下文协议(MCP)

一个新的基础设施层将对AI开发产生深远影响——模型上下文协议(MCP)(https://en.wikipedia.org/wiki/Model_Context_Protocol#:~:text=The%20Model%20Context%20Protocol%20(MCP,including%20OpenAI%20and%20Google%20DeepMind.)。由Anthropic在2024年底推出(https://www.anthropic.com/news/model-context-protocol)并迅速被OpenAI、Google DeepMind和Microsoft采用,MCP正成为代理访问外部API、工具和实时数据的通用规范。

正如MCP创建者所描述的,它可以被视为AI的USB-C。它支持持久内存、多工具工作流程和跨会话的细粒度权限管理。有了它,Agent可以链接任务、对实时系统进行推理,并与结构化工具交互——而不仅仅是生成输出。

对于开发者来说,MCP大大简化了集成。对于创业者而言,它则为构建真正具备自主行动能力的产品打开了大门——让AI不仅能辅助用户,还能在不同系统中替用户采取行动。

不过,目前MCP仍处于早期阶段。需要注意的是,MCP更像是一本“食谱”,而不是一位“厨师”。要真正做出好菜,还需要生态系统的支撑,例如Prefect推出的FastMCP(让构建MCP服务器更轻松),以及ArcadeKeycard(支持自主AI授权与权限管理)。随着围绕MCP连接器、治理框架以及智能体专用工具的“星座”不断形成,我们预计它将像HTTP之于互联网一样,成为智能体原生网络的基础。

暗物质:记忆、上下文与未来

随着AI原生工作流的成熟,记忆正成为核心的产品能力。跨时间的记忆、适应与个性化能力,能够让AI工具从“有用”跃升为“不可或缺”。优秀的AI系统正在超越简单的回忆功能,与用户一同演化。到2025年,长上下文窗口与检索增强生成(RAG)已经让单次会话的交互更连贯,但真正持久、跨会话的记忆依然是未解难题。除了基础模型公司,像mem0、Zep、SuperMemory和Langchain推出的LangMem等创业公司也在积极攻关。

上下文(context)指模型在推理时可见的数据。记忆(memory)指跨多次交互保留的信息,支持多步推理、个性化和智能体连续性。二者结合,驱动下一代AI应用的发展。

我们认为,领先的技术栈最终会融合以下几类能力:

· 短期记忆:依托扩展的上下文窗口(128k至100万+ tokens,取决于模型与架构)。

· 长期记忆:通过向量数据库、内存操作系统(如MemOS)、以及类似MCP的编排机制实现。

· 语义记忆:结合混合式RAG与新兴的情节记忆(episodic memory)模块,提供上下文丰富的回忆能力。

不过,仍存在权衡与挑战:上下文窗口越大,延迟与成本越高;持久记忆若缺乏智能上下文工程(动态选择、压缩、任务隔离),就会变得脆弱。

具有智能体特性的应用——如开发者代理、客户协作助手和创意工具——正在引领多模态记忆层和有状态工作流的采用。与此同时,对类神经记忆持续学习本地上下文缓冲等研究表明,可扩展的高质量记忆正越来越接近现实。

对于AI应用创业者而言,上下文与记忆可能是新的护城河。在这些问题上做到极致,AI的切换成本甚至会带上“情感属性”——当你的产品比任何替代品都更懂用户的世界,替换它就像从零开始。无论是深谙团队代码库的编程助手,还是深度嵌入CRM与沟通系统的销售智能体,对用户及其特定环境的积累性智能都将成为最黏性的资产。

尽管未知仍多,但未来的赢家大概率需要同时掌握基础设施交互层

· 构建灵活、具备低延迟回忆能力的记忆感知系统

· 面向隐式学习与核心工作流深度集成进行设计

· 将上下文转化为可复利的优势——涵盖数据、分发与用户体验

创业者应将记忆视为产品能力,而非后台管道。今天就具备记忆感知能力的产品,将塑造未来最智能、最个性化、最难替代的AI系统。

III. 横向和企业AI

正在形成的星系:面临冲击的记录系统(Systems of Record, SoR)

在企业软件领域,AI正在为初创公司提供机会,去挑战一些最大、最核心的横向记录系统(指传统只存储和管理数据的系统)。几十年来,像Salesforce、SAP、Oracle和ServiceNow这样的记录系统一直牢牢占据市场地位,依靠的是深厚的产品功能面、复杂的实施流程,以及对业务关键数据的核心地位。这些公司曾经拥有软件行业中最坚固的护城河——切换成本极高,以至于几乎没有创业公司敢尝试去取代它们。但如今,这些护城河正在被侵蚀。

借助AI处理非结构化数据、按需生成代码的能力,迁移到新系统的速度、成本与可行性都比以往大幅提升。具备自主执行能力的智能体工作流正在取代机械化的数据录入,而过去需要大批系统集成商、耗时数年的实施项目,如今被AI加速了数量级。

这些新一代平台不仅存储信息——它们还能直接对信息采取行动。

· CRM工具:如Day.ai和Attio,可自动记录来自邮件、电话、Slack的客户交互。

· AI原生ERP:如Everest、Doss和Rillet,可自动化财务预测和采购流程。

这种生产力差距正变得难以忽视。创业者们不再只是构建更好的“记录系统”,而是在构建“行动系统”(Systems of Action)。

构建行动系统的关键突破点

· AI“隐性渗透”功能:用一个有价值的切入工具接入数据流,让初创公司无需在第一天就替换掉现有记录系统,就能开始捕获所有流入其中的数据。

· 实施速度:利用代码生成工具,以及AI将自然语言描述的业务逻辑直接转化为代码的能力,让实施效率提升90%。

· 数据:自动接入,并借助AI在不同数据模式间转换的能力,实现一天内的数据迁移,让过去基于历史数据的供应商锁定几乎失效。

· ROI:相较传统系统提升10倍而不仅是增量改善;自主智能体工作流减少专业服务投入,加快价值实现速度。

我们认为,我们正处在一次跨时代转变的起点——从“记录系统”迈向“行动系统”。

正在形成的星系:新一代CRM、HR与企业搜索

核心问题:AI原生的挑战者是在创造全新的品类,还是终于动摇了行业巨头的地位?

在CRM领域,早期的颠覆迹象令人振奋。这些AI原生工具并不只是替换现有CRM,而是带来了一种全新的体验:它们不仅能替销售团队卸下大量手工工作,还能基于全渠道自动综合的交易信号,向销售经理智能推荐时间和精力的最佳分配方向。这不是10%的改进,而是10倍的飞跃

类似的切入点也出现在:

· HR与招聘:用于候选人筛选、入职培训和绩效追踪的AI协作助手

· 企业搜索:在内部知识库上训练的横向协作助手,正在接替过去由SharePoint或Notion搜索承担的角色

· 财务计划与分析(FP&A):AI原生的财务计划与分析工具,使财务分析师能够整合多个孤岛的数据,并在无需数据工程团队支持的情况下运行复杂分析

真正的制胜策略?从一个AI切入口(高价值的相邻能力)开始,然后逐步扩展成完整的记录系统。这种方式既能在保持对现有工作流兼容的前提下,长期积累专有数据,又能逐步增强产品的不可替代性。像Tradespace(知识产权管理)和Serval(IT服务管理)就是这种方法的优秀代表。

尽管这一领域仍处于早期,但在创造全新品类真正替代记录系统之间的战线已经初现端倪。这将是一个值得长期关注、极具看点的竞争舞台。

暗物质:企业ERP和长尾记录系统

尽管AI在企业软件领域的势头强劲,但一些最大的企业级应用领域仍然出乎意料地没有被显著颠覆:

· 企业级ERP(Enterprise Resource Planning,企业资源计划系统)

虽然我们在AI原生的会计与ERP平台上看到了大量令人兴奋的创新,但这些产品今天大多仍聚焦于中小企业与中端市场,且主要集中在软件与服务等相对简单的行业领域。相比之下,那些具备高度复杂制造、供应链与库存管理需求的行业,实施门槛要高得多。我们认为AI在这些复杂场景中依然能带来巨大价值,但新进入者需要时间来构建足够宽度和深度的产品能力,才能满足这类客户需求。真正的企业级ERP替换周期可能仍需多年才能到来。

· 长尾记录系统(The Long Tail of SoR)

在谈到记录系统时,人们的注意力往往集中在CRM与ERP,但事实上,还有一条很长的记录系统“尾巴”,同样蕴藏着巨大的颠覆机会。例如:

o 企业安全领域的身份管理平台(Identity Platforms)

o 公共安全领域的计算机辅助调度系统(Computer Aided Dispatch)

o 网站设计领域的内容管理系统(CMS)

我们认为,这些类别都非常适合被颠覆,但这将是一场长达十年的旅程,而创业者才刚刚开始将注意力转向这些领域。

潜力巨大,但落地艰难。展望2026年,我们相信下一波明星企业可能会诞生在这些领域,但现在仍为时过早,无法准确预测赢家。

IV. 垂直AI

去年,我们提出了一个大胆的观点:垂直领域AI(Vertical AI)有潜力超越即便是最成功的传统垂直SaaS市场。如今,我们对这一观点的信心比以往更强。

垂直AI的采用速度仍在加快,尤其是在那些长期依赖人工、服务密集或被认为对技术“抗拒”的垂直工作流中。这一趋势改变了我们对所谓“技术恐惧型”行业的看法——实际上,问题从来不在于他们不愿意采用新工具,而在于传统SaaS未能解决那些高价值、垂直领域特有且多模态或高度依赖语言的任务

垂直AI则终于能够在用户所在的场景中与他们接轨,提供的产品不再像软件,而更像是真正的生产力杠杆

正在形成的星系:垂直领域工作流自动化

在多个行业中,尤其是那些过去被视为“技术恐惧型”的领域,我们正看到垂直领域AI采用的显著加速迹象。例如:

医疗

· Abridge用生成式AI自动化临床病历记录,既缓解医生的职业倦怠,又提升文档质量。

· SmarterDx通过自动化复杂的编码工作流,帮助医院追回遗漏的收入。

· OpenEvidence自动化医学文献审查,并在诊疗现场提供即时答案。

法律

· EvenUp将原本需要数天的人工工作压缩至几分钟,通过生成法律索赔文件,让诉讼律师与人身伤害事务所可以大规模处理案件。

· Ivo帮助法律团队自动化合同审查,并在全公司范围内用自然语言搜索合同。

· Legora加速法律研究、审查与起草,并支持全流程协作。

教育

· Brisk TeachingMagicSchool提供AI驱动的教师工具,用于批改作业、辅导和内容创作等。

房地产

· EliseAI自动化以往高度依赖人工的物业管理工作流,从意向客户和住户沟通到租约审计全覆盖。

家庭服务

· Hatch充当AI驱动的客户服务代表团队。

· Rilla利用真实世界的音频分析面对面的销售对话,并在大规模上培训销售人员。

爆款垂直AI公司的共同策略模式

1. 有力的切入点(Wedge)

o 成功的早期赢家往往先解决一个核心痛点,该痛点通常是高度依赖语言或多模态的,因此在之前的软件浪潮中被忽视。

o 最好的切入产品直观易用,且无缝嵌入现有工作流,降低采用门槛。

o 语音/音频是反复出现的“神奇切口”。

2. 上下文是关键(Context is Key)

o 产品的防御力源于领域专长:垂直化需求驱动的集成能力、数据护城河、多模态界面。

o 最优秀的团队会快速超越简单的微调(fine-tuning),构建深度的垂直化实用功能。

3. 价值导向(Built for Value)

o ROI从第一天起就清晰可见,无需Excel表格来证明价值。

o 这些工具能带来10倍生产力提升,让劳动力转向更高价值的工作,降低成本或提升营收。

o 价值是立刻可感知的,而不是“锦上添花”。

暗物质:垂直领域AI的未解之谜

尽管垂直领域AI发展势头强劲,但在以下三个关键方面仍存在重大未知数:

· 与传统记录系统的关系

o 新一代垂直AI公司会继续与现有记录系统集成并扩展其功能(这是当前的主流做法),还是会直接与其竞争?

o 未来是否可能出现一种格局:这些传统记录系统不再是业务核心,而被AI原生、垂直领域专属的“行动系统”完全取代?

· 来自现有巨头的竞争

o 在那些已有巨头高度警惕、并未“躺平”的垂直领域,规模与分发优势会否战胜初创企业的创新?

o 或者,即便面对这些不利条件,新一代公司仍能突破重围?

· 可持续的数据护城河

o 当垂直AI公司不断扩大业务范围时,能否在那些数据高度分散、隐私敏感、且在规模化时难以获取或标准化的行业中,依然保持有意义的数据优势?

V. 消费级AI

随着底层技术的演进,满足新型消费者需求的机会也在不断涌现。去年,大多数消费者的使用场景仍以生产力驱动的任务为主,例如写作、编辑和搜索,因为他们还处在探索AI新奇性与实用性的阶段。

但我们正开始看到一种转变——使用场景正在向更深层次的领域延伸,包括心理治疗、情感陪伴和自我成长。AI不再只是辅助完成任务的工具,而是开始触及消费者生活中更具意义的领域

正在形成的星系:日常任务与创作的AI助手

各个年龄段的消费者正越来越多地依赖通用型大语言模型(LLM),尤其是ChatGPTGemini,来获得日常或每周的帮助——截至2025年3月,它们的周活跃用户数分别约为6亿4亿(https://techcrunch.com/2025/05/20/googles-gemini-ai-app-has-400m-monthly-active-users/)。曾经的新奇体验,如今已成为习惯,这些工具每周为数以亿计的用户提供包括研究、规划、建议和对话在内的多样化服务。尽管出现了大量专用型AI应用,绝大多数消费者依然依赖这些通用助手来满足广泛需求。

过去一年中,语音(https://www.bvp.com/atlas/roadmap-voice-ai)成为消费者与这些应用交互的强大模式。与传统助手(Alexa、Siri)不同,基于LLM的语音AI能够处理开放式问题、引导用户反思,并支持更流畅、自然的对话式交流,提供了一种直观、解放双手的人机交互方式。在语音AI领域,像Vapi这样的平台正在帮助消费者实现跨语言、跨上下文、跨情感的机器交互。

或许最有意义的变化之一,是消费者搜索信息和整体上与网络交互方式的转变。在这一不断演化的格局中,Perplexity成为了AI原生搜索的明星代表。它凭借模型无关的编排能力极快的用户体验脱颖而出,成为许多人首选的搜索工具。随着其推出智能体浏览器Comet,Perplexity正将边界进一步推进——它很可能成为下一代“无处不在、主动响应”型智能体的标志性形态。

除了成为更优越的助手,AI也在降低创作门槛,让每位消费者都有可能成为创作者:

· 应用开发:使用Create.xyz、Bolt、Lovable直接构建应用。

· 音乐创作:通过Suno、Udio生成音乐。

· 多媒体制作:利用Moonvalley、Runway、Black Forest Labs制作图像与视频。

· 创意加速:借助FLORA、Visual Electric、ComfyUI、Krea等工具加快创意构思与迭代。

AI正在把日常消费者转变为创作者,不断突破我们对可能性的想象边界。

正在形成的星系:专用AI助手

随着消费者希望将AI更深地融入日常生活,一波面向特定需求的消费类应用正在兴起。

1. 心理健康与情绪幸福感

这是增长最快的领域之一。虽然“ChatGPT治疗”持续受到关注,但我们也看到围绕自我反思个人成长的专用工具崛起:

· AI日记与导师:如Rosebud

· 游戏化自我关怀助手:如Finch,帮助用户设定个人目标、养成健康习惯、追踪情绪健康状况

早期的Character.AI已经表明消费者对情感表达型AI的兴趣,而在过去一年,这种需求已进入主流市场。越来越多基于LLM的工具被专门设计来支持长期记忆情绪韧性自我发展

2. 邮件与日历工作流

越来越多初创公司希望用AI简化日程安排收件箱管理待办事项自动化。不过,由于这些应用属于高度信任敏感的场景,并且面临Gmail等强势行业老大的激烈竞争,客户获取与留存仍是挑战。

3. 其他细分消费场景

膳食规划、健身、育儿等更细分的消费场景中,已有不少产品出现,但我们不确定这些领域会出现明确的赢家。多数消费者依然倾向于使用通用型LLM,因为它们在这些任务上的表现已“足够好”。要让专用应用突破,需要提供明显差异化价值,并以定制化体验满足高频、刚需的使用场景,才能赢得在用户主屏上长期驻留的位置。

暗物质:明显未解决的消费者痛点

一些最显而易见的消费者使用场景依然没有被很好满足,并非因为缺乏需求,而是因为它们仍需要用户付出过多的手动操作。尽管早期的智能体产品已经涌现,但底层技术仍在成熟过程中。

关于安全性自主性可靠性的问题依旧悬而未决,因此能够真正替用户采取行动的智能体,依然处在非常早期的阶段。

那些“显而易见但未被解决”的场景,正等待智能体基础设施的跟进:

· 旅行:旅游预订依旧割裂且耗时。一个个性化、端到端的旅行管家有着巨大的市场机会,但至今无人真正占据。

· 购物:如果电商的起点不再是Google搜索,而是由智能体替用户完成浏览、比价甚至结账,那么整个购物体验可能被彻底重塑。

谁将赢得这些场景?

会是掌握AI原生浏览器的玩家、通用型LLM助手,还是新一波面向消费者、端到端的智能体应用?答案很可能决定下一代消费级平台的赢家。

三、2025年AI五大预测

与往年一样,我们向合伙人征询意见,以确定未来几年中最重要的AI预测。今年我们从数十条预测中筛选出这五条,在团队内部至少达成了一定程度的共识。那么,事不宜迟——请看:

1. 浏览器将成为AI智能体的主导交互界面

随着智能体的演进,浏览器正崛起为一个可进行自主执行的潜在环境——它不仅是导航工具,更是通向整个数字世界的可编程接口。

虽然语音在某些场景中仍会是自然的交互方式,但浏览器提供了更强大的可能性:一个嵌入日常工作流的、环境感知且具有上下文的交互界面。浏览器能够无缝整合到消费者与企业系统中,让智能体可以在用户已依赖的应用中原生地观察、推理与行动

下一代智能体浏览器——如近期推出的CometDia——将远不止是插件,它们会将AI嵌入操作层,支持多步骤自动化跨标签页与会话的智能交互,以及实时决策。与传统扩展不同,这类浏览器能够理解用户意图并端到端地执行工作流。

我们预计OpenAI、Google等公司将很快推出全新的AI原生浏览器,并不断拓展智能体在会话中的能力边界。浏览器凭借其普及度、灵活性和深度集成能力,将成为B2B与B2C场景中智能体AI最强大且不可避免的交互层。

新一轮的“浏览器大战”即将打响!

2. 2026年将是生成式视频元年

2024年是生成式图像模型的主流拐点,2025年在语音领域出现了类似的爆发——延迟、上下文感知、拟人化程度与可定制性都有显著提升,同时成本大幅下降。如今的趋势表明,2026年将是视频跨越鸿沟的关键年份。无论是Google的Veo3、Kling、OpenAI的Sora、Moonvalley的Marey,还是新兴的开源技术栈,视频生成的质量正快速提升。可控性、可获取性和逼真度正接近临界点,使生成式视频有望实现规模化的商业可行性。

视频一向是成本最高、制作最复杂的媒介,而生成式视频与多模态模型正在打破这些壁垒,让视频的生产变得可行且普及。我们已经看到它在娱乐、营销、教育、社交媒体、零售等领域获得主流采用。预计未来一年会有大量初创公司与工具涌现,针对特定场景提供解决方案——从电影级故事创作、虚拟人动画,到实时客户互动与产品视频制作。

我们也预计未来12个月,生成式视频的市场格局将逐渐明朗

· 大型实验室会赢者通吃吗?

如Google Veo3在视频真实感与可控性方面设定了新基准;Higgsfield则通过在现有前沿模型之上用上下文学习(in-context learning)构建差异化应用,证明了无需自研模型也能做出强大的产品

· 开源能否赶超?

不同于图像生成领域开源模型的领先,视频生成领域开源玩家较少——因为视频模型在算力、数据上的消耗巨大,训练成本高且评估复杂。但我们预测2026年将出现强劲的开源视频模型——Qwen的开源视频模型是早期赢家之一,且势头正猛。

· 实时与低延迟场景有优势吗?

我们关注的早期团队Lemonslice,正尝试视频流式生成与实时推理,在这里速度与响应能力本身就可能成为产品护城河

重点关注的应用场景

· 电影级视频:为创作者、影视工作室与营销团队提供高质量创作工具(如Moonvalley)

· 实时、低延迟生成:直播、虚拟偶像、游戏

· 极致真实感:照片级真实故事讲述、虚拟制作

· 个性化内容与社交身份

· 开发者工作流:简化视频应用与产出制作的工具

无论未来生成式视频市场会是由少数实验室主导,还是形成一个充满应用、基础设施与开源创新的生态,有一点可以确定:视频创作的新纪元已至——它将重塑互联网

3. 评估和数据溯源将成为AI产品开发的关键催化剂

在企业级AI部署中,评估(Evaluation)依然是最大、尚未解决的瓶颈之一。一个产品、功能或算法改动效果如何?用户喜欢吗?它是否提升了收入、转化率、留存率?大多数公司仍难以判断,一个模型在其特定的真实业务场景中,能否稳定、可靠地发挥作用。像MMLU、GSM8K或HumanEval这样的公开基准测试,最多只能提供粗粒度的信号——它们往往无法体现真实工作流中的细微差别、合规限制,或在关键决策场景下的表现。

因此,我们判断2025–2026年将迎来一个转折点:AI评测将走向私有化、场景化、可信化,并由此推动企业级部署规模提升10倍

如今,企业追求的不仅是性能,更是信心。而信心来源于可验证、可复现、并针对自身数据、用户与风险环境定制的评估框架。趋势已经显现:企业不再一味追逐排行榜分数,而是构建内部评测套件,去衡量AI在隐私敏感工作流、客户支持、文档解析、智能体决策等领域的表现。

下一阶段的AI评测将具备的特征

· 私有化、用例驱动的评测:基于专有数据构建

· 贴近业务的指标:准确率、延迟、幻觉率、客户满意度等

· 持续评测管道:深度集成到生产系统与反馈回路中

· 数据溯源与可解释性:尤其适用于医疗、金融、保险等受监管行业

初创公司Braintrust、LangChain、Bigspin.ai、Judgment Labs已在这一新纪元的基础设施层率先布局,提供评测工具集、智能体基准测试环境、实时反馈回路等能力。

随着企业买方的成熟,他们将要求的不仅是性能,还要可证明、可解释、可信赖的性能。例如,DataHub可确保AI模型只使用符合预期来源、用途与范围的数据,并提供溯源以辅助验证与合规。未来,AI厂商必须在售前就能拿出有效性证明,而不是部署后才补救。评测与数据溯源将成为AI技术栈中的战略层,也是采购与治理的核心要求。

在传统软件中,产品开发一直追求数据驱动与用户反馈,平台如LaunchDarkly让实验与测量成为常态。而在AI时代——预测型体验取代了确定性体验——这些原则的基础被重新定义。公司如Arklex、Kiln AI、Pi Labs提出了AI原生时代全新的测量与反馈回路理念。

给在这一领域创业者的建议

· 构建支持多指标评估的工具(如同时监控准确率、幻觉风险、合规性)

· 提供合成评测环境,用于对智能体进行压力测试

· 确保与日志、检索、反馈系统的互操作性

· 支持模型漂移监控与持续更新

随着基础模型性能的趋同,真正的差异化不再是原始准确率,而是清楚知道模型在你的环境中何时、为何、如何起作用。能够让评测规模化、可解释、企业可用的初创公司,将解锁下一波AI部署浪潮,并定义新的基础设施前沿。

4. 由AI驱动的下一代社交平台的崛起

科技历史上,每一次重大消费者技术变革,几乎都会孕育出新的社交巨头:PHP让Facebook诞生;移动相机成就了Instagram;移动视频的进步推动了TikTok。如今,生成式AI带来的新能力,很难想象不会催生出类似的爆款平台。

我们还无法确定下一个社交媒体巨头会采取何种形态。它可能是一个由AI智能体默默运作的网络,确保用户不会错过朋友生日、本地重要活动或关键动态,让人们在网络与现实生活中都能成为更好的自己;也可能是一个由高情商的AI网红与AI克隆主导的虚拟世界。Character.AIReplika已经暗示了这种趋势:在某些社交空间中,AI而非人类,可能会成为核心主角。

无论形式如何,语音交互、长期记忆、图像与视频生成等领域的突破,都是下一代社交媒体爆发的燃料。赢家可能以大规模的主流产品亮相,也可能从小众社区起步,再快速扩张为完整生态系统。

5. 行业巨头反击,AI并购升温

在被AI原生初创公司连续两年快速颠覆后,企业巨头正在反击——不是从零重建,而是通过收购获得所需能力以追赶。我们预计在2025–2026年,并购活动将明显加速,老牌厂商会积极买入AI能力,全面进入AI时代。

最明显的战场在垂直软件。AI原生初创公司正深入行业特定工作流——自动化保险理赔、法律文件起草、营收周期管理等——这迫使传统SaaS厂商在进化淘汰之间做出选择。对许多人而言,最快的创新路径就是收购。我们预计在医疗、物流、金融服务、法律科技等高服务、高监管的行业中,会出现一波整合浪潮。

这不仅是增加AI功能,更是由垂直AI引发的结构性转变——软件与服务的界限正在模糊。AI工具深度嵌入行业工作流,正越来越像智能化的服务提供商。对于巨头而言,收购这些公司不仅是一次AI升级,更是对自身价值主张的重塑。

与此同时,围绕模型编排、评估、可观测性、记忆系统的AI基础设施和工具需求,也会推动战略性收购。企业收购的已不仅是应用,而是AI原生技术栈的底层积木

给创始人的要点

· 做好被战略收购的准备:如果你在构建行业特定或基础设施层的AI产品,要预期传统巨头的主动接触。

· 积累谈判筹码:技术护城河、客户粘性、深度嵌入的工作流是最难被复制的优势。

· 了解潜在收购方的产品路线图:找到他们在你领域的短板,提供他们无法快速自研的能力,你就具备高价值。

对投资人来说,这波整合既是退出机会,也是投资逻辑的验证——行业巨头用真金白银证明,AI原生公司正在设立新的行业标准。AI原生的颠覆浪潮虽然由初创公司开启,但第二幕已经拉开——巨头们正全副武装登场。

四、创始人在AI宇宙中的优势

我们已不再处于AI的黎明时分,而是身处其正在展开的星系之中。今天的顶尖初创公司不仅在构建更快的软件,而是在设计能够看、听、推理与行动的系统,将智能嵌入工作与生活的肌理。

真正的成功不仅取决于速度,还取决于方向——即朝着正确方向的速度。最具标志性的公司不会只是随波逐流,而是主动塑造浪潮,将指数级的能力与清晰的现实价值结合起来。

AI不再是理论,它已经进入运营层面——在创造收入、建立关系、重写行业规则。然而,记忆、上下文、治理、智能体能力等问题仍未完全解决。这正是当下的力量所在——地图依旧模糊,但前沿是真实存在的。

给AI应用创始人的关键要点

· 两类AI初创公司正在赢:超新星(Supernovas)平均1.5年达1亿美金ARR,但留存脆弱、毛利薄;闪耀星(Shooting Stars)像顶级SaaS一样成长,4年从300万到1亿美金,PMF稳固且毛利健康。

· 记忆与上下文是新护城河:最具防御力的产品将具备记忆、适应和个性化能力。持久记忆与语义理解可带来情感与功能双重锁定。

· 行动系统正在取代记录系统:AI原生应用不只是存储数据——它们会基于数据采取行动。不要在传统软件上简单加AI,要重构整个工作流。

· 从AI切入口(Wedge)开始:解决一个窄而高摩擦的问题(如法律研究、销售笔记),快速提供10倍价值,再扩展。

· 浏览器是你的画布:智能体AI正向浏览器层转移——这是新的可编程环境,代理可在其中观察并执行任务。为这一层构建,这是新的操作平台。

· 私有、持续的评测是关键:公共基准不够,企业需要可信、可解释的性能。从第一天就构建评测基础设施。

· 实施速度是战略优势:原需数月的上线,如今可在数小时内完成。代码生成、自动映射、自然语言接口正在瓦解供应商锁定。

· 垂直AI是新一代SaaS:曾被视为“技术恐惧”的行业正在快速采用AI。通过深度嵌入、从第一天就证明ROI,并快速扩张来取胜。

· 巨头已醒并开始收购:SaaS巨头正买入AI。构建技术与数据护城河,做好M&A准备,但也要以长期占领品类为目标。

· 品味与判断力是差异化因素:在智能体与自动化的世界里,人类洞察是关键。能直觉判断“应该存在什么”而非“能做什么”的创始人,将定义下一个时代。

相关内容

GPT-5“让人失望”,A...
OpenAI备受期待的GPT-5未能带来革命性突破。虽然通往通用人...
2025-08-17 14:43:50
免费人工智能免费网址:这些...
嘿,你是不是也经常刷到各种AI神器,但一看价格就退缩了?别担心,今...
2025-08-17 10:12:49
原创 ...
央视头条号“玉渊谭天”发表文章称,美国给芯片安“后门”,H20既不...
2025-08-17 08:44:36
2025重塑AI宇宙 | ...
编者注:蒋宇捷(@jiangyujie),信天创投管理合伙人,专注...
2025-08-17 08:16:44
信AI排行榜,不如信它们的...
文章开头问大家一个问题,如果想知道最近哪个 AI 牛,你会怎么查?...
2025-08-17 06:12:54

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...