图片来源:a16z
Z Highlights
似乎没有什么根本性的难题,是世界上最聪明的人在未来几年内投入巨大努力也无法解决的。
我认为在短期内,会爆炸式增长的职业类别是那些能够真正利用AI的工作。
实际上,我认为(AI辅助)编程领域蕴含着难以置信的潜力。其核心在于将软件创造的能力开放给大众,让每个人都能参与其中。
本次对话的三位核心参与者均为AI领域的领军人物:Adam D'Angelo是Quora及AI聊天平台Poe的CEO,被誉为“问答社区的构建者”,长期致力于知识分享与AI应用的前沿探索。Amjad Masad是Replit的创始人兼CEO,被业界称为“云端开发的布道者”,其平台正推动AI智能体重新定义软件开发流程。本次访谈发布于2025.11.8。
AI发展现状与通往AGI的路径之争
Adam D’Angelo:似乎没有什么根本性的难题,是世界上最聪明的人在未来几年内投入巨大努力也无法解决的。
Amjad Masad:人类经历了农业革命……我们将无法用一个特定的名称来称呼它。未来的人们会为它命名。但我们,确实正在经历某种变革。
Adam D’Angelo:这项技术将催生的独立创业者数量将大幅增长。
Amjad Masad:单个人首次能够做到的事情,对每个人来说机会都是巨大的。关键是让更多人具备成为创业者的能力。
Erlk Torenberg:欢迎各位。
Adam D’Angelo:谢谢。
Erlk Torenberg:最近很多人对AI的某些方面持悲观态度,提出了一些普遍的批评,人们也在讨论其局限性,例如大型语言模型为何不会达到某个预期阶段。也许我们几年前认为近在咫尺的事情,现在看起来可能要十年之后。我本人则更为乐观一些。我想请你们分享一下大致的总体看法。
Adam D’Angelo:老实说,我不太明白人们在谈论什么。我认为,如果你回顾一年前,世界是非常不同的。仅从过去一年的进展来看,无论是推理模型的突破、代码生成能力的飞跃,还是视频生成技术的革新,发展速度似乎都比以往任何时候更快。所以我真的不太理解这种悲观情绪从何而来。
Erlk Torenberg:我认为有这样一种感觉,我们曾希望它们能够取代所有任务或所有工作。而现在有种感觉是,它似乎达到了一个中等水平,接近但未完全达到终点。也许劳动力市场的自动化不会像我们原先设想的那样在相同的时间线上发生?
Adam D’Angelo:我不知道人们之前设想的时间线是怎样的。但你知道,我认为如果你展望五年后的世界,那将是一个截然不同的世界我认为,当前制约模型发展的许多因素并非其智能水平本身,而在于如何为其提供正确的上下文,使其智能得以有效运用。还有一些方面,比如计算机使用,目前还不太完善,但我认为在接下来的一两年内我们几乎肯定能解决这个问题。当这些问题解决后,我认为我们将能够自动化大部分人力所做的工作。我不知道是否会称之为AGI。但我认为这将满足目前很多人提出的批评。我认为这些批评在一两年后将不再成立。
Erlk Torenberg:你如何定义AGI?
Adam D’Angelo:每个人的想法都不同。我比较喜欢的一个定义是:假设存在一个人类远程工作者,任何可以由远程方式完成的工作,那么AGI,你可以认为,是指在这个范畴内,其能力不需要在每一项任务上都超越世界顶尖专家。有些人称那种水平为ASI,它不需要比人类团队做得更好。你可以争论这些不同的定义,但我认为,一旦我们达到比一个典型的远程工作者在其所做的工作上更出色的水平,我们就生活在一个非常不同的世界里了。我认为这是一个对于这些定义非常有用的锚定点。
Erlk Torenberg:所以,对于其他人提到的大型语言模型的局限性,你认为大型语言模型从这里开始还有很大的发展空间。我们不需要一个全新的架构或其他什么东西。
Adam D’Angelo:我不这么认为。我认为确实有一些事情,比如记忆和学习,比如持续学习,用当前的架构不太容易实现。我认为即使是这些,你也可以某种程度上模拟,也许能让它们工作得足够好。但我们似乎并没有遇到任何形式的限制,推理模型的进展是惊人的。而且我认为预训练的进展也相当快,也许没有人们预期的那么快,但肯定足够快,让你可以预期在未来几年内会有很多进展。
Erlk Torenberg:Amjad你怎么看?
Amjad Masad:我认为我一直相当一致。
Adam D’Angelo:和我一致。
Amjad Masad:并且,我认为与事态的发展一致,我开始在某种程度上成为一个更公开的质疑者,大约是在AI安全讨论达到顶峰的时候,大概是2022、2023年。我认为当时对我们来说,现实地看待进展很重要。因此,我批评那些观点,例如关于“AI神谕”的论述,以及情境感知等某些被热议的论文——它们其实算不上严谨的科学,更多是一种主观臆测。“这是我认为会发生的事情”,整个经济将会自动化。工作将会消失,这不现实。它不符合我们所看到的那种进展,而且它会导致糟糕的政策。
所以我的观点是,大型语言模型是惊人的、了不起的机器。我不认为它们完全等同于人类智能。你仍然可以用一些事情来欺骗它们,比如它们可能已经解决了某个关于草莓的问题,但你仍然可以用一个简单的句子问题来骗它们,比如“这个句子中有多少个小时”。我想我在推特上发过这个,就像四个模型中有三个没能答对,然后55B参数的模型经过深度思考,思考了大概十五、二十秒才答对那样的问题。
所以,大型语言模型,我认为是一种与人类不同的智能。而且,它们有明确的局限性,我们正在通过各种方式掩盖这些局限性,无论是在模型本身、训练数据中,还是在我们为使它们工作而构建的基础设施等所有方面。但这让我不那么乐观地认为我们已经破解了智能。我认为一旦我们真正破解了智能,它会感觉更具可扩展性,并且“惨痛教训”背后的理念实际上会成为现实,你可以只是投入更多的算力、更多的资源、更多的计算,它们就能更自然地扩展。我认为现在,为了使这些模型变得更好,投入了大量的手工劳动,在预训练扩展时代,在 GPT-2、3、3.5,也许到4之前,感觉像是你只需要放入更多数据,它就会变得更好。
而现在,感觉像是大量的标注工作在进行,大量的合约工作在进行,很多这种人为构造的强化学习环境被创造出来,为了让大型语言模型擅长编码并成为编码智能体,它们将要去做那件事。我认为OpenAI的消息说他们将为投资银行业做这件事。所以我试图创造了一个术语,我称之为“功能性AGI”,意思是你可以通过深入进去,收集尽可能多的数据,创建这些强化学习环境,但这将需要巨大的努力、金钱和所有一切才能做到。我同意Adam的观点,事情会变得更好,在接下来的三个月、六个月。Claude 4.5是一个巨大的飞跃。我不认为人们充分认识到它相对于4的飞跃有多大。Claude 4.5有一些非常、非常惊人的特性。所以进步是存在的。我们将继续看到进步。我不认为大型语言模型,就目前我们所理解的而言,正在通往AGI的道路上。
我对AGI的定义是,我认为是老派的定义,即一种能够进入任何环境并高效学习的机器,就像人类可以进入任何环境一样。你可以让一个人去玩一个他没玩过的游戏,在两小时内,他就能学会并玩起来。目前,我们还没有办法让机器像那样即时学习技能。一切都需要大量的数据、计算、时间和努力。而且,更重要的是,它需要人类的专业知识,这与“惨痛教训”的理念相悖,你知道,“惨痛教训”认为人类专业知识不应被规模化,而今天我们正处在依赖人类专业知识的阶段。
Adam D’Angelo:我认为人类当然比当前的模型更擅长在有限的数据和新环境中学习新技能。但另一方面,人类智能是进化的产物,而进化过程本身相当于进行了海量的有效计算。所以这是一种不同的智能。因为AI 没有经历这种相当于进化的大规模过程,它只有预训练,而预训练的效果没那么好。所以你随后需要更多数据来学习每一个新技能。但我猜,从功能性后果来看,比如世界何时会改变?就业格局何时会变化?经济增长何时会加速?我认为这更多地取决于我们何时能生产出与人类智能一样好的东西。即使它需要更多的计算、更多的能源、更多的训练数据,我们也可以投入所有这些能源,最终得到在完成一项典型任务上能与普通人一样好的软件。
Amjad Masad:我不同意这一点。感觉我们正处于一种蛮力式的模式中。但也许这也没关系。
Erlk Torenberg:那么分歧在哪里呢?
Amjad Masad:我不认为这样能达到奇点,或者我不认为我们能达到人类文明的下一个水平,除非我们破解了智能的真正本质,即直到我们理解并拥有实际上并非蛮力的算法。
经济变革与未来社会图景
Adam D’Angelo:蛮力……你认为那些算法需要很长时间才能出现?
Amjad Masad:需要很长时间才能出现,我对此持不可知论。我觉得大型语言模型在某种程度上分散了这方面的注意力,因为所有的人才都流向那里,因此尝试进行基础研究的人才就更少了。
Adam D’Angelo:关于智能的基础研究,但与此同时,有大量的人才涌入AI研究领域,这些人才以前是不会进入AI领域的。所以你有了这个庞大的产业,庞大的资金,资助计算,但也资助人力。似乎没有什么事情在根本上是如此困难,以至于世界上最聪明的人在未来五年内投入难以置信的努力也无法解决。
Amjad Masad:但基础研究是不同的,试图深入基础层面,可能有很多工业研究,比如如何让这些东西更有用?目的是为了产生利润。我认为那是不同的。这位科学哲学家,谈了很多关于这些研究计划如何变得像泡沫一样,吸走所有的注意力和想法,想想物理学,它们就像弦理论的产业,把一切都吸进去,有点像进步的黑洞。
Adam D’Angelo:我认为其中一件事是你必须等到……
Amjad Masad:现在这一代人退休。
Adam D’Angelo:我认为当前的范式相当好。而且我认为我们远未达到继续推进它会收益递减的地步。我打赌,你可以在这个范式内持续进行不同的创新来达到目标。
Erlk Torenberg:那么,假设我们通过蛮力方式实现了技术突破,能够自动化大量劳动力。你估计GDP年增长率会达到多少,比如百分之四、五,还是会上升到百分之十以上?这对经济的影响是什么?
Adam D’Angelo:我认为这在很大程度上取决于我们具体达到什么水平以及AGI意味着什么。假设你拥有这样的模型,它们消耗相当于一小时一美元成本的能源,就能完成任何远程工作者的工作。这只是作为一个理论上的点。我认为在那个世界里,你获得的GDP增长将远不止百分之四到五。我认为问题在于,你可能无法达到那个点。所以可能出现的情况是,能够做所有人类能做的事情的AI模型,其成本实际上高于目前人类的成本,或者它们只能完成人类工作的百分之八十,剩下的百分之二十无法完成。我认为,在某个时间点,你终将实现它们能以更低成本完成所有人类能做的事情,我看不出我们最终无法达到那里的理由。这可能需要五到十五年,但我认为在达到那里之前,我们会在AI尚不能完成的事情上遇到瓶颈,或者你知道,建设足够的发电厂来供应能源,或者供应链中的其他瓶颈。
Amjad Masad:我担心的一件事是,AI在经济中产生的二阶效应。这可能会有效地自动化入门级工作,但无法自动化专家级工作。以QA为例,它太好了,但仍然存在很多它无法处理的边缘情况。因此,你现在有很多非常优秀的QA人员在管理着数百个智能体,效率提升非常显著。但他们不再招聘新人,因为这些智能体比新人更好。这感觉像是一个奇怪的均衡状态。
Adam D’Angelo:正在思考这个问题。我认为这体现在计算机科学专业的大学毕业生身上。现在的相关工作岗位没有以前那么多了。大型语言模型在某种程度上替代了他们之前所做的工作。我确信这加剧了问题。这意味着,公司将减少投入资金雇佣和培养新人沿着那个职业阶梯上升。所以我认为这是一个真正的问题。这个问题也会创造出经济激励来解决问题。所以可能会出现更多能够培训人员的公司的机会,或者利用AI来教授人们这些技能,但毫无疑问,这是当前的一个问题。
Amjad Masad:另一个相关问题是:我们依赖专家数据训练AI,而AI又开始替代这些专家工作者。长此以往,到某个时间点,是否将不再有人类专家,因为相关领域的工作已全部被AI接管?如果AI真的依赖于标注数据和专家构建的强化学习环境,那么它们将如何实现自我改进?我认为这是一个需要经济学家坐下来思考的问题:一旦你实现了第一轮自动化,那里存在一些挑战。那么你如何继续前进?你如何继续前进?
Adam D’Angelo:你提到下一部分了吗?我认为很大程度上将取决于能够创造出多好的强化学习环境。你知道,一个极端是像AlphaGo那样,拥有一个完美的环境,你可以直接超越专家水平。但我认为很多工作岗位的数据有限,无法供人训练。所以,研究努力克服这一点的难易程度,以及这将如何影响进展,会很有趣。
Erlk Torenberg:如果你必须猜测未来哪种职业类别会爆炸式增长——有些人提及网红、护理领域、政府雇员、政策倡导者,或是AI引导者等——在日益自动化的背景下,你个人猜测更多人会投身于哪些领域?
Adam D’Angelo:在某个阶段,当所有事情都自动化之后,我认为人们会去做艺术和诗歌。有个数据点显示,自从计算机在国际象棋上超越人类之后,下棋的人反而更多了。所以,如果人们都能自由地追求自己的爱好,我并不认为那是个糟糕的世界。只要你有某种公平的分配方式,让人们能够负担得起生活。那还需要一段时间,在近期,比如十年……
Erlk Torenberg:十到十五年之后。
Adam D’Angelo:我不知道具体多久,但至少在未来的十年范围内。我认为在短期内,会爆炸式增长的职业类别是那些能够真正利用AI的工作。所以,擅长使用AI 来完成工作的人,尤其是完成那些单靠AI本身无法完成的事情的人,对此的需求将会非常巨大。
Amjad Masad:我不认为我们会达到自动化所有工作的阶段。在当前范式下肯定达不到。我怀疑这种情况会发生。我不确定是否会发生,但在当前范式下肯定不行。我认为这是因为很多工作是关于服务其他人的,你需要从根本上具备人性,才能真正理解人们想要什么。所以你需要拥有人类体验。因此,除非我们打算创造人造人,或者除非AI真正具身化并拥有人类体验,否则人类将始终是经济中想法的生成者。
Erlk Torenberg:在某个时间点,关于人类角色的部分,因为你创建了可以说是宇宙中最好的集体智慧平台之一。现在你又全身心投入Poe。你对以下问题有何看法:我们将在多大程度上依赖人类的多样性?我们是否会信任他们作为某种看护者或其他角色?
Adam D’Angelo:人类集体拥有很多知识。即使是一个作为专家的个体,他度过了整个人生,拥有完整的职业生涯,见过很多世面,他们通常知道很多没有在任何地方被记录下来的东西。不仅仅是测试,也包括他们有能力写下来的东西。当你问他们一个问题时。我认为人们在世界上分享他们的知识仍然扮演着重要的角色,特别是当他们拥有的知识原本并不在大型语言模型的训练数据中时。至于他们是否能以此谋生,我不知道,但如果那成为瓶颈,那么毫无疑问,各种经济压力都会指向那里。关于“你必须是人才能知道人类想要什么”这一点,我不太确定。举个例子,我认为任何推荐系统,比如为你的Facebook、Instagram、Quora信息流排序的系统,这些推荐系统在预测你对什么内容感兴趣方面已经超乎人类了。如果我给你一个任务,说“为我制作一个我会阅读的信息流”,无论你多么了解我,你都无法与这些算法竞争。它们拥有关于我过去点击过的一切、其他人点击过的一切、所有这些不同数据集之间相似性的海量数据。所以我不知道。确实,作为人类,你可以模拟作为人类的感受,这让你更容易测试想法。我确信作曲家和艺术家在工作中,这是他们创作过程的重要组成部分。
Amjad Masad:当他们应该创作出某些东西时。
Adam D’Angelo:烹饪某样东西,然后品尝它,他们能够品尝这一点很重要。但我不确定,他们拥有的数据与AI可以训练的数据相比非常少。所以我不知道这会如何发展。
Amjad Masad:说得有道理。最终,推荐系统是在聚合所有不同的品味,然后找到你的位置,在某种多维品味因子空间中为你找到最好的内容。所以我想有这方面的因素。但我认为这比我们想象的要狭窄。推荐系统确实如此,但我不确定这是否适用于所有事情。所以我认为对未来世界最好的预测,来自于《The Sovereign Individual》这本书。这并非表示我完全赞同或认为其必然发生,但我认为世界正朝着这个方向发展,尽管我认为部分结果可能是一个略微不稳定的系统。但我认为《The Sovereign Individual》仍然是对未来的一套非常好的预测,尽管它不是科学著作,而是一本非常博学的书。其核心思想是,在八十年代末、九十年代初,两位来自英国的经济学家——我认为经济学是一门不那么精确的科学——写了这本书,试图预测计算机技术成熟后会发生什么。
他们说,人类经历了农业革命和工业革命,我们显然正在经历另一场革命——信息革命,现在我们称之为智能革命或其他。我认为我们将来无法用一个特定的名称来称呼它。未来的人们会用一个名称来称呼它,但我们确实正在经历某种变革。所以他们试图预测接下来会发生什么。他们得出的结论是,最终,将会有大量人口失业或在经济上不再做出贡献。但是,企业家、创业催化剂的数量将会增加,因为他们可以利用AI智能体非常快速地创建公司。因为他们具有这种通用性,他们拥有有趣的想法。他们是人类,他们对其他人想要什么有有趣的想法。他们可以非常快速地创建这些公司和产品服务,并以某种方式组织经济。政治也会改变,因为今天的政治是基于每个人在经济上都具有生产力。但当只有少数创业者和非常有趣的、真正能够生产力的人时,政治结构也必须改变。所以他们谈到民族国家如何衰落,取而代之的是回到一个各国竞争人才、竞争富人的时代,作为一个主权个体,你可以与你喜欢的国家协商税率等等。这听起来有点科幻,但我不认为这离我们可能走向的未来很远。再次强调,这不是价值判断或我的愿望,但我确实认为值得思考:当人们不再是经济生产力的核心时,事情必须改变,包括文化和政治。
技术格局演变与创业生态展望
Erlk Torenberg:关于那本书和更广泛的问题:技术何时会奖励防御者而非聚合者?技术何时会激励更去中心化的力量?AI似乎确实赋能了许多个体,正如你们所说。然后加密货币结果,它赋能了民族国家吗?我认为这是一个悬而未决的问题:哪种技术更多地赋能了边缘还是中心?我认为如果你能赋能边缘,它似乎有利于主权个体。也许更准确的描述是:两者都在发生,大体上,巨头变得非常、非常、非常大,同时也存在这些孤立的个体。
Adam D’Angelo:我对独立创业者数量的增加感到非常兴奋。这些技术将催生的独立创业者数量,我认为会大幅增加。一有如此多的想法从未被探索,因为组建一个团队、可能筹集资金、找到具备所有所需不同技能的合适人选需要大量工作。而现在,一个人就能将这些想法变为现实,我认为将会出现很多真正了不起的东西。
Amjad Masad:我经常在推特上看到人们用他们的副业赚了很多钱,他们使用像Bubble这样的工具。这真的很令人兴奋。我认为这是首次机会并非零和游戏。
Adam D’Angelo:对每个人都是。
Amjad Masad:我认为对我来说,这项技术最令人兴奋的地方,除了我们讨论的所有其他方面之外,正是能够让更多人成为创业者。
Adam D’Angelo:这种趋势是......
Erlk Torenberg:显然会在未来十年发生吗?或者你认为这更可能是持续性的还是颠覆性的?换种方式问:你认为大部分价值捕获将来自已经规模化的公司,比如OpenAI这样的初创公司?或者你认为大部分价值将被之后创立的公司捕获?
Adam D’Angelo:有一个相关的问题,那就是超大规模公司与其他所有参与者之间,究竟能获得多少价值?在这个问题上,我认为我们实际上处于一个相当好的平衡状态:超大规模公司之间有足够的竞争,使得应用层面的公司有选择、有替代方案,而且价格正在以惊人的速度下降。但同时,竞争又没有激烈到像Anthropic和OpenAI这样的超大规模公司无法筹集资金并进行这些长期投资。所以我认为我们处于一个相当好的平衡状态,我们将会有很多新公司出现,同时超大规模公司也会大幅增长。
Amjad Masad:我认为这大致正确。关于持续性创新与颠覆性创新的理论困境来自“创新者的窘境”。其核心思想是,每当出现新的技术趋势时,它最初几乎像个玩具,或者服务于市场的低端,不引人注目。但随着它发展,它沿着价值曲线上升,最终甚至颠覆了现有者。所以最初现有者不关注它,因为它看起来像个玩具,但最终它颠覆了整个市场。个人电脑就是如此。个人电脑出现时,大型机厂商没有关注它,最初个人电脑的广告像是给孩子们的玩具,而他们则需要运行大型计算机、数据中心等等。但现在甚至连数据中心也运行在个人电脑架构上。个人电脑是一股巨大的颠覆性力量。但也有一些技术出现后,真正惠及了现有企业,并没有真正惠及新玩家、初创公司。
我认为,Adam说得对,这次是两者兼有。也许这是第一次出现如此巨大的技术趋势,既是持续性的又是颠覆性的。像云计算就是一股巨大的颠覆性力量。但这次,感觉它显然为现有企业、超大规模公司、大型互联网公司提供了超级动力。但它也催生了可能对抗现有企业的新商业模式。尽管,我认为发生的情况是每个人都读了那本书,每个人都学会了如何不被颠覆。例如,ChatGPT从根本上是对谷歌的对抗定位,因为谷歌有一个实际上运行良好的业务。ChatGPT被视为一个玩具,有很多关于信息的幻觉问题,而谷歌希望成为被信任的来源。所以谷歌内部有顾忌,他们在ChatGPT之后大约两年才发布模型,而ChatGPT那时已经在品牌认知度上占据了优势。所以在某种程度上,OpenAI是作为颠覆性技术出现的。但现在谷歌意识到这是一种颠覆性技术,同时也感到有责任。与此同时,AI显然会变得比谷歌更好,至少,搜索概览变得好多了,Workspace也通过Gemini变得好多了,他们的手机,所有东西都变得更好了。所以看起来确实是两者兼有。
Adam D’Angelo:我非常同意。就像每个人都读了那本书,这改变了它的含义,因为所有公开市场的投资者都读了那本书,他们现在会惩罚不适应的公司,奖励那些适应的公司,即使这意味着它们必须进行长期投资。所有公司的管理领导层也都读了那本书,他们处于高度警觉状态。而且,运营这些公司的人,我猜,也更聪明。我认为那本书所基于的那一代公司,它们正处于巅峰状态,其中很多是创始人控制的,因此他们更容易做出决策,承受冲击并进行这些投资。所以,实际上,你知道,如果你有一个更像我们过去比如九十年代的环境,我认为这次技术实际上会比现在这个高度竞争的世界更具颠覆性。
Erlk Torenberg:过去几年或过去几个月里反思过的一个想法是:我们曾经错过一些公司,因为我们认为它们不会成为市场领导者、品类赢家。我们从Web 2.0中学到的教训是,你必须投资品类赢家。事情会逐渐整合。为什么下一个基础模型公司不能作为初创公司出现?但似乎市场变得如此之大,无论是在基础模型还是应用层面,都有多个赢家,它们正在细分市场,各自都达到了风险投资规模。我很好奇,这是一种持久的现象吗?但这似乎是与Web 2.0的一个不同之处:有更多的赢家分布在更多的类别中。
Adam D’Angelo:我认为网络效应现在所起的作用,远不如Web 2.0时代那么重要了。这使得竞争对手更容易起步。规模优势依然存在,因为如果你拥有更多用户,就能获得更多数据;拥有更多用户,就能筹集更多资金。但这种优势并非绝对,并未使得规模较小的竞争者完全无法生存。这确实增加了难度,但毫无疑问,市场能够容纳比以往更多的赢家。
Erlk Torenberg:比以往任何时候都多。另一个不同之处在于,人们如此强烈地认识到其价值,以至于他们愿意早早付费,这与Web 2.0时代形成对比,那时我们创办公司时很难盈利。Facebook和谷歌当时也面临如何盈利的问题。你们公司包括Quora在内的动机是什么?
Amjad Masad:还存在地缘政治问题。很明显我们并非处于一个完全全球化的世界,或许情况会变得更糟。因此,投资于欧洲的OpenAI之类的基础模型公司可能是个好主意。所以这些地缘政治因素都会产生影响。
Erlk Torenberg:地缘政治和技术的交叉点是有帮助的,是有用的。我们之前谈到人类知识,你如何看待Poe在某种意义上颠覆了你们自己的业务?或者谈谈你在Poe上所做的赌注及其演变。
Adam D’Angelo:我认为我们更多地将Poe视为一个额外的机会,而不是对Quora的颠覆。我们是这样做的:在2022年初,我们开始尝试使用GPT-3 为Quora生成答案,并将其与人类答案进行比较,意识到它们还不够好。但真正独特的是,你可以立即得到任何你想问的问题的答案。而且我们发现,用户实际上更希望这是私密的,而非公开的。因此,我们觉得这里有一个新的机会,可以让人们私下与AI聊天。
Erlk Torenberg:你们也在赌不同的参与者会如何发展。
Adam D’Angelo:所以我也押注于模型公司的多样性,这需要一段时间才能显现出来。但我认为现在我们正达到这样一个阶段:有非常多的模型,非常多的公司,尤其是当你考虑到图像模型、视频模型、音频模型时。特别是推理研究模型正在分化,智能体也开始成为多样性的来源。所以我们很幸运现在能进入这个世界,已经有足够的多样性使得一个通用的接口聚合器变得有意义。不过,我们当初是有点早了。
Amjad Masad:实际上令人惊讶的是,即使是不太懂技术的普通消费者也确实会使用多个AI。我没想到会这样,你知道,人们过去只使用谷歌,他们从不看雅虎或者其他,很少有人这样做。但现在你和普通人交谈,他们会说,我付费使用ChatGPT,但Claude更擅长这类分析。所以用户的成熟度很有意思。
现在甚至有人说他们觉得Claude的个性更能引起共鸣。我想回到我们之前提到的一点,关于我们可以称之为"暗物质"的知识——我们将被迫去获取。人们拥有大量尚未被归类、不仅仅是测试的知识,而是你可以询问他们、他们能够描述出来的知识。因为人们关于AI的一个问题是:我们已经训练了整个互联网,还有多少知识存在?是十倍吗?还是一千倍?你直觉上认为,如果我们通过蛮力方式,建造这台巨大的机器,把所有人类知识提取出来,形成一个我们可以使用的数据集,那么我们从中能获得多大的提升空间?
Adam D’Angelo:你知道,我认为这很难量化,但一个庞大的产业正在形成,致力于将人类知识转化为AI可用的形式。这包括像Scale AI、Surge AI这样的公司,还有大量刚起步的长尾公司。随着智能变得越来越便宜、越来越强大,我认为瓶颈将越来越多地集中在数据上,以及创造这种智能需要什么。这将导致越来越多这样的事情发生。人们可能通过训练AI来赚更多钱,可能会有越来越多的这类公司成立,或者可能有其他形式。但我认为,经济自然会重视AI所能做的事情。
Erlk Torenberg:什么是评估AI能做什么的框架?如何模型化AI的能力?
Adam D’Angelo:你可以问AI研究员,他们可能有更好的答案。但对我来说,就是那些不在训练数据集中的信息。这是目前AI无法做到的。你知道AI会变得非常聪明,它能进行大量推理,在某个时间点,它甚至能从你给它的某些公理出发证明每一个数学定理。但如果它不知道这家特定的公司在二十年前是如何解决这个问题的,并且这些信息不在训练集中,那么只有知道这个信息的人类才能回答这个问题。
Erlk Torenberg:那么随着时间的推移,你如何看待Quora的定位?你们如何并行运营这些业务?你对此有何看法?
Adam D’Angelo:Quora专注于人类知识,让人们分享他们的知识。这些知识可能对其他人类有帮助,也对AI的训练有帮助。我们与一些AI实验室有合作关系,Quora将在这个生态系统中扮演它一直扮演的角色,即作为人类知识的来源。同时,我们也在让Quora变得更好。通过应用AI,我们已经在内容审核质量、答案排序以及改善产品体验方面取得了重大改进。所以Quora本身也因此变得更好了。
Erlk Torenberg:我也想问一下Replit的未来。显然,你经营这个业务已经很长时间了,专注于开发者。你们的目标是盈利吗?
Amjad Masad:不完全是。
Erlk Torenberg:科技市场,据报道有两三百万美元的收入。然后最近,科技巨头……我知道这已经过时了,我记得报道说是1.5亿?我知道自从你们转变了商业模式和客户细分后,取得了惊人的增长。你如何看待Replit的未来?
Amjad Masad:我认为David Capps最近说过,这将是智能体的十年,我认为这绝对正确。就像过去AI编程的模式演变:当AI 首次进入编程领域时,完全是关于补全,比如GitHub Copilot。然后变成了聊天模式,比如ChatGPT。然后我认为Cursor在"composer"模式上进行了创新,即编辑大段代码文件。
但话说回来,我认为Replit是在"智能体"模式上进行了创新,其理念是不仅提供代码补全,还包括基础设施配置,如数据库、执行迁移、连接云平台、部署、拥有完整的调试循环——执行代码、运行测试。因此,将整个软件开发生命周期闭环都纳入一个智能体中,而这需要很长时间才能成熟。所以我们的智能体在2024年9月进入测试版。它是首个同时处理代码和基础设施的智能体,但当时还相当不稳定,不过效果很好。
然后到了12月,随着新一代模型的发布——从Claude 3.5 到3.7,3.7是第一个真正懂得如何使用计算机的模型,这是一台虚拟机——毫不意外,它也是第一个计算机使用模型。这些事情是同步发展的。随着每一代模型的发布,我们都发现了新的能力。你知道,Agent V2在自主性方面有了很大改进。Agent V1只能运行大约两分钟。Agent V2可以运行二十分钟。Agent V3,我们宣传为可以运行二十年——这更像是一种象征性的说法,但它实际上可以近乎无限期地运行,我们有用户运行了超过28小时。这里的主要想法是,如果我们加入一个验证循环。
我记得读过一篇关于DeepSeek的视频论文,他们如何使用DeepSeek编写Kubernetes YAML文件,并且通过加入验证循环——比如能够运行测试之类的——能够运行DeepSeek大约二十分钟。那么我们能加入什么样的验证循环呢?显然可以加入你的测试,但单元测试并不能真正捕捉应用程序是否正常工作。所以我们开始深入研究计算机使用,以及计算机使用是否能够测试应用程序。计算机使用非常昂贵,实际上有点慢,而且漏洞很多。正如Adam谈到的,这将是取得重大改进并解锁许多应用的领域。我们正在构建自己的框架,整合了多种技巧、研究成果,并对计算机使用功能进行了封装。我认为测试模型是最好的方式之一。一旦我们将其纳入循环,你就可以让Replit AI实现高度自主。我们有一个自主模式,你可以选择你的自主级别,然后它就会编写代码,去测试应用程序,如果发现错误,它会追踪错误并重写代码,可以持续运行数小时。我见过人们构建了惊人的东西,让它运行了很长时间。这需要继续改进,需要变得更便宜、更快。所以最近的一个目标是让它运行时间更长,但同时也应该尽可能快。我们正在努力。
Agent V4包含一系列即将推出的想法。但其中一个重点是,你不应该只等待一个你要求的功能完成。你应该能够同时处理许多不同的功能。所以"强力智能体"的概念对我们来说非常有趣。比如,你要求一个登录页面,同时也可以要求一个Stripe结账功能,然后还可以要求一个管理仪表板。AI应该能够弄清楚如何并行处理所有这些不同的任务,或者有时无法并行时也能处理,并且还应该能够跨代码进行合并。因此,实现AI智能体之间的协作非常重要。通过这种方式,单个开发者的生产力会大大提高。目前,即使你使用Cursor或其他工具,仍然有很多上下文切换。但我认为下一个生产力提升将来自于坐在像Replit这样的编程环境中,管理许多智能体——可能在某个时候达到数百个,但至少是五、六、七、八、九、十个智能体,它们都在处理你产品的不同部分。我还认为,UI/UX方面还有很多工作要做。
目前,你试图将你的想法转化为文本描述。就像PRD那样,产品经理撰写产品描述,但产品描述很难精确。你会看到很多科技公司很难在具体功能上达成一致,因为语言是模糊的。因此我认为,未来我们与AI的交互将变得更加多模态。比如打开一个白板,能够绘制图表,真正像与人类合作那样与之协作。然后,下一阶段是拥有更好的记忆——项目内的记忆以及跨项目的记忆。也许拥有Replit智能体的不同实例,比如这个智能体非常擅长Python数据科学,因为它拥有关于我公司所有技能和过去所做事情的信息和记忆。所以我可能会有一个数据分析师类型的Replit智能体,一个前端Replit智能体。它们拥有跨多个项目、跨时间、跨交互的记忆,也许它们就存在于你的Slack中,像一个伙伴,你可以和它们交谈。所以,关于路线图,我可以再讲十五分钟,这可能会跨越三到四甚至五年。也许在这个智能体领域。我们目前所处的这个智能体领域,有太多工作要做,而且会非常有趣。
未来挑战与终极思考
Erlk Torenberg:我前几天和我们一位共同的朋友,一家大型生产力公司的联合创始人聊天。他说,伙计,现在这一周里,我甚至都不怎么和真人说话了。就是使用所有这些智能体来构建东西。这就像是生活在未来,而未来已经到来。
Amjad Masad:关于这一点,有些有趣的事情。人们在公司里彼此交谈是否变少了?这是坏事吗?我开始更多地思考这类事情的二阶效应。这可能会让新入职的员工感到尴尬。我为他们感到难过。如果人们因为觉得‘你应该能用AI智能体解决问题’,而减少了彼此间的知识分享,或在Slack上更少寻求帮助...我认为有一些文化力量需要认真对待。
Erlk Torenberg:很多棘手的文化力量。我们快接近尾声了。显然,你们专注于运营自己的公司,但为了了解生态系统的最新动态,你们也进行投资。你们对哪些领域最感到兴奋?我们谈到了机器人技术。Adam对机器人技术近期看好吗?或者有任何新兴类别、用例或领域是你们希望进行更多投资或关注的?
Adam D’Angelo:我认为(AI辅助)编程领域蕴含着难以置信的潜力。其核心在于将软件创造的能力开放给大众,让每个人都能参与其中。所以我认为一个被低估的原因是,这些工具距离专业软件工程师的能力还差得很远。如果你想象它们将达到那个水平——我认为没有理由在几年内达不到——那么就好像世界上每个人都将能够创造出原本需要一个由一百名专业软件工程师组成的团队才能完成的东西。这将为每个人极大地打开机会之门。所以我认为Replit就是一个很好的例子,但我认为除了构建应用程序之外,还会有其他用例被创造出来。
Erlk Torenberg:顺便问一下,如果你们今天去斯坦福或哈佛读书,现在是2025年,你们会主修什么?还是计算机科学吗?或者去创业?
Adam D’Angelo:我是在2002年开始上大学的,那时互联网泡沫刚刚破裂。当时有很多悲观情绪。我记得我的室友的父母告诉他不要学计算机科学,尽管那是他真正喜欢的。而我学计算机只是因为我喜欢它。我认为现在的就业市场肯定比几年前更差。但与此同时,掌握这些理解算法和数据结构的可能性的基础知识,实际上在你使用和管理智能体时对你很有帮助。我猜这在未来仍然会是一项有价值的技能。另一个问题是,你还能学什么?你能想到的每一个领域,都有论点说明它将被自动化。所以我认为你不如学习你喜欢的领域。而且我认为计算机科学和其他任何学科一样好。
Amjad Masad:我认为有很多令人兴奋的事情。有件事可能有点随机,但我真的对看到一些疯狂的科学实验感到兴奋,比如前几天DeepSeek发布的OCR技术。你看到了吗?太疯狂了。我只是粗略看了一下。但基本上,如果你使用文本的屏幕截图而不是纯文本,你可以在上下文窗口的使用上经济得多。
Amjad Masad:有趣的事情。我看到一些关于文本到图像的工作,有人通过不采用去噪的方法,而是使用单个BERT模型,尝试组合不同的词,只是预测这些不同的token,从而制作了一个文本到图像模型。我们有很多组件,我认为人们对此思考得不多。你知道,我们现在有基础预训练模型,有所有这些推理模型,有后训练模型,有融合模型。有所有这些不同的东西,就像你可以用不同的方式混合它们。我感觉这方面的探索还不够。如果有一家新的研究公司出现,不是试图与OpenAI等公司竞争,而是试图探索如何将这些不同的组件组合在一起,或者创造这些模型的新变体,那将会很棒。
Erlk Torenberg:他们谈论组合顺序,比如将基本构件混合在一起。
Amjad Masad:现在进行的实验性探索较少。我记得在Web 2.0时代,当我们还在摸索我们的工作,探索浏览器和Web Workers能做什么的时候,有很多非常有趣、奇怪的实验。Replit就是诞生于那个时期。Replit最初的开源版本,我的兴趣点是"你能编译C代码吗?"那只是当时众多探索之一,而Java本身就是一个原生hack。但我认为有太多……我认为我们硅谷现在有点狭隘,非常受金钱驱动,这让我有点难过,这也是我将公司搬出美国的部分原因。我感觉美国的文化可能变得……也许我当时不在那里,但听说在互联网泡沫时期或加密货币热潮时期,很多人谈论过这种"快速致富"的心态。所以我觉得需要更多的修补和探索,我很乐意看到更多公司获得资助,去尝试做一些更新颖的事情,即使它不一定是全新的基础模型。
Erlk Torenberg:最后一个问题。你长期以来对意识问题很感兴趣。你是否乐观地认为,通过某些AI工作或其他地方的某些科学项目,我们能在理解意识这个"困难问题"上取得进展?
Amjad Masad:最近发生了一件有趣的事。Claude 4.5似乎对其上下文长度有了更强的意识。当接近上下文窗口末尾时,它使用token变得更加经济。而且,当它在被引导或处于测试环境中时,它的警觉性似乎显著提高。所以那里正在发生一些相当有趣的事情。现在,关于意识问题,它从根本上仍然不是一个科学问题,而且某种程度上我们已经放弃了将其科学化的努力。但我也认为,这同样是我谈到的问题:所有精力都投入到大型语言模型上,没有人真正尝试思考智能的真正本质、意识的本质。有很多非常核心的问题,比如我最喜欢的一个是Roger Penrose的《皇帝新脑》,那是一本关于心灵哲学的书。在书中,他试图证明大脑从根本上不可能是一台计算机,因为人类能够做到图灵机无法做到的事情,或者说图灵机从根本上会陷入困境的事情,比如一些基本的逻辑谜题。例如,"这个陈述是假的"这样的古老逻辑谜题,在图灵机中无法确保一致性。总之,这是一个复杂的论证。但如果你读了那本书或同类著作,会发现这是心灵哲学中一个核心论证脉络,探讨计算机为何在根本上不同于人类智能。所以,我最近非常忙,没有太多更新这方面的思考。但我认为那里有一个巨大的研究领域尚未被探索。
Erlk Torenberg:如果你今天是一名刚进入大学的新生,你会研究那个吗?
Amjad Masad:我肯定会研究心灵哲学。我可能也会进入计算机科学,因为我认为随着AI 接管更多的工作和经济,这些核心问题将变得非常重要。
Erlk Torenberg:这是一个很好的结束点。非常感谢你们来做客播客。
原文:Amjad Masad & Adam D’Angelo: How Far Are We From AGI?
https://www.youtube.com/watch?v=191Ojd7Rq6s
编译:Cynthia Wang
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。