大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普的栏目。这个栏目的宗旨是"用最精彩的故事,讲述最硬核的知识"。在这里,你将看到深入浅出的AI核心技术解析,既不会被枯燥的技术细节困扰,也不会停留在肤浅的概念层面。通过生动的类比、通俗的语言和完整的故事,帮助你在轻松阅读中掌握那些看似难以理解的AI知识,培养应对AI时代的核心认知能力。无论你是AI领域的新手,还是希望加深理解的从业者,这里都能为你提供清晰的知识和独特的思考角度。
1983
1983年9月27日,麻省理工学院的一位名叫理查德·斯托曼的程序员,在他狭小的办公室里做出了一个看似疯狂的决定:他要创建一个完全免费的操作系统,让任何人都能自由使用、修改和分发。
当时,软件行业正处于商业化的黄金时期。微软、苹果等公司通过严格的版权保护和许可证制度,将软件变成了可以售卖的商品。而斯托曼的想法却完全相反——他认为软件应该像空气和水一样,是人类共享的资源。
斯托曼发起的GNU项目(GNU意为"GNU's Not Unix"),成为了后来整个开源运动的起点。他的理念简单而激进:软件的源代码应该对所有人开放,让每个人都能学习、改进和分享。
这个决定在当时看来近乎疯狂。谁会花费大量时间和精力去开发一个免费的软件?谁会相信一群分散在世界各地、从未谋面的志愿者能够创造出比专业公司更好的产品?但历史证明,斯托曼的疯狂想法改变了世界。今天,从安卓手机到网站服务器,从超级计算机到智能家电,开源软件无处不在。
OpenAI还是CloseAI
斯托曼提出开源理念的32年后,AI领域出现了一个有趣的悖论。
2015年12月,旧金山一座不起眼的办公楼里,山姆·奥特曼、埃隆·马斯克等几位硅谷巨头聚在一起,讨论着一个雄心勃勃的计划:创建一家名为OpenAI的公司,致力于开发安全的人工智能。
他们的初衷很简单——确保AI技术不会被少数大公司垄断,要让AI惠及全人类。然而,现实比理想复杂得多。随着技术的突破和商业的压力,OpenAI的策略发生了微妙而深刻的变化。
2018年,他们发布了GPT-1,一个拥有1.17亿参数的语言模型。虽然能力有限,但已经显露出非凡的潜力。
2019年,GPT-2面世,参数量增长到15亿。这次,OpenAI做出了一个前所未有的决定:拒绝公开完整的模型。他们声称这个模型"太危险了",可能被恶意使用来生成假新闻和虚假信息。
这个决定在学术界引起了激烈争议。一些人支持OpenAI的谨慎态度,认为确实需要考虑AI技术的潜在风险;但另一些人批评这是对开放科学传统的背叛,认为这只是为了获得商业优势的借口。
2020年,GPT-3横空出世,1750亿个参数的庞大规模在AI界引起轰动。这次,OpenAI的策略更加明确:通过API的形式提供服务,严格控制访问权限。你可以使用GPT-3的能力,但不能把它打包带回家。
到了2023-2024年,GPT-4系列的发布标志着这种必源策略的巅峰。这个模型的某些能力已经接近人类水平,后续的GPT-o系列发布后,迅速被应用到教育、医疗、法律、编程等各个领域,为OpenAI带来了巨大的商业成功。但关于它的技术细节,OpenAI三缄其口,连参数量都不愿透露。
从Open到Close,也就过了几年时间。
而面对各种质疑之声,OpenAI的逻辑很清晰:
1. AI技术如果被恶意使用,可能造成巨大危害。通过控制访问,可以确保技术被负责任地使用。
2. 训练GPT-4需要上亿美元的投入,如果技术完全开放,如何收回成本?如何维持持续的研发?
3. 集中式的开发可以确保模型的一致性和可靠性,避免了"九龙治水"的混乱。
听上去挺有道理,但很多话细品之后就觉得不是那么一回事。
但凡事就有两面。
Meta的开源
2023年2月,Meta(Facebook的母公司)做出了一个违背祖宗的决定:完全开源他们的大语言模型LLaMA。这意味着任何人都可以下载模型的权重文件,在自己的电脑上运行,甚至对其进行修改和再分发。
这就像斯托曼当年的选择在AI时代的重演——一位武林高手突然决定将自己的绝世武功公布于众,任何人都可以学习、修改、传授。在一个"神兵利器"被严格保密的时代,这种做法极其大胆。
消息传出后,AI社区立刻沸腾了。仅仅几天时间,LLaMA就被下载了数十万次。更神奇的是,全世界的开发者开始在LLaMA的基础上进行创新:
Alpaca:斯坦福大学的研究团队用很少的数据就让LLaMA学会了遵循指令,证明了小数据也能产生大效果。
Vicuna:加州大学的团队创造了一个在对话能力上接近GPT-4的版本。
WizardLM:微软亚洲研究院推出的版本在复杂推理任务上表现出色。
Code Llama:专门用于编程的版本,在代码生成和调试方面能力超群。
(我只是单纯很喜欢这张照片....才怪)
这些创新的速度快得令人目不暇接。几乎每周都有新的改进版本出现,每个版本都在某个方面有所突破。这就像是一场"人民战争"——虽然单个参与者的力量有限,但当成千上万的人联合起来时,爆发出的创新能量令人刮目相看。
为什么Meta要这样做?他们难道不担心竞争对手抄袭吗?
Meta的CEO马克·扎克伯格在一封内部信中解释了他们的逻辑:与其让OpenAI一家独大,不如培育一个开放的生态。这种想法让人想起当年斯托曼对抗软件垄断的信念——技术太重要了,不应该被少数公司控制。
然后,扎克伯格在2024年的公开信中进一步阐述了这个理念:"我们的愿景是应该有很多不同的AI存在,而不是只有一个单一的AI。我认为我们将生活在一个最终会有数亿甚至数十亿个不同AI智能体的世界里。"这个愿景的核心是多样性——就像自然界的生态系统一样。
在这个复杂的生态系统中,没有中央控制者,没有统一的规划,但却能够产生令人叹为观止的多样性和创新。每一种生物都在适应环境、寻找生存空间,它们相互竞争也相互依存,最终形成了一个充满活力的整体。
斯坦福的Alpaca专注于指令遵循,加州大学的Vicuna优化对话能力,微软的WizardLM深耕复杂推理——每个团队都在寻找自己的"生态位"。
但这种开源生态的繁荣,也意味着传统科技巨头面临着前所未有的挑战。当技术壁垒被大规模拆除,当创新的门槛被急剧降低,那些曾经看似坚不可摧的商业堡垒,也开始显露出脆弱的一面。
没有护城河的世界
2023年4月,一份谷歌内部文档意外泄露,标题是:《我们没有护城河,OpenAI也没有》。这八个字在整个AI行业掀起波澜,印证了开源模式的颠覆力量。
传统商业的护城河——专利技术、品牌优势、规模效应——在开源AI面前失效了。你花数年时间、数亿美元开发的先进模型,别人基于开源版本,用十分之一的成本和时间就能做出相当的产品。更要命的是,全世界有成千上万个团队在借助AI同时尝试。
而谷歌内部信中描述的现实就是:"虽然我们在争论GPT和Bard谁更强(Bard即现在的Gemini),开源社区已经悄悄赶上甚至超越了我们。他们用更少资源创造出性能相当的模型,迭代速度比我们快得多。"
但问题远比这更复杂。在没有护城河的世界里,公司面临着双重威胁:既有竞争对手的挑战,更有一个意想不到的敌人——模型本身。
随着模型能力的不断提升,越来越多的应用场景被模型本身所吞噬。那些原本需要专门开发的垂直应用,现在可能只需要一个提示词就能实现。这种"降维打击"让无数创业公司夜不能寐。
在这样的环境下,公司该如何生存?真正的护城河不在技术,而在认知。
具体来说,是对行业的深度认知和对垂直领域的专业理解。通用模型虽然强大,但它们就像是瑞士军刀——什么都能做,但在特定场景下未必是最优解。机会属于那些深耕某个领域、理解用户痛点的公司。
比如,一个通用的AI模型可能能够分析财务数据,但只有深度理解会计准则、税务法规、行业惯例的团队,才能开发出符合CFO需求的财务AI助手。通用模型可能能够生成法律文档,但只有理解不同司法管辖区法律差异、掌握实务操作细节的律师,才能打造出可靠的法律AI工具。
在没有护城河的世界里,最深的护城河反而是那些看不见的东西——对行业的洞察、对用户的理解、对场景的把握。这些认知无法被简单复制,也无法被模型轻易替代。它们需要时间积累、需要实践验证、需要与真实用户的深度交互。
这种认知护城河的建立,需要创业者从"技术思维"转向"场景思维"——关键在于理解"用户真正需要什么",而非"我的技术能做什么"。重点应该放在解决方案的适用性上,技术的先进性反而是次要的。
但仅仅有认知还不够,护城河需要更深层的东西——专业级的数据积累和对场景的洞察能力。
以医疗AI公司为例,他们在理解医学知识的基础上,更要拥有真实的临床数据、病例记录、诊疗流程。这些数据来自实际医疗场景的积累,是网上无法搜到的珍贵资产。更重要的是,他们能够透过表面的症状,看到医生真正的决策逻辑,理解不同科室之间的协作模式,把握患者就医的真实痛点。
这种洞察力的获得,需要长期的行业浸润和专业级的数据积累。你需要与真实用户深度合作,收集那些外人无法获得的一手信息,建立起属于自己的数据飞轮。当你拥有了行业内最真实、最全面的数据时,你就拥了别人无法复制的竞争优势。
最关键的是,要能够将这些深度洞察和专业数据打包成标准化的产品。重点在于将行业know-how固化成可复制、可扩展的解决方案,超越传统的咨询服务模式。这样,你就从一个"懂行的人"变成了一个"改变行业的产品"。
在没有护城河的AI时代,真正的护城河就是这样建立起来的:深入行业腹地,收集专业级数据,洞察真实场景,然后将这一切打包成别人无法轻易复制的产品。这种护城河看似简单,实际上需要时间、耐心和对行业的真正热爱。
回到1983年的选择
回到文章开头——1983年的理查德·斯托曼在小办公室里做出的那个"疯狂"决定。
当时几乎没有人相信开源能成功,但斯托曼坚持了下来。他相信,真正强大的技术应该像河流一样自由流淌,滋养更广阔的土地。
映射到今天,AI的王座永远不应该只属于一个人,而应该属于所有致力于让技术造福人类的人们。
我是蓝衣剑客,谢谢你看我的文章。
大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普的栏目。这个栏目的宗旨是\x26quot;用最精彩的故事,讲述最硬核的知识\x26quot;。