AI学什么(第15期):开源与闭源之争
创始人
2025-08-20 21:43:32
0

大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普的栏目。这个栏目的宗旨是"用最精彩的故事,讲述最硬核的知识"。在这里,你将看到深入浅出的AI核心技术解析,既不会被枯燥的技术细节困扰,也不会停留在肤浅的概念层面。通过生动的类比、通俗的语言和完整的故事,帮助你在轻松阅读中掌握那些看似难以理解的AI知识,培养应对AI时代的核心认知能力。无论你是AI领域的新手,还是希望加深理解的从业者,这里都能为你提供清晰的知识和独特的思考角度。

1983

1983年9月27日,麻省理工学院的一位名叫理查德·斯托曼的程序员,在他狭小的办公室里做出了一个看似疯狂的决定:他要创建一个完全免费的操作系统,让任何人都能自由使用、修改和分发。

当时,软件行业正处于商业化的黄金时期。微软、苹果等公司通过严格的版权保护和许可证制度,将软件变成了可以售卖的商品。而斯托曼的想法却完全相反——他认为软件应该像空气和水一样,是人类共享的资源。

斯托曼发起的GNU项目(GNU意为"GNU's Not Unix"),成为了后来整个开源运动的起点。他的理念简单而激进:软件的源代码应该对所有人开放,让每个人都能学习、改进和分享。

这个决定在当时看来近乎疯狂。谁会花费大量时间和精力去开发一个免费的软件?谁会相信一群分散在世界各地、从未谋面的志愿者能够创造出比专业公司更好的产品?但历史证明,斯托曼的疯狂想法改变了世界。今天,从安卓手机到网站服务器,从超级计算机到智能家电,开源软件无处不在。

OpenAI还是CloseAI

斯托曼提出开源理念的32年后,AI领域出现了一个有趣的悖论。

2015年12月,旧金山一座不起眼的办公楼里,山姆·奥特曼、埃隆·马斯克等几位硅谷巨头聚在一起,讨论着一个雄心勃勃的计划:创建一家名为OpenAI的公司,致力于开发安全的人工智能。

他们的初衷很简单——确保AI技术不会被少数大公司垄断,要让AI惠及全人类。然而,现实比理想复杂得多。随着技术的突破和商业的压力,OpenAI的策略发生了微妙而深刻的变化。

2018年,他们发布了GPT-1,一个拥有1.17亿参数的语言模型。虽然能力有限,但已经显露出非凡的潜力。

2019年,GPT-2面世,参数量增长到15亿。这次,OpenAI做出了一个前所未有的决定:拒绝公开完整的模型。他们声称这个模型"太危险了",可能被恶意使用来生成假新闻和虚假信息。

这个决定在学术界引起了激烈争议。一些人支持OpenAI的谨慎态度,认为确实需要考虑AI技术的潜在风险;但另一些人批评这是对开放科学传统的背叛,认为这只是为了获得商业优势的借口。

2020年,GPT-3横空出世,1750亿个参数的庞大规模在AI界引起轰动。这次,OpenAI的策略更加明确:通过API的形式提供服务,严格控制访问权限。你可以使用GPT-3的能力,但不能把它打包带回家。

到了2023-2024年,GPT-4系列的发布标志着这种必源策略的巅峰。这个模型的某些能力已经接近人类水平,后续的GPT-o系列发布后,迅速被应用到教育、医疗、法律、编程等各个领域,为OpenAI带来了巨大的商业成功。但关于它的技术细节,OpenAI三缄其口,连参数量都不愿透露。

从Open到Close,也就过了几年时间。

而面对各种质疑之声,OpenAI的逻辑很清晰:

1. AI技术如果被恶意使用,可能造成巨大危害。通过控制访问,可以确保技术被负责任地使用。

2. 训练GPT-4需要上亿美元的投入,如果技术完全开放,如何收回成本?如何维持持续的研发?

3. 集中式的开发可以确保模型的一致性和可靠性,避免了"九龙治水"的混乱。

听上去挺有道理,但很多话细品之后就觉得不是那么一回事。

但凡事就有两面。

Meta的开源

2023年2月,Meta(Facebook的母公司)做出了一个违背祖宗的决定:完全开源他们的大语言模型LLaMA。这意味着任何人都可以下载模型的权重文件,在自己的电脑上运行,甚至对其进行修改和再分发。

这就像斯托曼当年的选择在AI时代的重演——一位武林高手突然决定将自己的绝世武功公布于众,任何人都可以学习、修改、传授。在一个"神兵利器"被严格保密的时代,这种做法极其大胆。

消息传出后,AI社区立刻沸腾了。仅仅几天时间,LLaMA就被下载了数十万次。更神奇的是,全世界的开发者开始在LLaMA的基础上进行创新:

Alpaca:斯坦福大学的研究团队用很少的数据就让LLaMA学会了遵循指令,证明了小数据也能产生大效果。

Vicuna:加州大学的团队创造了一个在对话能力上接近GPT-4的版本。

WizardLM:微软亚洲研究院推出的版本在复杂推理任务上表现出色。

Code Llama:专门用于编程的版本,在代码生成和调试方面能力超群。

(我只是单纯很喜欢这张照片....才怪)

这些创新的速度快得令人目不暇接。几乎每周都有新的改进版本出现,每个版本都在某个方面有所突破。这就像是一场"人民战争"——虽然单个参与者的力量有限,但当成千上万的人联合起来时,爆发出的创新能量令人刮目相看。

为什么Meta要这样做?他们难道不担心竞争对手抄袭吗?

Meta的CEO马克·扎克伯格在一封内部信中解释了他们的逻辑:与其让OpenAI一家独大,不如培育一个开放的生态。这种想法让人想起当年斯托曼对抗软件垄断的信念——技术太重要了,不应该被少数公司控制。

然后,扎克伯格在2024年的公开信中进一步阐述了这个理念:"我们的愿景是应该有很多不同的AI存在,而不是只有一个单一的AI。我认为我们将生活在一个最终会有数亿甚至数十亿个不同AI智能体的世界里。"这个愿景的核心是多样性——就像自然界的生态系统一样。

在这个复杂的生态系统中,没有中央控制者,没有统一的规划,但却能够产生令人叹为观止的多样性和创新。每一种生物都在适应环境、寻找生存空间,它们相互竞争也相互依存,最终形成了一个充满活力的整体。

斯坦福的Alpaca专注于指令遵循,加州大学的Vicuna优化对话能力,微软的WizardLM深耕复杂推理——每个团队都在寻找自己的"生态位"。

但这种开源生态的繁荣,也意味着传统科技巨头面临着前所未有的挑战。当技术壁垒被大规模拆除,当创新的门槛被急剧降低,那些曾经看似坚不可摧的商业堡垒,也开始显露出脆弱的一面。

没有护城河的世界

2023年4月,一份谷歌内部文档意外泄露,标题是:《我们没有护城河,OpenAI也没有》。这八个字在整个AI行业掀起波澜,印证了开源模式的颠覆力量。

传统商业的护城河——专利技术、品牌优势、规模效应——在开源AI面前失效了。你花数年时间、数亿美元开发的先进模型,别人基于开源版本,用十分之一的成本和时间就能做出相当的产品。更要命的是,全世界有成千上万个团队在借助AI同时尝试。

而谷歌内部信中描述的现实就是:"虽然我们在争论GPT和Bard谁更强(Bard即现在的Gemini),开源社区已经悄悄赶上甚至超越了我们。他们用更少资源创造出性能相当的模型,迭代速度比我们快得多。"

但问题远比这更复杂。在没有护城河的世界里,公司面临着双重威胁:既有竞争对手的挑战,更有一个意想不到的敌人——模型本身。

随着模型能力的不断提升,越来越多的应用场景被模型本身所吞噬。那些原本需要专门开发的垂直应用,现在可能只需要一个提示词就能实现。这种"降维打击"让无数创业公司夜不能寐。

在这样的环境下,公司该如何生存?真正的护城河不在技术,而在认知。

具体来说,是对行业的深度认知和对垂直领域的专业理解。通用模型虽然强大,但它们就像是瑞士军刀——什么都能做,但在特定场景下未必是最优解。机会属于那些深耕某个领域、理解用户痛点的公司。

比如,一个通用的AI模型可能能够分析财务数据,但只有深度理解会计准则、税务法规、行业惯例的团队,才能开发出符合CFO需求的财务AI助手。通用模型可能能够生成法律文档,但只有理解不同司法管辖区法律差异、掌握实务操作细节的律师,才能打造出可靠的法律AI工具。

在没有护城河的世界里,最深的护城河反而是那些看不见的东西——对行业的洞察、对用户的理解、对场景的把握。这些认知无法被简单复制,也无法被模型轻易替代。它们需要时间积累、需要实践验证、需要与真实用户的深度交互。

这种认知护城河的建立,需要创业者从"技术思维"转向"场景思维"——关键在于理解"用户真正需要什么",而非"我的技术能做什么"。重点应该放在解决方案的适用性上,技术的先进性反而是次要的。

但仅仅有认知还不够,护城河需要更深层的东西——专业级的数据积累和对场景的洞察能力。

以医疗AI公司为例,他们在理解医学知识的基础上,更要拥有真实的临床数据、病例记录、诊疗流程。这些数据来自实际医疗场景的积累,是网上无法搜到的珍贵资产。更重要的是,他们能够透过表面的症状,看到医生真正的决策逻辑,理解不同科室之间的协作模式,把握患者就医的真实痛点。

这种洞察力的获得,需要长期的行业浸润和专业级的数据积累。你需要与真实用户深度合作,收集那些外人无法获得的一手信息,建立起属于自己的数据飞轮。当你拥有了行业内最真实、最全面的数据时,你就拥了别人无法复制的竞争优势。

最关键的是,要能够将这些深度洞察和专业数据打包成标准化的产品。重点在于将行业know-how固化成可复制、可扩展的解决方案,超越传统的咨询服务模式。这样,你就从一个"懂行的人"变成了一个"改变行业的产品"。

在没有护城河的AI时代,真正的护城河就是这样建立起来的:深入行业腹地,收集专业级数据,洞察真实场景,然后将这一切打包成别人无法轻易复制的产品。这种护城河看似简单,实际上需要时间、耐心和对行业的真正热爱。

回到1983年的选择

回到文章开头——1983年的理查德·斯托曼在小办公室里做出的那个"疯狂"决定。

当时几乎没有人相信开源能成功,但斯托曼坚持了下来。他相信,真正强大的技术应该像河流一样自由流淌,滋养更广阔的土地。

映射到今天,AI的王座永远不应该只属于一个人,而应该属于所有致力于让技术造福人类的人们

我是蓝衣剑客,谢谢你看我的文章。

大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普的栏目。这个栏目的宗旨是\x26quot;用最精彩的故事,讲述最硬核的知识\x26quot;。

相关内容

AI学什么(第15期):开...
大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普...
2025-08-20 21:43:32
华瑞指数云发布AI原生数据...
在人工智能作为引领新一轮科技革命和产业变革的战略性技术迅猛发展之际...
2025-08-20 12:43:56
DeepSeek开源新模型...
IT之家 8 月 20 日消息,DeepSeek 昨天深夜在 Hu...
2025-08-20 09:44:29
重磅!华为发布突破性技术—...
华为在2025金融AI推理应用落地与发展论坛上,正式发布了一项AI...
2025-08-20 06:43:38
广发证券“易淘金App”完...
近日,广发证券旗下“易淘金App”完成全方位AI原生化升级,实现从...
2025-08-19 23:15:25
“区域AI枢纽”与“广西桥...
原标题:在新加坡AI现场@广西 “区域AI枢纽”与“广西桥头堡”的...
2025-08-19 23:13:59

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...