开源or闭源?Meta发布“最强开源大模型”Llama3.1 405B,大模型格局或迎来重新洗牌
创始人
2024-07-25 20:33:07
0

深圳商报·读创客户端记者 张郗郡

当地时间7月23日,Meta正式发布了最新版本的语言大模型Llama3.1。本次发布被AI社区视为对“开源落后论”的一次有力反击,Meta创始人、CEO扎克伯格也在发布时表示“开源AI是通往未来的道路”。

一直以来,OpenAI因为ChatGPT的封闭性遭到了外界不少诟病,称其虽名为“Open”但实际上做着“Close”的事情,而以ChatGPT-4o为代表的闭源大模型的实力却也常常让业界望而却步,似乎“闭源大模型性能一定强于开源大模型”的观念已成默认。

但是本次Llama3.1的发布似乎会改写这一格局。本次Meta发布了Llama3.1的三个版本,分别为8B、70B和405B,其中405B为“顶配”版本,Meta号称其性能可与最好的闭源模型相媲美。

“史上最强的开源大模型”

Llama3.1 405B凭什么能够与最好的闭源模型一争高下?发布Llama3.1的同时,Meta也发布了一篇题为《The Llama 3 Herd of Models》的论文,其中详细阐述了Llama3模型的研发细节。

首先,在使用上,Llama3.1 支持8种语言,并且三个版本的上下文窗口都扩展到了128K,与GPT-4 Turbo 相同;同时Llama3.1 405B拥有4050亿个模型参数,训练规模是 Llama 2的50倍,采用密集 Transformer 架构,以保持更稳定的性能。这样一来,Llama一次性可以处理的文本数量高达9.6万字,同时无论是长文本还是短文本,都可以进行“得心应手”的处理。

在论文中,Meta也公布了Llama3.1 405B与ChatGPT-4o和Claude3.5 Sonnet这些头部闭源大模型的性能对比数据。测试结果显示,Llama3.1 405B在通用性能、长文本处理与多语言处理等多个方面,得分都处于领先地位。例如在ZeroSCROLLS项目测试中,Llama3.1 405B的得分为95.2,后两者皆为90.5。

表现优异的性能与庞大的训练基数让Llama3.1拥有“最强开源大模型”的称号,但目前的Llama3.1仍然是一个以语言处理为主的大模型,并不支持处理图像、视频或语音,这也就意味着在多模态任务处理上,ChatGPT依然拥有突出的能力。此外,部分网友也对Llama进行了实测,实际操作发现,在回答一些经典的迷惑性问题,如“9.11与9.9哪个大”,或者处理中文指令的时候,Llama3.1 405B并不如Meta官方所说的那样强大。迄今为止,所有 Llama 版本的总下载量已超过 3 亿次,但对Meta所说,这才是他们的开始。

“开源AI是未来之路”

或许Llama的实际使用体验还没有达到完美的程度,但此次Llama3.1 405B的发布,对全世界AI工作者来说最大的意义还是在于大模型的开源与闭源之争又翻开了新的一页。

在Meta官网,扎克伯格发布了一封公开信,坚定地对外宣称“开源AI是通往未来的道路”。信中他表示,尽管多家公司正在开发领先的闭源模型,但开源正在迅速缩小差距。以Llama为例,去年Llama 2只能与通用大模型的老旧版本相媲美,今年Llama 3就做到了与最先进的大模型相竞争,并在一些领域领先。

因此,扎克伯格希望把Llama做成大模型时代的 Linux,成为开源 AI 的行业标准。“在高性能计算的早期,主要技术公司都投入巨资开发自己的闭源Unix版本……今天,开源的Linux成为了云计算和运行大多数移动设备的操作系统的工业标准基础,我相信人工智能将以类似的方式发展。”由此不难看出,Meta想做的,是利用开源的大模型打造未来的AI生态,让Llama成为孕育万种大模型的基座,或“母体”。

而Meta目前确实已经做出了行动。此次发布的Llama3.1已经与一系列公司达成了合作,其中包括亚马逊、英伟达、Databricks,戴尔、德勤等公司也已准备好帮助企业采用Llama,并使用自己的数据训练自定义模型。

距离ChatGPT-4o发布已经过去了两个多月,大模型仍然在以惊人的速度训练、迭代,下一代的闭源大模型还会有哪些突破性的发展,以Llama3.1为代表的开源大模型能否进一步弥合两者之间的差距,大模型“开源”与“闭源”的斗争,似乎还有很长的路。

相关内容

卓易信息:通过多智能体协作...
证券之星消息,卓易信息(688258)07月04日在投资者关系平台...
2025-07-04 18:13:00
马克·库班预言:AI将催生...
人工智能技术的飞速发展正在重塑全球财富格局。美国知名投资人马克·库...
2025-07-04 16:42:00
AI+将给汽车产业打开什么...
作者 / 路 行 编辑 / 黄大路 设计 / 柴文静 编者按: ...
2025-07-04 16:41:55
阿里通义团队:AI如何理解...
在日常生活中,我们经常能从一个眼神、一句话的语调或是一个细微的表情...
2025-07-04 06:41:05
平安好医生入选首批“开源大...
7月3日,由全球数字经济大会组委会主办,中国信息通信研究院(以下简...
2025-07-03 21:41:09
计算架构,行业AI竞争的下...
2025-07-03 16:25:26 作者:狼叫兽 当Dee...
2025-07-03 17:42:01

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...