文本总结等方面超过 GPT-4,苹果披露 AFM AI 模型细节
创始人
2024-07-31 10:35:10
0

IT之家 7 月 31 日消息,苹果公司最新发布论文 [PDF],分享了关于 Apple Intelligence 模型的相关细节,部分性能已经超过 OpenAI 的 GPT-4。

模型简介

苹果在论文中介绍了 Apple Foundation Model(下文简称 AFM)模型,共有以下两款:

  • AFM-on-device:本地运行,30 亿参数,可以在 iPhone、iPad 等设备上高效运行;
  • AFM-server:苹果尚未公布参数等细节。
训练数据来源

苹果表示训练数据集包括从出版商处获得授权的数据、经过策划的公开或开源数据集以及我们的网络爬虫 Applebot 抓取的公开信息组成。

苹果强调注重保护用户隐私,数据混合物中不包括苹果用户的私人数据。

据《纽约时报》报道,苹果公司在 2023 年底与 NBC、Condé Nast 和 IAC 等多家出版商达成了价值至少 5000 万美元的多年期协议,在出版商的新闻档案中训练模型。

苹果的 AFM 模型还在 GitHub 上托管的开源代码上进行了训练,特别是 Swift、Python、C、Objective-C、C++、Java、Java 和 Go 代码。

论文称,为了提高 AFM 模型的数学技能,苹果公司特别在训练集中加入了来自网页、数学论坛、博客、教程和研讨会的数学问题和答案。

苹果利用了高质量、可公开获得的数据集(论文中未提及名称),这些数据集“拥有允许用于训练...... 模型的许可证”,并经过过滤以去除敏感信息。

AFM 模型的训练数据集约有 6.3 万亿个 token(token 是小块数据,通常更容易被生成式人工智能模型吸收)。相比之下,这还不到 Meta 用来训练其旗舰文本生成模型 Llama 3.1 405B 的 token 数量(15 万亿)的一半。

训练硬件

根据论文描述,苹果公司使用 8192 片 TPUv4 芯片训练 AFM-server 模型;2048 片 TPUv5p 芯片训练 AFM-on-device 模型。

每个 v5p pod 由 8960 个芯片组成,每秒的浮点运算(FLOPS)和内存分别是 TPU v4 的两倍和三倍,训练模型的速度快了近三倍。

模型性能

根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试超 GPT-4。

苹果公司的数据显示,AFM-server 有害输出违规率为 6.3%,明显低于 GPT-4 的 28.8%。同样,在设备上,AFM 7.5% 的违规率低于 Llama-3-8B(由 Facebook 母公司 Meta 训练)21.8% 的得分。

在电子邮件、信息和通知汇总方面,设备上的 AFM 的满意度分别为 71.3%、63% 和 74.9%。研究论文还指出,这三个模型分别领先于 Llama、Gemma 和 Phi-3 模型。IT之家附上相关性能结果如下:

相关内容

基金四季报披露:人形机器人...
近期,一批主题基金率先披露2025年四季报,投资重点涵盖AI应用、...
2026-01-18 21:16:56
AI应用爆发前夜,大模型等...
文 | 摩根商研所 2026年,AI行业的热度仍在持续。 近日,...
2026-01-18 19:47:52
只需299元,就能“买通”...
中新网北京1月18日电(记者 吴家驹)近期,有消费者反映,向AI提...
2026-01-18 12:16:43
AI转型阵痛:中控营收净利...
文/杨剑勇 自2022年底推出ChatGPT后,人工智能便进入生成...
2026-01-18 11:18:03
浙江两会,频提AI
浙江杭州的“机器人义警”在白堤向游客招手致意。(资料图) 王刚 摄...
2026-01-18 10:46:22
从京东AI上线、千问App...
随着2026年的到来,AI技术尤其是大模型应用的飞速发展,正在加速...
2026-01-18 10:17:32

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...