端侧AI成华为苹果竞技主看点?斯坦福明星团队发文:端侧AI响应更快、更安全
创始人
2024-09-10 16:22:53
0

出品|搜狐科技

作者|郑松毅

编辑|杨锦

华为与苹果“秋日比武”落幕,修图、翻译…这些出现在终端设备上的AI功能有成功吸引到你吗?

在上手体验前,且不过多评价各家AI功能优劣,但值得注意的是,有一些人正在埋头深研端侧模型部署,挖掘其背后蕴藏的潜在商业机会。

人工智能发展的下一步是什么?也许,从这里我们已经找到了答案——把大模型塞进手机、电脑等智能终端设备里。

近日,硅谷斯坦福端侧模型研发明星企业Nexa AI的两位创始人,联合Meta AI科学家等技术研究者共同发文,对端侧大模型应用潜力和价值进行了深入解读。

说起Nexa AI这家硅谷明星企业,别看成立时间只有一年,交出的产品答卷却引发了硅谷AI圈子的广泛关注。

Nexa AI由两位来自斯坦福大学的“95后”共同创立,可谓是年少有为。

创始人兼首席科学家陈伟,曾担任斯坦福华人创业协会的主席。联合创始人兼首席技术官李志远,在谷歌和亚马逊实验室拥有4年端侧AI的一线研发经验。他们还都曾担任过斯坦福CEO协会主席。

斯坦福大学副教授、斯坦福技术创业项目副主任Charles (Chuck) Eesley担任顾问,为团队提供指导和支持。

抛开豪华团队,其在产品“硬实力”方面让人不容小觑。

就在大家都在AI大模型战场“拼刺刀”时,Nexa AI另辟蹊径,沿着“小而美”的技术路线从中突围而出。

今年年初,NEXA AI(https://nexaai.com)推出的Octopus-V2模型轰动一时,这款模型曾在huggingface(开源模型库)全球60万模型中位列第二,在函数调用性能上超越了GPT-4。今年八月,这个团队又发布了Nexa AI开源端侧AI模型库和SDK,能够让开发者快速便捷地使用端侧模型进行开发。该产品现已对公众开放测试(https://github.com/NexaAI/nexa-sdk)。

值得一提的是,前不久搜狐科技《10个硅谷华人的AI见闻》系列报道对话的Meta AI科学家许家骏,也是这篇论文的共同作者

端侧AI:更快、更安全

近年来,人工智能技术飞速发展,先后见证了ChatGPT、Gemini、文心一言等一系列AI大模型的迅速崛起。

我们常说的人工智能实际上分为两大技术分支,分别是“云侧AI”和“端侧AI”,以上提到的这些耳熟能详的大模型均属于“云侧AI”范畴。

“云侧AI”具备处理大规模数据计算的优势,但随着模型规模不断增大,云端推理成本高、网络延迟高、用户数据隐私等问题引发关注,在一定程度上对用户体验造成了限制。

因此,“端侧AI”的部署开始发力,希望能将大模型直接部署在终端设备上,比如手机、电脑、汽车等。

“端侧AI”不仅可以在设备上直接运行算法,提高服务器响应速度,还避免了数据需要传输到远程服务器,从而更好地保护用户隐私。

论文《On-Device Language Models: A Comprehensive Review》指出,“全球市场已经嗅到了这个巨大机遇,预计到2032年,端侧AI市场规模将从2022年的152亿美元飙升到1436亿美元。这意味着从你的智能家电到自动驾驶汽车,各行各业都将被这项技术改变。”

把模型越做越小

如果说在AI模型发展初期,比的是谁家能把模型做的更大,如今的一项竞争则是谁能在保证性能的情况下把模型做得更小,小到能塞到终端设备中满足个性化需求。

研究数据应证了这个判断,自2023年起,参数量低于10B的模型系列如Meta的LLaMA、Microsoft的Phi等“小模型”涌现。进入2024年后,新模型的推出越发密集,Nexa AI、苹果、谷歌、智谱AI等海内外厂商在该赛道持续发力。

荣耀产品线总裁方飞也在最近与搜狐科技对话时表示,端侧模型会越做越“小”,往更加集成化、更加高效的方向演进。“现在的小模型,能力相当于原来非常大的模型。”

在6月份的华为开发者大会上,“鸿蒙NEXT”终端操作系统正式发布,有了盘古大模型5.0的加持,其AI能力得到明显提升。

另一“重磅玩家”苹果也不甘落后,其在WWDC24上宣布与OpenAI建立合作关系,并整合ChatGPT技术推出Apple Intelligence,让用户在终端设备上体验到跨应用的智能协作。

值得一提的是,这些模型在精缩的同时并没有忽略性能表现,无论是文本能力还是多模态能力都展现出了新的可能性,并不断根据用户需求优化。

然而,在有限的端侧资源上部署这些模型并非易事,面临内存和计算能力的双重挑战。

研究论文共同作者、Nexa AI联合创始人兼首席技术官李志远向搜狐科技介绍,“端侧AI目前面临的最大问题是模型能力不够,在技术上还没能实现让10B(百亿)参数规模以下的模型拥有和千亿参数规模的大模型一样的推理能力。”

为此,科学家们提出以下四点创新思路来应对这些挑战:量化、剪枝、知识蒸馏和低秩分解。

这些方法通过在性能、内存占用和推理速度之间找到平衡,确保AI模型在端侧应用的可行性。

举例来看,假如你有一幅用1600万种颜色绘制的画作,“量化”就是用256种颜色重画这幅画,虽然损失了一些细节,但画面仍然清晰可辨,而文件大小大大减少。

“剪枝”是指去掉模型不必要的参数,让模型变得更苗条但仍然聪明。

而“知识蒸馏”和“低秩分解”指的是把复杂的问题拆分成一系列易于解决的小问题,并且更强调学习知识精华,不苛求掌握全部细节内容。

硬件方面,GPU和TPU等专用硬件提供了强大的计算能力和高内存带宽,例如英伟达的Tensor Cores以及Google TPU的高效矩阵乘法能力,为模型训练提供了强有力的支持。

研究人员表示,“软硬协同设计的方法,不仅提升了端侧AI的部署效率,同时对部署成本起到了优化作用。”

被视作“杀手锏”

如今,端侧AI已在智能手机、PC、汽车、XR等众多领域得到落地应用,一众终端厂商也将其直接视为打出产品差异化的“杀手锏”。

从当前来看,“端侧AI”的应用价值还未完全展现,但不可否认的是,其将成为终端设备智能升级的关键驱动力。

想象一下,在没有网络的情况下,你也可以用终端设备与AI进行问答交互,或是随时随地用AI识别或生成图片。

再或是出国不用再担心语言沟通问题,端侧AI用更快的响应速度让“翻译官”随时待命。

在汽车这样的大型终端设备上,端侧AI也将进一步发挥作用,提高自动驾驶的安全性,让车辆更好地理解复杂路况。

正如研究者所说,“端侧AI正在潜移默化地改变我们与技术的交互方式,它让设备更贴心、更智能、也更懂我们的需求。”

华为也好,苹果也罢,端侧AI部署必将成为这些科技巨头的又一竞技场。对于消费者而言,有AI加持的新一代智能终端设备值得狠狠期待下。

相关内容

苹果AI难题“搅动”高层:...
【环球网科技综合报道】近日,苹果在人工智能领域的问题持续发酵,引发...
2025-07-20 16:12:59
AI算力助复旦科研再突破
中新网记者近日了解到,复旦大学在医学领域接连取得突破性成果,继发现...
2025-07-20 11:42:04
福州市长乐区总工会精准“喂...
从家庭作坊、草根工业到全球纺织产业链的关键一环,福州新区(长乐区)...
2025-07-20 10:13:30
AI超级联赛,何以落户广西...
中新网南宁7月18日电(记者 杨陈)近期全国各地高温热浪持续。在广...
2025-07-20 09:40:54
2025中国联通合作伙伴大...
7 月 18 日,以“向实同行共创融合新生态”为主题的 2025 ...
2025-07-19 22:42:52
中科信息:努力推进“AI+...
中证报中证网讯(王珞)中科信息(300678)日前表示,在行业智改...
2025-07-19 21:42:07

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...