2024年被称为AI手机的元年,手机厂商纷纷发力相关功能应用。而普通用户对AI在手机上的应用感知明显的,可能还是要到今年。
此前,一家手机品牌高层在媒体采访中表示,之前预计AI在用户里的教育过程要两年以上时间,但今年初Deepseek的出现加速AI的普及,反过来促使手机厂商不得不加速在AI上的发展步伐。
无论从功能体验还是产品营销角度出发,如今的AI都已经成为了手机品牌竞争的新赛道,OPPO、vivo、华为、小米、荣耀等主要的国产手机品牌都在发力AI的落地应用功能,以此打造出自己独家的功能体验优势。然而,从单一的AI功能,到AI智能体、多模态功能,手机AI仍然处于探索前进的阶段。
尽管2016年推出的荣耀Magic一代可以说是第一款AI手机,但生成式AI在手机上真正的大规模应用主要从2023年底开始,基于上游SoC芯片,如高通骁龙8 Gen3、联发科天玑9300等平台上大幅提升了AI算力,实现了端侧超过百亿级别的大语言模型运算,基于此各大终端手机品牌都推出了自家的AI大模型产品,如vivo蓝心大模型(BlueLM)、OPPO安第斯大模型(AndesGPT)、荣耀魔法大模型、华为盘古大模型、小米MiLM等,为不同AI功能创造大展拳脚的舞台。
刚开始,AI在手机上的落地主要集中在各项功能上,有不少朋友使用过的AI消除、AI文生图、AI写作、AI问答等,其中大家使用频率比较多的很可能就是AI消除功能,用户能够轻松将照片里的路人或者多余物体去掉,OPPO和小米还创新地带来了照片AI反光消除功能。AI消除相较于过去需要使用专业的PS软件或者付费App来处理的方式要方便不少。
在特色的AI功能上,荣耀最先推出的任意门功能同样值得介绍,该功能基于用户意图打造,并实现系统级的功能整合,用户只需将选中的内容拖拽到侧边对应的App图标,AI就能分析内容和用户意图,实现跨应用一步直达,用AI革新了手机的交互体验。
☛DeepSeek入局,AI智能体成各品牌竞争新高地
除了这些相对单一的AI功能,AI智能体(AI Agent)成为了2024下半年AI落地的主流方向。传统的智能手机语音助手功能限于简单的回答问题,如日常的天气状况、航班信息等信息的网页查询结果上,类似只是一个语音搜索功能,不够聪明,功能上存在明显的局限性。
2024年9月,荣耀率先公布其AI大模型赋能的YOYO智能体,随后vivo、OPPO、小米、华为等品牌都纷纷将自家的语音助手升级为AI智能体。
以荣耀为例,其YOYO智能体具备了模糊理解、界面识别、自动执行、一语到位等能力,并支持单指令系统级任务执行、第三方应用任务执行甚至多应用协调执行等多种模式。简单说就是变得更聪明,能更好地理解用户的想法,同时不仅能说会道,还能「动手」了。
去年底的荣耀Magic7系列发布上,时任荣耀CEO赵明对着手机上的YOYO智能体说“帮我点2000杯喝的,适合现在喝的”,然后手机就会自动完成打开APP、选择咖啡品种等一系列操作,最后只需点击确认支付即可完成整个下单流程,成为当晚发布会上的一大亮点。此外,YOYO智能体支持“一句话关闭应用自动续费”、“一句话关闭应用权限”等功能,多少有点钢铁侠里「贾维斯」那味了。
此外,小米澎湃OS 2上升级的“超级小爱”新增了屏幕识别、视觉交互、全局自然语言搜索以及跨设备跨应用执行等能力。在vivo新的“蓝心小V”上支持深度对话,并可识别屏幕界面内容(小V圈选),直接接管音频进行自主对话,以完成订餐餐厅、订咖啡等操作任务。OPPO则带来了全球首次MoE(混合专家模型)在端侧的落地,升级后的超级小布助手支持一键问屏、小布胶囊等功能,当然小布助手同样支持语音跨应用操作。
而在今年初,各个手机品牌的AI智能体已经陆续开始接入DeepSeek,带来了深度思考的能力,在问题分析回答方面的表现进一步提升。
可以预见到,当手机AI发展到足够强大后,很多原本需要第三方App实现的功能都会被更懂用户的AI智能体取代。
☛新的技术方向:多模态AI
AI开始在手机上落地应用初期,无论是SoC芯片厂商或者终端手机品牌,大家的传播重点多放在了AI算力上,如2023年底就可以实现70亿甚至130亿参数的端侧大模型。而去年下半年开始,手机上的AI大模型转向了“小”和“多”。
“小”即缩小AI大模型的规模,实现轻量化以减轻对手机运行内存、存储空间的压力,降低功耗(延长续航时间),如vivo的蓝心端侧大模型3B就只有30亿参数量级,远小于之前的70亿、130亿规模,内存占用也从70亿的3.5GB降到1.5GB,但其对话写作、摘要总结、信息抽取等能力上可以比肩以往行业7B—9B模型的表现。
AI大模型的轻量化降低了对手机硬件的要求,能够让更多手机,尤其是中端或者入门机型上也能支持部分的AI功能应用,并为AI在手机上的多模态应用提供了可能。
“多”就是多模态AI,传统AI模型通常只能处理单一类型的数据,而多模态AI大模型能够同时处理图像、文字、语音、视频等不同模式的多种类型数据,从而并生成更为可靠的结果。
我们可以在OPPO手机上用语音提问“画面里的人电影票房总和是多少?”,然后超级小布助手的一键问屏功能识别图片和视频里的人物,并且搜索其票房信息。
这一过程就涉及对语音的理解、画面内容人物的识别、相关网络数据的收集整理,最后通过文字和语音输出我们想要的答案。超级小布的一键问屏也能直接调用识别摄像头里的物体,整个操作过程十分便捷。
能听、看、说、做的多模态AI无论是交互抑或功能上都更加像与真人交流,降低了我们使用的门槛。
去年,AI还是中高端以上手机的功能加分项,到了今年,基础的AI功能已经下沉变成了越来越多新手机上的标配。
据赛迪顾问报告数据显示,中国手机品牌正不断加大AI手机的研发和普及力度。2024年,中国市场AI手机的出货量预计超过3500万部,市场占有率为12%,到了2027年,AI手机销售量将达到1.86亿部,市场占比达到56.1%。
虽然AI手机市场有着巨大的增长潜力和需求,各品牌正如火如荼地加大投入,但放在手机品牌面前是成本增加、功能差异化和AI竞争力等问题。
为了提升手机AI功能和能效表现,手机品牌在不断迭代采用最新的SoC芯片和其他硬件,以提升端侧AI大模型表现的同时,由于AI算力和功耗的原因,手机上很多的AI功能仍然离不开云端大模型的支持,因此包括云端大模型运算的AI算力、内存、存储、电力、网络、维护等成本同样不容忽视。此前vivo曾透露,按3亿用户每天调用大模型10次,每日运算成本高达3000万元,年均成本可达90-100亿元。
手机硬件或者研发成本可以通过直接提高终端产品售价来分摊到消费者身上,但目前国内手机品牌并没有针对云端大模型服务的卖断或订阅式收费,这部分运营成本大部分只能由品牌的利润来承担。
况且,对于用户来说,AI在使用过程中的不确定性和准确度是让人很纠结的问题,如同一台手机对同一个问题前后再次的回复,或者对同一张照片前后两次AI消除效果可能就大相径庭,「抽卡」现象这个生成式AI的通病仍然明显,这限制了手机AI主要用在日常或者轻办公场景,难以作为核心的工作生产力工具。
(使用同一款手机对同一张照片的右上角,前后两次进行AI消除后的效果)
如今的AI对手机品牌来说是“人有,我也得有”的存在,仍无法成为左右消费者进行最终购买的主角。我身边的同事或者朋友购买手机时,核心的影响因素仍然是价格、品牌、核心硬件(CPU、内存、屏幕等)、影像等方面。
手机AI需要长期的大投入,短期收益甚微,但手机品牌却义无反顾地坚持投入,原因无非是避免手机在市场竞争中处于劣势以及抢占新的流量入口。前者比较好理解,现在但凡价格超过2000元的新机都得有几个AI相关的功能,否则都不好意思发布上新。
后者就是一个庞大的商业市场,如我们用手机AI智能体订外卖默认接入美团还是饿了么?订机票是携程还是去哪儿?打车是用滴滴还是高德?购物是京东、淘宝还是拼多多等等,这些都是十分有价值的用户流量入口,比起现时手机上各种传统广告入口有着更高的转化。
手机AI无疑将会成为手机品牌新的营收增长点,试问哪个谁会愿意放弃呢!因此,纵使手机AI有各种难点,但大家都必须全力投入“All in AI”,抓住这个增长的新风口。
目前,手机AI正从各个单一的功能逐步去AI智能体、系统级AI、平台级AI功能进行整合演进,也许再过几年,当手机AI真正融合到人们生活的方方面面,绝大多数用户已经离不开AI时,AI手机的商业价值才会全面显现。
就如当年从功能机向智能机过渡一样,这需要一个过程、一个标杆产品甚至是一个“杀手级”功能的出现,而我们正见证并参与着这个改变。
下一篇:五千余岗位,AI工程师最热