高通“呼朋唤友”推进端侧AI新时代:腾讯混元部署 7B/3B 模型等
创始人
2024-10-22 06:57:27
0

IT之家 10 月 22 日消息,高通公司在今天举办的骁龙峰会上,推出了骁龙 8 至尊版移动平台,这是迄今为止高通最强大且全球速度最快的移动端系统级芯片。峰会首日,高通公司宣布和智谱、腾讯混元合作,共同推动端侧 AI 模型部署和落地。

骁龙 8 至尊版芯片 AI 性能

Hexagon NPU 融合了包含标量(scalar)、向量(vector)和张量(tensor)等 AI 加速器架构,支持 INT4、INT8、INT16 和 FP16 精度,能够利用大型语言模型(LLMs)和大型动作模型(LAMs),以支持全球最大的生成 AI 生态系统。

更多 AI 方面的细节,可以参考IT之家此前文章《骁龙 8 至尊版芯片开启端侧 AI 新时代:Hexagon NPU 性能最高提升 12 倍,全面增强拍照、连接等》。

腾讯混元

骁龙 8 至尊版通过支持基于硬件的 INT4 量化技术,实现腾讯混元大模型 7B 和 3B 版本的终端侧部署,可以大幅提升腾讯混元大模型在终端侧的运行效率,端侧推理实现首个 token 生成时延达到 150ms,解码速率达到超过 30 tokens / 秒

腾讯混元大模型已为腾讯内部超过 700 个业务场景和 C 端应用提供底层技术支持,在骁龙 8 至尊版芯片上部署后,能更好地满足广泛的终端侧业务需求。

例如腾讯手机管家短信智能识别功能通过海量数据结合深度神经网络与预训练,能够更准确地理解短信意图,让短信召回率大幅提高将近 200%,识别准确率提升 20%。

智谱

高通与智谱合作,为骁龙 8 至尊版适配优化 GLM-4V 端侧视觉大模型,支持丰富的多模态交互方式。

GLM-4V 端侧视觉大模型能够实现令人惊叹的处理能力,以超过 70 tokens / 秒的速度在终端侧高速运行。

此外通过与骁龙 8 至尊版进行深度适配和推理优化,终端侧多模态应用 ChatGLM 能够支持三种终端侧交互方式:使用相机进行实时语音对话、上传照片进行对话、上传视频进行对话。

丰富的多模态输入输出方式赋能智能助手 ChatGLM 实现了跨家庭、出行、工作和教育等多个场景的应用,例如:

  • 通过手机摄像头获取穿搭建议
  • 利用视觉信息实现智能导航
  • 通过车内摄像头识别遗留物品
  • 拍摄画作进行风格解析
网易

网易公司和高通合作,基于高通骁龙 8 至尊版芯片,采用一系列 Snapdragon Elite Gaming 特性,并在终端侧带来全新升级的 AI 队友功能,打造创新的《永劫无间》手游体验。

高通技术公司和网易还针对线程调度进行联合调优,并应用骁龙遮挡剔除(Snapdragon Occlusion Culling)等 Snapdragon Elite Gaming 特性,从而打造更加稳定的游戏体验。

在《永劫无间》手游极致画质下,与前代平台相比,骁龙 8 至尊版的平均帧数提升 22 帧,帧率稳定性提升 43%,助力实现更加流畅、稳定的复杂多人竞技场景。

基于骁龙 8 至尊版强大的高通 Hexagon™ NPU,《永劫无间》手游首次将具有 18 亿参数的大语言模型引入终端侧,利用包括软件和工具在内的高通 AI Stack 的全栈优化,打造全新升级的端到端 AI 队友功能。

该功能可以让 AI 队友不仅听懂玩家的语音对战指令并执行,还能够通过语音指导新手游玩;不仅如此,玩家还能够与 AI 队友进行自然的语音交流,获得优质队友的情绪价值。

  • 在终端侧推理可以显著降低网络传输带来的时延,使得首词时延控制在 300 毫秒以内
  • 用户数据无需上传云端,这将大大提升用户的隐私的安全性
  • 将 AI 推理从云端迁移到终端侧,可以充分利用骁龙 8 至尊版强大的终端侧 AI 推理能力,从而降低云端运行成本并降低能耗

相关内容

看了AI生成的ASMR吃播...
前段时间,一条用 AI 生成的切水果 ASMR 短视频,在洋抖上爆...
2025-07-12 13:13:44
上海AI实验室团队:如何优...
这项由上海AI实验室和复?dan大学联合开展的突破性研究发表于20...
2025-07-12 13:13:26
月之暗面Kimi K2发布...
月之暗面今天宣布,正式发布Kimi K2模型,并同步开源。Kimi...
2025-07-12 06:12:21
原创 ...
最近台湾岛内所谓的“经济专家”吴嘉隆提出,台湾当局应效仿以色列“先...
2025-07-11 23:13:00
太极股份:公司未推出昇腾芯...
金融界7月11日消息,有投资者在互动平台向太极股份提问:看到公司与...
2025-07-11 12:13:00
审查中国AI大模型,美国又...
路透社9日报道称,美国官员一直在秘密评估中国的人工智能(AI)大模...
2025-07-11 12:11:57

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...