清华系初创企业无问芯穹推出端侧开源模型
创始人
2024-12-16 19:13:55
0

欲做AI模型算力“超级放大器”、为人工智能提供设施的清华系初创企业推出端侧开源模型。

12月16日,上海无问芯穹智能科技有限公司推出端侧全模态理解的开源模型Megrez-3B-Omni,30亿参数尺寸适合手机、平板等端侧设备,具备图片、音频、文本三种模态数据处理能力。

在文本理解方面,Megrez-3B-Omni将上一代14B大模型压缩至3B规模,降低计算成本,提升计算效率。在语音理解方面,该模型支持中英文语音输入,处理复杂多轮对话场景,支持对输入图片或文字的语音提问,不同模态间自由切换。在图像理解方面,该模型在场景理解、OCR(光学字符识别)等任务上可识别并提取文本信息。同步开源的纯语言版本模型Megrez-3B-Instruct为单模态模型,最大推理速度领先同精度模型300%,具备AI搜索功能。

无问芯穹由清华大学电子工程系教授、系主任汪玉发起,他带领的NICS-EFC实验室早在2008年便投入到面向智能场景的软硬件联合优化技术路线,提出“算法创新-编译映射-硬件架构”联合优化的设计范式。联合创始人、首席科学家戴国浩毕业于清华大学电子工程系NICS-EFC实验室,现任上海交通大学长聘教轨副教授、清源研究院人工智能设计自动化创新实验室负责人。联合创始人兼CEO夏立雪是汪玉的博士生。

“我们做的主要是端侧小模型,一是因为端侧是我们的重点业务之一,另一方面也证明我们有模型训练和优化的能力。云和端一直是我们的两大业务,以前主要做云,现在开始云和端一起发力了。”无问芯穹表示,相较于云端大模型,端侧模型需要在资源有限的设备上快速部署、高效运行,对降低模型计算和存储需求提出更高要求。Megrez-3B-Omni通过软硬件协同优化策略,令各参数与主流硬件适配。该模型是能力预览,接下来还将持续迭代,未来用户只需给出简单的语音指令,就可完成端设备的设置或应用操作,该方案支持CPU、GPU和NPU同时推理,通过跨越软硬件层次的系统优化,额外带来最高70%的性能提升,最大化利用端侧硬件性能。

相关内容

万物皆可“AI”的后遗症,...
文 | 深观商业 从生成式AI的惊艳亮相引起全球科技巨头军备竞赛...
2025-10-27 22:16:09
MiniMax发布并开源新...
央广网北京10月27日消息(记者 樊瑞)10月27日,国内AI独角...
2025-10-27 22:16:08
微信Linux 4.1.0...
IT之家 10 月 27 日消息,深度操作系统官方今天在公众号发文...
2025-10-27 21:45:09
青云科技AI算力云「西南一...
青云科技旗下 AI 算力云——基石智算全新算力专区「西南一区」正式...
2025-10-27 19:45:30
拍我AI视频替换功能上线
10月27日,拍我AI推出全新视频替换功能(Swap),通过自研D...
2025-10-27 18:15:28
MiniMax M2开源登...
10月27日,MiniMax稀宇极智于发布并开源了其新一代文本大模...
2025-10-27 18:15:25

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...