AI明星企业血战小模型,成本暴降还更省电费,加速AI普及
创始人
2024-07-23 06:09:13
0

智东西(公众号:zhidxcom)

编译 |孟强

编辑 |云鹏

智东西7月22日消息,据Venture Beat报道,上周,Hugging Face、Mistral AI和OpenAI于7月16日和18日相继推出各自研发的小模型(SLM),承诺将先进的自然语言处理能力普及化。在过去,科技公司竞相在大语言模型赛道上追求规模更大、更复杂的神经网络,Venture Beat认为,这些小模型开辟了新的赛道,还可能影响企业使用AI解决方案的方式。

小模型,顾名思义,是相对于大语言模型(LLM)而言的,它们一般来说具有较少的参数和较低的计算资源需求。与参数量动辄上千亿甚至万亿规模的大语言模型相比,三个新的小模型:SmolLM、Mistral NeMo和GPT-4o mini的参数量可以在几亿到百亿不等,从训练量到能耗都低于大语言模型。三个模型虽然使用不同的方式实现AI普及化,但它们都有一个共同目标:将强大的语言处理能力带给更多设备和应用。

一、小模型如何改变边缘计算

Venture Beat认为,Hugging Face的SmolLM是三者中最具革新性的。它专为在移动设备上运行设计,拥有三种规格:1.35亿、3.6亿和17亿参数量,方便边缘设备进行AI处理,解决了数据隐私和延迟的关键问题。

SmolLM的意义远远不只是提升效率。让边缘设备也能用上AI处理,能够让设备应用在低延迟和高隐私保护的基础上运行。在过去,很多复杂的AI功能因隐私或连接问题无法实现,有了SmolLM,这些功能或能走进现实。

此外,Mistral AI推出了Mistral NeMo模型,拥有120亿参数量,上下文窗口可长达128k。Mistral NeMo面向台式电脑,定位介于云端大模型和超紧凑型移动AI之间,前者是在云计算平台上训练和运行的大规模AI模型,后者是在资源受限的移动设备(如手机和可穿戴设备)上运行的高效、紧凑的AI系统。

Venture Beat称,Mistral NeMo的计算方法可能会给企业领域带来不小的改变。该模型有潜力利用消费级硬件将复杂的AI功能普及化,这些功能曾经只是科技巨头和资金充足的研究机构的专属研究对象。这可能能帮助各行业普及AI驱动应用,比如优化客户服务、提供更复杂的数据分析工具。

二、OpenAI的高效小模型GPT-4o mini价格美丽

OpenAI也推出GPT-4o mini,加入了小模型的竞争,该模型被称为市场上最具成本效益的小模型。输入每百万token仅需15美分,输出每百万token仅需60美分,Venture Beat称GPT-4o mini大大降低了AI集成资金准入。

除此之外,GPT-4o mini的定价策略可能会催生出一波新的AI驱动创新,尤其是在初创企业和小型企业中。通过显著降低AI集成的成本,该模型有效地降低了采用AI驱动解决方案的准入门槛。Ventrue Beat认为,这可能会加速多行业的技术创新和改革。另外,这一向小模型的转变反映了AI社区的新趋势:研究人员和开发人员越来越关注效率、可及性和细分应用。这一趋势可能会催生更有针对性和更高效的AI解决方案,优化特定任务和行业。

三、小模型推动绿色科技创新,减少技术碳足迹

向小模型转变的趋势也与对AI环境影响的日益关注相一致。小模型训练和运行耗能更小,可能会减少AI技术的碳足迹。随着各科技公司在可持续方面面临越来越大的压力,Venture Beat认为,小模型的低能耗和低排放可能成为一个重要的卖点。

这种向小模型的转变的环境影响可能是深远的。随着AI变得越来越普及,更高效模型的普及所带来的节能效益可能是巨大的。这或许能让AI在绿色创新方面起到领导作用,而不是继续加剧全球变暖。

然而,小模型的崛起也并非没有挑战。随着AI变得越来越普及,偏见、问责制和伦理使用的问题变得更加紧迫。如果不加以监管,通过小模型普及AI可能会放大现有的偏见或产生新的伦理困境。对于小模型的开发者和用户来说,除了技术能力之外,还必须优先考虑伦理问题。

结语:AI发展的未来指向多元化、专业化

虽然小模型在效率和普及性方面具有优势,但由于参数量限制,它们在许多的任务上的处理能力可能无法与大语言模型匹敌。Venture Beat表示,这表明未来的AI发展格局中,将有各种规模的语言模型,而规模较小的模型将有自己所擅长的具体方面。

展望未来,我们期待看到AI模型的发展百花齐放,无论是大语言模型还是小模型,一刀切的方法都不可取,关键在于找到模型规模、性能和具体应用要求之间的平衡。对于企业和技术决策者来说,这三款小模型代表了向更高效、更专业、可部署的AI解决方案的转变,为AI在企业环境的整合提供了新的可能性。至于小模型是否能取代云端大模型目前的主导地位,现在下结论还为时尚早。

来源:VentureBeat

相关内容

港股AI应用股走强 MIN...
每经AI快讯,3月5日,港股AI应用股走强,截至发稿,MINIMA...
2026-03-05 09:49:34
微软发布能自主决定思考的P...
IT之家 3 月 5 日消息,据微软官方开发者社区博客今日消息,微...
2026-03-05 09:20:57
天风证券:AI赛道持续推进...
每经AI快讯,天风证券研报表示,AI方面,大模型迭代提速,AI硬件...
2026-03-05 08:49:54
Meta计划将自研芯片延伸...
Meta计划开发定制芯片来训练其人工智能模型。 3月4日周三,Me...
2026-03-05 08:49:42
【AI+CAE】国内CAE...
这是AIE加速工业进化【AI+CAE的现状和未来】系列的第11篇,...
2026-03-04 18:50:07
智元灵渠OS开源上线 ,1...
智元灵渠OS开源上线 据智元机器人消息,灵渠OS Alpha版本,...
2026-03-04 18:21:28

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...