原创 美国AI芯片初创企业Groq成功融资6.4亿美元
创始人
2024-08-06 12:38:49
0

8月6日消息,美国人工智能(AI)芯片初创公司Groq于当地时间周一成功获得了6.4亿美元的D轮融资,以加强其云端大模型推理能力。

据了解,Groq最新一轮融资由 BlackRock、Neuberger Berman、Type One Ventures、Cisco Investments、Global Brain 和 Samsung T催化剂等公司领投。

这家总部位于美国加利福尼亚州山景城的初创公司成立于 2016 年,是一家 AI 芯片生产商,旨在实现高吞吐量、低成本的推理,而不是训练。该公司核心团队来源于谷歌最初的张量处理单元(TPU)工程团队。Groq 创始人兼CEO Jonathan Ross是谷歌TPU项目的核心研发人员。该公司硬件工程副总裁Jim Miller 曾是亚马逊云计算服务AWS设计算力硬件的负责人,还曾在英特尔领导了所有 Pentium II 工程。截至目前,Groq 总共筹集了超过 10 亿美元,现在的估值已达 28 亿美元。

今年2月,Groq推出了全球首个基于LPU(Language Processing Unit)方案的大模型推理芯片,作为一款基于全新的TSA 架构的Tensor Streaming Processor (TSP) 芯片,旨在提高机器学习和人工智能等计算密集型工作负载的性能。

虽然Groq的LPU并没有采用更本高昂的尖端制程工艺,而是选择了14nm制程,但是凭借自研的TSA 架构,Groq LPU 芯片具有高度的并行处理能力,可以同时处理数百万个数据流,并该芯片还集成了230MB容量的SRAM来替代DRAM,以保证内存带宽,其片上内存带宽高达80TB/s。

根据官方的数据显示,Groq的LPU芯片的性能表现相当出色,可以提供高达1000 TOPS (Tera Operations Per Second) 的计算能力,并且在某些机器学习模型上的性能表现可以比常规的 GPU 和 TPU 提升10到100倍。

Groq表示,基于其LPU芯片的云服务器在Llama2或Mistreal模型在计算和响应速度上远超基于NVIDIA AI GPU的ChatGPT,其每秒可以生成高达500个 token。相比之下,目前ChatGPT-3.5的公开版本每秒只能生成大约40个token。由于ChatGPT-3.5主要是基于NVIDIA的GPU,也就是说,Groq LPU芯片的响应速度达到了NVIDIA GPU的10倍以上。Groq表示,相对于其他云平台厂商的大模型推理性能,基于其LPU芯片的云服务器的大模型推理性能最终实现了比其他云平台厂商快18倍。

另外,在能耗方面,英伟达GPU需要大约10到30焦耳才能生成响应中的tokens,而Groq LPU芯片仅需1到3焦耳,在推理速度大幅提升10倍的同时,其能耗成本仅有英伟达GPU的十分之一,这等于是性价比提高了100倍。

Groq的策略是使用光纤互连将数百个LPU拼接在一起,每个LPU都装有片上SRAM。通过使用 576 个 LPU 的集群,Groq 声称它能够在 Meta 的 Llama 2 70B 模型上实现每秒超过 300 个令牌的生成速率,是具有 8 个 GPU 的 HGX H100 系统的 10 倍,同时消耗十分之一的功率。

Groq公司在演示中展示了其芯片的强大性能,支持Mistral AI的Mixtral8x7B SMoE,以及Meta的Llama2的7B和70B等多种模型,支持使用4096字节的上下文长度,并可直接体验Demo。不仅如此,Groq还喊话各大公司,扬言在三年内超越英伟达。目前该公司的LPU推理芯片在第三方网站上的售价为2万多美元,低于NVIDIA H100的2.5-3万美元。

编辑:芯智讯-浪客剑

相关内容

真 AI 才实用!2026...
当前企业采购语音机器人的核心痛点,在于市场同质化内卷严重。许多产品...
2026-01-17 22:48:20
从“企业AI”到“AI企业...
作者:于佳卉 在2026第五届AIGC开发者大会上,由至顶科技主办...
2026-01-17 20:47:27
腾讯科技申请网络内容页面快...
国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“页面...
2026-01-17 20:19:05
GEO时代企业营销新支点:...
导语:当用户从搜索引擎的链接列表转向直接向AI提问获取答案,传统S...
2026-01-17 18:18:23
企业如何定位AI营销的发力...
数智之道 陈宇新 陈璐 林昊/文 营销是AI落地应用的前哨站。自...
2026-01-17 16:19:04
原创 ...
文|唐辰 图注:千问App产品发布会现场 唐辰现场拍摄 阿里千问打...
2026-01-17 16:18:13

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...