对话贾扬清:明年AI推理成本还会降低10倍以上,一两年内AI使用成本或低于人工
创始人
2024-10-29 19:03:42
0

Lepton AI创始人兼CEO贾扬清

出品|搜狐科技

作者|郑松毅

编辑|杨锦

近日,由声网联合主办的RTE2024第十届实时互联网大会在北京开幕。

大会开始前,Lepton AI创始人兼CEO贾扬清早早就坐在了嘉宾席。蓝色衬衫、牛仔裤,熟悉的那般“码农”形象再现。

他还是习惯性地把微笑挂在嘴边,和搜狐科技聊了聊最近美国硅谷发生的变化,以及对AI发展现状和未来趋势的一些看法。

这是他今年第二次回国,在大会开始前一晚刚到北京,但整个人看不出来丝毫倦意。

AI如何落地应用?国内外都在忙着找答案

“这次回来能明显感受到大家对于AI应用积极探索的热闹氛围,硅谷也正如此。”贾扬清说。

“相较于AI热潮初期的硅谷,现在的硅谷‘冷静’了许多,关注点更偏向于应用。大多数企业会选择在现有模型基础上加速功能迭代和研发。几乎没人还在比谁的模型更大、参数更多。”

他补充道,“同等质量的模型,规模会变得越来越小,计算效率会越来越高,模型架构会变得更加开放和标准,这是我观察到的未来趋势。”

如果说前两年的AI是在“卷”技术,那今年无疑都转向了“卷”应用。

在贾扬清看来,今天是做应用最好的年代,AI呈现出来的智能能力让做应用变得更简单,同时能够带给用户更好的交互体验。

以前人们常认为,芯片短缺是阻碍AI发展最大的“绊脚石”。但在贾扬清看来,“芯片供应链问题已经有了非常好的解决方案,因GPU短缺造成的算力问题不再会是瓶颈。关键是看如何找到AI应用路径,与垂直领域深度结合,真正把AI用起来。”

“就像当年‘电’刚被发明出来时,很多人不知道它有什么用,直到冰箱、电视、手机的出现,才让电的价值得以体现。”

但想让AI真正用起来,成本是一个不得不考虑的问题。

有人提出,“如今AI技术难广泛落地应用,问题是出在了高额成本上。从客服行业来看,标杆是5元每小时,这是菲律宾和印度的人工价格。要是AI使用成本比人还贵,就没必要了。”

对此,贾扬清比之前更加乐观。他认为,“成本不是核心问题,Token的推理成本可能在接下去的一年还会再降低十倍,甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下,可能就是一两年的时间。

他表示,“核心的大语言模型其实都差不多,但企业如何管理数据、怎么打通权限、用户搜索时是想找到文档还是想要内容总结?这些长远深度的思考远比模型本身更重要。”

GPU价格是个“伪命题”

除了应用,当前AI竞技场的另一关注点在于AI基础设施。

搞云计算出身的贾扬清,认为现在迎来了“云”的第三次浪潮,而AI正是这场革命的催化剂。

他介绍,“云”的前两次浪潮分别是2000年代的“Web云”,以及2010年代的“数据云”,而这次兴起的是“AI云”。

与前两朵“云”不同的是,“AI云”是在”传统云“的基础上增加了AI算法,利用神经网络等技术,可以满足更大规模的数据处理和计算需求。

“今天所有的AI应用都对大模型有非常高的需求,无论是AI图像生成还是AI视频生成,都会调用软件框架,最后落到云基础架构和GPU上面。”贾扬清说。

谁都不想错过“风口”的机会,“AI云”也正是贾扬清在辞任阿里巴巴技术副总裁后,看准的创业方向。

贾扬清说,“挤大模型赛道不是最想干的事,更看重AI发展背后生出的机会点,即对高性能计算的需求,以及AI市场会越来越需要好的云服务,这是团队最擅长的。”

Lepton AI和很多硅谷创业公司一样,团队规模并不大,大多是程序员和产品经理。

公司名字的由来也很有意思,在物理学中,“Lepton”指的是轻子,是一种基本粒子。

这和贾扬清所期望的一样,用最简单的方式和低廉的成本帮助其他公司解决行业痛点问题。

“他们需要更快的GPU、更好的供应链、更高的性价比、更加专业的服务...这一切都是我们正在做的事。”

具体来说,Lepton AI提供的是大模型推理引擎,建立了云平台供用户找到性价比最高的GPU资源。

贾扬清认为,“GPU价格在一定程度上是个‘伪命题’,因为Buy is better than build(购买AI云服务会比自建算力设施更划算)。”

他提到,“很多有前瞻性的CEO已经放弃纠结一块GPU到底需要多少钱,而是选择了这样的方式,把更多的精力和资源放在应用开发上。”

对话最后,搜狐科技请贾扬清谈了谈如何才能在技术创新的道路上找到自己的方向。

他想了片刻说,“创新没有捷径一说,兴趣是最好的驱动力,因为谁也猜不到未知技术领域会带来怎样的惊喜,能做的就是追随兴趣坚持走下去。”

相关内容

AI不是侵权“挡箭牌”
王 铎作 名人声音被AI“克隆”,是侵权吗?由AI生成的视频文案与...
2026-04-18 11:14:46
Google正式推出面向m...
谷歌近日正式发布了面向macOS平台的Gemini原生应用程序,用...
2026-04-18 11:13:16
Meta押注AI数字人 正...
来源:环球市场播报 Meta正在打造人工智能版马克・扎克伯格,可代...
2026-04-18 11:12:52
AI应用向好,计算机ETF...
4月13日,AI应用向好,计算机ETF国泰(512720)收涨超1...
2026-04-13 21:58:04
MiniMax M2.7正...
钛媒体App 4月13日消息,MiniMax M2.7在全球正式开...
2026-04-13 21:44:24
统一VLA范式!港科大开源...
新智元报道 编辑:LRST 【新智元导读】当前具身智能的VLA(...
2026-04-13 13:51:15

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...