用AI生成3D世界!“AI教母”李飞飞最新访谈:空间智能是我的“北极星”,和语言智能一样重要
创始人
2024-09-22 17:50:27
0

每经编辑:张锦河,宋欣悦

9月21日,风险投资公司安德森·霍洛维茨公司(Andreessen Horowitz,简称a16z)发布了一期重磅访谈视频。a16z普通合伙人马丁·卡萨多(Martin Casado)与World Labs的两位领军人物——被誉为“AI教母”的李飞飞以及她曾经的学生贾斯汀·约翰逊(Justin Jhonson)展开了一场精彩对话。

此次访谈重点讨论了AI的历史进程、当前挑战以及未来突破,特别是“空间智能”这一领域的潜力和应用。

图片来源:Youtube视频截图

  • 回顾AI发展:从“寒冬”到“大爆发”

李飞飞在访谈中首先回顾了人工智能的发展历程。她表示,尽管许多人对那个时期的AI发展持悲观态度,称之为“AI的寒冬”,但她却始终认为这是“春前的冬眠”

李飞飞形象地描述道,人工智能正经历着“大爆发”式的快速发展。她强调,当前的AI已经不仅限于文本处理,在音频、视频等多模态领域也正在迅速崛起,这为AI带来了无数的可能性。

贾斯汀则通过自己的学术经历,回顾了深度学习的兴起,并强调算力的飞速提升对AI发展的关键作用:“算力的增长是惊人的,以前需要6天才能完成的任务,现在只需要不到5分钟就能完成。”他用具体的例子说明,随着技术的发展,AI的能力在几何级数上攀升。

图片来源:Youtube视频截图

  • 空间智能:3D世界的AI革命

作为此次对话的核心话题之一,李飞飞和贾斯汀深刻剖析了“空间智能”的革命性潜力。李飞飞定义道:“空间智能是机器在3D空间和时间中感知、推理和行动的能力。”

李飞飞表示,视觉空间智能是她的“北极星”。她指出,空间智能与语言智能一样重要,甚至在某些方面可能更古老、更基础。她还提到,AI的发展不会局限于处理平面图像或文本,而是会迈向对三维世界的理解,这是智能发展的自然延伸。

贾斯汀进一步解释了空间智能与传统基于语言的AI之间的差异:“语言模型的底层表示是一维的,但世界是三维的。我们认为,世界的三维特性应该在表示中占据核心地位。”他认为,空间智能不仅仅是对图像或视频的2D处理,而是通过3D模型来推动机器理解物理世界的本质。

李飞飞还从进化的角度阐述了空间智能的重要性:“智能的进化使动物,尤其是人类,能够在世界中移动,与世界互动,甚至创造文明。这种能力不仅仅是感知二维世界,更是理解并应对三维的真实物理环境。”

“视觉智能是我的激情所在,因为我相信每一个智能生物,如人类、机器人或其他形式,都必须具备看待世界、推理世界和与世界互动的能力。”李飞飞进一步解释,空间智能不仅是技术上的突破,更是构建未来AI生态的关键

李飞飞强调,当前的计算能力更加成熟,数据理解比以往更深入,算法进展迅速,正是探索空间智能的关键时刻

图片来源:Youtube视频截图

  • 应用场景:虚拟与现实世界融合

当谈及空间智能的潜在应用时,贾斯汀表示:“未来的AI不仅能生成图像或视频,还能创建一个充满活力和交互性的3D世界。”他设想,空间智能能够应用在游戏、教育、虚拟摄影等多个领域,甚至开启一种全新的媒体形式。这不仅降低了3D内容制作的成本,还可能会激发更多的沉浸式体验。

李飞飞则补充了增强现实(AR)和虚拟现实(VR)的应用场景。她提到:“这种技术将成为AR/VR的‘操作系统’,帮助人类增强能力。”

她举例说,未来,佩戴AR眼镜的人可能不需要任何专业技能,就能修理汽车或完成复杂的操作。她认为,通过空间智能,虚拟世界与现实世界的融合将大大增强人类与机器的互动能力。

贾斯汀指出,随着这项技术的成熟,未来我们可能不再需要使用手机、平板等不同尺寸的屏幕。他表示:“如果你能够将虚拟内容与物理世界无缝融合,那么对所有这些屏幕的需求就会减少。”

李飞飞还提到了苹果发布的Vision Pro。她笑称,“就在World Lab成立的时候,苹果发布了Vision Pro。苹果使用了‘空间计算’这个词,几乎是‘偷’了我们的名字,我们是‘空间智能’。”

  • 迈向“北极星”的旅程

在对话的最后,马丁·卡萨多问及如何衡量空间智能的成功。李飞飞表示:“当我们看到越来越多的企业和用户开始使用我们的模型来解锁他们的需求时,那将是我们到达一个重要里程碑的时刻。”但她也指出,追逐技术的“北极星”是一场永无止境的旅程,空间智能的未来充满了无限可能。

贾斯汀则认为,空间智能的终极目标是理解宇宙的四维结构,技术的每一次突破都会开启更多的未知领域:“我们永远不会到达终点,但这正是技术魅力所在。”

每日经济新闻综合公开消息

每日经济新闻

相关内容

人大主办!全球青年科学家共...
智东西 作者 | ZeR0 编辑 | 漠影 智东西5月31日报道,...
2026-06-20 12:53:20
聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
制造业大市如何拥抱AI?绍...
“此次圆桌研讨凝聚起产业发展共识,后续浙江将持续整合各方资源,汇聚...
2026-05-30 05:50:45
鸿蒙生态设备超13亿台,开...
PChome 5月28日消息,2026开源鸿蒙开发者大会正式召开,...
2026-05-30 05:44:37
德勤:聚焦AI驱动产业变革...
上证报中国证券网讯(记者 汪友若)5月27日,“2026德勤中国高...
2026-05-28 21:01:39

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...