科技行业对“下一个大趋势”有着强烈的渴望。但有时,正是那些老技术最终成为了应对新任务的合适工具。这是RelationalAI创始人兼首席执行官Molham Aref的观点,他认为关系型数据库完全可以提供支持新型AI工作负载的图关系。
RelationalAI开发了一种知识图谱基础架构,旨在存储和查询关联数据,以支持预测性和规范性的人工智能工作负载。从这个角度来看,它与存储数据在节点和边上的底层属性图(如Neo4j)以及存储数据在语义三元组集中的语义图(如AllegroGraph)相似。
然而,这些图与 RelationalAI 的底层数据存储之间有一个重大区别:RelationalAI 使用关系型数据库技术和常规 SQL,而非超规范化图数据结构和专用查询语言。尽管领先的属性图和语义图采用专用技术,但 RelationalAI 基于可追溯至 70 年代的技术构建。这使 RelationalAI 在一个由炒作驱动的行业中显得有些特立独行。
但Aref坚持自己的看法,事实上,他在上周的Snowflake Summit 25上发表了演讲,认为关系模型和SQL是构建当今生成式AI和代理AI应用程序底层数据基础设施的最 佳技术基础。
“我认为我们都应该承认,关系模型总会胜出,这次也不例外,”Aref接受BigDATAwire采访时表示。“我年纪够大,记得80年代人们曾说‘这种技术永远无法用于OLTP。真正的程序员想要……平面文件和导航数据库。’ 到了90年代,人们又说MOLAP(多维OLAP)是唯一途径,关系型数据库是愚蠢的。”
OLAP(在线分析处理)至今仍存在。事实上,它是许多大型分析型数据库(如Snowflake)的架构基础。但Aref指出,如今人们不再区分关系型OLAP(ROLAP)与MOLAP。如今,ROLAP基本上与OLAP同义。
多年来,人们曾多次尝试超越关系型模型和SQL。整个Hadoop阶段就是一次大规模的实验。当Snowflake还是一家初创公司时,它通过宣称使用关系模型和SQL的效率与智慧而引起关注,而当时世界其他地方正在研究如何将数据存储在Hadoop分布式文件系统(HDFS)上,并使用MapReduce等复杂框架进行处理。试图重新规范化数据的尝试,例如Apache Hive,就像试图将Humpty Dumpty重新拼凑在一起一样。
Aref记得Snowflake在早期面临的挑战,当时沙丘路上的投资者对它持怀疑态度。他记得前Snowflake首席执行官Bob Muglia告诉他,Snowflake在C轮融资中被拒绝了27次。这让Aref想起那段经历时不禁笑出声来。
“想象一下,作为一个拒绝投资Snowflake的投资者,”他说。“当时大家认为Hadoop才是赢家。大数据是新的工作负载,而实现大数据的唯一方式就是MapReduce。‘看,谷歌在用MapReduce。关系型数据库已死,别再提了。’然后Snowflake提出了云原生架构,并支持半结构化数据,现在Hadoop就像COBOL一样过时了。”
Aref现在正在与知识图谱展开类似的斗争。RelationalAI并未将数据迁移至专用的属性图或语义图数据库中,而是让数据保留在Snowflake表中,并通过传统的SQL查询来提出类似图结构的问题,这些查询结果反馈给预测性和规范性推理器。
总体的目标是以最 佳方式为AI算法提供数据,使其能够对数据进行推理并帮助用户解答复杂问题,例如“明年12月纽约市的iPhone销量会是多少?”“这不是一个SQL问题,”Aref表示,“这是一个关于尚未发生的事情的问题。它并不存在于数据库中。”
RelationalAI超越了基于检索增强生成(RAG)的技术,通过使用客户的结构化、半结构化和非结构化数据对知识图谱进行训练和微调,从而提升AI算法的能力。这本质上使AI模型能够理解客户数据中存在的关联关系。
“这是一种新型的知识图谱,”Aref说,“它不是导航图谱。我们与传统图谱的不同之处在于,我们能够基于规则进行预测性、规范性推理,并具备传统图谱的强大功能。”
正如存在擅长OLAP(在线分析处理)的关系型数据库和擅长OLTP(在线事务处理)的关系型数据库一样,我们现在正看到擅长图数据处理的关系型数据库的出现,Aref表示。
RelationalAI架构
“归根结底,图只是两个事物之间的连接。关系模型本身并不存在无法用于建模图的限制,”他说,“关系模型的美妙之处在于它并非专为某一特定工作负载硬编码,你可以进行OLTP和OLAP。它被硬编码为一种抽象,你可以在底层实现任何数据结构和连接算法。”
RelationalAI 以原生应用的形式部署在 Snowflake 平台内,这为客户带来了某些优势,尤其是在数据安全和治理方面。RelationalAI 还采用了 Snowflake 在峰会上发布的全新语义视图,这将带来更多标准化,并使基于数据构建预测和推理应用程序变得更加容易。
Aref表示,他尊重早期图数据库开发者利用当时可用的工具和技术所取得的成就。但他指出,得益于计算技术的进步,如今无需放弃关系模型和SQL即可构建知识图谱。
“我们不是在试图建立一个教派。我们试图为人们构建有用的东西,”Aref说。“我们的方法我认为更加谦逊。我们更加谦逊。就像,嘿,你在 Snowflake 上,在 SQL 中。我们知道如何让它能够运行关系查询,这些查询提出的是图数据库的问题。”
下一篇:一场AI展厅里的书法展