微软推出CoRAG:通过迭代推理提升AI检索能力
创始人
2025-02-23 10:52:09
0

作者 | Robert Krzaczyński

翻译审校 | InfoQ 编辑部

微软人工智能团队与中国人民大学合作,推出了 CoRAG(检索增强生成链 Chain-of-Retrieval Augmented Generation),这是一种全新的人工智能框架,旨在优化检索增强生成(Retrieval-Augmented Generation,RAG)模型。与传统 RAG 系统仅依赖单次检索不同,CoRAG 支持迭代搜索和推理,使得人工智能模型在生成答案前能够动态优化检索结果。

这一改进弥补了传统 RAG 系统的重大缺陷:传统 RAG 系统难以有效整合多源信息。在处理复杂查询,尤其是多跳问答(QA)时,传统 RAG 模型往往力不从心,因为它们仅检索一次信息,这就导致结果不完整或不准确。CoRAG 则通过在每一步重新构建查询来改变这一现状,使人工智能能够像人类研究人员一样“深入思考”检索过程。

CoRAG 的核心创新在于其动态查询重构机制。该模型不再依赖单次检索,而是根据中间推理状态迭代优化查询。这一过程确保了每个阶段检索到的信息都与上下文相关,进而逐步构建出更完整的最终答案。

为了能在无需大量昂贵的人工标注的情况下训练 CoRAG,研究人员采用了 拒绝采样技术(Rejection Sampling),即从现有的 RAG 数据集中生成合理的检索链。模型在这些增强数据集上进行训练,学习生成子查询、子答案和最终答案。

在推理阶段,CoRAG 提供了多种灵活的解码策略,比如:

  • 为提高效率的贪心解码;

  • 为优化准确性的 N 选 1 采样;

  • 为平衡计算成本和性能的树搜索。

这种可扩展性使用户能够控制检索深度,在准确性和计算效率之间实现最佳平衡。

图注:来源:https://arxiv.org/abs/2501.14342

CoRAG 在 KILT 基准测试和多跳问答任务上进行了测试,与现有的 RAG 模型相比,其效果得到了提升。在需要从多个来源检索和整合信息的任务中,该方法尤为有效。

图注:KILT 基准测试结果,来源:https://arxiv.org/abs/2501.14342

图注:多跳问答任务基准测试结果,来源:https://arxiv.org/abs/2501.14342

人工智能领域已经注意到了 CoRAG 的潜在影响力。Durapid Technologies 的创始人兼首席执行官迪普什·贾恩(Deepesh Jain)评价道:> “这是 RAG 向前迈出的一大步!传统方法常常遗漏关键细节,而 CoRAG 的迭代方法让检索更智能、更具动态性。让模型像人类一样优化搜索,有望为复杂查询提供更好的答案。”

此外,Velotix 的高级机器学习工程师叶卡捷琳娜·巴鲁(Ekaterina Baru)强调了该方法与人类研究方法的相似之处:> “这是一种引人入胜的方法——利用迭代检索优化查询,真实地反映了研究人员深入探究问题的过程。它在多跳问答任务上的性能提升令人印象深刻,我很好奇在实际应用中,更长的检索链和计算成本之间的平衡将如何发展。期待看到它的后续进展!”

从静态检索转向迭代方法,CoRAG 开创了一种全新的人工智能搜索和推理处理方式。这在自动研究、企业知识系统以及人工智能辅助决策等领域具有重要价值,因为在这些领域中,获取准确且结构化的信息至关重要。

关于作者

Robert Krzaczyński,Robert Krzaczyński 是一名专注于微软技术的软件工程师。日常工作中,他主要使用.NET 进行软件开发,但他的兴趣远不止于此。除了核心专业技能外,他对机器学习和人工智能有着浓厚的兴趣,并不断在这些前沿领域拓展自己的知识。他拥有控制工程与机器人学的工程学学士学位以及计算机科学的工程学硕士学位。

相关内容

Canva全新设计模型有望...
Canva在周四的秋季产品发布会上推出了一系列全新的AI产品和功能...
2025-10-31 23:15:42
中部第一城,想进AI城市第...
近日发布的“十五五”规划建议,“人工智能”被提及8次。而在前瞻未来...
2025-10-31 21:44:38
AI公平性:如何让人工智能...
创新者在发展人工智能时有一个重要目标——确保AI能够服务于公共利益...
2025-10-31 21:16:40
开源可信MCP,AICC机...
2025-10-31 15:13:14 作者:狼叫兽 大模型技术...
2025-10-31 21:16:27
曝AI专家周舒畅加入小鹏汽...
【CNMO科技消息】10月31日,有媒体报道称,人工智能专家、阶跃...
2025-10-31 17:46:01
海看股份:计划2027年实...
10月31日,海看股份在“天津论道暨第30届智能视听与科技创新产业...
2025-10-31 17:45:16

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...