当前位置: 首页 > ds >正文

召回增强RAPTOR策略

原文地址: https://arxiv.org/pdf/2401.18059

参考:https://baoyu.io/translations/ai-paper/2401.18059-raptor-recursive-abstractive-processing-for-tree-organized-retrieval?utm_source=chatgpt.com

摘要

检索增强语言模型(Retrieval-Augmented Language Models)能够更好地适应世界状态的变化,并整合长尾知识。然而,大多数现有方法仅从检索语料库中检索短的连续文本块,限制了对整个文档上下文的整体理解。我们引入了一种新颖的方法,通过递归地嵌入、聚类和总结文本块,从底层向上构建具有不同摘要级别的树。在推理时,我们的 RAPTOR 模型从这棵树中检索,在不同抽象级别整合冗长文档中的信息。 对照实验表明,在多个任务上,递归摘要检索比传统检索增强型语言模型有显著改进。在涉及复杂、多步骤推理的问答任务中,我们展示了最先进的结果;例如,通过将 RAPTOR 检索与 GPT-4 结合使用,我们可以将 QuALITY 基准的最佳性能绝对准确率提高 20%。

1、引言

大型语言模型(LLMs)已成为推动技术变革的重要工具,在许多任务上表现出色。随着 LLM 的规模不断增长,它们可以作为非常有效的知识存储体,其参数中编码了大量事实(Petroni 等,2019;Jiang 等,2020;Talmor 等,2020;Rae 等,2021;Hoffmann 等,2022;Chowdhery 等,2022;Bubeck 等,2023;Kandpal 等,2023),并且可以通过在下游任务上的微调进一步提升性能(Roberts 等,2020)。然而,即使是大型模型,对于特定任务也可能缺乏足够的领域知识,而且世界持续变化,可能使得 LLM 中的事实失效。通过额外的微调或编辑来更新这些模型的知识是困难的,特别是在处理庞大的文本语料库时(Lewis 等,2020;Mitchell 等,2022)。一种替代方法是在开放域问答系统中开创的(Chen 等,2017;Yu 等,2018),即在一个单独的信息检索系统中索引大量文本,在将其分割成块(段落)后。然后,将检索到的信息与问题一起作为上下文提供给 LLM(“检索增强”,Lewis 等,2020;Izacard 等,2022;Min 等,2023;Ram 等,2023),使得系统可以轻松提供特定领域的最新知识,并实现易于解释和溯源的能力,而 LLM 的参数知识是难以追溯其来源的(Akyurek 等,2022)。

然而,现有的检索增强方法也存在缺陷。我们要解决的问题是,大多数现有方法仅检索少量短的连续文本块,这限制了它们表示和利用大规模话语结构的能力。这对于需要整合文本多个部分知识的主题性问题尤为重要,例如理解整本书的内容,如 NarrativeQA 数据集(Kočiskỳ 等人,2018)中的情况。以“灰姑娘”的童话故事为例,问题“灰姑娘是如何获得幸福结局的?”中,检索到的前 k 个短的连续文本可能无法提供足够的上下文来回答问题。

为了解决这个问题,我们设计了一个索引和检索系统,使用树结构来捕捉文本的高层次和低层次细节。如图 1 所示,我们的系统 RAPTOR 对文本块进行聚类,生成这些聚类的文本摘要,然后重复此过程,从底层向上构建树。这种结构使 RAPTOR 能够将代表文本不同层次的块加载到 LLM 的上下文中,从而能够有效地回答不同层次的问题。

在这里插入图片描述
图 1: 构建知识树的过程:RAPTOR 通过分析文本块的深层含义,将它们归为一类,并为每一类生成简要概述,由此自下而上地构建出一棵知识树。归为一类的信息点成为兄弟节点;而每个父节点则包含了这一类信息的总结。

2、方法

2.1 文本块的嵌入和聚类

我们首先将文档分割成较小的文本块(例如段落或句子),然后使用预训练的语言模型(如 BERT)将每个文本块转换为向量表示。接下来,根据这些向量的相似性,将相似的文本块聚集在一起,形成一个个“簇”。

2.2 摘要生成与树结构构建

对于每个聚类,我们使用抽象式摘要模型生成一个简洁的摘要,代表该聚类的主要内容。然后,将这些摘要作为新的文本块,重复聚类和摘要生成的过程,逐层向上,直到形成一个树状结构的摘要层次。底层节点包含原始文本块,越往上层,信息越抽象,直到根节点代表整个文档的高层摘要。

3、实验与结果

我们在多个问答任务上进行了对比实验,验证了 RAPTOR 的有效性。实验结果表明,RAPTOR 在处理需要多步推理的复杂问题上表现突出。例如,在 QuALITY 基准测试中,结合 GPT-4 的 RAPTOR 模型将准确率提升了 20%。

4、讨论与未来工作

RAPTOR 提供了一种创新的方式,使语言模型在处理长文档和复杂问题时更加高效和准确。然而,在实际应用中,RAPTOR 可能面临一些挑战,如计算资源需求、索引构建时间、更新和维护等。此外,摘要质量、查询效率和多模态数据处理等方面也需要进一步研究和优化。未来的工作将致力于解决这些挑战,并探索 RAPTOR 在更多领域的应用。

http://www.xdnf.cn/news/9760.html

相关文章:

  • 响应式布局进阶:企业商城系统复杂交互页面的多端适配方案
  • Python训练打卡Day36
  • flutter加载dll 报错问题
  • Cesium实现标注动画
  • SMME 2025:创新海洋工程模式,迎接未来挑战
  • 深入解析 CountDownLatch、Semaphore 和CyclicBarrier
  • NHANES指标推荐:CircS
  • 3D LUT--颜色魔方
  • 生物化学:药品药物 营养和补充剂信息 第三方认证信息 常见误区 汇总
  • VirtualBox怎样安装Win10
  • 直角坐标系下 dxdy 微小矩形面积
  • 硬盘驱动器习题解析
  • 力扣刷题 -- 20.有效的括号
  • NR[ RF - 简介 ]
  • Docker Desktop无法在windows低版本进行安装
  • Qt 的简单示例 -- 地址簿
  • XCTF-web-fileinclude
  • maven离线将jar包导入到本地仓库中
  • 【大模型原理与技术-毛玉仁】第一章 语言模型基础
  • STM32F103_Bootloader程序开发04 - App跳转模块(app_jump.c与app_jump.h)
  • 使用 Unsloth 快速微调 LLMs 实用指南
  • CentOS7安装WVP+ZLM
  • 设置随机数种子的作用
  • 智慧康养实训室建设方案:基于“互联网 + 康养”的实训设计​
  • 【IEEE出版| 高届数EI会议】第十届计算机与信息处理技术国际学术研讨会(ISCIPT 2025)
  • 高并发订单服务库存超卖解决方案
  • 题目 3342: 蓝桥杯2025年第十六届省赛真题-红黑树
  • 电动黄油枪行业数据分析报告2025-恒州诚思
  • JavaWeb:NodeJS安装及环境配置
  • python的server启动项目和nginx有什么区别?