当前位置: 首页 > ds >正文

【论文阅读笔记】Context-Aware Hierarchical Merging for Long Document Summarization

2025ACL

keywords  长文本摘要 / LLM / 幻觉

传统长文本摘要方法  暴力切块,相邻合并,递归生成,直到长度符合要求。

本文方法  合并的时候不直接用相邻内容,而是挑相关的context。具体有三种方法,第一种直接挑关键句子做生成,第二种使用摘要检索输入中的相关内容,第三种以输入内容作参考引用做生成

关于IC模块的理解:

关于加入IC模块后的具体使用方式:

实验

数据集:Multi-LexSum(法律)、SuperSummary(小说)

模型:Llama3、MemSum(Extract方法抽contexts的时候)

可改进的方向

1. 人工评估,没什么说的。

2. 在Support方法中,输入上下文被用作支持证据,导致在合并阶段输入到LLM的文本长度增加,相比replace方法,运行效率低。可以探索更高效地将上下文信息整合到摘要过程中的方法。例如,可以选择性地包含上下文,基于位置信息或对文档结构的了解,而不是简单地将所有上下文信息都纳入。

3. 虽然实验结果表明加入上下文可以提高摘要的准确性,但目前尚不清楚上下文是如何在中间摘要和最终结果中发挥作用的。未来的研究可以进一步分析上下文如何改善中间摘要的质量,以及如何更有效地利用上下文信息。例如,可以通过实验来评估不同上下文选择方法对摘要质量的影响,或者开发一种机制来预测哪些段落对摘要任务最有帮助

比较能做的:改进上下文选择方法(比如结合一下或者用别的)、优化上下文长度(动态调整之类的)、垂直领域(加知识库、外部数据库)

http://www.xdnf.cn/news/17885.html

相关文章:

  • 【R语言】R语言的工作空间映像(workspace image,通常是.RData)详解
  • 《卷积神经网络(CNN):解锁视觉与多模态任务的深度学习核心》
  • 【完整源码+数据集+部署教程】火柴实例分割系统源码和数据集:改进yolo11-rmt
  • 【类与对象(下)】探秘C++构造函数初始化列表
  • 响应式对象的类型及其使用场景
  • WMware的安装以及Ubuntu22的安装
  • 11.用反射为静态类的属性赋值 C#例子 WPF例子
  • 第六十五章:AI的“精良食材”:图像标注、视频帧抽帧与字幕提取技巧
  • 数据挖掘常用公开数据集
  • 【KO】Android 网络相关面试题
  • Redis 核心数据结构与常用命令详解
  • Qwen-Image(阿里通义千问)技术浅析(二)
  • HTTP 协议详细介绍
  • 第6章 AB实验的SRM问题
  • elasticsearch mapping和template解析(自动分词)!
  • 何解决PyCharm中pip install安装Python报错ModuleNotFoundError: No module named ‘json’问题
  • Flink DataStream 按分钟或日期统计数据量
  • 如何在VS里使用MySQL提供的mysql Connector/C++的debug版本
  • LeetCode 刷题【40. 组合总和 II】
  • 基于C#、.net、asp.net的心理健康咨询系统设计与实现/心理辅导系统设计与实现
  • 药房智能盘库系统的Python编程分析与实现—基于计算机视觉与时间序列预测的智能库存管理方案
  • Redis学习——Redis的十大类型String、List、Hash、Set、Zset
  • 仓库无人叉车的安全功能有哪些?如何在提升效率时保障安全?
  • 机器学习——svm支持向量机
  • 为什么要使用消息队列呢?
  • 【龙泽科技】汽车故障诊断仿真教学软件【科鲁兹】
  • 总经理掌舵研发团队:在技术突破与商业落地间找到平衡的艺术-中小企实战运营和营销工作室博客
  • 力扣 hot100 Day72
  • Gradle(二)Gradle的优势、项目结构介绍
  • LINUX812 shell脚本:if else,for 判断素数,创建用户