当前位置: 首页 > news >正文

RAG中的chunk以及评测方法

RAG中的chunk以及评测方法

https://www.pinecone.io/learn/chunking-strategies/

分块(chunking)是将大块文本分解成小段的过程。chunk的主要原因是尽量减少我们Embedding内容的噪音,所以为知识库中的文档找到最为合适的chunk大小,非常影响后续查找的准确性和相关性。

chunk的一些需要思考的问题

  • 被索引的内容:长文档还是短内容。这会影响选择embedding model,从而也影响chunk的策略。每个embedding model在不同的大小的chunk上的表现不一样。例如 sentence-transformer在单个句子上表现很好,text-embedt-ada-002这样的模型在包含256或512个tokens的块上表现得更好。
  • 用户的输入的prompt的长度也是需要考虑的内容。
  • 大模型tokens上限也会影响chunk的大小。

chunk的几种方法

如下介绍的方法在当前成熟的框架中几乎都已经支持了,例如langchain、llamaindex等。

  • 固定大小是指确定tokens的数量,以及它们之间是否有重叠(有一些重叠能够保留部分上下文语义。)大部分的chunk都是采
http://www.xdnf.cn/news/737839.html

相关文章:

  • 详解Seata的四种事务模式:AT、TCC、SAGA、XA
  • 深入浅出网络分析与故障检测工具
  • Chrome插件学习笔记(二)
  • C++核心编程_赋值运算符重载
  • 2025最新Nginx安装配置保姆级教程(Windows)
  • 《JavaScript高级程序设计》读书笔记 34 - 代理基础
  • 【术语扫盲】BSP与MSP
  • FreeRTOS多任务系统①
  • Vector - VT System - 板卡_VT板卡使用介绍目录
  • 【Redis】hash
  • LevelDB、BoltDB 和 RocksDB区块链应用比较
  • 前端基础之《Vue(17)—路由集成》
  • 【C/C++】无限长有序数组中查找特定元素
  • 语音通信接通率、应答率和转化率有什么区别?
  • (20)Java 在 AI ML 领域应用
  • Spring AI开发跃迁指南(第二章:急速上手5——Spring AI 结构化输出源码级原理详解及使用实例)
  • 电动飞行器(eVTOL)动力测试实验室系统方案
  • JavaScript正则表达式
  • 精通 Kubernetes:从故障排除到化繁为简
  • MySql--定义表存储引擎、字符集和排序规则
  • 前端面试题目-高频问题集合
  • 用OLEDB读取EXCEL时,单元格内容长度超过255被截断
  • 痉挛性斜颈相关内容说明
  • 换行符在markdown格式时异常2
  • 智能化能源管理系统在“双碳”背景下的新价值
  • 本地部署Ollama DeepSeek-R1:8B,接入Cherry Studio
  • 优先队列用法
  • [正点原子]ESP32S3 RGB屏幕移植LVGL
  • 基本数据指针的解读-C++
  • 数据即资产:GEO如何重塑企业的信息价值链