当前位置：首页 > news >正文

RAG中的chunk以及评测方法

news 2025/6/3 10:38:10

RAG中的chunk以及评测方法

https://www.pinecone.io/learn/chunking-strategies/

分块（chunking）是将大块文本分解成小段的过程。chunk的主要原因是尽量减少我们Embedding内容的噪音，所以为知识库中的文档找到最为合适的chunk大小，非常影响后续查找的准确性和相关性。

chunk的一些需要思考的问题

被索引的内容：长文档还是短内容。这会影响选择embedding model，从而也影响chunk的策略。每个embedding model在不同的大小的chunk上的表现不一样。例如 sentence-transformer在单个句子上表现很好，text-embedt-ada-002这样的模型在包含256或512个tokens的块上表现得更好。
用户的输入的prompt的长度也是需要考虑的内容。
大模型tokens上限也会影响chunk的大小。

chunk的几种方法

如下介绍的方法在当前成熟的框架中几乎都已经支持了，例如langchain、llamaindex等。

固定大小是指确定tokens的数量，以及它们之间是否有重叠（有一些重叠能够保留部分上下文语义。）大部分的chunk都是采

http://www.xdnf.cn/news/737839.html

相关文章：

详解Seata的四种事务模式：AT、TCC、SAGA、XA

深入浅出网络分析与故障检测工具

Chrome插件学习笔记（二）

C++核心编程_赋值运算符重载

2025最新Nginx安装配置保姆级教程（Windows）

《JavaScript高级程序设计》读书笔记 34 - 代理基础

【术语扫盲】BSP与MSP

FreeRTOS多任务系统①

Vector - VT System - 板卡_VT板卡使用介绍目录

【Redis】hash

LevelDB、BoltDB 和 RocksDB区块链应用比较

前端基础之《Vue（17）—路由集成》

【C/C++】无限长有序数组中查找特定元素

语音通信接通率、应答率和转化率有什么区别？

(20)Java 在 AI ML 领域应用

Spring AI开发跃迁指南（第二章：急速上手5——Spring AI 结构化输出源码级原理详解及使用实例）

电动飞行器（eVTOL）动力测试实验室系统方案

JavaScript正则表达式

精通 Kubernetes：从故障排除到化繁为简

MySql--定义表存储引擎、字符集和排序规则

前端面试题目-高频问题集合

用OLEDB读取EXCEL时,单元格内容长度超过255被截断

痉挛性斜颈相关内容说明

换行符在markdown格式时异常2

智能化能源管理系统在“双碳”背景下的新价值

本地部署Ollama DeepSeek-R1:8B，接入Cherry Studio

优先队列用法

[正点原子]ESP32S3 RGB屏幕移植LVGL

基本数据指针的解读-C++

数据即资产：GEO如何重塑企业的信息价值链