dify的知识库的父子分段和通用分段的对比
首先文档及其分段的表查询语句是
SELECT * FROM documents
--WHERE name = '标题前自动插入特殊符号生产物料供应商开发与管理操作手册(1).docx'
ORDER BY created_at desc ;
--文档分段-父子分段和通用分段共用表
SELECT * FROM document_segments where document_id='36844daf-a952-4dd3-ae1b-972fad2ca4e9' ;
--文档分段-父子分段的子分段表,segment_id是父分段id
SELECT * FROM child_chunks where document_id='36844daf-a952-4dd3-ae1b-972fad2ca4e9' and segment_id='3ba4799a-adee-42b9-99d3-a4cba9108dea'
更多表解析
深入解读大模型开发工具Dify--底层数据存储_dify 表结构-CSDN博客
效果界面效果
流程编排测试
父子分段,可以将上下文紧密联系在一起,进行推理重构
通用模式下,检索相同的问题,回答远没有父子模式的精准,很明显是关键字没有命中部分步骤,而父子 模式将整个信息进行了上下文内容的存储,并且形成了关联,其上下文内容更丰富,因此推断更为精准和合理