当前位置: 首页 > news >正文

【lucene】tip文件详解

把 `.tip` 文件按 字节顺序 画成一张“路线图”:

```

┌---------------------┐

│ Header │ CodecHeader(魔数+版本)

├---------------------┤

│ FSTIndex[0] │ 字段0的FST字节流

│ FSTIndex[1] │ 字段1的FST字节流

│ ... │

│ FSTIndex[NumFields-1]│

├---------------------┤

│ IndexStartFP[0] │ VLong,字段0的FST在.tip中的起始偏移

│ IndexStartFP[1] │ VLong,字段1的FST在.tip中的起始偏移

│ ... │

│IndexStartFP[NumFields-1]│

├---------------------┤

│ DirOffset │ Uint64,指向上面这张“IndexStartFP表”的起点

├---------------------┤

│ Footer │ CodecFooter(校验和)

└---------------------┘

```

一句话记忆

“头 + 一堆 FST + 指针表 + 指针表的指针 + 尾”。

指针表存的就是:执向某个字段的fst的起始位置的指针。

整体顺序  

```

Header

FSTIndex × NumFields ← 每个字段一棵 FST

IndexStartFP × NumFields ← 每棵 FST 在文件中的起始偏移

DirOffset

Footer

```

字段说明

原文 中文含义 作用 

Header → CodecHeade

http://www.xdnf.cn/news/1322911.html

相关文章:

  • 08.常见文本处理工具
  • 基于Spring Boot+Vue的社区便民服务平台 智慧社区平台 志愿者服务管理
  • 咨询进阶——解读咨询顾问技能模型
  • QT 字节大小端转序方法
  • axure chrome 浏览器插件的使用
  • kafka的pull的依据
  • 关系型数据库与非关系型数据库
  • 冒泡排序——简单理解和使用
  • 嵌入式第三十一天(线程间的机制,IPC机制)
  • JAVA经典面试题:数据库调优
  • rust 从入门到精通之变量和常量
  • 从 ORA-12703 到顺利入库:Go + Oracle 11g GBK 字符集踩坑记20250818
  • [免费]基于Python的全国气象数据采集及可视化大屏系统(Flask+request库)【论文+源码+SQL脚本】
  • elasticsearch-集成prometheus监控(k8s)
  • 【LeetCode题解】LeetCode 74. 搜索二维矩阵
  • 【深度长文】Anthropic发布Prompt Engineering全新指南
  • IDE开发系列(2)扩展的IDE框架设计
  • 【音视频】瑞芯微、全志芯片在运动相机和行车记录仪产品分析
  • mybatis连接数据库
  • Kafka 零拷贝(Zero-Copy)技术详解
  • 数据赋能(401)——大数据——持续学习与优化原则
  • RAG 入门指南:从概念到最小系统搭建
  • 基于Android的随身小管家APP的设计与实现/基于SSM框架的财务管理系统/android Studio/java/原生开发
  • 从0-1使用Fastmcp开发一个MCP服务,并部署到阿里云百炼 -持续更新中
  • Flutter 自定义 Switch 切换组件完全指南
  • 深度学习——R-CNN及其变体
  • React diff——差异协调算法简介
  • 【Python面试题】写一个用元类(metaclass)实现API接口自动注册的Demo。以及装饰器在项目中典型应用场景。
  • AI行业应用深度报告:金融、医疗、教育、制造业落地案例
  • 前端环境安装