当前位置: 首页 > ai >正文

浅谈Elasticsearch数据写入流程的refresh和flush操作

这篇文章主要写Elasticsearch写入流程中底层的存储实现,主要涉及refresh和flush等操作。

从上图可以看到 ES中一个Index可能分为多个shard。实现上每个shard都是一个Lucence的Index,而每个Lucence Index内部是由多个Segment文件组成。

下面分别从 Lucene数据写入 和 Elasticsearch数据写入 两个视角来了解Elasticsearch写入数据底层到底都有哪些操作。

Lucene 数据写入

下面是一张Lucene写入模型图,

 

  • DocumentsWriter 处理写请求,并分配具体的线程 DocumentsWriterPerThread

  • DocumentsWriterPerThread 具有独立内存空间,对文档进行处理 DocumentsWriter 触发一些 flush 的操作。

  • DocumentsWriterPerThread 中的内存 In-memory buffer 会被 flush

http://www.xdnf.cn/news/18808.html

相关文章:

  • ICDE 2025 | 包含OPTIONAL和UNION表达式的SPARQL查询的高效执行方法
  • 硬件开发_基于物联网的儿童座椅系统
  • 3.【鸿蒙应用开发实战: 从入门到精通】开发入门 Hello World
  • 7、prefix-tuning、P-tuning、Prompt-tuning
  • 基于数据安全的旅游民宿租赁系统
  • 音频时长裁剪工具:高效处理音频,让内容创作更轻松
  • docker 所有常用命令,配上思维导图,加图表显示
  • 配送算法16 A Deep Reinforcement Learning Approach for the Meal Delivery Problem
  • 【Linux】用户与用户组管理
  • 【C语言强化训练16天】--从基础到进阶的蜕变之旅:Day14
  • 蓝桥杯算法之基础知识(3)——Python的idle的快捷键设置(idle改键)
  • OpenCV实战1.信用卡数字识别
  • 极简风格PDF格式转换解决方案
  • 人工智能安全地图:将人工智能漏洞与现实世界的影响联系起来
  • Linux 系统核心调优:CPU、磁盘 I/O、网络与内核参数实战
  • Java全栈开发面试实录:从基础到实战的深度探索
  • 【AI算力平台】算力高效调度策略——GPU调度
  • Rust 登堂 之 函数式编程(三)
  • vagrant怎么在宿主机管理虚拟机镜像box(先搁置)
  • PyTorch生成式人工智能——PatchGAN详解与实现
  • LeetCode 438. 找到字符串中所有的字母异位词
  • 功能强大的PDF工具箱-- PDF补丁丁,v1.1.0.4657新版本,免费无广告,开箱即用版~
  • flutter专栏--dart基础知识
  • Android系统学习2——Android.Utils.Log模块讨论
  • [Maven 基础课程]Maven 是什么
  • Java微服务AI集成指南:LangChain4j vs SpringAI
  • imx6ull-驱动开发篇43——I.MX6U 的 I2C 驱动分析
  • 软件开发技术栈
  • 集成电路学习:什么是ResNet深度残差网络
  • LeetCode 2140. 解决智力问题