当前位置: 首页 > news >正文

ElasticSearch导读

ElasticSearch


简介:ElasticSearch简称ES是一个开源的分布式搜素和数据分析引擎。使用Java开发并且是当前最流行的开源的企业级搜索引擎,能够达到近实时搜索,它专门设计用于处理大规模的文本数据和实现高性能的全文搜索。它基于 Apache Lucene 构建,专为处理海量数据而设计。它支持全文搜索、结构化查询、数据分析,并广泛应用于日志管理(如 ELK Stack)、电商搜索、实时监控等场景。

基本概念

术语说明
索引(Index)类似数据库中的“表”,存储相关文档(如 user_index)。
文档(Document)索引中的基本数据单元,格式为 JSON(如一条用户信息)。
分片(Shard)索引被分割成的子部分,支持分布式存储和并行计算。
节点(Node)一个运行中的 Elasticsearch 实例,多个节点组成集群(Cluster)。

ELK技术栈

Elasticsearch结合Kibana、Logstash、Beats,也就是elastic stack(ELK)。被广泛应用在日志数据分析,实时监控等领域:

核心组件

组件功能配图示意(文字描述)
LogstashBeats数据采集与处理:从多种来源(如日志文件、数据库)收集数据,过滤并格式化后传输到 Elasticsearch。[输入] → Logstash(过滤/转换) → [输出]
Elasticsearch数据存储与检索:分布式存储处理后的数据,支持快速搜索和分析。[数据存储] → Elasticsearch(索引/分片)
Kibana数据可视化:通过图表、仪表盘展示 Elasticsearch 中的数据。Kibana ← [查询] → Elasticsearch

总结:ELK 技术栈通过 Logstash/Beats(采集)→ Elasticsearch(存储)→ Kibana(可视化) 实现数据全生命周期管理,适用于日志分析、运维监控等场景。学习时需掌握各组件配置和协同工作原理。

Elasticsearch和lucene之间的关系

说的专业一点:Elasticsearch 基于 Apache Lucene(高性能全文检索引擎库)构建,核心的索引和搜索功能由 Lucene 实现。

说的通俗一点:Lucene 是“发动机”,专注单机性能Elasticsearch 是“整车”,集成发动机并添加了方向盘、底盘(分布式、易用性)

总结:Elasticsearch = Lucene + 分布式 + 易用接口 + 高级功能(如聚合、近实时搜索)。

索引

两个基本概念:

文档(Document):文档是 Elasticsearch 中 最小的数据存储单元,类似于 Excel 表格中的一行数据,但更灵活。

词条(Term):词条是文档内容经过 分词处理 后的最小单位,是搜索引擎操作的基本元素。

文档与词条的关系:

维度文档(Document)词条(Term)
角色数据存储的基本单位(“完整信息包”)搜索的基本单位(“信息碎片”)
存储方式原始 JSON 格式,保存在索引(Index)中分词后存储在反向索引(Inverted Index)中
操作目标用于增删改查完整数据用于快速检索和匹配内容

正向索引:正向索引是 以文档为中心 的索引结构,记录每个文档包含哪些关键词(类似书的目录,告诉你每本书里有什么内容)。

反向索引:反向索引是 以关键词为核心 的索引结构,记录每个关键词出现在哪些文档中(类似词典的索引页,告诉你哪个词在哪本书出现)。

正向索引VS反向索引

正向索引反向索引
核心逻辑文档→关键词(书→内容)关键词→文档(词典→书页)
搜索效率慢(需遍历所有文档)快(直接查关键词对应的文档)
存储空间较小较大(需存储词频、位置等额外信息)
典型应用早期搜索引擎、小规模系统现代搜索引擎(Google/Bing)、大数据系统

Mysql与ElasticSearch

  • ES 适合全文搜索和实时分析(如日志、商品搜索)。

  • MySQL 适合强事务和高一致性的业务(如支付、订单)。

  • 实际项目中常结合使用(如 MySQL 存储业务数据,ES 提供搜索服务)。

http://www.xdnf.cn/news/572167.html

相关文章:

  • 【网络安全】日志采集、监控任务守护进程详细教程(附实战案例)
  • 打卡31天
  • Python学习Day1:安装
  • 谷歌2025年I/O开发者大会热点总结
  • shell脚本总结3
  • 【LLMs篇】12:Qwen3 技术报告翻译
  • 人工智能路径:技术演进下的职业发展导航
  • 20个关于Java编程语言的常见问题
  • 从微积分到集合论(1630-1910)(历史简介)——第2章——牛顿(Newton)和莱布尼兹(Neibniz)以及莱布尼兹传统(H.J.M.Bos)
  • 2025年人工智能新应用与新技术全景解析
  • Qt+线段拖曳示例代码
  • 【UE5】环形菜单教程
  • 现代计算机图形学Games101入门笔记(十九)
  • 汽车电子电气架构诊断功能开发全流程解析
  • Linux nbd 网络块设备(2)-内核实现
  • fork 和 写时拷贝
  • NV009NV010美光闪存颗粒NV011NV012
  • 【Elasticsearch】字段别名
  • el-radio-group 与 el-dropdown 一起使用时的注意事项
  • Pytorch基础操作
  • cookie跨域共享踩的坑
  • sqli-labs第十八关——POST-UA注入
  • 使用MATLAB输出1000以内所有完美数
  • MoManipVLA-北京邮电-2025.3.17-移动操控-未完全开源
  • UML 时序图 使用案例
  • PostGIS实现栅格数据导出PNG应用实践【ST_AsPNG 】
  • 乘“4”而上,进取不止|Aloudata 的变与不变
  • 【专四 | 2022年真题】LANGUAGE USAGE逐题总结
  • dedecms织梦全局变量调用方法总结
  • 【OCCT+ImGUI系列】009-Geom2d-Geom2d_AxisPlacement