当前位置: 首页 > news >正文

ES使用之查询方式

文章目录

  • ES中的数据查询
      • 返回字段含义
        • track_total_hits
      • 精准匹配(term)
        • 单值匹配
        • 多值匹配
      • 全文检索(match)
      • range查询
      • 高级查询
        • 布尔查询

ES中的数据查询

返回字段含义

在这里插入图片描述

track_total_hits

track_total_hits是 Elasticsearch 中用于 ‌控制匹配文档总数统计行为‌ 的关键参数。就算统计total.value的数量,如果是true就准确返回匹配的数量,如果是false就不匹配,如果设置数量就在数量范围内获取,超过了就算返回设置的默认值

精确统计模式

  • 当设置为 track_total_hits=true 时,Elasticsearch 会 ‌强制计算所有匹配文档的精确总数‌,无论数量多大。此时返回的 hits.total.relation 始终为 eq(精确相等)15。
  • 适用场景‌:需精准分页、数据导出等对总数准确性要求高的场景

估算模式

  • 默认值为 track_total_hits=10000,当匹配文档数 ‌超过设定阈值‌(如默认 10,000)时,返回 hits.total.relationgte(大于等于),表示 value 是实际总数的下限估算值

完全禁用统计

  • 设置为 track_total_hits=false 时,跳过总数计算,返回 "value": 0, "relation": "gte",性能最优但无统计意义
{	//精准获取返回条数"track_total_hits":true,"query":{"match":{"data_info":"下午"}
}}
{//表示查询耗时(单位:毫秒)。表示本次查询耗时21毫秒"took": 21,//标识查询是否超时。示例中的 false 表示未超时"timed_out": false,//描述分片执行情况"_shards": {//参与查询的分片总数"total": 3,//成功执行查询的分片数"successful": 3,//查询过程中被跳过的分片数量"skipped": 0,//执行失败的分片数"failed": 0},"hits": {"total": {//匹配文档总数"value": 4,//表示 value 的精确性两种//eq‌(exact):精确计数//gte‌估算"relation": "eq"},"max_score": 2.622515,"hits": [{   // 索引名"_index": "ldsx_test_2025.04.28",// 此条数据唯一标识"_id": "HM-2hJYBpFEB9Te9Nw5R",// 文档匹配评分"_score": 2.622515,// 文档原始数据"_source": {"data_name": "node11","created_at": "2025-04-28 15:05:31","data_info": "下午属于五一假期"}},{"_index": "ldsx_test_2025.04.28","_id": "Es83e5YBpFEB9Te91w6C","_score": 0.5753642,"_source": {"data_name": "node1","created_at": "2025-04-28 15:05:31","data_info": "这是一个晴朗的下午"}},{"_index": "ldsx_test_2025.04.28","_id": "E884e5YBpFEB9Te9Fg7H","_score": 0.3718877,"_ignored": ["created_at"],"_source": {"data_name": "node2","created_at": "2025-04-28111 15:05:31","data_info": "这是一个晴朗的下午1"}},{"_index": "ldsx_test_2025.04.28","_id": "FM84e5YBpFEB9Te9Sw7e","_score": 0.35767543,"_source": {"data_name": "node3","created_at": "2025-04-28 15:05:31","data_info": "这是一个晴朗的下午,你好"}}]}
}

精准匹配(term)

适用于keyword类型,直接以原始值存储,适合使用 term 查询精准匹配

包括整数、浮点数等数值型字段,term 查询可直接匹配精确数值

如创建时间、更新时间等结构化时间字段,可通过 term 查询精准匹配特定时间点

例如标记为 true/false 的状态字段,可直接进行精确值匹配

单值匹配
{"track_total_hits":500,"query":{"term":{"data_info.raw":"这是一个晴朗的下午"}
}
}
多值匹配
{"track_total_hits":500,"query":{"terms":{"data_name":["node6","node9"]}
}}

全文检索(match)

虽然 match 查询主要用于 text 类型,但也可作用于以下类型,但行为有所不同

‌**keyword 类型字段**‌

  • 直接匹配字段的完整值,不进行分词(等效于 term 查询)。例如,查询 "status.keyword": "active" 时需严格匹配 active

数值、日期、布尔类型字段

  • 不会分词,直接将查询字符串转换为对应类型进行匹配。例如,查询 "price": 100 会精确匹配数值 100

text 类型字段

data_info主字段为text类型查询下午会检索出所有下午的内容

{"query": {"match": {"data_info": "下午"}}
}

此处查询虽然传入证据,但是text,match将会分词搜索,可能实际查询内容为:[“下午”, “属于”, “五”,“一”, “假期”],会将包含这些分词内容的信息都查询出来,无顺序限制。

{"query": {"match": {"data_info": "下午属于五一假期"}}
}

按照分词顺序匹配完整的短语,提升 match 查询的严格性。

{"query": {"match_phrase": {"data_info": "下午属于五一假期"}}
}

range查询

固定结构支持 gt(>)、lt(<)、gte(≥)、lte(≤)四种运算符

{"range": {"field1": {"gte": <最小值>,"lte": <最大值>}}
}
{"query": {"range": {"field1": {"gte": <最小值>,  // 大于等于"lte": <最大值>,  // 小于等于"gt": <最小值>,   // 大于"lt": <最大值>    // 小于}}}
}

高级查询

布尔查询

组合多个查询条件,支持 must(必须满足)、should(至少满足一个)、must_not(禁止满足),filter

(过滤),mustfilter均可以过滤文档。

must 子句中的 range性能低于filter,must参与相关性评分,filter纯过滤。

{"query": {"bool": {"should": [{ "match": { "data_info": "下午" } },{ "match": { "data_info": "电脑" } },{ "match": { "data_info": "属于" } }],"minimum_should_match": 2  // 至少满足 1 个 should 条件}}
}
{"query": {"bool": {"must": [{ "term": { "category": "electronics" }},      // 必须类目为电子产品{ "term": { "in_stock": true }}               // 必须有库存],"should": [{ "term": { "brand": "Apple" }},              // 品牌为苹果{ "term": { "brand": "Samsung" }}             // 品牌为三星],"must_not": [{ "terms": { "color": ["red", "blue"] }}      // 排除红色和蓝色商品],"filter": [{ "range": { "price": { "gte": 1000, "lte": 5000 }}}  // 过滤价格范围],"minimum_should_match": 1                       // 至少满足一个should条件}}
}

筛选价格在 500~1000 且库存量大于 50 的商品

{"query": {"bool": {"must": [{"range": {"price": { "gte": 500, "lte": 1000 }}},{"range": {"stock": { "gt": 50 }}}]}}

筛选价格低于 300‌ 评分高于 4.5 的商品

{"query": {"bool": {"should": [{ "range": { "price": { "lt": 300 } } },{ "range": { "rating": { "gt": 4.5 } } }],"minimum_should_match": 1  // 默认值为 1,可省略}}
}
http://www.xdnf.cn/news/235477.html

相关文章:

  • 空域伦理与AI自主边界的系统建构
  • 《冰雪传奇点卡版》:第二大陆介绍!
  • Java 手写jdbc访问数据库
  • 代理脚本——爬虫
  • 【MySQL】索引特性
  • JGQ511机械振打袋式除尘器实验台装置设备
  • 鸿蒙的StorageLink
  • BT137-ASEMI机器人功率器件专用BT137
  • 【Hive入门】Hive性能优化:执行计划分析EXPLAIN命令的使用
  • 41 python http之requests 库
  • spring中的@Configuration注解详解
  • pytorch的cuda版本依据nvcc --version与nvidia-smi
  • 企业架构之旅(4):TOGAF ADM 中业务架构——企业数字化转型的 “骨架”
  • 永磁同步电机控制算法--单矢量模型预测电流控制MPCC
  • # 实现中文情感分析:基于TextRNN的模型部署与应用
  • 软件测试52讲学习分享:深入理解单元测试
  • BI平台是什么意思?一文讲清BI平台的具体应用!
  • AWTK:一键切换皮肤,打造个性化UI
  • 开源版禅道本地安装卸载备份迁移小白教程
  • Windows服务器部署全攻略:Flask+Vue+MySQL跨平台项目实战(pymysql版)
  • SQL Server 数据库重命名
  • VS2017 编译QCefView
  • 《系统分析师-第三阶段—总结(八)》
  • 从误删到精准识别:300+店铺验证的Vine订单三维判定模型
  • OpenCV实战教程 第一部分:基础入门
  • 【Unity笔记】基于距离驱动的参数映射器 InverseDistanceMapper 设计与实现
  • Modbus转Profibus:一键连接,轻松保护电机!
  • 从错误思路到滑动窗口:力扣2962“包含至少K个最大值”的子数组计数问题---left的解读
  • 经典算法 独立任务最优调度问题
  • Gradio全解20——Streaming:流式传输的多媒体应用(2)——构建对话式聊天机器人