当前位置: 首页 > ops >正文

Elasticsearch AI 语义搜索(semantic_text)

一、语义搜索

在传统的搜索系统中,Elasticsearch 一直依赖 倒排索引(inverted index)+ BM25 算法,这种方式非常适合关键词匹配,但存在明显的局限性:

  • 同义词问题:用户输入“手机”,但文档中写的是“智能电话”,传统搜索可能匹配不到。
  • 语义理解问题:用户输入“谁写了红楼梦?”,关键词搜索会检索“谁”、“写”、“红楼梦”,但很难直接理解用户意图。
  • 上下文问题:传统搜索不理解句子整体含义,例如“最好的编程语言是什么”,它只会匹配“最好”和“编程语言”,而不是理解这个问题是在寻找“排名”或“推荐”。

为了解决这些问题,Elasticsearch 从 8.0 版本开始,逐渐引入了 dense_vector 向量字段knn search、以及 semantic_text 查询,结合大语言模型(LLM)和向量搜索(vector search),构建出真正的 语义搜索(semantic search) 能力。


二、Elasticsearch 语义搜索核心原理

语义搜索的关键是 Embedding 向量化

  1. Emb

http://www.xdnf.cn/news/18971.html

相关文章:

  • 群晖Nas上使用工具rsync工具usb同步数据
  • 国际期货Level2分时Tick历史行情数据处理分析
  • Vue2+Element 初学
  • 如何备份 TECNO 手机上的短信
  • position属性
  • rabbitmq学习笔记 ----- 多级消息延迟始终为 20s 问题排查
  • 2025最新uni-app横屏适配方案:微信小程序全平台兼容实战
  • Java开发MongoDB常见面试题及答案
  • DQL单表查询相关函数
  • 【WPF】WPF 自定义控件实战:从零打造一个可复用的 StatusIconTextButton (含避坑指南)
  • 安卓开发---BaseAdapter(定制ListView的界面)
  • 中文PDF解析工具测评与选型指南
  • js AbortController 实现中断接口请求
  • 【面试场景题】三阶段事务提交比两阶段事务提交的优势是什么
  • 《C++进阶之STL》【AVL树】
  • 基于 GPT-OSS 的成人自考口语评测 API 开发全记录
  • 数据分析编程第七步:分析与预测
  • Qt节点编辑器设计与实现:动态编辑与任务流可视化(一)
  • 【拍摄学习记录】07-影调、直方图量化、向右向左
  • 经典扫雷游戏实现:从零构建HTML5扫雷游戏
  • 【Python】Python 实现 PNG 转 ICO 图标转换工具
  • LightGBM 在金融逾期天数预测任务中的经验总结
  • Qt自定义聊天消息控件ChatMessage:初步实现仿微信聊天界面
  • Linux之Shell编程(一)
  • Linux笔记12——shell编程基础-6
  • Swift 解法详解 LeetCode 365:水壶问题
  • Java -- 文件基础知识--Java IO流原理--FileReader
  • 了解ADS中信号和电源完整性的S参数因果关系
  • hintcon2025 Verilog OJ
  • 【python】python进阶——生成器