当前位置: 首页 > news >正文

AI_RAG

一.为什么需要RAG(AI幻觉)

大模型LLM在某些情况下给出的回答很可能错误的,涉及虚构甚至是故意欺骗的信息。

二.什么是RAG

RAG是一种结合“信息检索”和“文本生成”的技术,旨在提升生成式AI模型的准确性和可靠性。它通过以下两个核心步骤工作:

1. 信息检索(Retrieval)

当收到用户提问时,RAG首先从外部知识库(如数据库、文档或网页)中检索与问题相关的信息片段,而不是仅依赖模型训练时学到的知识。

2..文本生成(Generation)

将检索到的相关信息和用户问题一起输入生成模型,生成更精准、基于事实的答案。

三.RAG的分块策略

按照字符数来切分

按固定字符数 结合overlapping window

按照句子来切分

递归方法 RecursiveCharacterTextSplitter

四.RAG向量和向量检索

1.Embeddings向量化

(1)向量检索

        根据用户的输入,与向量数据库中存放的文本向量进行相似度计算匹配,并检索返回最为相似的内容

(2)数据内容转为向量(目前的向量模型可实现)

2.本地大模型

        Ollama向量模型本地部署:官方网址:https://ollama.com/

3.向量间的相似度计算

常用的向量相似度计算方法包括:

        -余弦相似度Cosine:基于两个向量夹角的余弦值来衡量相似度。

        -欧式距离L2:通过计算向量之间的欧几里得距离来衡量相似度。

        -点积:计算两个向量的点积,适合归一化后的向量

4.“top-k”语义检索

        在根据向量相似度检索向量时,能够找出的相似向量一般是多个,如果我们不需要这么多或者要控制相似度的大小,top-k 语义检索就派上了用场。

五.向量数据库

http://www.xdnf.cn/news/1266841.html

相关文章:

  • C# 使用iText获取PDF的trailer数据
  • 计算机网络:CIDR地址块划分子网可以使用VLSM吗?
  • Linux操作系统如何不进入图形化界面
  • 电子电气架构 --- 电气/电子架构迁移已拉开帷幕
  • 2025年SEVC SCI2区,基于深度强化学习与模拟退火的多无人机侦察任务规划,深度解析+性能实测
  • Linux运维新手的修炼手扎之第26天
  • 力扣面试150(51/100)
  • Prometheus监控平台部署与应用
  • rotary_emb 位置编码 加速
  • 书生浦语第五期-L1G4-InternLM 论文分类微调实践(XTuner 版)
  • 大模型在垂直场景的创新应用:搜索、推荐、营销与客服新玩法
  • 笔试——Day33
  • 基于深度强化学习的Atari中的SpaceInvaders
  • Effective C++ 条款31: 将文件间的编译依存关系降至最低
  • AI 大模型企业级应用落地挑战与解决方案
  • [Oracle] MAX()和MIN()函数
  • QT第一讲- Qt初探
  • 轻量化阅读应用实践:21MB无广告电子书阅读器测评
  • 政府数字化大屏系统 - Flask实现方案
  • 6.6 ASPICE验证过程的缺陷管理
  • ESP32之wifi_HTTP
  • Linux-JSON Schema
  • 大模型SSE流式输出技术
  • 【Python 高频 API 速学 ③】
  • 信息安全及防火墙总结
  • 【排序算法】②希尔排序
  • 束搜索(Beam Search):原理、演进与挑战
  • AI鉴伪技术:守护数字时代的真实性防线
  • PromptPilot打造高效AI提示词
  • llama-factory代码详解(一)--model_args.py