当前位置: 首页 > java >正文

AI 相关内容:Agent、MCP、Prompt 与 RAG 入门指南

目录

1、Agent

2、MCP

3、Prompt

RAG

chunking:

embedding:


1、Agent

        在人工智能(AI)和计算机科学领域,Agent(智能体) 是指具备自主感知环境、分析信息、制定决策并执行任务能力的软件实体或系统。它并非简单的 “程序”,核心特点是能根据外部环境变化和预设目标,主动调整行为,而非仅被动响应指令。

        把在工具、模型、用户之间传话的工具交agent。ai可以通过agent获取工具的信息(查文件,读文件)并执行操作。

工具相关的信息统一格式放在Function calling中(也可能放在systempromrt中)

2、MCP

一个通讯协议,规定了aiagent和工具之间的通信(格式参数等等)

3、Prompt

        在人工智能领域中,"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落,用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应,以便更好地控制生成的输出。

        可以分为两类:

user Prompt用户提示词:用户说的话。
systempromrt系统提示词:描述ai的性格角色背景信息语气等。

流程总结:

1、使用agent,输入用户提示词。

2、agent通过mcp协议获取工具。

3、agent将工具和用户提示词放在一起给到ai模型。

4、ai大模型发现工具,产生调用工具的请求。

5、agent使用工具。

6、将结果返回给ai大模型。

7、ai大模型分析出结果并返回。

视频来源:10分钟讲清楚 Prompt, Agent, MCP 是什么哔哩哔哩bilibili

RAG

        什么是ai的幻读?你有一个独特的文档,你想问ai有关这个文档的问题,但是由于ai并没有这个文档,此时ai返回的答案可能与你的文档并没有关系。 这时就需要你把文档一起发送给ai大模型,这样就会返回正确的答案了。但是由于你的文档很大不能一次发给ai,这时候就需要找的文档中的相关内容来给到ai。

        这个过程就是RAG。Retrieval-Augmented Generation(检索增强生成),它是一种结合 “外部知识检索” 与 “大模型生成” 的 AI 技术方案,核心目标是解决大模型的 “知识滞后” 和 “幻觉(生成与事实不符的内容)” 问题,让 AI 能基于特定、最新或私有的知识生成准确回答。Retrieval-Augmented Generation(检索增强生成),它是一种结合 “外部知识检索” 与 “大模型生成” 的 AI 技术方案,核心目标是解决大模型的 “知识滞后” 和 “幻觉(生成与事实不符的内容)” 问题,让 AI 能基于特定、最新或私有的知识生成准确回答。

        如何找到文档中相关的内容呢?这时候需要对文档做一个处理。

chunking:

对文字进行切块。分块是将长文档分割为语义连贯的小片段(Chunk)的过程,目的是适配大模型的上下文限制,同时保留内容关联性。分块质量直接影响后续检索的准确性和生成的连贯性。

embedding:

将每段文字转化成向量。嵌入是将文本转化为高维向量(Embedding)的过程,使计算机能够通过数学运算(如余弦相似度)量化文本间的语义关联。向量数据库存储这些向量后,可实现高效的语义检索。

提出问题时使用相同的embedding模型将问题向量化,找到数据库中最相近的来返回。

流程总结

        rag存在的问题:

1、语义会分割:比如我是小明。我爱喝饮料。这个句子中我指的是小明,但切分之后我可能就不知道是谁了;

2、缺乏完整性,一个文档返回与问题相关的内容,但是提问“这篇文章出现了几个我”可能就会出现问题。

http://www.xdnf.cn/news/19403.html

相关文章:

  • tkinter布局
  • 鸿蒙应用开发:开机自启并自检网络状态
  • docker,数据卷
  • Flink部署实战:从入门到优化
  • Linux基本工具(yum、vim、gcc、Makefile、git、gdb)
  • 【模型训练篇】VeRL分布式基础 - 框架Ray
  • 解决 uni-app 中大数据列表的静默UI渲染失败问题
  • Q1 Top IF 18.7 | 基于泛基因组揭示植物NLR进化
  • C语言强化训练(2)
  • 生物学自然主义:心灵哲学中的生物性探索
  • 编程与数学 03-004 数据库系统概论 11_数据库的维护
  • 线阵相机和镜头选型案例介绍
  • 雪花算法是什么,时钟回拨问题怎么解决?
  • 第2章 MySQL的调控按钮-启动选项和系统变量
  • React 状态管理演进之路:从 Dva 到现代架构
  • YOLO 目标检测:YOLOv2基本框架、多尺度训练、锚框、维度聚类、位置预测、passthrough
  • 房屋租赁系统|基于SpringBoot和Vue的房屋租赁系统(源码+数据库+文档)
  • 秋招 AI 方向 —— 华为机考
  • Spring MVC 九大组件源码深度剖析(六):HandlerExceptionResolver - 异常处理的艺术
  • 雪花算法实现分布式环境下的高效动态ID生成
  • 20.28 《4bit量化模型预处理揭秘:如何节省75%显存高效微调LLM?》
  • leetcode_74 搜索二维矩阵
  • 通信原理(006)——分贝(dB)超级详细
  • Tomcat 中部署 Web 应用
  • Git 远程仓库操作:推送到远程仓库、拉取远程仓库到本地仓库
  • 软考备考(5)
  • 《以奋斗者为本》读书笔记(上篇:价值管理)
  • 下一波红利:用 #AI编程 闯入小游戏赛道,#看广告变现 模式正在崛起!
  • Ruoyi-vue-plus-5.x第一篇Sa-Token权限认证体系深度解析:1.4 Sa-Token高级特性实现
  • 机器人控制器开发(底层模块)——Rk3588 CAN0调试