当前位置: 首页 > backend >正文

RAG-大模型课程《李宏毅 2025》作业1笔记

原视频链接:HW1 - Retrieval Augmented Generation with Agentic System_哔哩哔哩_bilibili

1、什么是RAG

2、为什么用RAG

3、什么是agent系统

1、什么是RAG
  • Retrieval - augmented generation (RAG) ·检索增强生成
  • RAG是一种让大语言模型(LLMs)利用外部知识回答查询的方法,在一种简单的RAG实现中,用户的问题会首先被输入到“检索系统”或“已知知识库”中以收集相关信息。

2、为什么要用RAG
  • 可解决大语言模型知识截止(模型预训练的数据有截止时间)
  • 直接训练模型成本高(RAG不需要训练模型)
  • 提升答案可靠性(比如企业内部文库)

3、作业中的agent

大语言模型,作为一个个“角色”配合完成复杂任务的框架

Agent目前没有统一agent定义,可以查看上篇内容

例子:

  • 用户问题:美国独立战争第一枪在哪里打响的?
  • maneger:决定把问题(如果有RAG ,则与RAG信息一起) 传给哪个“分类专家”——从科学、历史、数学中,选择了历史专家。
  • 事实检测:通过网络搜索,检查历史专家答题结果,确认回答正确。

作业代码链接:ML2025 Homework 1 | Kaggle

http://www.xdnf.cn/news/17375.html

相关文章:

  • 算法篇----分治(快排)
  • 赛灵思ZYNQ官方文档UG585自学翻译笔记:General Purpose I/O (GPIO)通用输入 / 输出,LED控制亮灭,按键控制,中断控制
  • 【Mac】MLX:Lora微调工作流
  • 疯狂星期四文案网第34天运营日记
  • 第15届蓝桥杯Scratch图形化省赛中级组2024年8月24日真题
  • C++四种类型转换
  • 决策树技术详解:从理论到Python实战
  • 数据标准化与归一化的区别与应用场景
  • UE蓝图节点Add Impulse和Add Torque in Radians
  • Solana上Launchpad混战:新颖性应被重视
  • [激光原理与应用-201]:光学器件 - 增益晶体 - 概述
  • 大语言模型提示工程与应用:LLMs文本生成与数据标注实践
  • Java基础-TCP通信(多发多收和一发一收)
  • PHP-单引号和双引号(通俗易懂讲解版)
  • MySQL 元数据详细说明
  • AI基础与实践专题:神经网络基础
  • 探索Trae:使用Trae CN爬取 Gitbook 电子书
  • Java 8 特性
  • 网络管理实战
  • 【QT】常⽤控件详解(六)多元素控件 QListWidget Table Widget Tree Widget
  • QT第三讲- 机制、宏、类库模块
  • MBR分区nvme固态硬盘安装win7--非UEFI启动和GPT分区
  • ruoyi关闭shiro校验,任何接口可以直接访问
  • 可直接运行的 Playwright C# 自动化模板
  • 贪心----1.买卖股票的最佳时机
  • 基于 InfluxDB 的服务器性能监控系统实战(二)
  • 代码随想录day59图论9
  • [已解决]VSCode右键菜单消失恢复
  • GPT-4 vs GPT-5 深度分析
  • 制作浏览器CEFSharp133+X86+win7 之配置环境(一)