当前位置: 首页 > ai >正文

大模型开发学习笔记

文章目录

  • 大模型基础
    • 大模型的使用
    • 大模型训练的阶段
    • 大模型的特点及分类
    • 大模型的工作流程
      • 分词化(tokenization)与词表映射
    • 大模型的应用
  • 进阶
    • agent的组成和概念
    • planning规划
      • 子任务分解
      • ReAct框架
    • memory记忆
    • Tools工具\工具集的使用
    • langchain
      • 认知框架
        • ReAct框架
        • plan-and-Execute计划与执行
        • self-ask(自问自答)
        • thinking and self-refection思考并自我反思
      • ReAct框架实例
      • 通过llamindex实现ReAct RAG Agent

大模型基础

foundational Models,基础模型或称基座模型,即大模型

大模型的使用

prompt engineering(提示词工程)

大模型训练的阶段

  1. 预训练
  2. SFT(监督微调)
  3. RLHF(基于人类反馈的强化学习)

大模型的特点及分类

  • 适应性灵活性强

  • 广泛数据集的预训练

  • 计算资源需求大

  • 参数规模大

  • 大语言模型

  • 多模态模型(计算机视觉\语音)

大模型的工作流程

分词化(tokenization)与词表映射

  • 词粒度,适用英文
  • 字符粒度,中文分词
  • 子词粒度,将单词分解为更小的单位
  • 每一个token通过预先设置好的词表,映射为一个tokenid,这是token的身份证

大模型的应用

理解人类或自己本身,就能很好的学会大模型应用及开发

进阶

agent的组成和概念

在这里插入图片描述
memory + tools + Planning + Action <-----agent

agent的决策流程
在这里插入图片描述

planning规划

子任务分解

思维链(chain of thoughs,CoT)
思维树(Tree of thoughs,ToT),使用深度优先或广度优先搜索
在这里插入图片描述

ReAct框架

搜索高端手机,最好用的手机
组合推理和行动.首先通过推理确定搜索"苹果手机",并从外部环境中观察结果.随着推理的深入,识别出需要搜索…几轮交互后,得出标准答案

memory记忆

智能体中的记忆机制

  • 形成记忆,大模型训练参数得到的记忆
  • 短期记忆,当前任务的暂存记忆
  • 长期记忆,长期保留的信息,通常用向量数据库来存储和检索

Tools工具\工具集的使用

使用工具突破大模型本身的限制

langchain

agent只是实现智能体的框架,真正的大脑还是LLM

认知框架

ReAct框架

在这里插入图片描述

plan-and-Execute计划与执行

在这里插入图片描述

self-ask(自问自答)

在这里插入图片描述

thinking and self-refection思考并自我反思

在这里插入图片描述

ReAct框架实例

我的理解是langchain已经在这些认知框架中把提示词封装好了,不用我们去手写了

通过llamindex实现ReAct RAG Agent

http://www.xdnf.cn/news/3436.html

相关文章:

  • 提示词版本化管理:AI开发中被忽视的关键环节
  • 【Linux】基础指令(2)
  • 冯·诺依曼体系:现代计算机的底层逻辑与百年传承
  • C++ 与 Lua 联合编程
  • Python-pandas-操作Excel文件(读取数据/写入数据)及Excel表格列名操作详细分享
  • 单链表操作(single list)
  • Python高级爬虫之JS逆向+安卓逆向1.7节: 面向对象
  • NY204美光闪存MT29F8T08EQLCHL5-QA:C
  • python设置word字体的方法
  • GBDT 基本概述
  • JVM——JVM 是如何执行方法调用的?
  • 华为云Astro轻应用利用自定义连接器调用第三方接口实际操作
  • 【家政平台开发(98)】解锁家政平台新姿势:业务模式创新与多元化发展
  • C++11新特性_标准库_std::array
  • 软连接和硬连接【Linux操作系统】
  • Spring Boot中集成Guava Cache或者Caffeine
  • 接口测试实战指南:从入门到精通的质量保障之道
  • 【安装指南】Centos7 在 Docker 上安装 RabbitMQ4.0.x
  • 芯片中的pad、strap和probe
  • C++11新特性_委托构造函数
  • 《Android 应用开发基础教程》——第十一章:Android 中的图片加载与缓存(Glide 使用详解)
  • 铸铁划线平板:多行业的精密测量工具(北重铸铁平板厂家)
  • golang常用库之-标准库text/template
  • C++负载均衡远程调用学习之消息队列与线程池
  • 【前端知识】Vue3状态组件Pinia详细介绍
  • 同城跑腿小程序帮取帮送接单抢单预约取件智能派单同城配送全开源运营版源码优创
  • Python实例题:Python获取小说数据并分析
  • 计算方法实验四 解线性方程组的间接方法
  • 使用 n8n 创建一个定时获取“RSS新闻“的工作流
  • (35)VTK C++开发示例 ---将图片映射到平面2