当前位置：首页 > backend >正文

AI时代基础入门

backend 2025/7/17 12:36:30

文章目录

基础概念介绍
大模型工作流程
- 调用大模型参数
- 提示词工程
Agent
- Agent是什么
- - Agent流程图
  - 自己创建一个Agent
  - 添加记忆
  - 添加工具
  - 其他Agent框架

基础概念介绍

人工智能概念简介：
在这里插入图片描述

现在的大模型都是通过深度学习这种算法学习出来的

大模型工作流程

1.分词
对输入的句子进行分词，比如我想去北京，拆分成【我，想，去，北京】（分词有不同的拆分策略，比如一个字一个字，或者说根据常用词语等）
拆分出来的单个的词都对应一个token, 每一个token又对应一个token id，这样我们就会得到一个token id列表。
在这里插入图片描述
2.根据给定的文本预测下一个token
根据第一步我们得到了一个token列表，第二步其实就是开始生成，根据最大概率原则生成下一个token。再把新生成的token加入到列表中，如此循环往复，这个过程叫做自回归。直至输出特殊token(如句号对应的token)或者长度达到阈值。
这个概率是怎么预测的呢？是通过Transformer预测的。
在这里插入图片描述

调用大模型参数

temperature(温度):
语义相似度，一般是0-1，当为0的时候，同一个问题的回复的相似度是最高的，也更贴合人类的回复。
为1的时候是最低的，这个时候回复就倾向于不同的结果，会更具有发散性，但并不是很直接准确。

提示词工程

提示词决定了大模型给我们怎样的反馈，答案正确与否，所以提示词很关键
怎样用提示词？
1.明确目标：你希望大模型为你做什么
2.对于复杂任务，自己拆分步骤，引导大模型
3.明确上下文，给出自己的背景信息

Agent

Agent是什么

大模型可以接受输入，可以分析&推理，但是缺无法进行规划，思考，无法调用外部工具，资源去解决问题，也无法拥有人类的记忆能力。

AI Agent是基于LLM(大语言模型)的能够自主理解，规划，执行复杂任务的智能体。
更直白的理解就是基于LLM的代理人，本质上还是涌现LLM的能力，Agent的大脑还是LLM.

Agent的设计是为了解决大模型无法直接解决的问题，尤其是这些问题涉及多个任务或者说外部数据的情况。

Agent流程图

Planning(规划) :
智能体会对任务进行拆分，并规划任务执行流程，同时对执行过程进行反思和思考，从而决定是否继续执行任务或者是结束任务

Memory(记忆)：
分为短期记忆和长期记忆，
长期记忆指的是外部知识库，通常用向量数据库进行检索和搜索。长期存在
短期记忆指的是一次任务的上下文，任务结束清空

Tools（工具库）：
为智能体配备的工具API, 比如：数据库搜索，代码执行器，计算器等等。

Action(执行):
最后就是执行，根据规划和记忆进行执行，这个过程中可能调用外部的API.

在这里插入图片描述

自己创建一个Agent

其实已经有开源的Agent框架了，比如说LangChain,我们只需要调用接口即可。
在这里插入图片描述

在这里插入图片描述

添加记忆

在这里插入图片描述

添加工具

在这里插入图片描述

其他Agent框架

在这里插入图片描述

今天的分享就到这里了,有问题可以在评论区留言,均会及时回复呀.
我是bling,未来不会太差,只要我们不要太懒就行, 咱们下期见.
在这里插入图片描述

http://www.xdnf.cn/news/15555.html

相关文章：

测试学习之——Pytest Day2

深入理解 Kafka 核心：主题、分区与副本的协同机制

Scalefusion 与 EasyControl 对比：轻量级方案与全功能 IoT MDM 的深度碰撞

spring容器的bean是单例还是多例的？线程安全吗？

AI编程神器 Claude Code 安装及使用体验

SQLSERVER清理日志

【28】MFC入门到精通——MFC串口 Combobox 控件实现串口号

Python面向对象编程(OOP)详解：通俗易懂的全面指南

Linux驱动基础：阻塞、休眠、poll、异步通知

探究Netty 4.2.x版本

增程式汽车底盘设计cad【9张】三维图＋设计说明书

单列集合顶层接口Collection

医疗AI“全栈原生态“系统设计路径分析

【游戏引擎之路】登神长阶（十八）：3天制作Galgame引擎《Galplayer》——无敌之道心

用AI做带货视频评论分析进阶提分【Datawhale AI 夏令营】

LLM大语言模型不适合统计算数，可以让大模型根据数据自己建表、插入数据、编写查询sql统计

加速度传感器的用途与应用

es启动问题解决

【C#】实体类定义的是long和值识别到的是Int64，实体类反射容易出现Object does not match target type

高性能架构模式——高性能NoSQL

【MySQL基础】MySQL事务详解：原理、特性与实战应用

用PyTorch手写透视变换

嵌入式学习-PyTorch（5）-day22

Towards Low Light Enhancement with RAW Images 论文阅读

ASP.NET Core Hosting Bundle

Debian 12中利用dpkg命令安装MariaDB 11.8.2

C++11迭代器改进：深入理解std::begin、std::end、std::next与std::prev

在 kubernetes 上安装 jenkins

数据结构自学Day7-- 二叉树