当前位置: 首页 > backend >正文

实战演练11:生成式对话机器人(Bloom)

实战演练11:生成式对话机器人

  • 对话机器人介绍
  • 预训练模型简介
  • 解决方案
  • 生成式对话机器人代码
  • 常见解码参数介绍
  • 小结和后期规划

对话机器人介绍

  • 什么是对话机器人?
    • 对话机器人在本质上是一个用来模拟人类对话或聊天的计算机程序,接收人类的自然语言作为输入,并给出合适的回复
    • 按照任务类型划分,对话机器人简单的可以划分为闲聊机器人、问答机器人、任务型对话机器人
    • 按照答案产生的逻辑划分,对话机器人可以划分为检索式对话机器人和生成式对话机器人
    • 本次课程关注的内容为基于生成式的问答机器人

预训练模型简介

  • 因果语言模型,自回归模型
    • 将完整序列输入,基于上文的token预测当前token
    • 结束位置要有特殊token,eos_token
      在这里插入图片描述

解决方案

  • 指令微调
    • 指令微调的方式,赋予回答问题的能力
    • 多类型的任务共同学习,能够解决不同的任务
http://www.xdnf.cn/news/16152.html

相关文章:

  • 输电线路微气象在线监测装置:保障电网安全的科技屏障
  • [网安工具] 自动化威胁检测工具 —— D 盾 · 使用手册
  • 多模态LLM/Diffusion推理加速
  • 11.2 yolov8用自己的数据集训练语义分割模型
  • Android Camera createCaptureSession
  • Mysql命令show processlist
  • 成品电池综合测试仪:保障电池品质与安全的核心工具|深圳鑫达能
  • 聚观早报 | 猿编程推动中美青少年AI实践;华为Pura 80数字版售价公布;iPhone 17 Air电池曝光
  • J2EE模式---组合实体模式
  • ollama无法拉取模型导致报错
  • Linux724 逻辑卷挂载;挂载点扩容;逻辑卷开机自启
  • 噪声环境下的数据驱动预测控制:提升抗测量噪声干扰能力
  • Python桌面版数独(五版)-优化选择模式触发新棋盘生成
  • Opencv C# 重叠 粘连 Overlap 轮廓分割 (不知道不知道)
  • STM32 HAL库 HAL_TIM_OC_Stop函数详细解释
  • Flink-1.19.0源码详解7-Flink集群端调度
  • RWA与DeFi(去中心化金融)的关系是什么?RWA在DeFi中扮演什么角色?
  • 使用ffmpeg转码h265后mac默认播放器不支持问题
  • 亚马逊云科技实战架构:构建可扩展、高效率、无服务器应用
  • 【25-cv-08165】纸牌游戏 UNO注册商标!!由GBC律所代理发案
  • b-up:Enzo_mi:Transformer DETR系列
  • Java 实现 C/S 架构详解:从基础到实战,彻底掌握客户端/服务端编程
  • 项目质量如何提升?
  • C++常见面试题/笔试收录(一)
  • 深入探索Amazon SQS:构建弹性微服务与无服务器应用的秘密武器
  • 模拟退火算法 (Simulated Annealing, SA)简介
  • Unity GC 系列教程第四篇:GC Alloc 优化技巧与实践(下)与 GC 调优
  • Java 垃圾回收器之CMS GC问题分析与解决
  • 嵌入式开发学习———Linux环境下数据结构学习(三)
  • 《Flutter篇第一章》基于GetX 和 Binding、Dio 实现的 Flutter UI 架构