当前位置: 首页 > web >正文

transformers库里model.generate和model.forward的区别 generate函数里不同的解码方式

  • 简单来说,generate就是封装好的自回归生成函数,其会调用指定次的forward,用来以自回归的方式生成输出;但是注意,generate只能用于推理,不能用于训练,在训练过程中应该使用forward
  • generate和forward的区别
  • 怎么利用forward函数模仿实现generate函数的功能
  • 详细介绍generate函数的参数设置,如解码方式里的greedy search、beam search、top-k sample、top-p sample等的详细介绍
    • greedy search 贪心搜索
      • 每次选择概率最大的vacab id作为当前token的值
    • beam search 波束搜索
      • 每次储存beam个概率最大的vacab id,并在结束生成时选择所有路径中累积概率最大的路径作为最终生成
    • top-k sample
      • 把greedy search和beam search的确定性选取输出的操作转变为基于概率分布的采样操作,选出概率最高的k个vocab id,然后把它们的概率重新归一化,之后在这个概率分布中随机采样
      • 这样模型输出的随机性和创造性会更好,能够产生一些让人感觉富有insight的输出
    • top-p sample
      • 把top-k里固定取k个概率最高的vocab id的操作变成从概率最高的vocab id开始取,直到取到当前vocab id时,累积概率超过预设值p
      • 相比于top-k sample,top-p sample可以保证采样分布里的vocab id数量动态调整,只采样那些概率较大的vocab id
  • generate函数手册
http://www.xdnf.cn/news/3234.html

相关文章:

  • 【MyBatis-Plus】禁用某个方法里面查询语句的逻辑删除标记
  • Java 中的 设计模式详解
  • errorno 和WSAGetlasterror的区别
  • 潇洒郎: 100% 成功搭建Docker私有镜像仓库并管理、删除镜像
  • Pytorch深度学习框架60天进阶学习计划 - 第55天:3D视觉基础(一)
  • 【人工智能】释放本地AI潜能:LM Studio用户脚本自动化DeepSeek的实战指南
  • (A2A Agent通信故障诊断体系)
  • Spring Boot 数据库最佳实践:从自动配置到高性能优化
  • 腾讯云CodeBuddy初体验
  • 从边缘到云端:边缘计算与云计算的协同未来
  • OpenCV-Python (官方)中文教程(部分一)_Day20
  • Elastic Security 8.18 和 9.0 中的新功能
  • Vue 3 动态组件
  • PostgreSQL可串行化快照隔离和冻结处理
  • 农产品园区展示系统——仙盟创梦IDE开发
  • 《PyTorch documentation》(PyTorch 文档)
  • vscode 个性化
  • 通过API网关防御重放攻击:技术方案与实战验证
  • 规划权重和全局优化器逻辑处理
  • 基于C++的IOT网关和平台5:github项目ctGateway开发指南
  • MyBatis的SQL映射文件中,`#`和`$`符号的区别
  • 大数据治理自动化与智能化实践指南:架构、工具与实战方案(含代码)
  • Oracle Bigfile 与 Smallfile 表空间对比分析
  • 打印机脱机状态原因有哪些?打印机脱机状态恢复正常解决方法
  • openEuler 22.03 安装 Nginx,支持离线安装
  • 基于Spring Boot + Vue 项目中引入deepseek方法
  • PostgreSQL事务与并发清理
  • 阿里云服务迁移实战: 06-切换DNS
  • scGPT-spatial:持续预训练scGPT用于空间转录组
  • 【diffusers 进阶之 PEFT 入门(五)】LoRA 权重如何接着训练?踩坑总结和解决方案