当前位置: 首页 > backend >正文

解密LLM重复输出:Max Token设置与模型机制

new max token设置相关问题的解释:

输入句子再次输出的原因

  • 模型学习捷径:LLM对上下文非常有信心,当输入句子中的token共享同一个句子级的上下文时,模型可能会学到一条捷径,直接复制该token,导致输入句子被再次输出。
  • Induction Head机制:模型中的Induction Head机制会回顾当前token前面的内容,找到前面出现当前token的地方,并按照前面出现过的模式来补全当前token后面的内容。所以如果输入句子中的某些token在前面出现过,模型就可能倾向于按照之前的模式再次生成这些token,进而导致输入句子被重复输出。
  • 自我强化效应:重复的概率几乎随着历史重复次数的增加而单调增加,最终,重复概率稳定在某个上限值附近。一旦生成的句子重复几次,模型将会受困于因自我强化效应引起的句子循环,使得输入句子更容易被再次输出。

new max token设置的作用

  • 控制输出长度:max token设置决定了模型生成内容的最大token数量。它限制了模型在一次响应中能够生成的token数量,
http://www.xdnf.cn/news/6303.html

相关文章:

  • 基于面向对象设计的C++日期推算引擎:精准高效的时间运算实现与运算重载工程化实践
  • Linux操作系统实战:中断源码的性能分析(转)
  • 基于EFISH-SCB-RK3576/SAIL-RK3576的矿用本安型手持终端技术方案‌
  • 散列表(1)
  • [思维模式-37]:什么是事?什么是物?什么事物?如何通过数学的方法阐述事物?
  • 1. this指向的指向规则
  • 30天通过软考高项-质量论文
  • 多模态和多智能体系统与理性的结合综述研究
  • python: *args 与 **kwargs 用法
  • 【KWDB 创作者计划】MySQL数据库迁移至KWDB的完整实践指南
  • 强化学习_PPO算法
  • 2025最新出版 Microsoft Project由入门到精通(八)
  • rocketmq 拉取消息
  • 信奥赛-刷题笔记-队列篇-T3-P2058海港和P1886单调队列
  • sip协议栈--sip结构分析
  • 大模型哲学:语言的边界就是世界的边界
  • 并查集算法的学习
  • React学习———useContext和useReducer
  • 香橙派zero3 安卓12 TV,遥控器关机。重启?
  • AD 规则的使能及优先级的设置
  • mybatis plus (sqlserver) 根据条件来获取id最大的,或者是新增的最新的一条记录(同条件可能会有多条出现)
  • 数据 分析
  • AD 局部铺铜
  • 职坐标解析职业规划核心五步骤
  • 谷歌web第三方登录
  • 解锁数据的力量:数据治理的新篇章与未来蓝图“
  • Chrome浏览器实验性API computePressure的隐私保护机制如何绕过?
  • ZYNQ PS VDMA②
  • ElasticSearch高级功能
  • 使用matlab进行数据拟合