当前位置：首页 > backend >正文

解密LLM重复输出：Max Token设置与模型机制

backend 2025/8/26 0:08:17

new max token设置相关问题的解释：

输入句子再次输出的原因

模型学习捷径：LLM对上下文非常有信心，当输入句子中的token共享同一个句子级的上下文时，模型可能会学到一条捷径，直接复制该token，导致输入句子被再次输出。
Induction Head机制：模型中的Induction Head机制会回顾当前token前面的内容，找到前面出现当前token的地方，并按照前面出现过的模式来补全当前token后面的内容。所以如果输入句子中的某些token在前面出现过，模型就可能倾向于按照之前的模式再次生成这些token，进而导致输入句子被重复输出。
自我强化效应：重复的概率几乎随着历史重复次数的增加而单调增加，最终，重复概率稳定在某个上限值附近。一旦生成的句子重复几次，模型将会受困于因自我强化效应引起的句子循环，使得输入句子更容易被再次输出。

new max token设置的作用

控制输出长度：max token设置决定了模型生成内容的最大token数量。它限制了模型在一次响应中能够生成的token数量，

http://www.xdnf.cn/news/6303.html

相关文章：

基于面向对象设计的C++日期推算引擎：精准高效的时间运算实现与运算重载工程化实践

Linux操作系统实战：中断源码的性能分析（转）

基于EFISH-SCB-RK3576/SAIL-RK3576的矿用本安型手持终端技术方案‌

散列表（1）

[思维模式-37]：什么是事?什么是物？什么事物?如何通过数学的方法阐述事物？

1. this指向的指向规则

30天通过软考高项-质量论文

多模态和多智能体系统与理性的结合综述研究

python: *args 与 **kwargs 用法

【KWDB 创作者计划】MySQL数据库迁移至KWDB的完整实践指南

强化学习_PPO算法

2025最新出版 Microsoft Project由入门到精通（八）

rocketmq 拉取消息

信奥赛-刷题笔记-队列篇-T3-P2058海港和P1886单调队列

sip协议栈--sip结构分析

大模型哲学：语言的边界就是世界的边界

并查集算法的学习

React学习———useContext和useReducer

香橙派zero3 安卓12 TV，遥控器关机。重启？

AD 规则的使能及优先级的设置

mybatis plus (sqlserver) 根据条件来获取id最大的，或者是新增的最新的一条记录（同条件可能会有多条出现）

AD 局部铺铜

职坐标解析职业规划核心五步骤

谷歌web第三方登录

解锁数据的力量：数据治理的新篇章与未来蓝图“

Chrome浏览器实验性API computePressure的隐私保护机制如何绕过？

ZYNQ PS VDMA②

ElasticSearch高级功能

使用matlab进行数据拟合