当前位置: 首页 > backend >正文

论文阅读:arxiv 2025 How Likely Do LLMs with CoT Mimic Human Reasoning?

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2402.16048

https://www.doubao.com/chat/8775621039078402

How Likely Do LLMs with CoT Mimic Human Reasoning?
在这里插入图片描述

文章目录

  • 速览
      • **1. 研究背景:CoT的“表里不一”**
      • **2. 核心方法:用因果分析拆穿模型的“伪装”**
      • **3. 重要发现:模型的“推理假象”**
      • **4. 具体案例:模型如何“忽悠”**
      • **5. 结论:如何让模型真推理?**
      • **通俗总结**

速览

这篇论文主要探讨了大型语言模型(LLMs)在使用思维链(CoT)时是否真的在模仿人类推理,还是只是表面上的关联。

1. 研究背景:CoT的“表里不一”

  • CoT的作用:思维链是让LLM一步步输出推理过程的方法,比如解数学题时写出每一步计算。人们以为这样能让模型更像人类一样思考。
  • 存在的问题:但实验发现,CoT有时没提升模型表现,甚至推理过程和答案不一致(比如算错步骤却得出正确答案),这说明模型可能没真正“推理”,只是在“解释”。

2. 核心方法:用因果分析拆穿模型的“伪装”

  • 把问题拆成三部分
    • Z(指令):比如“请解这道加法题”。
    • X(CoT推理):一步步的计算过程。
    • Y(答案):最终结果。
  • 关键思路:通过干预(修改Z或X)看Y的变化,判断三者的因果关系,比如:
    • 给模型正确的CoT(X),看答案(Y)是否变对;
    • 给模型错误的指令(Z),看答案是否被误导。

3. 重要发现:模型的“推理假象”

  • 四种因果结构
    • 理想情况(因果链):Z→X→Y,即指令导致推理,推理导致答案(像人类一样)。
    • 常见问题(共同原因/全连接):Z直接影响Y,X和Y没关系或部分相关。此时模型可能先“猜”答案,再编推理过程(解释),导致推理和答案矛盾。
  • 模型越大≠推理越强:比如GPT-4比GPT-3.5准确率高,但因果结构未必更接近理想情况,说明单纯扩大模型没用。
  • 训练方法的副作用
    • 上下文学习(ICL):给模型示例能强化因果链(接近人类推理)。
    • 监督微调(SFT)和RLHF:反而削弱因果链,让模型更依赖表面关联(比如指令中的提示词)。

4. 具体案例:模型如何“忽悠”

  • 数学题中的矛盾:60%以上的简单加法题中,模型推理步骤错但答案对,比如算错个位数却凑对总和;甚至GPT-4在74%的加法题中出现这种情况。
  • 逻辑题中的“编造”:模型可能编造题目里没有的条件,强行推出正确答案,推理过程其实不合理。

5. 结论:如何让模型真推理?

  • 现有方法的局限:CoT看似让模型“说理由”,但多数情况下模型只是在“找借口”,而非真正推理。
  • 未来方向:需要新的训练技术,让模型的推理过程(X)真的能决定答案(Y),而不是被指令(Z)直接影响。比如用因果干预技术强化X→Y的关系。

通俗总结

这篇论文揭穿了LLM的“小聪明”:它们用CoT时可能不是在认真推理,而是先猜答案再编过程。要让模型像人一样思考,不能只靠扩大模型或调参,得从因果关系入手,让推理步骤真正“说了算”。

http://www.xdnf.cn/news/13993.html

相关文章:

  • 自动化模型管理:MediaPipe Android SDK 中的模型文件下载与加载机制
  • Flutter:步骤条组件
  • Wi-Fi 6 在 2.4GHz 频段的速率与优化分析
  • Unit 3 训练一个Q-Learning智能体 Frozen-Lake-v1
  • 基于springboot视频及游戏管理系统+源码+文档+应用视频
  • RTP MOS计算:语音质量的数字评估
  • STM32HAL库发送字符串,将uint8_t数据转为字符串发送,sprintf函数的使用方法
  • 声学成像仪在电力行业的应用品牌推荐
  • Java从入门到精通 - 面向对象高级(一)
  • vllm eagle支持分析
  • 燃气从业人员资格证书:开启职业大门的 “金钥匙”
  • Ntfs!NtfsInitializeRestartTable函数分析
  • 资金分析怎么做?如何预防短期现金流风险?
  • 刀客doc:WPP走下神坛
  • 中国AI Top30 访问量排行榜 - 2025年05月
  • 外部记忆的组织艺术:集合、树、栈与队列的深度解析
  • 燃气从业人员资格证书:职业发展的 “助推器”
  • 灌区信息化智能一体化闸门系统解决方案
  • 学习STC51单片机36(芯片为STC89C52RCRC)智能小车3(PWM差速小车)
  • 【软件安装那些事 4】CAD字体 SHX格式字库 免费 下载 及 使用方法
  • python中的分支结构:单分支、多分支,switch语句
  • JeecgBoot Pro-Online表单开发
  • 【经验篇】自签名TLS证书生成
  • 博客园突发大规模DDoS攻击 - 深度解析云安全防御新范式
  • P10987 [蓝桥杯 2023 国 Python A] 火车运输
  • 第一章 数字电路概述
  • 记一次错误 深拷贝 key值全部小写
  • 三次握手建立连接,四次挥手释放连接——TCP协议的核心机制
  • 上海市计算机学会竞赛平台2022年6月月赛丙组模糊匹配
  • 蚂蚁国际计划在香港和新加坡推出稳定币