大语言模型(LLM)如何通过“思考时间”(即推理时的计算资源)提升推理能力
核心围绕人类思维机制、模型架构改进、训练方法优化等展开
一、人类思维的启发:快思考与慢思考
- 类比心理学:
人类思维分两种模式: - 快思考(系统1):直觉驱动,快速但易出错(如估算简单问题)。
- 慢思考(系统2):逻辑分析,耗时但准确(如计算复杂数学题)。
大模型若想解决复杂问题,需模拟“慢思考”,通过增加推理步骤(如生成中间思考过程)提升准确性。
二、大模型如何“思考”:技术路径
1. 显式生成思考步骤:思维链(CoT)
- 基本思路:
让模型在给出答案前先输出中间推理过程(如数学题的分步计算&#