当前位置: 首页 > java >正文

论文略读:Large Language Models Assume People are More Rational than We Really are

ICLR 2025 5668

为了让 AI 系统能够有效地与人类沟通,它们必须理解人类是如何做决策的。然而,人类的决策并不总是理性的,因此大型语言模型(LLMs)中对人类决策过程的内隐建模必须能够捕捉这种非理性行为。

以往的一些实证研究似乎表明,LLMs 对人类行为的建模是准确的——它们在日常交互中表现得像我们预期中的人类。然而,本文通过将多种先进 LLM(如 GPT-4o、GPT-4 Turbo、LLaMA-3 8B 和 70B、Claude 3 Opus)在模拟和预测人类选择行为时的输出与一个大规模人类决策数据集进行系统比较,发现事实并非如此:

这些模型普遍高估了人类的理性程度,它们更倾向于依据经典的**期望值理论(expected value theory)**来预测行为,而不是符合真实人类的决策模式。

有趣的是,人类自己在解释他人行为时,也倾向于假设他人是理性的。因此,当进一步对比 LLM 与人类在另一个心理学数据集上对“他人决策”的推理结果时,研究发现两者的推理高度相关。

综上,LLM 所学习到的内隐决策模型,更接近于“人们如何期望别人决策”(理性),而非“人们实际是如何决策的”(非理性)。这一发现揭示了 LLM 与人类心理预期之间的微妙对齐,同时也暴露了它们在理解真实人类行为上的系统性偏差。

http://www.xdnf.cn/news/13734.html

相关文章:

  • SQL进阶之旅 Day 27:存储过程与函数高级应用
  • 自检该如何写
  • 哈医大团队利用网络药理学+PPI分析+分子对接三联策略,解码灵芝孢子调控AKI凋亡的精准机制
  • 按关键字批量合并 Excel 多工作簿工作表攻略-Excel易用宝
  • FramePack 与其他视频生成工具的横向对比:优势、短板与差异化竞争
  • 有没有实现“直链”的网盘?不是外链
  • Spring生命周期及关联面试题
  • 25.6.12学习总结
  • 强化微调技术与GRPO算法(1):简介
  • 如何选择适合自己需求的PCB厚板厂家?
  • Windows桌面图标修复
  • 基于NSGA2的柔性作业车间调度
  • 【React】使用 useContext + useReducer 实现一个轻量的状态管理库
  • 大模型Prompt|提示工程的10个常见设计模式
  • Kubernetes安全机制深度解析(二):从身份认证到资源鉴权
  • 埃隆·马斯克宣布特斯拉Robotaxi自动驾驶出租车服务将于6月22日在奥斯汀“试运行”启动
  • Rust入门之并发编程基础(二)
  • Redis 安装实践:基于鲲鹏 ARM 架构 Ubuntu 环境
  • 【Linux网络篇】:TCP协议全解析(一)——从数据段格式到可靠传输的三大基石
  • GitHub Desktop Failure when receiving data from the peer
  • Facebook的速推帖子有用吗?
  • 补充讲解perfetto/systrace的CPU Trace信息详解和抓取方法
  • 深度学习:张量标量概念、PyTorch张量创建、类型转换等
  • C 语言之 循环
  • mvc与mvp
  • Oracle DG库手动注册归档日志的两种方法
  • 单链表经典算法题之分割链表
  • 操作系统——第五章(I/O设备)
  • 【AUTOSAR COM Eth】Service Discovery (SD) 模块技术解析
  • 面试遇到的商城项目相关问题总结