当前位置：首页 > web >正文

论文略读：Efficient Reasoning for LLMs through Speculative Chain-of-Thought

web 2025/6/25 16:21:00

202504 arxiv

现在LLM（如Deepseek-R1）在进行推理任务是，有两个缺点
- 参数量大（成本大）
- 思考过程长（速度慢）
之间的解决方法有两种
- 把大模型压缩成小模型
  - 但小模型解题能力直线下降
- 让模型少进行一定的思考，直接给答案
  - 但遇到难题时，草稿太短反而容易出错
——>论文提出SCoT（推测性思维链）
- 小模型快速生成多个短的思考过程
- 大模型选择最好的小模型的思考过程作为答案，
- 如果小模型全错，那就大模型重新生成一遍思考过程

http://www.xdnf.cn/news/12731.html

相关文章：

vue中的派发事件与广播事件，及广播事件应用于哪些场景和一个表单验证例子

Android 视图系统入门指南

C++常用的企业级日志库

绘制饼图详细过程

qt使用笔记二：main.cpp详解

STM32的系统滴答定时器简述

fast-reid部署

LangChain面试内容整理-知识点1：LangChain架构与核心理念

高并发下的缓存击穿/雪崩解决方案

青少年编程与数学 01-011 系统软件简介 08 Windows操作系统

JavaWeb基础入门 — SpringBoot Web 案例详解

LBE-LEX系列工业语音播报器|AGV语音提示器|工程车音乐报警器操作使用说明

亚川科技IBMS集成管理平台：构建商业综合体智慧中枢

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

1-2 Linux-虚拟机（2025.6.7学习篇- win版本）

Android学习总结-GetX库常见问题和解决方案

计算机组成与体系结构：补码数制一（Complementary Number Systems）

振动力学：多自由度系统

快速上手Linux全局搜索正则表达式（grep）

分页查询的实现

29、make_shared

GESP 二级复习参考 A

大话软工笔记—需求调研概述

Spring Boot 数据访问三剑客：JdbcTemplate、JPA 和 MyBatis 的对决与选择指南

如何判断当前web页面是在钉钉内部打开的？

ubuntu服务器件如何配置python环境并运行多个python脚本

Xilinx FPGA 重构Multiboot ICAPE2和ICAPE3使用

【LLM】fast-api 流式生成测试

MS358A 低功耗运算放大器车规

similarsites网页版入口，一键查询相似网站