当前位置: 首页 > ops >正文

大模型技术30讲-4-彩票假设

彩票假设

  • 定义
  • 训练流程
  • 参考文献

定义

彩票假设是一个关于神经网络训练的概念,它认为在一个随机初始化的神经网络中,存在着这样一个子网络(也称为“中奖彩票”):如果单独训练,在训练步骤相同的情况下,能在测试集上达到与一个完整的网络一样高的正确率。

训练流程

在这里插入图片描述

  1. 使用较小的随机权重值初始化神经网络
  2. 训练直至收敛(训练损失最小化,分类正确率最大化)
  3. 对神经网络的权重参数进行剪枝,将它们从网络中移除。有两种方式:非结构化剪枝(对单个权重剪枝,置为0)和结构化剪枝(对网络中较大的块剪枝,比如整个卷积滤波器通道权重置为0)
  4. 将权重重置为第一步中的原始小随机值,并对剪枝后的网络进行训练(直接复用第一步中的权重)
  5. 重复第2步到第4步的剪枝步骤,直到网络达到我们期望的大小。

在彩票假设的原始论文中,作者成功将网络缩减到其原始大小的10%,并且分类正确率没有降低。此外,剪枝后的稀疏网络,比原始密集网络展现出了更好地泛化性。

参考文献

[1] Jonathan Frankle and Michael Carbin, The lottery ticket hypothesis: Finding sparse, trainable neural networks (2019), in International Conference on Learning Representations.
[2] 塞巴斯蒂安·拉施卡, 大模型技术30讲, 人民邮电出版社(北京), 2025, P15-P17.

http://www.xdnf.cn/news/13528.html

相关文章:

  • MCP(Model Context Protocol)与 LangChain的区别与联系
  • 标识符和预处理 day12
  • 6.10[A]BB84 量子
  • 一般增长率
  • Kubernetes 从入门到精通-ReplicaSet控制器
  • 超级神冈探测器2025.6.11
  • Java多线程通信核心机制详解
  • 通过共享内存在多程序之间实现数据通信
  • Python实例题:Python计算泛函分析
  • Linux操作系统故障排查案例实战
  • 南京师范大学 AM:焦耳加热 “点亮” 高效析氢新路径
  • Amazon Linux 2023 系统上 Radius 部署文档
  • 三维自动光学检测-3D扫描扇叶尺寸检测设备-中科米堆
  • 运维之十个问题--6
  • URL末尾加“/“与不加“/“区别
  • 【Dv3Admin】系统视图消息中心API文件解析
  • 与算法相关的一些数学物理理论知识
  • mysql DQL(javaweb第七天)
  • 2025年春季学期《算法分析与设计》练习15
  • Docker快速构建并启动Springboot程序,快速发布和上线/
  • OM6629 是一款针对蓝牙低功耗和专有 2.4GHz 系统级芯片(SoC)解决方案
  • 汉诺塔 (easy)
  • 根据 LiDAR 株高数据计算植被生物量
  • Koji构建系统宏定义注入与Tag体系解析
  • GEO行业中的STREAM框架解析:内容一致性得分(A)如何实现全渠道品牌信息的协同与统一
  • LangGraph基础知识(Reducer/MessageGraph)(二)
  • 机器学习赋能的智能光子学器件系统研究与应用
  • 开疆智能ModbusTCP转Canopen网关连接AGV地标传感器
  • HGAdmin无法连接本地数据库解决方式(APP)
  • Linux操作系统基线检查与安全加固概述