当前位置: 首页 > ops >正文

知识蒸馏:从模型输出到深层理解

1. 概念阐释:

还记得上次说的“老师教你画画,不只教‘猫’,还教‘像狗像树叶’的细微感觉”吗?那是最初的蒸馏。

后来大家发现,老师不仅仅通过“最后画出来像什么”来教你。

  • 有时候,老师是教你“他画画时,哪里用了力气,哪里画得特别认真”(这叫基于特征的蒸馏,学习老师画画的“内在过程”)。
  • 有时候,老师是教你“这只猫和旁边那只老虎,它们之间有什么不同和相似”(这叫基于关系的蒸馏,学习老师对不同东西的“比较和连接”)。

所以,知识蒸馏就像是,老师有很多种高级的教学方法,不只通过最终的“画作”来教你,还通过他“画画的技巧”和“对不同画的理解和比较”来教你,让你这个小孩子(小模型)学得更全面,更聪明!

自Hinton开创性的基于Logits的知识蒸馏后,研究者们发现,“知识”不仅仅是最终的预测概率,它还能以其他形式存在于教师模型中,并能被有效地传递。这导致了知识蒸馏方法的极大丰富。

A. 不同类型的知识蒸馏(知识传

http://www.xdnf.cn/news/12118.html

相关文章:

  • 论文笔记——相干体技术在裂缝预测中的应用研究
  • kafka入门学习
  • 蓝桥杯2118 排列字母
  • 10_聚类
  • llm-d:面向Kubernetes的高性能分布式LLM推理框架
  • react私有样式处理
  • Nuxt.js 入门总结教程
  • 汇编语言综合程序设计:子程序、分支与循环深度解析
  • 灾难恢复演练:数据库备份与恢复的全流程实践
  • [测试_10] Selenium IDE | cssSelector | XPath | 操作测试
  • 9.axios底层原理,和promise的对比(2)
  • BLOB 是用来存“二进制大文件”的字段类型
  • 时间获取函数
  • 制作官网水平导航栏
  • 开源供应链攻击持续发酵,多个软件包仓库惊现恶意组件
  • 捍卫低空安全!-中科固源发现无人机MavLink协议远程内存泄漏漏洞
  • 设计模式(代理设计模式)
  • 墨者学院-密码学实训隐写术第二题
  • 【C++快读快写】
  • nt!CcMapData函数分析之Loop to touch each page触发nt!MmAccessFault函数----NTFS源代码分析之四
  • 中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2024)
  • npm run dev 报错:Error: error:0308010C:digital envelope routines::unsupported
  • UDP:简洁高效的报文结构解析与关键注意事项
  • std::conditional_t一个用法
  • [10-2]MPU6050简介 江协科技学习笔记(22个知识点)
  • MVCC机制:Undo Log版本链与ReadView机制
  • Python Excel 文件处理:openpyxl 与 pandas 库完全指南
  • 使用高斯朴素贝叶斯算法对鸢尾花数据集进行分类
  • 数据库优化实战分享:高频场景下的性能调优技巧与案例解析
  • 结构体指针与非指针 问题及解决