当前位置: 首页 > backend >正文

[Semantic Seg][KD]FreeKD: Knowledge Distillation via Semantic Frequency Prompt

1. BaseInfo

TitleFreeKD: Knowledge Distillation via Semantic Frequency Prompt
Adresshttps://arxiv.org/abs/2311.12079
Journal/TimeCVPR 2024
Author北大,浙大
Code
Read

2. Creative Q&A

Knowledge Distillation, KD

  1. 目前知识蒸馏的问题:但教师模型在空间域的连续下采样会干扰学生模型分析需模仿的特定信息,导致精度下降。频域蒸馏面临新挑战,低频带上下文信息,高频带信息更丰富但引入噪声,且并非频带内每个像素对性能贡献相同。
  2. 提出 Frequency Prompt,插入教师模型,在微调时吸收语义频率上下文。
  3. 蒸馏期间,通过 Frequency Prompt 生成像素级频率掩码,定位不同频带中感兴趣像素(Pol)。
  4. 针对密集预测任务,采用位置感知关系频率损失,为学生模型提供高阶空间增强。
    该方法称为 FreeKD,可确定频率蒸馏的最佳定位和范围。
    在这里插入图片描述

在空间域,随着下采样比例增加,图像分辨率降低;在频域,不同下采样比例呈现出不同的频率信息分布,直观呈现下采样操作对图像在空间域和频域表现的影响

在这里插入图片描述

(a) Token Insertion:提示作为 token 插入编码器层。
(b) Sum - wise Insertion:提示在输入图像 RGB 通道上求和插入。
© Ours Insertion(本文方法):提示与中间特征相互作用,从中间特征中提炼频率信息,定位感兴趣像素(Pol)并优化频率带,更好地服务于知识蒸馏过程 。
以往知识蒸馏多使用传统损失函数(如 Kullback - Leibler 散度、均方误差 )处理分类和回归输出或中间特征。


频域
这个没怎么看懂暂时放过。

http://www.xdnf.cn/news/16050.html

相关文章:

  • Elasticsearch是什么?
  • SQL语句中锁的使用与优化
  • 计算机底层入门 05 汇编学习环境通用寄存器内存
  • 【菜狗处理脏数据】对很多个不同时间序列数据的文件聚类—20250722
  • PyTorch常用工具
  • c++day05(ASCII)
  • 【RK3576】【Android14】MIC开发调试
  • ES--为什么没有完全删除?
  • 【科研绘图系列】R语言绘制柱状堆积图
  • 程序是如何生成的-以c语言为例
  • 阶段1--Linux中的文件服务器(FTP、NAS、SSH)
  • 从零构建实时通信引擎:Freeswitch源码编译与深度优化指南
  • Socket套接字
  • 【React-Three-Fiber实践】放弃Shader!用顶点颜色实现高性能3D可视化
  • 项目复盘核心要点
  • ndarray的创建(小白五分钟从入门到精通)
  • 引擎动画系统设计
  • Google Gemini 体验
  • AI一周事件(2025年7月15日-7月21日)
  • C语言符号可见性控制与工程实践——深入理解 __attribute__((visibility)) 和 -fvisibility=hidden
  • repmgr+vip实现对业务透明的高可用切换
  • 【金融机器学习】第四章:风险-收益权衡——Bryan Kelly, 修大成(中文翻译)
  • 92套毕业相册PPT模版
  • 【vscode】vscode中python虚拟环境的创建
  • SpringBoot与Vue实战:高效开发秘籍
  • 基于LangGraph的Open Deep Research架构全解析:从多Agent协作到企业级落地
  • 精密全波整流电路(二)
  • 大疆视觉算法面试30问全景精解
  • 企业工商信息查询API详细文档对接流程-JavaScript营业执照真伪解析
  • Word Press富文本控件的保存