当前位置: 首页 > web >正文

AI 笔记 -基于retinaface的FPN上采样替换为CARAFE

上采样替换为CARAFE

  • 引言
  • 内容感知特征重组(CARAFE)
    • 公式化
      • 核预测模块

引言

  1. 简介:CARAFE(Content-Aware ReAssembly of FEatures),是用于增强卷积神经网络特征图的上采样方法,论文被 ICCV 2019 接收为 oral presentation。相对 最近邻 和 双线性 等上采样算子,在不同任务中都取得了显著的提升,同时只引入很少的参数量和计算代价。CARAFE具有几个吸引人的特性:(1)大视野。与仅利用子像素邻域的前期工作(例如双线性插值)不同,CARAFE可以在大感受野内聚合上下文信息。(2)内容感知处理。与对所有样本使用固定核(例如反卷积)不同,CARAFE支持针对实例的内容感知处理,可以即时生成自适应核。(3)轻量级且计算速度快。CARAFE引入的计算开销很小,并且可以轻松集成到现代网络架构中。我们在目标检测、实例/语义分割和图像修复的标准基准上进行了综合评估。CARAFE在所有任务中都表现出一致且显著的增益(分别为、、、),且计算开销可忽略不计。它有望成为未来研究的强大构建块。代码和模型可在https://github.com/open-mmlab/mmdetection获取。
  2. 应用场景
    (1)改进图像处理和计算机视觉任务中的上采样过程,特别适用于目标检测、实例分割、语义分割和图像修复等任务
    (2)特征上采样是许多卷积网络架构(例如特征金字塔)中的关键操作。
  3. 作用
    (1)提高特征质量:通过内容感知的重新组装机制,能够生成更准确的上采样特征
    (2)增强模型泛化能力:动态地调整上采样过程以适应不同的输入特征,有助于提高模型的泛化能力,更好地处理复杂和多样化的图像数据
    (3)减少计算开销:引入额外步骤的复杂度相对较低,不会对整体计算性能造成显著影响
  4. 创新点
    (1)内容感知上采样:与双线性插值等传统的上采样方法相比,引入了内容感知机制,能够根据输入特征的内容动态地调整上采样过程
    (2)动态重新组装:通过预测每个位置的重新组装核(reassembly kernel),实现对输入特征的局部区域进行重新组装,从而生成更准确的上采样结果。
    (3)高效性:引入的计算步骤,计算开销相对较小,且能够显著提高上采样后的特征质量

内容感知特征重组(CARAFE)

在每个位置上,CARAFE可以利用底层内容信息来预测重组核,并在预定义的附近区域内重新组合特征。得益于内容信息,CARAFE可以在不同位置使用自适应和优化的重组核,并且比主流上采样算子(如插值或反卷积)实现更好的性能。

公式化

CARAFE作为具有内容感知核的重组算子,包含两个步骤

  1. 第一步核预测模块: 根据内容为每个目标位置预测一个重组核
  2. 第二步内容感知重组模块: 使用预测的核重新组合特征。

核预测模块

核预测模块负责以内容感知的方式生成重组核,由三个子模块组成,即通道压缩器、内容编码器和核归一化;
通道压缩器减少了输入特征图的通道数。内容编码器将压缩后的特征图作为输入,对内容进行编码以生成重组核。核归一化对每个重组核应用softmax函数。

  1. 通道压缩器: 采用一个卷积层压缩输入特征通道。可以减少后续步骤中的参数量和计算成本
  2. 内容编码器: 采用一个卷积层,根据输入特征的内容生成重组核。
  3. 核归一化器。在应用于输入特征图前,每个重组核都会通过softmax函数在空间上进行归一化,强制内核值的和为1,这是在局部区域内的软选择。由于核归一化器,CARAFE不会执行任何重新缩放并改变特征图的平均值,这就是算子被称为特征的重组的原因。
http://www.xdnf.cn/news/6734.html

相关文章:

  • Android framework 中间件开发(一)
  • 149.WEB渗透测试-MySQL基础(四)
  • 【暗光图像增强】【基于CNN的方法】2020-AAAI-EEMEFN
  • 显性知识的主要特征
  • math.js 加/减/乘/除 使用
  • 第九天——贪心算法——非递减数组
  • ZYNQ Overlay硬件库使用指南:用Python玩转FPGA加速
  • AWS中国区CloudFront证书管理和应用指南
  • 五月月报丨MaxKB在教育行业的应用进展与典型场景
  • 现代简约中式通用,民国画报风,中国风PPT模版8套一组分享
  • 【Vue 3全栈实战】从响应式原理到企业级架构设计
  • 数据结构(3)线性表-链表-单链表
  • k8s监控方案实践补充(二):使用kube-state-metrics获取资源状态指标
  • 前端开发笔记与实践
  • Visual Studio 2022 中添加“高级保存选项”及解决编码问题
  • WebMvcConfigurer介绍-笔记
  • GESP2025年3月认证C++二级( 第三部分编程题(2)时间跨越)
  • MongoDB 应用实战
  • 多尺度对比度调整
  • DDD领域驱动介绍
  • MODBUS RTU调试助手使用方法详解
  • 基于Mongodb的分布式文件存储实现
  • Java实现生产者-消费者模式:从基础到高级实践
  • MiniMax语音模型Speech-02近日登顶多个全球榜单,详细技术解析
  • 【Reality Capture 】02:Reality Capture1.5中文版软件设置与介绍
  • Lua中使用module时踩过的坑
  • 计算机指令分类和具体的表示的方式
  • 【Win32 API】 lstrcmpA()
  • Java内存泄露生产环境排查过程,通透了
  • 计算机网络 : Socket编程