当前位置: 首页 > ds >正文

小目标检测的集成融合论文阅读

摘要

小目标检测常因图像模糊和分辨率低而受到阻碍,这给小目标的精确检测和定位带来了重大挑战。此外,传统的特征提取方法往往难以捕捉到这些目标的有效表征,因为下采样和卷积操作会导致小目标细节的模糊化。为了解决这些问题,本研究提出了一种基于集成融合的方法,通过利用多种不同模型变体的优势并融合它们的预测结果来检测微小目标。实验结果表明,所提方法能够有效地结合各模型的优点,从而在小目标检测的准确性和鲁棒性方面获得提升。在小鸟小目标检测 MVA 挑战中,我们的模型在 IoU 阈值为 0.5 的情况下取得了平均精度 (AP) 最高 0.776 的成绩。

1 引言

小目标检测(Small Object Detection,简称 SOD)已成为计算机视觉领域的关键任务,因为精确检测微小目标对于监控[1]、自动驾驶[2]、航拍图像分析[3]等众多应用场景至关重要。尽管计算机视觉研究取得了显著进展,SOD 仍然面临多重挑战。首先,小目标通常对比度低、显著特征有限,难以从背景中分离出来。在 Drone 数据集[4]和小鸟小目标检测挑战(SOD4SB)数据集[5]中,存在大量模糊和快速移动的目标,进一步加剧了检测难度。由于下采样和卷积操作会模糊小目标细节,传统特征提取方法往往难以获取有效表征。此外,小目标常出现在复杂背景中,增加了与周围环境分离的难度;即使边界框定位稍有偏差,也可能导致目标未被完整包围。正因 SOD 的重要性和挑战性,该研究方向在过去数年中广受关注。

为应对上述问题,研究者主要沿两条思路展开:一是利用现有通用目标检测模型[6–23],二是设计专门针对 SOD 的模型[24–38]。在第一类方法中,尽管大多数模型表现不尽如人意,但 CenterNet[7]和 Cascade R-CNN[6]等因其独特的结构设计在 SOD 任务上已取得相对较好成绩。然而,与专门定制的 SOD 模型相比,仍有提升空间。在第二类方法中,研究者主要尝试以下几个方向:
a) 利用低层特征或图像超分辨率方法来增强小目标的对比度和显著性[24,25,37,38];
b) 修改下采样策略或多尺度特征融合与预测策略(如采用空洞卷积或调整模型颈部结构),以防止特征提取过程中小目标细节的丢失[25–28];
c) 引入注意力机制以筛选更相关的重要特征信息[28–31];
d) 利用数据增强和标签设计与分配策略(如归一化瓦瑟斯坦距离 (NWD) 或基于 Copy-Paste 的增强方法)进一步提升性能[32–36]。尽管这些方法各有优势,但仍需进一步研究以充分发挥其在 SOD 任务中的潜力。

针对上述挑战,本文提出了一种集成融合方法,通过整合多种现有方法的优势以提升整体性能。其基本思路是利用不同模型之间的多样性,借助集成方法通常能提高泛化能力,从而得到更为鲁棒和精确的预测。具体而言,我们的集成融合方法在训练阶段结合了 Cascade R-CNN[6]和 CenterNet[7] 两种架构的多种变体:使用不同骨干网络(如 InternImage[22]、ResNet[10])及技术(如 NWD[33]、CopyPaste[32])生成性能互补的模型变体;在推理阶段,则通过 Slicing Aided Hyper Inference (SAHI)[24] 和测试时增强(TTA)等技术进一步扩充变体。最后,利用加权框融合(Weighted Box Fusion, WBF)[39] 方法对各模型的预测进行融合,与单一最优模型相比显著提升了检测效果

为验证所提方法的有效性,我们在 SOD4SB 数据集上进行了全面实验评估。结果表明,集成融合方法的整体性能优于任何单一模型,且超越了基线 Cascade R-CNN 在公共测试集上的表现。此外,本文还对各训练策略、推理技术及集成方法进行了深入分析,以验证它们在提升 SOD 性能方面的作用。

本文贡献
实现并比较了不同的小目标检测训练策略、推理技术和集成方法;
在 SOD4SB 数据集上评估了多种集成融合方法及其效果࿱

http://www.xdnf.cn/news/2788.html

相关文章:

  • 项目实战-贪吃蛇大作战【补档】
  • 快速搭建对象存储服务 - Minio,并解决临时地址暴露ip、短链接请求改变浏览器地址等问题
  • 对比N+1查询和关联聚合查询
  • Spring Cloud Config 自定义配置源与动态刷新:从原理到企业级实践
  • Kafka 配置参数性能调优建议
  • 31、简要描述Promise.all的用途
  • 在 Ubuntu 22.04 x64 系统安装/卸载 1Panel 面板
  • 电子电器架构 ---电气/电子架构将在塑造未来出行方面发挥啥作用?
  • [Linux运维] [Ubuntu/Debian]在Lightsail Ubuntu服务器上安装Python环境的完整指南
  • 在线图书管理系统的结构化设计过程讲解
  • [密码学实战]SDF之设备管理类函数(一)
  • uniapp常用
  • case和字符串操作
  • 网络原理 - 10(HTTP/HTTPS - 1)
  • UniApp 实现分享功能
  • 深入探究C++ 中的stack、queue和deque
  • 图论---拓扑排序(DFS)
  • delphi使用sqlite3
  • 《AI大模型应知应会100篇》第39篇:多模态大模型应用:文本、图像和音频的协同处理
  • 基于 Python 的实现:居民用电量数据分析与可视化
  • C++入门(namespace/输入输出)
  • 2025A卷-正整数到Excel编号之间的转换
  • 对Electron打包的exe文件进行反解析
  • 在idea开发中遇到的20个bug
  • 晶振PCB设计核心要点与规范
  • 设备指纹护航电商和金融反欺诈体系建设
  • 飞凌嵌入式T527核心板获得【OpenHarmony生态产品兼容性证书】
  • STL标准模板库
  • 杰理-ios获取不了时间问题
  • 爬虫过程中如何确保数据准确性