当前位置: 首页 > java >正文

【SOD】目标检测

一、SOD任务的含义、特性、分类

小目标的定义

将目标物的bbox表示为(x,y,w,h)(x,y,w,h)x,y,w,h
小目标:短边长度不小于4像素,长边不超过32像素。
min(w,h)≥4pixelmax(w,h)≤32pixel min(w,h) \ge 4 pixel \\ max(w,h) \le 32 pixel min(w,h)4pixelmax(w,h)32pixel

学术界还细分为:

  • 小目标检测:SOD(Small Object Detection)
  • 微小目标检测:TOD(Tiny Object Detection)

但具体的标准没有明确的标准,这里都统称为小目标检测

小目标的特性

  1. 小目标之间的交叠概率比较低,即使有交叠,其IoU多数情况下也是比较小的
    在这里插入图片描述
    在这里插入图片描述
  2. 小目标自身的纹理显著度有强弱区别,但是总体来说纹理特征都较弱,很多时候需要借助一定的图像上下文来帮助确认

在这里插入图片描述
如图左侧的图片,人都很难判断是什么。但是不断添加上下文信息,看到人的身体轮廓,人肉眼就能识别出是人脸。

小目标的分类

分类依据:

  1. 图像上下文的依赖程度
  • 比如微小人脸,他是人身体的一部分,所以有身体就能确定是人脸。
  • 而微小人体,背景可以随意换,所以上下文变化很大,依赖程度低。
  • 一般目标是a bart of类的,就都是上下文依赖程度强的。
  1. 自身纹理显著程度
  • 比如飞机,轮廓特征就很明显,纹理特征显著。
  • 车辆就是一个矩形,很容易和其他物体混淆。
    在这里插入图片描述

二、基于感受野的理论推出一系列网络设计原则

做任何尺寸目标的检测任务,模型都需要达到一定的感受野。
由于有效感受野不能被精确计算,所以理论感受野必须要大于目标尺度。
要达到某个固定的理论感受野数值,网络结构如何设计。

思考小目标检测backbone的设计

这里只选取两个层,

  • 3x3步长为1的卷积
  • 3x3步长为2的卷积,用于下采用
    在这里插入图片描述

基本认识:在不考虑宽度的情况下,网络深度越深,通常来说更有利于特征学习

在这里插入图片描述

三、增强、增多对小目标的学习

http://www.xdnf.cn/news/19184.html

相关文章:

  • 《WINDOWS 环境下32位汇编语言程序设计》第8章 通用对话框
  • 【dtcc】数据库 随笔
  • Python字符串转日期完全指南:从基础到企业级应用实践
  • 第三方软件测试:【深度解析SQL注入攻击原理和防御原理】
  • 从自定义日期类角度解析运算符重载,友元函数(friend)
  • Java中使用Spring Boot+Ollama实现本地AI的MCP接入
  • Dify平台:Agent开发初学者指南
  • Mybatis的常用标签
  • 高精度惯性导航供应商价格解析
  • 【Java基础|第三十篇】File流
  • GitHub 宕机自救指南:打造韧性开发体系
  • 多方调研赋能AI+智慧消防 豪越科技人工智能创新获认可
  • 飞牛Nas每天定时加密数据备份到网盘,基于restic的Backrest笔记分享
  • C# WinForms 使用 CyUSB.dll 访问 USB 设备
  • 第6.4节:awk语言 for 语句
  • Java ThreadLocal为什么要用弱引用
  • 2025最新:Salesforce认证考试—考试中心预约全流程
  • 香港电讯为知名投资公司搭建高效、安全IT管理服务体系
  • GraphRAG 知识图谱核心升级:集成 langextract 与 Gemini ----实现高精度实体与关系抽取
  • 营业执照识别技术应用OCR与深度学习,实现高效、精准提取企业核心信息,推动数字化管理发展。
  • Linux时间处理函数
  • 机器学习(三)sklearn机器学习
  • 第二阶段WinForm-11:自定义控件
  • Java全栈工程师的面试实战:从技术细节到业务场景
  • 在八月点燃AI智慧之火:CSDN创作之星挑战赛开启灵感盛宴
  • 04.《VLAN基础与配置实践指南》
  • Django Admin 管理工具
  • NSSCTF-[NISACTF 2022]string_WP
  • 身份证实名认证API集成—身份核验接口-网络平台安全合规
  • mitmproxy的使用初试