目标检测相关【清晰易懂】
目标检测相关
(b)是语义分割,(c)是实例分割
-
目标检测 = 每个目标一个框+标签
-
实例分割 = 语义分割 + 识别每一个目标个体
目标检测基础上进一步提升模型能力有两个方向:实例分割、旋转目标检测。
实例分割
(1)定义
目标检测的进一步扩展,不仅定位物体的位置,而且给出物体的精确轮廓。它通常需要通过 mask 来标注每个物体的像素级区域。
(2)实现方式
一般是在目标检测的基础上,增加一个分割分支(输出掩膜 mask),典型代表是:
-
Mask R-CNN:Faster R-CNN 加上分割头
-
YOLACT / SOLO / Mask2Former:更快更灵活的分割方式
-
一些最新的 segment anything 模型也属于这个方向
旋转目标检测
(1)定义
目标检测不仅检测物体的位置,还要精确预测物体的角度,通过旋转的矩形框来标注物体,而不是简单的水平矩形框。
例如,在遥感卫星图像里检测船只,如果不用旋转框,可能一个框套住了两艘船。而旋转框可以斜着框住每一艘船,更准确。
(2)实现方式
在原有框架上,模型输出的框格式从 [x, y, w, h]
变为 [x, y, w, h, θ]
,多了一个角度θ。
典型代表模型有:
-
RTMDet
-
R3Det(Refined Rotated RetinaNet)
-
Rotated Faster R-CNN
-
Oriented R-CNN
-
基于 YOLO 的旋转目标检测(比如 YOLOv5-OBB)
语义分割和实例分割对比
项目 | 语义分割 | 实例分割 |
---|---|---|
像素级别分类 | ✅ | ✅ |
区分个体 | ❌ 不行(只知道种类) | ✅ 可以(知道是哪一个物体) |
应用 | 场景理解、自动驾驶道路分割等 | 高级视觉识别(如COCO、人脸遮挡处理) |
难度 | 相对较低 | 更高(要结合检测) |
目标检测、实例分割和旋转目标检测的关系
-
目标检测和实例分割常常是顺序执行的,先做目标检测,后做实例分割。
-
旋转目标检测通常是独立的任务,也可以与目标检测或实例分割并行进行,专注于处理旋转物体的定位和角度预测。