深度学习下的单阶段通用目标检测算法研究综述2.0
1、以Transformer为架构的单阶段检测器
DETR主要特点通过目标检测转化为集合预测问题,使用Transformer的编码器-解码器结构来处理图像特征和生成边界框。
DETR引入位置编码和二分匹配算法
优势,端到端的训练过程和全文建模能力,在复杂场景好的效果,
改进了Deformable DETR。
引入可行变卷积和可行变注意力,解决DETR收敛时间问题
可变性卷积每个卷积核位置上添加一个偏移量
动态调整卷积核的位置,
改进
Dynamic
DETR同样是解决原始DETR对于小目标检测较差与模型收敛过慢两个问题进行改进的
引入动态查询机制和ROI动态注意力模块,
针对小目标家呢差提出动态查询机制,
针对收敛慢提出基于兴趣区域ROI的动态注意力模块代替交叉注意力模块