当前位置：首页 > news >正文

【CV 目标检测】Fast RCNN模型②——算法流程

news 2025/8/18 9:25:41

Fast RCNN 算法流程

(1）算法流程

候选区域生成：使用选择性搜索的方法找出图片中可能存在目标的候选区域，只需要后续按区域的位置信息
CNN网络特征提取：将整张图像输入到CNN网络中，得到整幅图的特征图，并将上一步获取的候选区域位置从原图映射到该特征图上
ROIpooling：对于每个特征图上候选框，ROIpooling层从特征图中提取固定长度的特征向量，每个特征向量被送入一系列全连接层（fc）中
目标检测：分两部分完成，一个输出各类别加上1个背景类别的Softmax概率估计，另一个为各类别的每一个类别输出四个实数值，来确定目标的位置信息。

A、候选区域生成

同RCNN中一样

B、CNN网络特征提取

与RCNN中一样，使用预训练模型进行特征提取

C、ROI Pooling

候选区域从原图映射到特征图中后，进行ROIpooling的计算

ROI Pooling层使用最大池化将输入的特征图中的任意区域（候选区域对应的区域）内的特征转化为固定的 $H×WH\times W$ 的特征图，其中 $H$ 和 $W$ 是超参数。对于任意输入的 $h×wh\times w$ 的候选区域，将其分割为 $H×WH\times W$ 的子网格，每个网格的大小为： $(hH)×(wW)(\frac{h}{H})\times (\frac{w}{W})$ ，取每个子网格中的最大值，送入后续网络中进行处理

使用ROI Pooling层替换预训练网络中最后的池化层，并将超参 $H ， W$ 设置为和网络第一个全连接兼容的值，例如VGG6，设H= W= 7

D、目标分类和回归
（最后一个全连接层）
原网络的最后一个全连接层替换为两个同级层（分类任务和回归任务）：K+1个类别的SoftMax分类层和边框的回归层
● K：VOC数据集中为20；COCO数据集中为80
● +1：多了一个背景层

上面红框中的为同一个FC层（边框的回归层实现——输出四个实数值，用来确定位置信息）

http://www.xdnf.cn/news/1317457.html

相关文章：

代码随想录算法训练营四十四天|图论part02

【Luogu】每日一题——Day21. P3556 [POI 2013] MOR-Tales of seafaring (图论)

上网行为组网方案

数据结构03（Java）--（递归行为和递归行为时间复杂度估算，master公式）

Mac（五）自定义鼠标滚轮方向 LinearMouse

Linux软件编程：进程与线程（线程）

JVM学习笔记-----StringTable

Docker Compose 安装 Neo4j 的详细步骤

PostgreSQL导入mimic4

go基础学习笔记

k8s集群搭建一主多从的jenkins集群

Win11 文件资源管理器预览窗格显示 XAML 文件内容教程

C++ vector的使用

10 SQL进阶-SQL优化（8.15）

说一下事件委托

Java 大视界 -- Java 大数据分布式计算在基因测序数据分析与精准医疗中的应用（400）

【UEFI系列】ACPI

跨越南北的养老对话：为培养“银发中国”人才注入新动能

JavaScript 性能优化实战：从评估到落地的全链路指南

Spark03-RDD02-常用的Action算子

在鸿蒙中实现深色/浅色模式切换：从原理到可运行 Demo

E2B是一个开源基础设施，允许您在云中安全隔离的沙盒中运行AI生成的代码和e2b.dev网站

Diamond基础2：开发流程之LedDemo

c_str()函数的详细解析

简单的 VSCode 设置

(nice!!!)(LeetCode 每日一题) 837. 新 21 点 (动态规划、数学)

bash shell 入门

云智智慧停充一体云-allnew全新体验-路内停车源码+路外停车源码+充电桩源码解决方案

Rust：DLL 输出对象的生命周期管理

API生命周期10阶段