当前位置: 首页 > news >正文

【CV 目标检测】Fast RCNN模型②——算法流程

Fast RCNN 算法流程

(1)算法流程

  1. 候选区域生成:使用选择性搜索的方法找出图片中可能存在目标的候选区域,只需要后续按区域的位置信息
  2. CNN网络特征提取:将整张图像输入到CNN网络中,得到整幅图的特征图,并将上一步获取的候选区域位置从原图映射到该特征图上
  3. ROIpooling:对于每个特征图上候选框,ROIpooling层从特征图中提取固定长度的特征向量,每个特征向量被送入一系列全连接层(fc)中
  4. 目标检测:分两部分完成,一个输出各类别加上1个背景类别的Softmax概率估计,另一个为各类别的每一个类别输出四个实数值,来确定目标的位置信息。
A、候选区域生成

同RCNN中一样

B、CNN网络特征提取

与RCNN中一样,使用预训练模型进行特征提取

C、ROI Pooling

候选区域从原图映射到特征图中后,进行ROIpooling的计算

ROI Pooling层使用最大池化将输入的特征图中的任意区域(候选区域对应的区域)内的特征转化为固定的H×WH\times WH×W的特征图,其中HHHWWW是超参数。对于任意输入的h×wh\times wh×w的候选区域,将其分割为H×WH\times WH×W的子网格,每个网格的大小为:(hH)×(wW)(\frac{h}{H})\times (\frac{w}{W})(Hh)×(Ww),取每个子网格中的最大值,送入后续网络中进行处理

使用ROI Pooling层替换预训练网络中最后的池化层,并将超参H,WH,WHW设置为和网络第一个全连接兼容的值,例如VGG6,设H= W= 7

D、目标分类和回归
(最后一个全连接层)
原网络的最后一个全连接层替换为两个同级层(分类任务和回归任务):K+1个类别的SoftMax分类层和边框的回归层
● K:VOC数据集中为20;COCO数据集中为80
● +1:多了一个背景层

上面红框中的为同一个FC层(边框的回归层实现——输出四个实数值,用来确定位置信息)

http://www.xdnf.cn/news/1317457.html

相关文章:

  • 代码随想录算法训练营四十四天|图论part02
  • 【Luogu】每日一题——Day21. P3556 [POI 2013] MOR-Tales of seafaring (图论)
  • 上网行为组网方案
  • 数据结构03(Java)--(递归行为和递归行为时间复杂度估算,master公式)
  • Mac(五)自定义鼠标滚轮方向 LinearMouse
  • Linux软件编程:进程与线程(线程)
  • JVM学习笔记-----StringTable
  • Docker Compose 安装 Neo4j 的详细步骤
  • PostgreSQL导入mimic4
  • go基础学习笔记
  • k8s集群搭建一主多从的jenkins集群
  • Win11 文件资源管理器预览窗格显示 XAML 文件内容教程
  • C++ vector的使用
  • 10 SQL进阶-SQL优化(8.15)
  • 说一下事件委托
  • Java 大视界 -- Java 大数据分布式计算在基因测序数据分析与精准医疗中的应用(400)
  • 【UEFI系列】ACPI
  • 跨越南北的养老对话:为培养“银发中国”人才注入新动能
  • JavaScript 性能优化实战:从评估到落地的全链路指南
  • Spark03-RDD02-常用的Action算子
  • 在鸿蒙中实现深色/浅色模式切换:从原理到可运行 Demo
  • E2B是一个开源基础设施,允许您在云中安全隔离的沙盒中运行AI生成的代码和e2b.dev网站
  • Diamond基础2:开发流程之LedDemo
  • c_str()函数的详细解析
  • 简单的 VSCode 设置
  • (nice!!!)(LeetCode 每日一题) 837. 新 21 点 (动态规划、数学)
  • bash shell 入门
  • 云智智慧停充一体云-allnew全新体验-路内停车源码+路外停车源码+充电桩源码解决方案
  • Rust:DLL 输出对象的生命周期管理
  • API生命周期10阶段