当前位置: 首页 > web >正文

【CV 目标检测】Fast RCNN模型③——模型训练/预测

(2)模型训练

R-CNN中的特征提取和检测部分是分开进行的,Fast R-CNN提出一个高效的训练办法:多任务训练
Fast R-CNN有两种输出:

  1. 一部分输出在K+1个类别上的离散概率分布(每个候选区域),p=(p0,p1,…,pk)p = (p_0,p_1,\dots,p_k)p=(p0,p1,,pk)。通常,通过全连接层的K+1个输出上的Softmax来计算概率值
  2. 另一部分输出对于由K个类别中的每一个检测框回归偏移,tk=(txk,tyk,twk,thk)t^k = (t_x^k, t_y^k, t_w^k, t_h^k)tk=(txk,tyk,twk,thk)。其中tkt_ktk指定相对于候选框的尺寸不变转换和对数空间高度/宽度位移,与在RPN网络中是一样的
    将上面两个任务的损失函数放在一起:
    L(p,u,tu,v)=Lcls(p,u)+λ[u≥1]LIoc(tu,v)L(p, u,t^u, v) = L_{cls}(p,u)+\lambda[u \ge 1]L_{Ioc(t^u,v)}L(p,u,tu,v)=Lcls(p,u)+λ[u1]LIoc(tu,v)联合训练fast-RCNN网络。
    ppp:网络预测分类结果
    uuu:每个候选区有一个目标值,即uuu为类别的真实值
    tut^utu:每个候选框对应的框的真实值
    vvv:网络预测出来的结果
    u≥1u\ge1u1:只用类别不是背景的,才会计算回归损失

(3)模型预测

● 输入图像

● 图像被送入到卷积网络进行特征提取,将通过选择性搜索获取的候选区域映射到特征图中

● 在特征图上Rol中应用RolPooling,获取尺寸相同的特征向量

● 将这些区域传递到全连接的网络中进行分类和回归,得到目标检测的结果

(4)模型总结

Fast R-CNN是对R-CNN模型的一种改进:

  1. CNN网络不再是对每个候选区域进行特征提取,而是直接对整张图像进行出路,这样减少了很多重复计算
  2. 用ROI Pooling进行特征的尺寸变换,来满足FC全连接层对输入数据尺度的要求
  3. 将目标的回归和分类统一在一个网络中,使用FC+softmax进行目标分类,使用FC layer进行目标框的回归
    在Fast R-CNN中使用的目标检测识别网络,在速度和精度上都有了不错的结果。但是,其候选区域提取方法耗时较长,而且和目标检测网络是分离的,并不是端到端的。因此,在2016年又提出了Faster R-CNN模型用于目标检测
http://www.xdnf.cn/news/18296.html

相关文章:

  • c++最长上升子序列长度
  • 8.18网络编程——基于UDP的TFTP文件传输客户端
  • 力扣32:最长有效括号
  • 如何解决机器翻译的“幻觉“问题(Hallucination)?
  • 博客项目 Spring + Redis + Mysql
  • 深度研究系统、方法与应用的综述
  • android 实现表格效果
  • 接口文档——前后端分离开发模式下的“契约书“
  • Java原子类详解
  • MySQL的多版本并发控制(MVCC):
  • illustrator插件大全 免费插件介绍 Ai设计插件集合 (4)
  • LeetCode 每日一题 2025/8/11-2025/8/17
  • Windows 安装使用 MySQL
  • C++架构设计原则
  • 监督学习(Supervised Learning)和 无监督学习(Unsupervised Learning)详解
  • MySQL新手教学
  • 之前说的要写的TCP高性能服务器,今天来了
  • Elasticsearch全文检索中文分词:IK分词器详解与Docker环境集成
  • 用 Python 实现一个“小型 ReAct 智能体”:思维链 + 工具调用 + 环境交互
  • 如何使用 React 101 的 Highcharts 包装器
  • Pomian语言处理器 研发笔记(一):使用C++的正则表达式构建词法分析器
  • 视频讲解:CatBoost、梯度提升 (XGBoost、LightGBM)对心理健康数据、交通流量及股票价格预测研究
  • 从数据汇总到高级分析,SQL 查询进阶实战(下篇)—— 分组、子查询与窗口函数全攻略
  • 8.18 表达式树|浮点数绝对值
  • 基于Flink CDC实现联系人与标签数据实时同步至ES的实践
  • Ps 2025 图像编辑 Photoshop(Mac中文)
  • 【避坑指南】初始化与更新共享数据赋值的一致性问题
  • 【数模国奖冲刺】备赛过程中的常见问题
  • Linux 服务:RAID 级别解析与 mdadm 工具实操指南
  • SWMM排水管网水力、水质建模及在海绵与水环境中的应用技术-模拟降雨和污染物质经过地面、排水管网、蓄水和处理