当前位置: 首页 > java >正文

【PD】《Research on Package Detection Algorithm Based on Convolutional》

在这里插入图片描述

[1]陈启玮.基于卷积神经网络的包裹检测算法研究[D].重庆邮电大学,2020.DOI:10.27675/d.cnki.gcydx.2020.000927.


文章目录

  • 1、Background and Motivation
  • 2、Related Work
  • 3、Advantages / Contributions
  • 4、Method and Experiments
    • 4.1、Datasets and Metrics
    • 4.2、基于 Faster R-CNN 的密集包裹检测方法
    • 4.3、基于多尺度特征融合的小目标包裹检测方法
  • 5、Conclusion(own) / Future work


1、Background and Motivation

随着电子商务的快速发展,物流需求越来越高。智慧物流系统在提升物流中转中心的运作效率,降低管理成本等方面发挥着重要作用,从而受到广泛的关注。包裹检测是智慧物流系统包裹管理的关键技术之一(包裹检测是监测包裹的暴力违规操作、识别卡塞、掉落的异常包裹的基础工作之一),也是目标检测在物流领域的具体应用之一。

在实际场景中,经常会发生包裹的丢失问题,这需要工作人员通过监控视频检查,花费大量的时间。因此,快速准确地对物流中转中心的包裹进行检测具有极大的应用前景和现实意义。

尽管近年来目标检测技术取得了巨大的进步,但是直接把现有的目标检测技术应用到包裹检测任务上会面临较大的挑战。

一方面,包裹的大量堆积造成包裹成像目标密集,另一方面,由于成像距离较远,包裹目标成像形态较小。此外,包裹周围的各类传输相关设备会造成复杂的背景干扰。这些挑战使得包裹检测是一件比较困难的任务。

为此,本文首先对目标检测的研究现状进行梳理;其次,基于中国邮政集团公司无锡集散中心的监控视频数据,对基于卷积神经网络的包裹检测算法进行深入研究。

在这里插入图片描述

2、Related Work

  • 基于人工设计特征的目标检测方法
  • 基于卷积神经网络的目标检测方法

在这里插入图片描述

本文深入研究基于卷积神经网络的包裹检测算法,将目标检测算法应用在包裹检测实际问题中,针对包裹监测任务中存在的密集包裹小目标包裹问题展开研究。

3、Advantages / Contributions

  • 根据目标检测数据集 Pascal VOC 数据集与 MS COCO 数据集建立包裹检测数据集,为解决包裹检测这一实际问题提供数据基础
  • 根据物流中转中心存在的密集遮挡现象对包裹检测算法进行改进,创新性地将适用于行人检测中用于解决密集行人检测的 RepGT 损失函数对包裹检测算法中的回归项进行调整,使预测框偏离周围非对应的目标框,较大地提升了检测精度。
  • 针对包裹检测中存在的小目标包裹的问题进行研究,确定合适的 anchor 大小,并结合 FPN 特征融合的方法,对卷积层 conv3_3、conv4_3 与 conv5_3 产生的特征图融合成一张特征图,显著地改善了小目标包裹的检测效果,使检测精度有较大提升

4、Method and Experiments

4.1、Datasets and Metrics

采用的数据集来自于中国邮政集团公司无锡集散中心的监控视频中的图像,分为多个角度,场景复杂,含有大量的密集包裹与小目标包裹

在这里插入图片描述
数据集中包括 1158 个训练样本和 668 个测试样本,标记的包裹数量为 32320 个

在这里插入图片描述

评价指标 mAP

4.2、基于 Faster R-CNN 的密集包裹检测方法

在这里插入图片描述

运用 RepGT loss 对包裹检测算法中的回归项进行调整,选择更加合适的候选框,不仅使预测框和所对应的真实目标框的距离缩小,也使得其与周围非对应的目标框(包含真实目标框和预测框)的距离加大

在这里插入图片描述

Wang X, Xiao T, Jiang Y, et al. Repulsion loss: Detecting pedestrians in a crowd[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7774-7783.
在这里插入图片描述

在这里插入图片描述

proposal 越倾向于与非目标 groundtruth 物体重叠,RepGT 损失对边界框回归器的惩罚就越大,从而有效防止边界框移向相邻的非目标物体。

在这里插入图片描述

RepGT 损失函数对于包裹检测的检测精度有一定的提升,从原来的 57.60 提升到了 59.98
在这里插入图片描述

4.3、基于多尺度特征融合的小目标包裹检测方法

在这里插入图片描述

faster rcnn 只在 conv 4 上接 head 结构,无法很好的处理小目标,作者进行了如下改进

在这里插入图片描述

在这里插入图片描述
不采用 FPN 的原因

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

确定合适的 anchor 大小也可以提升精度

5、Conclusion(own) / Future work

  • RepGT 损失函数
  • 修改 anchor size
  • 特征金字塔融合

未来工作

  • 进一步搜集并标注数据来扩充数据集,提高算法的可靠性。
  • 小目标包裹方面还是有很多包裹未被网络检测到,还将在上下文信息与算法设计方面作进一步的研究
  • 未来将进一步研究弱监督与半监督方面的包裹检测

更多论文解读,请参考 【Paper Reading】

http://www.xdnf.cn/news/4361.html

相关文章:

  • huggingface 热门开源TTS模型Dia-1.6B,支持多人对话生成、情感控制~
  • 球速最快的是哪种球类运动·棒球1号位
  • Python 10天冲刺《__slots__ 是一个类级属性》用于限制和优化对象的属性存储
  • 【JS逆向基础】WEB基础
  • CAD图纸智能搜索三大突破:图纸秒搜技术、相似度匹配与AI语义搜索
  • 【每天一个知识点】使用 apriori() 函数获取频繁项集
  • 逐次逼近式A/D转换器
  • 线性回归练习1
  • 从基础到进阶:C++ 中 find 函数的全方位解析
  • MySQL 隐式转换及整数转浮点
  • 解锁健康生活:全新养身指南
  • Leetcode Hot 100 三数之和
  • Relay算子注册(在pytorch.py端调用)
  • 卷积神经网络实战(3)
  • 【基础】Python包管理工具uv使用全教程
  • Java日期格式化方法总结
  • DApp 开发:开启去中心化应用新时代
  • Spring事务和事务传播机制
  • C语言| 递归和循环的优缺点
  • 塔能水泵节能方案:精准驱动工厂能耗优化
  • 展锐Android13禁止用户使用超级省电
  • 新一代Python专业编译器Nuitka简介
  • ROS2:自定义接口文件(无废话)
  • 多模态理论知识
  • 二叉树与堆排序(概念|遍历|实现)
  • python酒店在线预定管理系统-酒店客房管理系统-快捷酒店入住系统
  • 【Linux系统】vim编辑器的使用
  • FoMo 数据集是一个专注于机器人在季节性积雪变化环境中的导航数据集,记录了不同季节(无雪、浅雪、深雪)下的传感器数据和轨迹信息。
  • C语言编程--递归程序--求数组的最大元素值
  • 油气地震资料信号处理中的NMO(正常时差校正)