当前位置: 首页 > ops >正文

PillarNet: Real-Time and High-PerformancePillar-based 3D Object Detection

​ECCV 2022

paper:[2205.07403] PillarNet: Real-Time and High-Performance Pillar-based 3D Object Detection

code:https://github.com/VISION-SJTU/PillarNet-LTS

纯点云基于pillar3D检测模型

网络比较

SECOND

  • 基于voxel,one-stage,基于sparse 3D conv

  • 将点云划分为3D voxel,在BEV空间识别box

  • 模型结构包括

    • encoder:编码非空3D voxel特征,生成多size3D特征

    • neck:将bev空间下的多尺度3D特征flatten,转换成多尺度(和多size区别?)特征;top-down

    • detect head:用多尺度bev特征做box分类回归

PointPillars

  • 用一个小PointNet将点云投射到xy平面,生成一个稀疏2D底图

  • 2Dconv(top-down)网络,对底图生成多尺度特征

  • detect head



分析

  • 基于pillar的网络性能瓶颈(资源性能?效果性能?)主要在于sparse encoder、neck模块

  • PointPillar直接在稠密的2d底图上 用特征金字塔网络 fuse多尺度特征

    • 缺少pillar特征编码

    • 把输出特征的size和初始pillar范围耦合了,造成所用计算资源随着pillar scale上涨



改进

  1. 将SECOND中的3d sparse conv替换成2d

  2. 用neck模块融合稀疏的空间特征、抽象高维语义特征

  3. 总结

    1. 学pillar 特征:较重的 sparse encoder

    2. 空间特征融合:较轻的neck



结构

encoder

  1. 输入:稀疏2d pillar特征

  2. stage1-4:2d conv,逐渐降采样pillar特征

    1. 可使用2d检测backbone:vgg,resnet,并且可提升3d效果

    2. 逐渐降采样,缓解了pillar size绑定的影响

neck

  1. 16倍下采样稠密特征

  2. 3种设计

    1. v1:SECOND设计

    2. v2:基于1多一条skip connection

    3. v3:基于2多一层conv





loss

  1. cls:focal loss

  2. iou:

    1. S:分类score

    2. W:3d iou score

      1. L1 loss

      2. β:超参

      3. iou计算:2 ∗ (W − 0.5) ∈ [−1, 1].

    3. 解耦朝向:xxIoU loss → OD-xxIoU

  1. size(3d box),off(位置偏移量),z(z方向位置),ori(朝向):L1 loss









http://www.xdnf.cn/news/14586.html

相关文章:

  • MySQL 8.x配置MGR高可用+ProxySQL读写分离(二):ProxySQL配置MySQL代理及读写分离
  • HarmonyOS 5 多端适配原理与BreakpointSystem工具类解析:附代码
  • Flutter ListTile 徽章宽度自适应的真正原因与最佳实践
  • 十四天机器学习入门——决策树与随机森林:从零构建智慧决策模型
  • Python Django全功能框架开发秘籍
  • Jenkins部署及反向代理
  • 【JS-4.7-表单value属性】深入理解DOM操作中的表单value属性
  • 雷达高度计 RA-6500
  • AI浪潮拐点:MCP与A2A协议如何重塑AI智能体协作生态
  • 金融行业B端系统布局实战:风险管控与数据可视化的定制方案
  • 动手用 Web 实现一个 2048 游戏
  • 如何预防电磁铁损坏
  • Data Vault 初探(九) —— 定期装载_Kettle_附属表
  • Java性能优化权威指南-操作系统性能监控
  • HarmonyOS NEXT应用元服务布局优化ArkUI框架执行流程
  • 从java角度理解io多路复用和redis为什么使用io多路复用
  • PixPin:一个强大且免费的截图贴图工具
  • SpringBoot+Vue服装商城系统 附带详细运行指导视频
  • 群晖 NAS Docker 镜像加速配置详细教程
  • 开源 python 应用 开发(二)基于pyautogui、open cv 视觉识别的工具自动化
  • RSA加密原理及推导
  • Qt项目,记事本
  • 【JS-4.4-键盘常用事件】深入理解DOM键盘事件:提升用户交互体验的关键
  • 【unitrix】 4.0 类型级数值表示系统(types.rs)
  • Java的锁机制问题
  • Linux之网络的基础认识
  • KES数据库部署工具使用
  • 系统思考VS心智模式
  • CSP-S 模拟赛一总结(T1、T2)
  • AI大模型提示词工程研究报告:长度与效果的辩证分析