当前位置: 首页 > ds >正文

CaDDN- Categorical Depth Distribution Network for Monocular 3D Object Detection

CVPR 2021 

单目纯视觉BEV检测模型

paper:https://arxiv.org/pdf/2103.01100

code:https://github.com/TRAILab/CaDDN

  1. 视椎特征网络(和LSS做法一致,对深度有监督学习)
    1. DNN模块,抽图像特征
      1. 输入:
      2. 输出:,D:深度桶的数量,C:特征通道数
    2. 深度特征模块
      1. 输入:图像特征
      2. 输出:,对每个像素生成一个深度分布,再softmax后作为分桶结果
      3. 分桶方式:每个桶大小线性增加 linear-increasing discretization(LID)
        1.  di:索引号
    3. 点乘融合
      1. 输入:图像特征(reduce降通道后),深度分布
      2. 输出:视椎特征G
  2. 视椎特征转voxel特征(和LSS做法一致)
    1. 输入:,视椎采样点,相机参数
    2. 输出:
    3. 做法:
      1. 视椎采样点用相机参数转到voxel索引
      2. 用上一阶段网络输出的深度(桶索引),去视椎特征G中抽取voxel特征V,在G对应位置周围用trilinear采样
  3. voxel特征转bev特征
    1. 输入:
    2. 输出:
    3. 做法:直接reshape
  4. DNN detector+head
    1. 采用PointPillars模块结构
  5. loss:
    1. 深度监督:
      1. focal loss,前背景像素α:3.25/0.25
    2. 整体模型:
      1. dir:回归框朝向
      2. 0.2

其他附图:

感觉paper风格偏工程

http://www.xdnf.cn/news/8133.html

相关文章:

  • 比斯特自动化|移动电源全自动点焊机:高效点焊助力移动电源制造
  • 【ffmpeg】硬软编码
  • 第十周作业
  • 从单链表 list 中删除第 i 个元素--Python
  • GaussDB(PostgreSQL)查询执行计划参数解析技术文档
  • 代码随想录算法训练营第四十六四十七天
  • Ubuntu/Linux 服务器上调整系统时间(日期和时间)
  • 零基础入门:MinerU 和 PyTorch、CUDA的关系
  • Facebook广告如何投放保健品类别?
  • Python爬虫(33)Python爬虫高阶:动态页面破解与验证码OCR识别全流程实战
  • Second-Brain 如何用 NocoBase 为金融企业构建 AI 系统
  • Nginx 代理Https服务
  • python调wfdb库读心电数据库的注释文件中NUL问题
  • [免费]微信小程序宠物医院管理系统(uni-app+SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】
  • el-table高度自适应、数据查询后高度展示错误问题
  • LeRobot的机器人控制系统(下)
  • 【缓存】JAVA本地缓存推荐Caffeine和Guava
  • 现代生活的健康密钥:养生新法则
  • uniapp实现大视频文件上传-- 阿里云oss直传方式 - app、H5、微信小程序
  • springboot使用jdk17快速搭建教程
  • 【sylar-webserver】10 HTTP模块
  • 【Linux 学习计划】-- 倒计时、进度条小程序
  • 【ffmpeg】编解码器
  • 前端父元素flex布局设置左右padding时,input溢出父元素右内边距无效
  • Android 直播播放器FFmpeg静态库编译实战指南(NDK r21b)
  • 数仓-概念模型、逻辑模型、物理模型介绍
  • 2025版 JavaScript性能优化实战指南从入门到精通
  • flask允许跨域访问如何设置
  • 探秘 C++ 计数器类:从基础实现到高级应用
  • MySQL与Redis数据同步实践与优化