当前位置: 首页 > news >正文

BEVDepth- Acquisition of Reliable Depth for Multi-view 3D Object Detection

中科院 旷视 AAAI 2023

纯视觉多相机BEV方案检测模型

code:https://github.com/Megvii-BaseDetection/BEVDepth

paper:BEVDepth: Acquisition of Reliable Depth for Multi-View 3D Object Detection| Proceedings of the AAAI Conference on Artificial Intelligence

输入:N帧环视相机

过程:

  1. CNN抽2D图像特征
  2. DepthNet从2D特征建模深度
    1. 点云+相机内外参计算图像深度信息(2.5D图像)
    2. min pooling+one hot,计算深度真值
    3. depth网络里加残差、deformable conv扩大感受野,抵消相机外参变化带来的影响(?)
    4. camera-awareness DepthNet
      1. 目的:提升深度分类效果
      2. 方案:相机内参作为DepthNet网络输入
        1. MLP层:expand内参到特征同维数
        2. SE层:融合2D特征+相机内外参
    5. 提效voxel pooling 
      1. 方案:自定义cuda算子VoxelPoolingTrain
  3. view transformer用2D图像特征+深度获取3D特征,再投射成bev表征
  4. CenterPoint 3D检测头识别检测框(class,3Dbox offset,属性等)

http://www.xdnf.cn/news/684883.html

相关文章:

  • [蓝桥杯C++ 2024 国 B ] 立定跳远(二分)
  • [Hackers and Painters] 读书笔记 | 设计模式思想 | LISP
  • 设计模式-装饰模式
  • 机器学习中无监督学习方法的聚类:划分式聚类、层次聚类、密度聚类
  • Python爬虫第22节- 结合Selenium识别滑动验证码实战
  • Java设计模式之设计原则
  • 莫毅明和钟家庆数学命题证明使用的预期理由和或然推理的错误
  • 使用JAVA 语言中 JNA 和 PDU 的区别
  • 深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用
  • Python爬虫(40)基于Selenium与ScrapyRT构建高并发动态网页爬虫架构:原理、实现与性能优化
  • vscode 配置 QtCreat Cmake项目
  • 文件上传绕过方法总结
  • Deep Evidential Regression
  • 【AUTOSAR】时间保护(Timing Protection)概念、应用与实现源代码解析(上篇)
  • 大模型三大缺陷与RAG破解之道
  • vue3基本类型和对象类型的响应式数据
  • Disruptor—核心源码实现分析(三)
  • 解决开机必须联网的问题并关闭windows搜索页面的推荐
  • MES生产管理系统:Java+Vue,含源码与文档,集成生产信息,实现计划、执行与监控高效协同
  • Foupk3systemX5OSNTXPro引擎
  • 一键重装Windows/Linux系统,支持虚拟服务器
  • Java并发编程中的锁分类
  • AD-PCB--AD20软件安装及中英文切换 DAY 2
  • 链表题解——相交链表(力扣160 easy)
  • 树莓派安装中文字体和中文输入法
  • 【Qt开发】容器类控件
  • Python深度挖掘:openpyxl与pandas高效数据处理实战
  • 洛谷P1165—— 日志分析
  • java中的定时期
  • Linux换源yum和安装nginx,mysql