当前位置: 首页 > news >正文

Simple-BEV论文解析

背景

现有的工作为了避免昂贵的激光雷达,只使用多图像输入来生成BEV特征表示,忽略了radar数据;并且大多数技术都着重如何将图像特征lift到BEV平面,使用更大分辨率的输入与Backbone,这导致在多视角BEV感知下什么是最重要的这个问题缺乏研究。

贡献

  • 只使用了简单的无参lift投影操作获取BEV特征图,重点研究了batch、图像分辨率、数据增强与lift策略等的影响,消融实验做的好,说明batch,图像分辨率用的好能提高指标,而lift操作的差别影响不大。
  • 提出了radar+camera融合,能极好地提升指标质量,这是由于radar能识别远距离物体,并且受恶劣环境影响小
    ,能够与相机进行有效互补,但其数据稀疏,且有噪声。

方法

在这里插入图片描述

配置与总体架构

数据输入是多视角图像、radar甚至lidar,传感器内外参已知并且传感器之间很好地数据同步。模型定义3D感知范围,前后、左右100m,上下10m,平面分辨率设为200×200,高度分辨率设为8,而这个体素空间以前置摄像头为中心,左右方向为X轴,上下方向为Y轴,前后方向为Z轴。
总体架构上,使用ResNet提取每个相机的特征,将其lift到3D再拍扁成BEV,最后对BEV视角再用ResNet得到输出

http://www.xdnf.cn/news/156439.html

相关文章:

  • 关于聚簇索引
  • 【软考-架构】13.5、中间件
  • Linux——动静态库
  • WPF 实现PLC数据采集
  • 如何打包python程序为可执行文件
  • linux中shell脚本的编程使用
  • 一台服务器已经有个python3.11版本了,如何手动安装 Python 3.10,两个版本共存
  • deepseek-cli开源的强大命令行界面,用于与 DeepSeek 的 AI 模型进行交互
  • Pygame音效与音乐:为你的游戏注入灵魂
  • LLaMa Factory大模型微调
  • shell语言核心语法
  • RabbitMQ全栈实践手册:从零搭建消息中间件到SpringAMQP高阶玩法
  • 数据结构和算法(九)--红黑树
  • C++?类和对象(下)!!!
  • 精益数据分析(27/126):剖析用户价值与商业模式拼图
  • 观察者模式 (Observer Pattern)
  • 游戏引擎学习第246天:将 Worker 上下文移到主线程创建
  • 如何给GitHub项目提PR(踩坑记录
  • windows下查看idea运行的进程占的JVM情况工具
  • olama部署deepseek模型
  • 从后端研发角度出发,使用k8s部署业务系统
  • gradle-缓存、依赖、初始化脚本、仓库配置目录详解
  • SpringBoot实现的后端开发
  • Ubuntu20.04 Ollama 配置相关
  • c++初始化数组
  • C语言中位段的应用
  • 【教程】Docker运行gitlab容器
  • 数据结构和算法(八)--2-3查找树
  • 什么时候使用Python 虚拟环境(venv)而不用conda
  • Qt软件开发-摄像头检测使用软件V1.1