当前位置: 首页 > news >正文

bevformer模型训练过程

本文已发表在知乎,辛苦移步~《bevformer模型训练过程》

最近把bevformer模型训练流程走了一遍,笔记如下。

在这里插入图片描述

算法介绍
细节参考:《mmdetection3d中bevformer解析》,类别共分为’smallMot’, ‘bigMot’, ‘nonMot’, ‘pedestrian’, 'TrainedOthers’共5类。

数据集
项目中使用了三十万帧私有数据进行训练,由于算力和时间限制,从中抽取了2万帧用于实验。评测集用了2000帧进行评测。
训练完了才发现只有车辆前方安装了激光雷达,因为数据标注是在雷达坐标系下(bevformer的预测的3d结果也是在lidar坐标系下),所以导致ground truth只有车辆前方才有。正常的bevformer用的是环视一圈的相机,效果应该会更好一些,本案例中相当于只用了左前,右前,正前三个方向的相机,并且也不会预测这三个相机视角里面的所有目标,只会预测这三个相机与激光雷达视角重叠的部分的目标(因为只有这个重叠部分有标注)。正好也验证了部分视角的bevformer也是可以work的。
训练
倒腾上百G数据到云端太费劲了,所以就在本地家用电脑上训练,24个epoch在1张3090卡上跑了大概37个小时。loss趋势如下,按照趋势来看,如果继续训练指标应该会继续上升一些:

http://www.xdnf.cn/news/1400995.html

相关文章:

  • 嵌入式Linux输入子系统驱动开发
  • Python实现点云AABB和OBB包围盒
  • 后台技术方案设计经验之谈
  • FPGA增量式方差与均值计算
  • 银河麒麟V10(Phytium,D2000/8 E8C, aarch64)开发Qt
  • 【计算机网络】生产问题排查:如何使用Wireshark抓包/读取抓包文件进行网络分析
  • TensorFlow深度学习实战(35)——概率神经网络
  • SpringCloud Alibaba Sentinel 流量治理、熔断限流(四)
  • (三)Python语法基础(实战)
  • 为什么要用 Markdown?以及如何使用它
  • 【系列09】端侧AI:构建与部署高效的本地化AI模型 第8章:移动端部署实战 - Android
  • SQLSugar 封装原理详解:从架构到核心模块的底层实现
  • C++ 面试高频考点 力扣 34. 在排序数组中查找元素的第一个和最后一个位置 二分查找左右端点 题解 每日一题
  • PostgreSQL表空间(Tablespace)作用(管理数据库对象的存储位置)(pg_default、pg_global)
  • 一道比较难的sql题,筛选出重复字段的行数
  • 【物联网】bleak (scan)扫描在干什么? BLE 广播(Advertising)
  • jxWebUI--下拉选择框
  • AtCoder Beginner Contest 421
  • 海盗王64位dx9客户端修改篇之三
  • React前端开发_Day10
  • 骑行商城怎么开发
  • 【PCIE系列】1---PCIE系统拓扑结构分析
  • Ethan独立开发新品速递 | 2025-08-30
  • Libvio 访问异常排查关键要点
  • 基于Ultralytics YOLO通用目标检测训练体系与PyTorch EfficientNet的图像分类体系实现
  • oha:一款轻量级HTTP负载测试工具
  • 流式HTTP MCP服务器开发
  • ceph集群部署
  • 接雨水,leetCode热题100,C++实现
  • 嵌入式linux相机(2)