当前位置: 首页 > news >正文

UAD详解

1. 算法动机及开创性思路

在这里插入图片描述

  • 现存问题:Unity AD和VAD等方法需要大量人工标注和计算资源(Unity AD需48 GPU/天,VAD需28 GPU/天),导致数据扩展成本高昂。
  • 核心观点:感知模块的标注量和设计复杂度并非提升规划性能的关键,扩大数据量才是核心。
  • 创新策略:
    • 无监督代理任务:将需要感知标签的监督学习改为无监督方式,消除标注成本
    • 自监督方向感知:通过方向感知策略进一步提升规划性能
  • 性能优势:推理速度达7.2 FPS(Unity AD仅2.1 FPS,VAD为5.3 FPS),训练仅需21.3 GPU/天

2. 主体结构

在这里插入图片描述

  • 流程区分:
    • 黑色箭头:推理阶段专用模块
    • 橙色箭头:训练阶段特有模块
  • 输入输出:环视图像→预测轨迹

1)角度感知代理任务

  • 检测器
    在这里插入图片描述
    在这里插入图片描述

    • 检测方法:采用GroundingDINO(开放集检测器)
      • 开放集特性:可检测训练集未见的类别(如训练集只有猫狗,测试时能检测鸭子)
      • 类别限定:仅检测vehicle/pedestrian/barrier三类
      • 输出形式:2D检测框(非3D)
  • 采样及bev特征图划分

    • BEV转换:
      • 近大远小效应导致扇形区域(近处物体投影范围小,远处范围大)
      • 通过均匀角度划分将不规则mask转为规则区域
  • 采样策略:

    • 在BEV特征图随机采样点
    • 采样点在2D框范围内置True,否则置False
    • 区域内有任一True点则整个区域标记为存在物体
  • Dreaming decoder
    在这里插入图片描述

    • 工作原理:
      • 初始化k个角度query(与BEV特征区域对应)

      • 通过GRU实现自回归更新:
        在这里插入图片描述

      • 交叉注意力生成下一时刻特征:
        在这里插入图片描述

  • 监督方式:

    • 计算相邻时刻query分布的KL散度
    • 时刻为先验分布(基于当前特征)
    • 时刻为后验分布(含未来信息)

2)方向感知规划模块

  • 三大组件:
    • 规划头:与Unity AD相同的模仿学习轨迹预测
    • 方向增强:对BEV特征旋转90°/180°/270°
    • 方向一致性:
      • 预测轨迹需与旋转后的GT轨迹匹配
      • 反向旋转后的预测轨迹需与原预测一致
  • 驾驶行为分类:
    • 按主车方向划分直行/左转/右转
    • 通过三分类任务增强方向感知

3. 损失函数

在这里插入图片描述

  • 复合损失:
    在这里插入图片描述
    • Lspat:扇形区域物体存在性的二分类交叉熵
    • Ldrm:Dreaming decoder的KL散度损失
    • Liml:模仿学习的轨迹预测损失
    • Ldir:驾驶行为(直行/左转/右转)分类损失
    • Lcos:旋转增强后的一致性损失

4. 性能对比

1)开环指标对比

在这里插入图片描述

  • 评估指标:新增了与地图边界碰撞率指标,用于检测模型是否通过违规驾驶(如压线)来避免碰撞
  • UAD优势:
    • 在L2误差(1s/2s/3s)和碰撞率指标上全面领先
    • 轻量化版本达到18.9FPS,比VAD-Tiny快3FPS
    • 采用不同平均计算方式时仍保持最优性能
  • 方法对比:
    • NMP/SA-NMP仅使用检测和运动预测(L2误差2.31/2.05)
    • ST-P3使用检测和地图(L2误差3.28)
    • VAD系列增加运动预测(Base版L2误差1.22)
    • UAD无需3D标注(L2误差0.90)

2)闭环仿真指标对比

  • 评估指标:
    • 路线完成率(Route Completion)
    • 驾驶分数(Driving Score)
  • 性能表现:
    • CILRS:完成率13.4%,得分3.68
    • LBC:完成率55.01%,得分7.05
    • Transfuser:完成率78.41%,得分31.15
    • VAD-Base:完成率87.26%,得分30.31
    • UAD:完成率92.72%,得分71.63(最优)

3)Dreaming decoder消融实验

  • 关键设计:
    • BEV特征与query的循环更新机制
    • 无监督代理任务(障碍物存在感知)
  • 实验发现:
    • 不加代理任务时L2误差达1.82,碰撞率1.00%
    • 加入后L2降至0.90,碰撞率0.19%
    • 循环更新使3s预测误差从2.74m降至1.50m

4)方向感知规划消融实验

在这里插入图片描述
在这里插入图片描述

  • 组件对比:
    • 仅用路径损失(Cpath):L2误差3.18
    • 增加方向损失(Cdir):误差降至1.00
    • 加入模仿损失(Cimi):误差反弹至1.20
  • 最优配置:
    • 完整模型L2误差0.90,碰撞率0.19%
    • 方向一致性使左右转场景提升显著

5)角度设计消融实验

  • 扇形区域划分:
    • 未划分时L2误差1.37,碰撞率1.37%
    • 角度量化后误差降至0.90,碰撞率0.19%
  • 效果验证:
    • 证明角度敏感的特征表示对运动预测至关重要
    • 与方向增强形成互补优化

6)3D检测头消融实验

  • 实验设置:
    • 对比有无3D检测头的性能差异
  • 关键发现:
    • 添加检测头导致L2误差从0.90增至0.93
    • 碰撞率从0.19%上升至0.25%
    • 验证了无需显式3D检测也能实现良好性能

7)不同驾驶场景下的性能

在这里插入图片描述在这里插入图片描述

  • 场景划分:
    • 直行(5309样本)
    • 左转(301样本)
    • 右转(409样本)
  • 结果分析:
  • 基线方法(UniAD):直行L2误差0.98,左转1.48
  • UAD*(无方向增强):直行0.89,左转1.55
  • 完整UAD:直行0.84,左转1.39(右转场景碰撞率下降50%)

8)nuScenes可视化

在这里插入图片描述

  • 可视化要素:
    • 绿色:GT 3D框
    • 红色:GroundingDINO检测结果
  • BEV扇形区域物体掩码
  • 轨迹对比:
    • UAD(红)最接近GT轨迹(绿)
    • UniAD(紫)会碰撞道路边界
    • 验证了角度量化表征的有效性

9)Carla仿真可视化

  • 典型场景:
    • ST-P3(黄)轨迹停在人行道
    • Transfuser(蓝)会碰撞行人
    • UAD动态调整:行人通过后才继续行驶
  • 方法优势:
    • 避免使用人工标注的3D检测标签
    • 通过方向增强提升复杂场景表现
    • 计算效率优化(Base版7.2FPS)
http://www.xdnf.cn/news/1350721.html

相关文章:

  • BEVDepth
  • 领码方案:新一代页面权限体系全景解析(完整版)
  • 英伟达显卡GPU驱动的本质
  • 在WSL2 Ubuntu中部署FastDFS服务的完整指南
  • 【K8s】整体认识K8s--K8s架构与集群创建过程
  • GRS认证是国际供应链的“硬性门槛“
  • 数据库字段类型深度解析:从关系型到 NoSQL 的全面指南
  • 自动化运维Ansible
  • 强光干扰与密集场景下工服识别准确率↑89%!陌讯多模态融合算法在安全生产中的实战优化
  • 在Excel和WPS表格中快速插入多行或多列
  • 一个适用于 Word(Mac/Win 通用) 的 VBA 宏:把所有“上角标格式的 0‑9”以及 “Unicode 上角标数字 ⁰‑⁹” 批量删除。
  • PYTHON让繁琐的工作自动化-列表
  • 构建现代高并发服务器:从内核机制到架构实践
  • Win11 下卸载 Oracle11g
  • 青少年机器人技术(五级)等级考试试卷(2020年9月)
  • 基于Python对酷狗音乐排行榜数据分析可视化【源码+LW+部署】
  • 【Win】Motrix+Aria2浏览器下载加速
  • 深入解析Spring Boot自动配置原理:简化开发的魔法引擎
  • 在 Spring Boot 中配置和使用多个数据源
  • C++之list类的代码及其逻辑详解 (中)
  • 构建真正自动化知识工作的AI代理
  • 随着威胁的加剧,地方政府难以保卫关键基础设施
  • Java项目:基于SpringBoot和Vue的图书个性化推荐系统(源码+数据库+文档)
  • 以太坊智能合约地址派生方式:EOA、CREATE 和 CREATE2
  • C语言宏用法
  • Python 地理空间分析:核心库与学习路线图
  • ESP32应用——UDP组播/广播(ESP-IDF框架)
  • HarmonyOS 递归实战:文件夹文件统计案例解析
  • 配置npm国内源(包含主流npm镜像源地址)
  • 北极圈边缘生态研究:从数据采集到分析的全流程解析