当前位置: 首页 > ai >正文

DriveDreamer4D

本文提出DriveDreamer4D框架,通过整合自动驾驶世界模型的先验知识来改进4D驾驶场景表征。我们的方法将自动驾驶世界模型[81]作为生成引擎,合成新轨迹视频数据以增强真实驾驶数据集的密度和训练效果。特别地,我们提出新轨迹生成模块(NTGM)来生成多样化的结构化交通条件,DriveDreamer4D运用这些条件独立调控复杂驾驶环境中前景与背景元素的运动动力学。这些条件会随着车辆机动进行同步的视角投影,确保合成数据符合时空约束。随后提出表亲数据训练策略(CDTS),将时序对齐的真实数据与合成数据融合用于训练4D高斯溅射(4DGS),并通过正则化损失保证感知一致性。

据我们所知,DriveDreamer4D是首个利用视频生成模型提升自动驾驶4D场景重建质量的框架,为变道、加速和减速等场景提供丰富的多视角数据。如图1所示,实验结果表明DriveDreamer4D显著提升了新轨迹视角的生成保真度,与PVG[9]、S3Gaussian[28]和Deformable-GS[74]相比,FID指标分别实现32.1%、46.4%和16.3%的相对提升。同时,该框架增强了前景与背景元素的时空一致性,在NTA-IoU指标上分别提升22.6%、43.5%和15.6%。综合用户研究显示,相较于三个基线模型,DriveDreamer4D的平均胜率超过80%。

本研究的主要贡献包括:
(1)提出首个利用世界模型先验知识推进自动驾驶4D场景重建的框架DriveDreamer4D;
(2)设计NTGM模块自动生成结构化条件,使框架能创建具有复杂机动且保持时空一致性的新轨迹视频,并引入CDTS策略融合时序对齐的真实与合成数据训练4DGS,通过正则化损失保持感知一致性;
(3)通过全面实验验证DriveDreamer4D显著提升新轨迹视角的生成质量及驾驶场景元素的时空一致性。

http://www.xdnf.cn/news/19253.html

相关文章:

  • Qt线程提升:深度指南与最佳实践
  • HTS-AT模型代码分析
  • More Effective C++ 条款17: 考虑使用缓式评估(Consider Using Lazy Evaluation)
  • 快速傅里叶变换FFT推导以及运算复杂度分析
  • 【深入解析——AQS源码】
  • 机器视觉学习-day11-图像噪点消除
  • audioLDM模型代码阅读(二)——HiFi-GAN模型代码分析
  • 对于STM32工程模板
  • 坚鹏请教DEEPSEEK:请问中国领先的AI智能体服务商有哪些?知行学
  • 【CF】Day136——Codeforces Round 1046 (Div. 2) CD (动态规划 | 数学)
  • 0830 C++引用const函数重载结构体类
  • MySQL之事务
  • SQL优化_以MySQL为例
  • ROS2的编译机制和工程组织形式
  • C++:list容器--模拟实现(下篇)
  • (链表)Leetcode206链表反转+Leetcode6删除链表的倒数第N个结点+虚拟头节点使用
  • Linux shell命令扩涨
  • 有限字长效应
  • Qt中的锁和条件变量和信号量
  • 数据结构青铜到王者第十三话---优先级队列(堆)(2)
  • Spring Cloud 和 Dubbo 是目前主流的两大微服务框架,分别代表了两种不同的技术路线
  • Systemd 启动初探
  • IPv6过渡技术6VPE
  • 【MYSQL】GET_LOCK使用方法简单解析
  • 直线与椭圆相交弦长计算公式
  • 【物联网】BLE Fundamentals 核心概念总结-广告-读写特征-LED控制-传感器通知-上下游通信过程
  • hashmap计算key的hash的时候为什么要右移16位
  • [光学原理与应用-329]:ZEMAX - 主要用途与主要功能
  • 复现 RoboDK 机械臂几何校准(Staubli TX2‑90L / TX200)
  • Redis(自写)