当前位置：首页 > backend >正文

论文阅读：HybridTrack: A Hybrid Approach for Robust Multi-Object Tracking

backend 2025/7/13 9:04:37

论文地址：2501.01275v2

代码地址：GitHub - leandro-svg/HybridTrack: [RA-L25/ICRA26] HybridTrack: A Hybrid Approach for Robust Multi-Object Tracking

前言

多目标跟踪旨在在帧间检测和关联所有所需的目标。大多数方法通过明确或隐式地利用强大的线索（即空间和外观信息）来完成任务，这些线索表现出强大的实例级别判别能力。然而，当出现目标遮挡和聚类时，由于目标之间的高度重叠，空间和外观信息同时变得模糊不清。在本文中，作者证明MOT中这个长期以来的挑战可以通过引入弱线索来有效地解决，以补偿强线索的不足。作者引入了「速度方向」、「置信状态」和「高度状态」作为潜在的「弱线索」。在性能方面表现优越的同时，作者的方法仍保持了简单、在线和实时（SORT）的特性。

🔍 研究背景

传统SORT/DeepSORT等方法的局限：固定的运动模型和线性卡尔曼滤波器在非刚性目标或快速加减速等复杂轨迹下难以适应，鲁棒性差。
深度学习方法虽强，但重训练成本高，无法快速迁移到新场景或设备。
目标：构建一个兼具高精度、强泛化和轻量实时性的跟踪方法。

🚀 Motivation

HybridTrack 提出了一种 无需训练的混合滤波器 框架，解决：

如何提升传统滤波方法的自适应性？
是否可以利用神经网络对卡尔曼预测和更新残差进行学习补偿？

答案是将KF与轻量深度网络融合：保留卡尔曼滤波器结构，同时用神经网络替换其静态部分。

作者希望Hybrid-SORT的泛化能力、即插即用和无需训练的特点使其在各种真实世界场景和边缘设备中具有吸引力。作者的贡献可以总结如下：

证明了引入弱线索（即置信度状态、高度状态和速度方向）可以显著减轻遮挡和聚类等长期存在的挑战，作为对常用强线索的补偿。
引入简单的Tracklet Confidence Modeling（TCM）和Height Modulated IoU（HMIoU）来对置信度状态和高度状态进行建模和利用。通过精细的建模，弱线索可以有效地、高效地缓解由强线索产生的模糊匹配，而附加计算量可忽略不计。
这种即插即用和无需训练的设计在不同的场景和追踪器上都具有良好的泛化能力。作者在5个代表性追踪器上实现了作者的设计，实现了一致且显著的改进。最后，作者的方法Hybrid-SORT在DanceTrack、MOT17和MOT20基准测试中取得了优越的性能。

🧭 系统结构概述

关联阶段主要包括3个阶段：

第一阶段是高置信度目标的关联
第二阶段是低置信度目标的关联（ByteTrack中的BYTE）
第三阶段是利用最后一个检测恢复丢失的轨迹（OC-SORT中的OCR）

Overall Pipeline:

输入：图像帧 + 检测框（来自YOLO/Faster R-CNN等）。
跟踪器主体：融合残差学习模块的Hybrid-KF（Hybrid Kalman Filter）。
输出：连续帧目标轨迹ID。

模块组成：

Baseline跟踪器：标准SORT结构。
残差学习器（Residual Learner）：预测运动残差以修正KF预测。
增益学习器（Gain Learner）：学习动态Kalman增益，自适应调整置信度。
匹配机制：使用匈牙利算法进行匹配，同时融合空间（IOU）与运动相似度。

⚙️ 技术细节

作者使用独立的ReID模型来整合外观信息，如图所示。按照BoT-SORT的方法，作者的流程首先检测目标，然后将结果裁剪的补丁送入ReID模型。作者使用指数移动平均（EMA）来建模轨迹的外观信息，并使用余弦距离作为计算轨迹外观特征与检测外观特征相似性的度量。需要注意的是，ReID组件不是作者论文的重点。