当前位置：首页 > backend >正文

怎么理解自动驾驶技术中的agent

backend 2025/6/17 2:50:06

一、核心概念定义

术语	定义	典型示例
Agent	具有动态性与交互性的道路参与者，其行为需被预测并影响自车决策。	行驶车辆、行人、自行车、临时停止的出租车
静态障碍物	固定不动且无自主行为的物体，仅需几何避让，无需行为预测。	路灯、路沿、建筑物、消防栓
静止物体	当前速度为零的物体，可能是临时停止的 Agent 或真正的静态障碍物（需二次判断）。	等红灯的车辆（Agent）、倒塌的树（静态障碍物）

🔍 关键区别：

动态性：Agent 会运动或具有运动潜力；静态障碍物永久固定。
交互性：Agent 的行为与自车存在博弈；静态障碍物只需绕行。

二、感知模块（Perception）的输出与处理

1. Detection（检测）阶段

输出：场景中所有可识别物体的边界框 + 类别标签（包括 Agent、静态障碍物、背景物体）。
不区分动态/静态：检测仅识别物体存在性（如“车辆”“行人”“电线杆”）。

2. 关键后续处理

步骤	功能	区分 Agent 的关键作用
分类	确认物体类别（车/人/树等）	初步筛选：车辆、行人等属于候选 Agent。
跟踪（Tracking）	跨帧关联目标，计算运动状态（速度、轨迹）	核心依据：动态物体 → Agent；静止物体 → 静态障碍物或临时 Agent。
地图融合	结合高精地图过滤已知静态物体	排除固定障碍物（如交通牌）。

✅ 结论

Detection 输出包含所有物体，但只有动态且需交互的目标被归类为 Agent。

三、跟踪模块（Tracking）的输出逻辑

1. Tracking 的核心任务

输入：Detection 输出的所有物体。
处理：
- 为每个物体分配 唯一ID，关联连续帧中的同一目标。
- 估计 运动状态（速度、加速度、轨迹历史）。
输出：所有被跟踪物体的列表（含动态 Agent、静态障碍物、临时静止物体）。

2. Tracking 输出 ≠ Agent

跟踪目标类型	是否属于 Agent？	原因
持续运动的车辆/行人	✅ 是	动态且需交互预测。
临时静止的车辆	✅ 是	可能随时启动（如等红灯），需行为预测。
永久静态物体（如路灯）	❌ 否	无运动能力，仅需避让几何位置。
误检背景（如飘动的塑料袋）	❌ 否	通常在后续模块过滤。

✅ 结论

Tracking 输出包含所有被跟踪目标，但仅动态且有交互需求的物体被系统标记为 Agent。

四、系统级处理流程

graph TDA[Detection] -->|“所有物体”| B[Tracking]B -->|“跟踪目标列表”| C{动态性分析}C -->|动态物体| D[Agent]C -->|静态物体| E[静态障碍物]D -->|送入预测模块| F[行为预测 + 交互决策]E -->|送入规划模块| G[几何路径避让]

为何如此设计？

资源优化：预测模块只需处理关键 Agent（减少算力消耗）。
功能分离：
- Agent → 预测意图 + 博弈交互（如让行、超车）。
- 静态障碍物 → 几何避障（如绕开路桩）。
状态切换处理：跟踪模块持续监控“静止物体”，避免漏跟临时停止的 Agent（如车辆突然启动）。

五、总结：Agent 的最终判定条件

一个物体被系统认定为 Agent，需同时满足：

动态性：当前运动或具有潜在运动能力（如停着的车）。
交互性：其行为可能影响自车安全或效率（如行人可能横穿马路）。
跟踪持续性：在多帧中被稳定跟踪并排除误检。

静态障碍物：只需满足 → 位置固定 + 无行为意图。

六、实际案例

场景	Detection 输出	Tracking 输出	最终类型	处理逻辑
行驶中的摩托车	“自行车”	ID=103, 速度=30km/h	Agent	预测轨迹，决策是否超车。
路边消防栓	“柱状物体”	ID=205, 速度=0	静态障碍物	规划避让路径。
临时停靠的快递车	“车辆”	ID=301, 速度=0	Agent	预测开车门或起步，准备刹车。
被风吹倒的广告牌	“大型物体”	ID=404, 速度=0	静态障碍物	标记为临时障碍物并绕行。