当前位置：首页 > backend >正文

扩展卡尔曼滤波（EKF）的一阶泰勒展开（雅可比矩阵）详解

backend 2025/8/24 14:49:03

1. 雅可比矩阵介绍

概念
雅可比矩阵（Jacobian Matrix）是向量值函数的一阶偏导数构成的矩阵。对于一个从 $R^n$ 映射到 $R^m$ 的向量函数 F(x) ，其雅可比矩阵定义为：
在这里插入图片描述
核心原理
雅可比矩阵的本质是提供多变量函数在某一点的最佳线性近似，对于函数 F(x) ，在点 a 附近的线性近似为：
F(x)≈F(a)+J(a)(x−a)

作用与效果
雅可比矩阵描述了输入空间的小变化如何映射到输出空间，表示了在局部区域内，函数如何"拉伸"、"旋转"和"扭曲"空间，雅可比行列式（矩阵的行列式）表示了局部体积的变化率和方向，即雅可比矩阵的每个元素 $∂Fi∂xj\frac {\partial F_i}{\partial x_j}$ 表示当第 j 个输入变量发生微小变化时，第 i 个输出变量的变化率，在以下场景中至关重要：

评估系统对参数变化的敏感度
分析系统的稳定性
优化问题中确定搜索方向

2. EKF-SLAM回顾

在EKF-SLAM中，需要对非线性的运动模型和观测模型进行一阶泰勒展开，以实现线性化处理。泰勒展开的核心是计算雅可比矩阵，它提供了函数在某一点的局部线性近似。

状态向量：

$\begin{bmatrix} s^T & m_1^T & m_2^T & \cdots & m_n^T \end{bmatrix}^T$

其中：

$s=[x,y,θ] ^T$ 是机器人位姿（2D平面）
$m_i^T=[m_{x,i}, m_{y,i}]^T$ 是第 i 个路标的坐标
n 是路标总数

算法流程

预测步骤：
- 预测状态
- 计算雅可比矩阵 $F_t$ （对 $x_{t−1}$ 求导）
- 预测协方差
更新步骤（对于每个观测到的路标 i ）：
- 计算观测预测
- 计算雅可比矩阵 $H_t$ （对 $x_t$ 求导）
- 计算卡尔曼增益
- 更新状态
- 更新协方差

3.运动模型及其雅可比矩阵

3.1 运动模型

运动模型描述了机器人如何根据控制输入 $u_t$ ，从 $x_{t−1}$ 移动到 $x_t$ ：
$xt=f(xt−1,ut)+wt\mathbf{x}_t = f(\mathbf{x}_{t-1}, \mathbf{u}_t) + \mathbf{w}_t$
其中 $w_t$ 是过程噪声，假设使用简单的速度运动模型，模型如下：

$fx(xt−1,ut)=[xt−1+vtΔtcos⁡(θt−1+ωtΔt/2)yt−1+vtΔtsin⁡(θt−1+ωtΔt/2)θt−1+ωtΔt]f_x(x_{t-1}, u_t) = \begin{bmatrix} x_{t-1} + v_t\Delta t \cos(\theta_{t-1} + \omega_t\Delta t/2) \\ y_{t-1} + v_t\Delta t \sin(\theta_{t-1} + \omega_t\Delta t/2) \\ \theta_{t-1} + \omega_t\Delta t \end{bmatrix}$

其中 $u_t =[v_t ,ω_t ]^T$ 是线速度和角速度。

3.2 雅可比矩阵
运动模型的雅可比矩阵 $F_t$ 是对前一时刻的状态 $x_{t−1}$ 求偏导，在估计值 $x^t−1∣t−1\hat{x}_{t-1|t-1}$ 处计算：

$Ft=∂f(xt−1,ut)∂xt−1∣x^t−1∣t−1\mathbf{F}_t = \left. \frac{\partial f(\mathbf{x}_{t-1}, \mathbf{u}_t)}{\partial \mathbf{x}_{t-1}} \right|_{\hat{\mathbf{x}}_{t-1|t-1}}$

由于运动只影响机器人位姿，不影响地图特征，雅可比矩阵为分块结构：

$Ft=[∂fs∂x03×203×2⋯03×202×3I202×2⋯02×202×302×2I2⋯02×2⋮⋮⋮⋱⋮02×302×202×2⋯I2]\mathbf{F}_t = \begin{bmatrix} \frac{\partial f_s}{\partial x} & \mathbf{0}_{3\times 2} & \mathbf{0}_{3\times 2} & \cdots & \mathbf{0}_{3\times 2} \\ \mathbf{0}_{2\times 3} & \mathbf{I}_2 & \mathbf{0}_{2\times 2} & \cdots & \mathbf{0}_{2\times 2} \\ \mathbf{0}_{2\times 3} & \mathbf{0}_{2\times 2} & \mathbf{I}_2 & \cdots & \mathbf{0}_{2\times 2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ \mathbf{0}_{2\times 3} & \mathbf{0}_{2\times 2} & \mathbf{0}_{2\times 2} & \cdots & \mathbf{I}_2 \end{bmatrix}$

其中，机器人位姿部分的雅可比子矩阵为：

$∂ft∂x=[10−vtΔtsin⁡(θt−1+ωtΔt/2)01vtΔtcos⁡(θt−1+ωtΔt/2)001]\frac{\partial f_t}{\partial \mathbf{x}} = \begin{bmatrix} 1 & 0 & -v_t\Delta t \sin(\theta_{t-1} + \omega_t\Delta t/2) \\ 0 & 1 & v_t\Delta t \cos(\theta_{t-1} + \omega_t\Delta t/2) \\ 0 & 0 & 1 \end{bmatrix}$

3.3 说明
运动模型雅可比矩阵的特点：

只有机器人位姿部分有非零元素
地图特征部分为单位矩阵，表示运动不影响地图特征

在预测步骤中，需要计算状态预测的协方差：
$P_{t∣t−1} =F_t P _{t−1∣t−1} F_t^ T +Q t$

这里 $F_t$ 表示前一时刻状态的微小变化如何影响当前时刻的状态预测，因此需要对 $x_{t−1}$ 求导，用于状态预测和协方差预测。

4. 观测模型及其雅可比矩阵

4.1 观测模型
观测模型描述了机器人如何观测环境中的路标：

$zt=h(xt)+vt\mathbf{z}_t = h(\mathbf{x}_t) + \mathbf{v}_t$

其中 $v_t$ 是观测噪声，假设观测到路标 i ，观测模型的极坐标形式为：

$h(xt)=[(mx,i−xt)2+(my,i−yt)2tan⁡−1(my,i−ytmx,i−xt)−θt]=[rϕ]h(\mathbf{x}_t) = \begin{bmatrix} \sqrt{(m_{x,i} - x_t)^2 + (m_{y,i} - y_t)^2} \\ \tan^{-1}\left(\frac{m_{y,i} - y_t}{m_{x,i} - x_t}\right) - \theta_t \end{bmatrix} = \begin{bmatrix} r \\ \phi \end{bmatrix}$

其中 r 是距离，ϕ 是角度。

4.2 雅可比矩阵
观测模型的雅可比矩阵 $H_t$ 是对当前时刻的状态 $x_t$ 求偏导，在预测值 $x^t∣t−1\hat x_{t∣t−1}$ 处计算：

$Ht=∂h(xt)∂xt∣x^t∣t−1\mathbf{H}_t = \left. \frac{\partial h(\mathbf{x}_t)}{\partial \mathbf{x}_t} \right|_{\hat{\mathbf{x}}_{t|t-1}}$

雅可比矩阵也是分块结构，只对机器人位姿和被观测路标位置有非零元素：

$Ht=[∂h∂s0⋯∂h∂mi⋯0]\mathbf{H}_t = \begin{bmatrix} \frac{\partial h}{\partial \mathbf{s}} & \mathbf{0} & \cdots & \frac{\partial h}{\partial \mathbf{m}_i} & \cdots & \mathbf{0} \end{bmatrix}$

其中： $∂h∂s\frac{\partial h}{\partial \mathbf{s}}$ 是观测模型对机器人位姿的雅可比子矩阵
$∂h∂mi\frac{\partial h}{\partial \mathbf{m}_i}$ 是观测模型对路标 i 位置的雅可比子矩阵
具体计算：
令 $d=(mx,i−xt)2+(my,i−yt)2d=\sqrt{(m_{x,i} - x_t)^2 + (m_{y,i} - y_t)^2}$

表示机器人到路标的距离，则：

$∂h∂s=[−mx,i−xtd−my,i−ytd−1my,i−ytd2−mx,i−xtd20]\frac{\partial h}{\partial \mathbf{s}} = \begin{bmatrix} -\frac{m_{x,i} - x_t}{d} & -\frac{m_{y,i} - y_t}{d} & -1 \\ \frac{m_{y,i} - y_t}{d^2} & -\frac{m_{x,i} - x_t}{d^2} & 0 \end{bmatrix}$

$∂h∂mi=[mx,i−xtdmy,i−ytd−my,i−ytd2mx,i−xtd2]\frac{\partial h}{\partial \mathbf{m}_i} = \begin{bmatrix} \frac{m_{x,i} - x_t}{d} & \frac{m_{y,i} - y_t}{d} \\ -\frac{m_{y,i} - y_t}{d^2} & \frac{m_{x,i} - x_t}{d^2} \end{bmatrix}$