视觉slam十四讲学习笔记(三)李群与李代数

1. 理解李群与李代数的概念,掌握 SO(3), SE(3) 与对应李代数的表示方式。

2. 理解 BCH 近似的意义。

3. 学会在李代数上的扰动模型。

4. 使用 Sophus 对李代数进行运算。

目录

前言

一、李群李代数基础 

1 群

2 李代数的引出

3 李代数的定义

4 李代数 so(3)

5 李代数 se(3)

二、指数与对数映射

1 SO(3) 上的指数映射

2 SE(3) 上的指数映射

三、李代数求导与扰动模型

1 BCH 公式与近似形式

2 SO(3) 李代数上的求导

3 李代数求导

4 扰动模型(左乘)

5 SE(3) 上的李代数求导

四、实践:Sophus

总结


前言

  • 三维世界中刚体运动的描述:旋转矩阵、旋转向量、欧拉角、四元数等。
  • 除了表示之外,还要对它们进行估计和优化。
  • 旋转矩阵自身带有约束(正交且行列式为1)。作为优化变量时,会引入额外的约束,使优化变得困难。
  • 李代数上可以变成无约束优化。

哔哩哔哩课程链接:视觉SLAM十四讲ch4_哔哩哔哩_bilibili


一、李群李代数基础 

三维旋转矩阵构成了特殊正交群 SO(3),而变换矩阵构成了特殊欧氏群 SE(3)

旋转矩阵也好,变换矩阵也好,它们对加法是不封闭的。换句话说,对于任意两个旋转矩阵 R1, R2,它们按照矩阵加法的定义,和不再是一个旋转矩阵:

对于变换矩阵亦是如此。我们发现,这两种矩阵并没有良好定义的加法,相对的,它们只有一种较好的运算:乘法。SO(3) SE(3) 关于乘法是封闭的:

道乘法对应着旋转或变换的复合——两个旋转矩阵相乘表示做了两次旋转。对于这种只有一个运算的集合,把它叫做

1 群

  • 旋转矩阵集合和矩阵乘法构成群。
  • 同样变换矩阵和矩阵乘法也构成群。
  • 因此称它们为旋转矩阵群和变换矩阵群。

群(Group)是一种集合加上一种运算的代数结构。我们把集合记作 A,运算记作 ·, 那么群可以记作 G = (A, ·)。群要求这个运算满足以下几个条件:

常见的群有:

  • 一般线性群 GL(n) 指 n × n 的可逆矩阵,它们对矩阵乘法成群。
  • 特殊正交群 SO(n) 也就是所谓的旋转矩阵群,其中 SO(2) SO(3) 最为常见。
  • 特殊欧氏群 SE(n) 也就是前面提到的 n 维欧氏变换,如 SE(2) SE(3)

李群是指具有连续(光滑)性质的群。像整数群 Z 那样离散的群没有连续性质,所以不是李群。而 SO(n) SE(n),它们在实数空间上是连续的。我们能够直观地想象一个刚体能够连续地在空间中运动,所以它们都是李群。

李代数的引出

任意旋转矩阵 R,满足:

如果,R 是某个相机的旋转,它会随时间连续地变化,即为时间的函数:R(t)。由于它仍是旋转矩阵,有:

对于任意反对称矩阵,我们亦能找到一个与之对应的向量。把这个运算用符号 表示:

等式两边右乘 R(t),由于 R 为正交阵,有:

可以看到,每对旋转矩阵求一次导数,只需左乘一个 ϕ (t) 矩阵即可。设 t0 = 0,并设此时旋转矩阵为 R(0) = I。按照导数定义,可以把 R(t) 0 附近进行一阶泰勒展开:

我们看到 ϕ 反映了 R 的导数性质,故称它在 SO(3) 原点附近的正切空间 (Tangent Space) 上。同时在 t0 附近,设 ϕ 保持为常数 ϕ(t0) = ϕ0

由于做了一定的假设,所以它只在 t = 0 附近有效。旋转矩阵 R 与另一个反对称矩阵 ϕ0 通过指数关系发生了联系。也就是说,当知道某个时刻的 R 时,存在一个向量 ϕ,它们满足这个矩阵指数关系。

  1. 如果上式成立,那么给定某时刻的 R,就能求得一个 ϕ,它描述了 R 在局部的导数关系。与 R 对应的 ϕ 有什么含义呢?后面会看到,ϕ 正是对应到 SO(3) 上的李代数 so(3)
  2. 其次,矩阵指数 exp(ϕ ) 如何计算?——事实上,这正是李群与李代数间的指数/对数映射。

李代数的定义

每个李群都有与之对应的李代数。李代数描述了李群的局部性质。通用的李代数的定义如下:

李代数由一个集合 V,一个数域 F 和一个二元运算 [, ] 组成。如果它们满足以下几条性质,称 (V, F, [, ]) 为一个李代数,记作 g

其中二元运算被称为李括号。从表面上来看,李代数所需要的性质还是挺多的。相比于群中的较为简单的二元运算,李括号表达了两个元素的差异。它不要求结合律,而要求元素和自己做李括号之后为零的性质。

李代数 so(3)

SO(3) 对应的李代数是定义在 R 3上的向量,记作 ϕ。每个 ϕ 都可以生成一个反对称矩阵:

由于 ϕ 与反对称矩阵关系很 紧密,在不引起歧义的情况下,就说 so(3) 的元素是 3 维向量或者 3 维反对称矩阵,不加区别:

SO(3) 的关系由指数映射给定:

李代数 se(3)

对于 SE(3),它也有对应的李代数 se(3)。为省略篇幅,我们就不描述如何引出 se(3)了。与 so(3) 相似,se(3) 位于 R 6 空间中:

把每个se(3)元素记作ξ,它是一个六维向量。前三维为平移,记作 ρ;后三维为旋转,记作 ϕ,实质上是 so(3) 元素。同时,拓展了 符号的含义。在 se(3) 中,同样使用 符号,将一个六维向量转换成四维矩阵,但这里不再表示反对称:

仍使用 符号来指代“从向量到矩阵”和“从矩阵到向量”的关系,以保持和 so(3) 上的一致性。读者可以简单地把 se(3) 理解成“由一个平移加上一个 so(3) 元素构成的向量”(尽管这里的 ρ 还不直接是平移)。同样,李代数 se(3) 亦有类似于 so(3) 的李括号:

二、指数与对数映射

SO(3) 上的指数映射

exp(ϕ ) 是如何计算的?它是一个矩阵的指数,在李群和李代数中,称为指数映射(Exponential Map)。同样,会先讨论 so(3) 的指数映射,再讨论 se(3) 的情形。

任意矩阵的指数映射可以写成一个泰勒展开,但是只有在收敛的情况下才会有结果,其结果仍是一个矩阵。

同样地,对 so(3) 中任意一元素 ϕ,亦可按此方式定义它的指数映射:

由于 ϕ 是三维向量,可以定义它的模长和它的方 向,分别记作 θ a,于是有 ϕ = θa。这里 a 是一个长度为 1 的方向向量。首先,对于a ,有以下两条性质:

利用这两个性质,可以把指数映射写成:

so(3) 实际上就是由所谓的旋转向量组成的空间,而指数映射即罗德里格斯公式。通过它们,把 so(3) 中任意一个向量对应到了一个位于 SO(3) 中的旋转矩阵。反之,如果定义对数映射,也能把 SO(3) 中的元素对应到 so(3) 中:

SE(3) 上的指数映射

se(3) 上的指数映射形式如下:

ξ 的指数映射左上角的 R 是我们熟知的 SO(3) 中的元素,与 se(3) 当中的旋转部分 ϕ 对应。而右上角的 J 则可整理为(设 ϕ = θa):

从左上的 R 计算旋转向量,而右上的 t 满足:t = Jρ。由于 J 可以由 ϕ 得到,所以这里的 ρ 亦可由此线性方程解得。

SO(3), SE(3), so(3), se(3) 的对应关系如上图。

三、李代数求导与扰动模型

BCH 公式与近似形式

SO(3) 中完成两个矩阵乘法时,李代数中 so(3)上发生了什么改变呢?反过来说,当 so(3) 上做两个李代数的加法时,SO(3) 上是否对应着两个矩阵的乘积?如果成立的话,相当于:

exp (ϕ 1 ) exp (ϕ 2 ) = exp ( (ϕ1 + ϕ2) ) .

如果 ϕ1, ϕ2 为标量,那显然该式成立;但此处我们计算的是矩阵的指数函数,而非标量的指数。

在研究下式是否成立:ln (exp (A) exp (B)) = A + B ?

很遗憾,该式在矩阵时并不成立。两个李代数指数映射乘积的完整形式,由 Baker-Campbell-Hausdorff 公式(BCH 公式)给出。由于它完整的形式较复杂,我们给出它展开式的前几项:

其中 [] 为李括号。当处理两个矩阵指数之积时,它们会产生一些由李括号组成的余项。特别地,考虑 SO(3) 上的李代数 ln (exp (ϕ 1 ) exp (ϕ 2 )),当 ϕ1 ϕ2 为小量时,小量二次以上的项都可以被忽略掉。此时,BCH 拥有线性近似表达:

当对一个旋转矩阵 R2(李代数为 ϕ2)左乘一个 微小旋转矩阵 R1(李代数为 ϕ1)时,可以近似地看作,在原有的李代数 ϕ2 上,加上了一项 Jl(ϕ2) 1ϕ1。同理,第二个近似描述了右乘一个微小位移的情况。于是,李代数在 BCH近似下,分成了左乘近似和右乘近似两种,在使用时须加注意,使用的是左乘模型还是右乘模型

书以左乘为例。左乘 BCH 近似雅可比 Jl 事实上就是:

假定对某个旋转 R,对应的李代数为 ϕ。我们给它左乘一个微小旋转,记作 R,对应的李代数为 ϕ。那么,在李群上,得到的结果就是 R · R,而在李代数上,根据 BCH近似,为:Jl 1 (ϕ)∆ϕ + ϕ。合并起来,可以简单地写成:

反之,如果在李代数上进行加法,让一个 ϕ 加上 ϕ,那么可以近似为李群上带左右雅可比的乘法:

这将为之后李代数上的做微积分提供了理论基础。同样的,对于 SE(3),亦有类似的BCH 近似公式:

这里 J l 形式比较复杂,它是一个 6 × 6 的矩阵。由于在计算中不用到该雅可比,故这里略去它的实际形式。

SO(3) 李代数上的求导

SLAM 中要估计一个相机的位置和姿态,该位姿是由 SO(3) 上的旋转矩阵或 SE(3) 上的变换矩阵描述的。不妨设某个时刻小萝卜的位姿为 T。它观察到了一个世界坐标位于 p 的点,产生了一个观测数据 z。那么,由坐标变换关系知:

然而,由于观测噪声 w 的存在,z 往往不可能精确地满足 z = T p 的关系。所以,通常会计算理想的观测与实际数据的误差:

寻找一个最优的 T,使得整体误差最小化:

李代数解决求导问题的思路分为两种:

  1. 用李代数表示姿态,然后对根据李代数加法来对李代数求导。
  2. 对李群左乘右乘微小扰动,然后对该扰动求导,称为左扰动和右扰动模型。

第一种方式对应到李代数的求导模型,而第二种则对应到扰动模型。下面我们来讨论这两种思路的异同。

李代数求导

首先,考虑 SO(3) 上的情况。假设对一个空间点 p 进行了旋转,得到了 Rp。现在,要计算旋转之后点的坐标相对于旋转的导数,不严谨地记为:

按照导数的定义,有:

第二行的近似为 BCH 线性近似,第三行为泰勒展开舍去高阶项后近似,第四行至第五行将反对称符号看作叉积,交换之后变号。于是,推导了旋转后的点相对于李代数的导数:

扰动模型(左乘)

另一种求导方式,是对 R 进行一次扰动 R。这个扰动可以乘在左边也可以乘在右边,最后结果会有一点儿微小的差异,我们以左扰动为例。设左扰动 R 对应的李代数为φ。然后,对 φ 求导,即:

SE(3) 上的李代数求导

给出 SE(3) 上的扰动模型,而直接李代数上的求导就不再介绍了。假设某空间点 p 经过一次变换 T(对应李代数为 ξ),得到 T p。现在,给 T 左乘一个扰动∆T = exp (δξ ),设扰动项的李代数为 δξ = [δρ, δϕ] T,那么:

把最后的结果定义成一个算符 ,它把一个齐次坐标的空间点变换成一个 4 × 6的矩阵。

四、实践:Sophus

git clone https://github.com/strasdat/Sophus.git
cd Sophus
git checkout a621ff

Sophus 本身亦是一个 cmake 工程。想必你已经了解如何编译 cmake 工程了。Sophus 库只须编译即可, 无须安装。

mkdir build
cd build
cmake ..
make
sudo make install

如果遇到了关于fmt的问题:

git clone  https://github.com/fmtlib/fmt.git
cd fmt
mkdir build&&cd build
cmake ..
make
make install

在build文件里面生成useSophus文件运行结果:

2.22045e-16          -1           01 2.22045e-16           00           0           1
SO(3) from quaternion:
2.22045e-16          -1           01 2.22045e-16           00           0           1
they are equal
so3 =      0      0 1.5708
so3 hat=0 -1.5708       01.5708       0      -0-0       0       0
so3 hat vee=      0      0 1.5708
SO3 updated = 0          -1           01           0     -0.00010.0001 2.03288e-20           1
*******************************
SE3 from R,t= 
2.22045e-16          -1           0           11 2.22045e-16           0           00           0           1           00           0           0           1
SE3 from q,t= 
2.22045e-16          -1           0           11 2.22045e-16           0           00           0           1           00           0           0           1
se3 =  0.785398 -0.785398         0         0         0    1.5708
se3 hat = 0   -1.5708         0  0.7853981.5708         0        -0 -0.785398-0         0         0         00         0         0         0
se3 hat vee =  0.785398 -0.785398         0         0         0    1.5708
SE3 updated = 
2.22045e-16          -1           0      1.00011 2.22045e-16           0           00           0           1           00           0           0           1

总结

以上就是今天要讲的内容,本文重点介绍了旋转的表示,但是在 SLAM 中,除了表示之 外,我们还要对它们进行估计和优化。因为在 SLAM 中位姿是未知的,而我们需要解决什么样的相机位姿最符合当前观测数据这样的问题。一种典型的方式是把它构建成一个优化问题,求解最优的 R, t,使得误差最小化。

如前所言,旋转矩阵自身是带有约束的(正交且行列式为 1)。它们作为优化变量时,会引入额外的约束,使优化变得困难。通过李群——李代数间的转换关系,希望把位姿估计变成无约束的优化问题,简化求解方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1076688.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Docker笔记-搭建Python环境、安装依赖、打包镜像、导入镜像、编写bash脚本灵活调用

说明 适合无联网的机器及多Python的机器进行部署。 制作docker版Python环境 有网络及有docker的,拉取指定版本的python如: docker pull python:3.7 安装好后进入容器: docker run -it <name> /bin/bash 使用pip安装各种依赖: pip install <name> pip in…

Python访问数据库

目录 SQLite数据库 SQLite数据类型 Python数据类型与SQLite数据类型的映射 使用GUI管理工具管理SQLite数据库 数据库编程的基本操作过程 sqlite3模块API 数据库连接对象Connection 游标对象Cursor 数据库的CRUD操作示例 示例中的数据表 无条件查询 有条件查询 插入…

重学JavaScript高级(十二):async/await-事件循环-面试高频

async/await-事件循环 前面我们学习了生成器和迭代器&#xff0c;那么在本篇文章中&#xff0c;我们主要讲解生成器与Promise的结合使用&#xff0c;从而引出async/await语法&#xff0c;同时会涉及面试中频次最高的一个知识点&#xff1a;事件循环 生成器与异步处理 首先需要…

【Chrono Engine学习总结】4-vehicle-4.1-vehicle的基本概念

由于Chrono的官方教程在一些细节方面解释的并不清楚&#xff0c;自己做了一些尝试&#xff0c;做学习总结。 1、基本介绍 Vehicle Overview Vehicle Mannel Vehicle的官方demo 1.1 Vehicle的构型 一个车辆由许多子系统构成&#xff1a;悬挂、转向、轮子/履带、刹车/油门、动…

搜索专项---最短路模型

文章目录 迷宫问题武士风度的牛抓住那头牛 一、迷宫问题OJ链接 本题思路:只需要记录各个点是有哪个点走过来的&#xff0c;就能递推得出路径。记录前驱假设从 1,1 这个点向下走到了2, 1&#xff0c;则将2,1这个点的前驱记为1,1。这样&#xff0c;将整张地图 bfs 后&#xff0c…

C++进阶(十五)C++的类型转换

&#x1f4d8;北尘_&#xff1a;个人主页 &#x1f30e;个人专栏:《Linux操作系统》《经典算法试题 》《C》 《数据结构与算法》 ☀️走在路上&#xff0c;不忘来时的初心 文章目录 一、C语言中的类型转换二、为什么C需要四种类型转换三、C强制类型转换1、static_cast2、reint…

【必看】Onlyfans如何使用搜索功能?Onlyfans如何搜索博主?如何在OnlyFans搜索HongkongDoll

1. 什么是Onlyfans OnlyFans是一种内容订阅服务平台&#xff0c;它成立于2016年。 它允许内容创作者在平台上面分享自己的创作&#xff0c;如图片、视频等等&#xff0c;用户需要支付订阅费用才能查看创作者的内容。此外&#xff0c;用户还可以通过打赏的方式来让创作者为自己…

[Python进阶] 制作动态二维码

11.1 制作动态二维码 二维码&#xff08;QR code&#xff09;是一种二维条形码&#xff08;bar code&#xff09;&#xff0c;它的起源可以追溯到20世纪90年代初。当时&#xff0c;日本的汽车工业开始使用一种被称为QR码的二维条码来追踪汽车零部件的信息。 QR码是Quick Respo…

代码随想录算法训练营Day55|392.判断子序列、115.不同的子序列

目录 392.判断子序列 思路 ​算法实现 115.不同的子序列 思路 算法实现 总结 392.判断子序列 题目链接 文章链接 思路 利用动规五部曲进行分析&#xff1a; 1.确定dp数组及其下标含义&#xff1a; dp[i][j] 表示以下标i-1为结尾的字符串s&#xff0c;和以下标j-1为结尾的…

controlnet的模型下载

controlnet模型有sd15和基于sd15上的fp16版本 fp16版本的模型比较小&#xff0c;但功能效果跟sd15是一样的 controlnet的fp16模型下载地址 https://huggingface.co/comfyanonymous/ControlNet-v1-1_fp16_safetensors/tree/main controlnet的openpose里&#xff0c;有个dw_open…

寒假作业

手写盗版微信登入界面 #include "mainwindow.h" #include "ui_mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent), ui(new Ui::MainWindow) {ui->setupUi(this);this->resize(421,575);this->setFixedSize(421,575);th…

AI:126-基于深度学习的人体情绪识别与分析

🚀点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~ 🎉🎊🎉 你的技术旅程将在这里启航! 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带有在本地跑过的关键代码,详细讲解供…

docker常用容器命令

首先说下容器&#xff1a; 它是指当docker运行镜像时&#xff0c;创建了一个隔离环境&#xff0c;称之为 容器。 这种方式优点&#xff1a;可以开启多个服务&#xff0c;服务之前是互相隔离的&#xff08;比如&#xff1a;在一台服务器上可以开启多个mysql&#xff0c;可以是…

2.12 分支、循环练习

1、选择题 1.1、以下程序的输出结果是 A 。 main() { int k11,k22,k33,x15; if(!k1) x--; else if(k2) if(k3) x4; else x3; printf(“x%d\n”,x); } A x4 B x15 C x14 D x3 解析&#xff1a;if(!k1) x--; 检查 k1 是否为0。因为 k1 的值为1&#xff0c;所…

论文阅读-One for All : 动态多租户边缘云平台的统一工作负载预测

论文名称&#xff1a;One for All: Unified Workload Prediction for Dynamic Multi-tenant Edge Cloud Platforms 摘要 多租户边缘云平台中的工作负载预测对于高效的应用部署和资源供给至关重要。然而&#xff0c;在多租户边缘云平台中&#xff0c;异构的应用模式、可变的基…

Netty Review - NioEventLoopGroup源码解析

文章目录 概述类继承关系源码分析小结 概述 EventLoopGroup bossGroup new NioEventLoopGroup(1); EventLoopGroup workerGroup new NioEventLoopGroup();这段代码是在使用Netty框架时常见的用法&#xff0c;用于创建两个不同的EventLoopGroup实例&#xff0c;一个用于处理连…

pycharm控制STM32F103ZET6拍照并上位机接收显示(OV7670、照相机、STM32、TFTLCD)

基于STM32的照相机 准备工作最终效果一、下位机1、主函数2、OV7670初始化 二、上位机1、控制拍照2、接收图片数据 三、资源获取 准备工作 一、硬件及片上资源: 1,串口1(波特率:921600,PA9/PA10通过usb转ttl连接电脑&#xff0c;或者其他方法)上传图片数据至上位机 2,串口2(波特…

文件包含知识点详细总结

如果想看图片和观感更好的话,可以直接去我的github或者gitbook github:https://github.com/kakaandhanhan/cybersecurity_knowledge_book-gitbook.22kaka.fun gitbook:http://22kaka.fun description: 这里将通过参考文章和做题一起进行总结,并且文件包含漏洞,很多都利用了…

【JavaEE】_CSS常用属性

目录 1. 字体属性 1.1 设置字体家族 font-family 1.2 设置字体大小 font-size 1.3 设置字体粗细 font-weight 1.4 设置字体倾斜 font-style 2. 文本属性 2.1 设置文本颜色 color 2.2 文本对齐 text-align 2.3 文本装饰 text-decoration 2.4 文本缩进 text-indent 2.…