Skip to content

5.3.6 李群和李代数

5.3.6.1 引言

李群和李代数是以挪威数学家索弗斯·李 (Sophus Lie, 1842-1899) 命名的. 本章只考虑矩阵的李群, 因为它们在应用中最重要. 矩阵李群的主要例子是:

  • 正交矩阵群 O(n) ,

  • 行列式为 +1 的正交矩阵 (即 Rn 中刻画旋转的正交矩阵) 形成的子群 SO(n) .

  • 刻画多体运动的欧几里得群 SE(n) .

这些群在计算机制图和机器人理论中有许多应用.

李群和对应的李代数间最重要的关系将借助指数映射刻画. 这个关系可通过下列例子说明.

  • 一阶微分方程或微分方程组的初值问题的解可以应用指数函数确定.

对于 y=y(t) 的初值问题 (5.143a),有下列解 (5.134b):

(5.134a)dydx=xy(x 是常数 ),y(0)=y0,(5.134b)y(t)=exty0.

类似地,对于未知向量 y=y(t) 的具有常系数矩阵 X 的一阶微分方程组,初值问题(5.135a)

(5.135a)dydt=(dy1dt,dy2dt,,dyndt)T=Xy(X 是常数矩阵 ),y(0)=y0,

有含矩阵指数函数 etX 的解 (5.135b):

(5.135b)y(t)=eXty0,etX=k=01k!tkXk=In×n+k=11k!tkXk.

对于给定的(n, n)方阵 X 特殊的矩阵指数函数 etX ,有下列性质:

  • e0X=I(n,n) ,其中 I(n,n) 表示单位矩阵.

  • etX 可逆,因为 detetX=etTrX0 .

  • 对于每个 t1,t2R,et1Xet2X=e(t1+t2)X=et2Xet1X ,但一般地, eX1eX2eX2eX1eX1+X2.

  • 特别地, etXetX=etXetX=I(n,n) .

  • ddtetX|t=0=XetX|t=0=X .

因此,元素 etX (对于固定的 X ) 对于矩阵乘法形成一个乘法群. 因为 tR , 所以矩阵 etX 形成一维群. 同时它是李群的最简单的例子. 我们将证明矩阵 XtX 是属于这个李群的李代数的元素 (参见第 477 页 5.3.6.4). 于是指数函数生成李代数的元素形成的李群.

5.3.6.2 矩阵李群

对于矩阵李群不必一般地定义李群. 对于一般的李群必须引进可微流形, 在此则不需要. 对于矩阵李群, 下列的定义是重要的, 同时在进一步的讨论中主要的论题是一般线性群.

1. 一般线性群

(1)群 群 (参见第 451 页 5.3.3) 是一个具有映射

(5.136a)G×GG,(g,h)gh

的集合, 这个映射称为群运算或群乘法, 有下列性质:

  • 结合律: 对于每个 g,h,kG ,
(5.136b)g(hk)=(gh)k
  • 恒等元的存在性: 存在元素 eG 使得对于每个 gG ,
(5.136c)ge=eg=g;
  • 逆元的存在性: 对于每个 hG ,存在元素 hG 使得
(5.136d)gh=hg=e.

注 1 如果对于每个 g,hG,gh=hg ,那么称群是交换的. 矩阵群在此认为是非交换的. 显然从定义可推出群的两个元素之积也属于这个群, 因此群对于群乘法是封闭的.

注 2 设 Mn(R) 是所有(n, n)实元素矩阵的向量空间. 显然 Mn(R) 关于矩阵乘法不是一个群,因为并非每个(n, n)矩阵都是可逆的.

(2)一般线性群的定义 所有实可逆(n, n)矩阵显然对于矩阵乘法形成一个群, 称为一般线性群,并且记为 GL(n,R) .

2. 矩阵李群

(1) 矩阵的收敛性 矩阵 Am=(akl(m))k,l=1n 的序列 {Am}m=1 (其中 Am Mn(R)) 收敛于(n, n)矩阵 A ,如果每个元素序列 {akl(m)}m=1 在实数收敛的意义下收敛于对应的矩阵元素 akl .

(2) 矩阵李群的定义 矩阵李群是 GL(n,R) 的具有下列性质的子群 G : 设 {Am}m=1 是任意一个 G 中矩阵的序列,在 Mn(R) 中收敛的意义下收敛于矩阵 AMn(R) ,那么或者 AG ,或者 A 不可逆.

这个定义也可用下列方式叙述: 矩阵李群是一个子群,它是 GL(n,R) 的闭子集 (这并不意味着 G 必须在 Mn(R) 中闭).

(3) 矩阵李群的维数 矩阵李群的维数定义为对应的李代数的维数 (参见第 477 页 5.3.6.4). 矩阵李群 GL(n,R) 有维数 n2 .

3. 连续群

矩阵李群也可以借助连续群 (见 [22.26], [5.18], [5.15]) 引进.

(1)定义 连续群是一个特殊的无限群,其元素唯一地由连续参数向量 φ= (φ1,φ2,,φn) 给出:

(5.137)a=a(φ).
  • R2 中的旋转矩阵群 (参见第 308 页 (3.432)):
(5.138)D=(cosφsinφsinφcosφ)=a(φ),0φ2π.

群元素仅与一个实参数 φ 有关.

(2) 积 元素为 a=a(φ) 的连续群中两个元素 a1=a(φ1),a2=a(φ2) 的积由

(5.139a)a1a2=a3=a(φ3)

给出其中

(5.139b)φ3=f(φ1,φ2),

这里 f(φ1,φ2) 的分量是连续可微函数.

如 (5.138) 中的两个旋转矩阵 a=a(φ1)a=a(φ2) (其中 0φ1,φ22π ) 之积是 a3=a(φ1)a(φ2)=a(φ3) ,其中 φ3=f(φ1,φ2)=φ1+φ2 . 应用 Falk 格式 (参见第 366 页 4.1.4, 5.) 以及加法定理可得

a(φ2)a(φ1)a(φ3)=a(φ1+φ2),

或详细地,

cosφ2

sinφ2

sinφ2

cosφ2

cosφ1

sinφ1

cosφ1cosφ2sinφ1sinφ2

cosφ1sinφ2sinφ1cosφ2

sinφ1

cosφ1

sinφ1cosφ2+cosφ1sinφ2

sinφ1sinφ2+cosφ1cosφ2

(3) 维数 参数向量 φ 是称作参数空间的向量空间的元素. 在这个参数空间中存在一个区域作为连续群的定义域, 将它称为群空间. 这个群空间的维数考虑为连续群的维数.

A : 实(n, n)可逆方阵的群有维数 n2 ,因为方阵的每个元素都可考虑为参数.

B : (5.138) 中旋转矩阵群 (对于矩阵乘法) D 有维数 1. 旋转矩阵是(2,2)型的,但它的 4 个元素只与一个参数 φ(0φ2π) 有关.

4. 李群

(1)李群的定义 李群是一个连续群, 其中群的所有元素是参数的连续函数.

(2)特殊的矩阵李群及其维数

A: 旋转 R 的群 SO(n) 旋转 R 的群 SO(n) 用矩阵乘法依照 x=RxRn 作用在元素 xRn 上. SO(n) 是一个 n(n1)/2 维李群.

B: 特殊欧几里得群 SE(n) 特殊欧几里得群 SE(n) 由元素 g=(R,b) 组成,其中 RSO(n) ,以及 bRn ,并且群乘法 g1g2=(R1R2,R1b2+b1) . 它依照

(5.140)x=Rx+b

作用于欧几里得空间 Rn 的元素. SE(n)n 维欧几里得空间中刚体运动群,是一个 n(n+1)/2 维李群. SE(n) 的离散子群是,例如,晶体空间群即正则晶体格的对称群.

C: 标度欧几里得群 SIM(n) 标度欧几里得群 SIM(n) 由所有的对 (eaR,b) 组成,其中 aR,RSO(n),bRn ,群乘法 g1g2=(ea1+a2R1R2,R1b2+b1) . 它通过平移、旋转和伸缩 (即伸长和收缩) 作用于 Rn 的元素:

(5.141)x=eaRx+b.

标度欧几里得群有维数 1+n(n+1)/2 .

D: 实特殊线性群 SL(n,R) 实特殊线性群 SL(n,R) 由所有行列式为 +1 的 (实)(n, n)矩阵组成. 它通过旋转、畸变和切变以 x=Lx 作用于 Rn 的元素,使得体积保持不变,并且平行线仍然保持平行. 其维数是 n21 .

E: 特殊仿射群 Rn 的特殊仿射群由所有的对 (eaL,b) 组成,其中 LSL(n)bRn ,通过旋转、平移、切变、畸变和伸缩作用于 Rn 的个体. 这个李群是欧氏空间中最一般的将平行线映为平行线的形变群; 它有维数 n(n+1) .

F: 群 SO(2)SO(2) 刻画 R2 中所有绕原点的旋转:

(5.142)SO(2)={(cosφsinφsinφcosφ),φR}.

G: 群 SL(2) SL(2)的每个元素可表示为

(5.143)(cosφsinφsinφcosφ)(et00et)(1ξ01).

H: 群 SE(2)SE(2) 的元素可以表示为(3,3)矩阵:

(5.144)(cosθsinθx1sinθcosθx2001), 其中 θR,x=(x1x2)R2.

注 除实矩阵李群外,也可以考虑复矩阵李群. 例如, SL(n,C) 是所有行列式为 +1 的复(n, n)矩阵形成的李群. 类似地,存在元素是四元数的矩阵李群.

5.3.6.3 重要应用

1. 刚体运动

SE(3) 是欧氏空间 R3 中的刚体运动群. 这就是它经常应用于机器人控制的原因. 通常定义下列 6 个独立的变换:

a) x 方向平移;

b) y 方向平移;

c) z 方向平移;

d) 绕 x 轴旋转;

e) 绕 y 轴旋转;

f) 绕 z 轴旋转.

这些变换可以通过应用于三维齐次坐标 (参见第 310 页 3.5.4.2) 的(4,4)矩阵来表示,即 (x,y,z)TR3 表示为具有 4 个坐标的向量(x, y, z,1).

对应于变换 a)f) 的矩阵是

M1=(100a010000100001),M2=(1000010b00100001),M3=(10000100001c0001),

(5.145a)

M4=(10000cosαsinα00sinαcosα00001),M5=(cosβ0sinβ00100sinβ0cosβ00001),(5.145b)M6=(cosγsinγ00sinγcosγ0000100001)

矩阵 M4,M5,M6 刻画 R3 中的旋转,因此 SO(3)SE(3) 的子群. 群 SE(3) 如下地作用在有齐次坐标 (x,1)Tx=(x,y,z)TR3 上:

(5.146)(x1)=(Rv01)(x1)=(Rx+v1),

其中 RSO(3) 是旋转, v=(a,b,c)T 是平移向量.

2. 2维空间的仿射变换

2维空间的仿射变换群 GA(2) 是具有下列 6 个维的六维矩阵李群:

a) x 方向平移;

b) y 方向平移;

c) z 方向平移;

d) 对于原点的伸长和收缩;

e) 切变 (对于 y ,对于 x 的伸长);

f) 与 (第)5(维) 有关的 45 切变.

这些变换也可用 (x,y)TR2 的齐次坐标 (x,y,1)T 的矩阵刻画:

M1=(10a010001),M2=(10001b001),M3=(cosαsinα0sinαcosα0001),

(5.147a)

M4=(eτ000eτ0001),M5=(eμ000eμ0001),(5.147b)M6=(coshνsinhν0sinhνcoshν0001)

这个群以由 M1M2 给出的平移群, M1,M2M3 给出的欧几里得群 SE(2) , 以及 M1,M2,M3,M4 给出的相似群作为本质子群.

应用 群 GA(2) 可用来刻画平面个体的所有这种变换: 在微小的角度形变下它被在 3 维空间中移动的照相机记录. 如果透视角也可能出现大的变化, 那么可应用群 P(2) ,即所有射影空间变换的群. 矩阵李群由 M1M6 及另两个矩阵

(5.147c)M7=(100010β01),M8=(1000100γ1)

生成. 这两个增加的群对应于水平线的变化或平面图形的边缘的消失.

5.3.6.4 李代数

1. 实李代数

实李代数是一个具有称作李括号的运算

(5.148)[,]:A×AA

的实向量空间,这个运算具有下列性质: 对于所有 a,b,cA

  • [,] 是线性的;

  • [a,b]=[b,a] ,即这个运算是斜对称的或反对称的;

  • 所谓雅可比恒等式成立 (作为丧失结合性的替代物)

(5.149)[a,[b,c]]+[c,[a,b]]+[b,[c,a]]=0.

显然 [a,a]=0 成立.

2. 李括号

对于 (实)(n, n)矩阵 XY ,李括号由换位子给出,即

(5.150)[X,Y]=XYYX.

3. 特殊的李代数

存在与矩阵李群相伴的李代数.

(1) 函数 g:RGL(n)GL(n) 的单参数子群,如果

  • g 是连续的;

  • g(0)=I(n,n);

  • 对所有 t,sR,g(t+s)=g(t)g(s) .

特别地:

(2) 如果 gGL(n) 的单参数子群,那么存在一个唯一定义的矩阵 X 使得

(5.151)g(t)=etX(参见第 472 页 5.3.6.1).

(3) 对于任何(n, n)矩阵 A ,对数 logA 定义为

(5.152)logA=m=1(1)m+1m(AI)m,

如果这个级数收敛. 特别,当 AI∥<1 时此级数收敛.

4. 李群与李代数间的对应

矩阵李群与相伴的李代数间的对应如下.

(1) 设 G 是矩阵群. G 的李代数 (记作 g ) 是所有使得 etXG (对所有实数 t) 的矩阵 X 的集合.

在给定的矩阵李群中接近于单位矩阵的元素可以表示为 g(t)=etX ,其中 X g ,而 t 接近于零. 如果指数映射是满射,例如当 SO(n)SE(n) 情形,那么可以借助对应的李代数的元素的矩阵指数函数将群元素参数化. 矩阵 dgdtg1g1dgdt 分别称为 gG 的切向量或切元素. 对 t=0 计算这些元素,我们得到 X 本身,即 g 是恒等矩阵 I 的切空间 TIG .

(2) 可以证明这样设计的李群的李代数也是抽象意义下的李代数.

G 是一个矩阵李群,相伴矩阵李代数是 g,XYg 的元素. 那么:

  • 对于任何实数 s,sXg ;

  • X+Yg ;

  • [X,Y]=XYYXg . A: 与李群 SO(2) 相伴的李代数 so(2) 可以从元素用 SO(2) 的表示 g(θ)= (cosθsinθsinθcosθ) 借助于切元素算出:

(5.153a)dgdθg1|θ=0=(sinθcosθcosθsinθ)(cosθsinθsinθcosθ)|θ=0=(0110).

因此,

(5.153b)so(2)={s(0110),sR}.

反之,从 X=(0110) 得到

(5.153c)esX=coss(1001)+sins(0110)=(cosssinssinscoss).

B: 下列矩阵形成李代数 so(3) 的基:

(5.154)X1=(001001010),X2=(001000100),X3=(010100000).

注 指数映射 so(3)SO(3)se(3)SE(3) 蕴涵 (多值) 对数函数的存在性. 不过这个对数函数可应用于插值.

例如,如果给定刚体运动 B1,B2SE(3) ,那么可以算出 logB1,logB2 是李代数 so(3) 的元素. 于是取这些对数间的线性插值 (1t)logB1+tlogB2 ,然后应用指数映射以便由

(5.155)exp((1t)logB1+tlogB2)

得到刚体运动 B1B2 间的插值.

C : 与矩阵李群 SE(3) 相伴的矩阵李代数 se(3) 由矩阵

E1=(0001000000000000),E2=(0000000100000000),E3=(0000000000010000),

(5.156a)

E4=(0000001001000000),E5=(0010000010000000),E6=(0100100000000000)

(5.156b)

生成.

5. 内积空间

如果适当地定义内积 (标量积), 那么对于给定的有限维矩阵李群总可能找到相伴李代数的正交基. 在此情形应用格拉姆-施密特正交化方法 (参见第 424 页 4.6.2.2, (4)可由李代数的任何一组基得到正交基.

在实矩阵李群的情形李代数由实矩阵组成, 所以内积由

(5.157)(X,Y)=12Tr(XWYT)

给出,其中 W 是一个正定实对称矩阵.

A: 刚体运动群 SE(2) 可以参数化为

(5.158a)g(x1,x2,θ)=ex1X1+x2X2eθX3=(cosθsinθx1sinθcosθx2001),

其中

(5.158b)X1=(001000000),X2=(000001000),X3=(010100000).

这里 X1,X2,X3 对于由权矩阵

(5.158c)(100010002)

给出的内积形成李代数 se(2) 的正交基.

B: 李代数 sl(2,R) 的一组基是

(5.159)X1=(0110),X2=(1001) 和 X3=(0110).

这些元素对于权矩阵 W=I(2,2)=(1001) 形成正交基.

5.3.6.5 在机器人理论中的应用

1. 机器人运动

刻画 R3 中机器人运动的特殊欧几里得群 SE(3) 是群 SO(3) (绕原点的旋转) 和 R3 (平移) 的半直接积:

(5.160)SE(3)=SO(3)×R3.

在直接积中因子没有交互作用, 但这里是半直接积, 因为旋转在平移上的作用显然是从矩阵乘法得到

(5.161)(R2t201)(R1t101)=(R2R1R2t1+t201),

即加第二个平移向量前第一个平移向量已被旋转.

2. 沙勒定理

这个定理说每个不纯粹是平移的刚体运动可以刻画为 (有限的) 螺旋运动. 一个沿着经过原点的轴的 (有限的) 螺旋运动有形式

(5.162a)A(θ)=(Rθp2πx01)

其中 x 是旋转轴方向的单位向量, θ 是旋转角, p 是角系数. 因为 x 是旋转轴,所以 Rx=x ,即 x 是矩阵 R 属于单位特征值 1 的特征向量.

当旋转轴不经过原点,那么在旋转轴上选择一个点 u ,它被转移到原点,那么经螺旋运动后它被转回:

(5.162b)(Iu01)(Rθp2πx01)(Iu01)=(Rθp2πx+(IR)u01).

沙勒定理告诉我们任意刚体运动可以用上面形式给出,即对于给定的 R,t 和适当的

pu ,有

(5.163)(Rt01)=(Rθp2πx01)

设从 R 已经知道旋转角 θ 和旋转轴 x ,那么有

(5.164)θp2π=xt

所以可以算出角系数 p . 于是线性方程组

(5.165)(IR)u=θp2πxt

的解给出 u . 这是奇异方程组,其中 x 是它的核. 因此除相差 x 的某个倍数外解 u 是唯一确定的. 为确定 u ,要求 u 垂直于 x 是合理的. 当刚体运动是纯粹的旋转时, 则不可能确定适当的向量 u .

3. 机械联结

一个自由度的联结可以由群 SE(3) 的单参数子群表示. 对于一般螺旋联结情

形对应的子群是

(5.166)A(θ)=(Rθp2πx+(IR)u01),

其中 x 是旋转轴, θ 是旋转角, p 给出角系数,而 u 是旋转轴上的任意一点.

最常出现的一类联结是旋转联结, 它可以由下列子群刻画:

(5.167)A(θ)=(R(IR)u01)

对应于移位联结的子群是

(5.168)A(θ)=(Iθt01)

其中 t 刻画移位方向.

4. 前向运动学

工业机器人情形的目标是最终效应器的运动和控制, 这是由运动链的联结完成的. 如果所有的联结都是单参数的并且机器人 (例如) 由 6 个联结组成, 那么机器人的每个位置可以由联结变量 θT=(θ1,θ2,θ3,θ4,θ5,θ6) 刻画. 机器人的输出状态由零向量刻画. 那么机器人的运动可这样刻画: 首先使最远的联结与最终效应器一起开动并且这个运动由矩阵 A(θ6) 给出. 现在使第 5 个联结开动. 因为这个联结的轴不可能受到最后一个联结的运动的影响,所以这个运动由矩阵 A(θ5) 给出. 于是使所有联结开动, 并且最终效应器的完整运动由

(5.169)K(θ)=A1(θ1)A2(θ2)A3(θ3)A4(θ4)A5(θ5)A6(θ6)

给出.

5. 向量积和李代数

螺旋运动由

(5.170)A(θ)=(Rθp2πx+(IR)u01)

给出,并且它表示通过角 θ 参数化的刚体运动. 显然, θ=0 给出恒等变换. 如果算出在 θ=0 时的导数,即当恒等变换时的导数,那么李代数的一般元素如下:

(5.171a)S=dAdθ|θ=0=(dRdθθp2πxdRdθu00)|θ=0=(Ωθp2πxΩu00),

其中 Ω=dRdθ(0) 是斜对称矩阵. 可以证明 R 是正交矩阵,那么有 RRT=I 以及 RTR=I ,因而

(5.171b)ddθ(RRT)=dRdθRT+RdRTdθ=dIdθ=0.

因为当 θ=0R=I ,所以

(5.171c)dRdθ(0)+dRTdθ(0)=0.

于是每个斜对称矩阵

(5.171d)Ω=(0ωzωyωz0ωxωyωx0)

可以等同于向量 ωT=(ωx,ωy,ωz) . 这样,用矩阵 Ω 乘任何三维向量 p 对应于与向量 ω 的向量积:

(5.171e)Ωp=ω×p

从而 ω 是辐角为 ω 的刚体运动的角速度. 因此李代数 se(3) 的一般元素有形式

(5.171f)S=(Ωv00)

这些矩阵形成一个六维向量空间, 它们通常等同于形如

(5.172)s=(ωv)

的六维向量.

version 1.24.0