Skip to content

4.6.2 特殊特征值问题

4.6.2.1 特征多项式

特征值方程 (4.194) 产生一个齐次方程组, 它仅当

(4.195a)det(AλI)=0

时有非平凡解 x0 . 展开行列式 det(AλI) 得到

det(AλI)=|a11λa12a13a1na21a22λa23a2nan1an2an3annλ|(4.195b)=Pn(λ)=(1)nλn+an1λn1++a1λ+a0=0.

因此特征值行列式等价于一个多项式方程. 这个方程称为特征方程,多项式 Pn(λ) 称为特征多项式. 它的根是矩阵 A 的特征值. 对于任意 n 阶方阵 A ,下列命题成立.

情形 1: 因为 n 次多项式有 n 个根 (若考虑它们的重数),所以矩阵 A(n,n) 恰有 n 个特征值 λ1,λ2,,λn . 实对称矩阵的特征值都是实数,在其他情形特征值也可能是复数.

情形 2: 如果所有 n 个特征值互异,那么矩阵 A(n,n) 恰有 n 个线性无关的特征向量 xi ,它们是方程组 (4.194) 当 λ=λi 时的解.

情形 3: 如果在特征值中 λi 的重数是 ni ,并且矩阵 A(n,n)λiI 的秩等于 ri ,那么对应于 λi 的线性无关的特征向量的个数等于所谓系数矩阵的零化度 nri . 不等式 1nrini 成立,即对于实或复方阵 A(n,n) 存在至少 1 个、至多 n 个实或复的线性无关的特征向量.

A :

(231313524)det(AλI)=|2λ3131λ3524λ|=λ3λ2+2λ=0.

特征值是 λ1=0,λ2=1,λ3=2 . 特征向量由对应的线性齐次方程组确定:

  • λ1=0 :
2x13x2+x3=0,3x1+x2+3x3=0,5x1+2x24x3=0.

用 (例如) 选主元法求得: x1 任意, x2=310x1,x3=2x1+3x2=1110x1 . 若取

x1=10 ,则特征向量是

x1=C1(10311)

其中 C10 是任意常数.

  • λ2=1 : 对应的齐次方程组产生: x3 任意, x2=0,x1=3x2x3=x3 . 若取 x3=1 ,则特征向量是
x2=C2(101)

其中 C20 是任意常数.

  • λ3=2 : 对应的齐次方程组产生: x2 任意, x1=43x2,x3=4x1+3x2= 73x2 . 若取 x2=3 ,则特征向量是
x3=C3(437)

其中 C30 是任意常数.

B:

(301141103)det(AλI)=|3λ0114λ1103λ|=λ3+10λ232λ+32=0.

特征值是 λ1=2,λ2=λ3=4 .

  • λ1=2 : 我们求得: x3 任意, x2=x3,x1=x3 ,并且取 (例如) x3=1 . 于是对

应的特征向量是

x1=C1(111)

其中 C10 是任意常数.

  • λ2=λ3=4 : 我们得到: x3,x3 任意, x1=x3 . 存在两个线性无关的特征向量,例如,当 x2=1,x3=0x2=0,x3=1 时,
x2=C2(010),x3=C3(101),

其中 C20,C30 是任意常数.

4.6.2.2 实对称矩阵、相似变换

在对于实对称矩阵 A 的特殊特征值问题 (4.194) 情形,下列命题成立.

1. 与特征值问题有关的性质

(1) 特征值的个数 矩阵 A 恰有 n 个实特征值 λi(i=1,2,,n) ,这里计数要考虑它们的重数.

(2) 特征向量的正交性 对应于不同的特征值 λiλj 的特征向量 xixj 互相正交,即对于 xixj 的标量积有

(4.196)xiTxj=(xi,xj)=0.

(3) 有 p 重特征值的矩阵 对于重数为 p 的特征值 (λ=λ1=λ2==λp) , 存在 p 个线性无关的特征向量 x1,x2,,xp . 由 (4.194),它们所有非平凡线性组合也是对应于 λ 的特征向量. 应用格拉姆-施密特正交化方法,我们可以从这些组合中选取 p 个使它们互相正交.

综而言之: A 恰有 n 个是实正交特征向量.

  • A=(011101110),det(AλI)=λ3+3λ+2=0 . 特征值是 λ1=λ2=1

λ3=2 .

  • λ1=λ2=1 : 由对应的齐次方程组得到: x1 任意, x2 任意, x3=x1x2 . 首先取 x1=1,x2=0 ,然后取 x1=0,x2=1 ,我们得到线性无关的特征向量 x1=C1(101)x2=C2(011) ,其中 C10C20 是任意常数. - λ3=2 : 我们得到 x1 任意, x2=x1,x3=x1 ,并且取 (例如) x1=1 ,得到特征向量 x3=C3(111) ,其中 C30 是任意常数. 矩阵 A 对称,所以对应于不同的特征值的特征向量正交.

(4) 格拉姆-施密特正交化方法Vn 是任意 n 维欧氏向量空间. 设向量 x1,x2,,xnVn 线性无关,那么存在正交向量组 y1,y2,,ynVn ,它们可以由向量 xi 得到如下:

(4.197)y1=x1,yk=xki=1k1(xk,yi)(yi,yi)(k=2,3,,n).

注 (1) 此处 (xk,yi)=xkTyi 是向量 xkyi 的标量积.

(2) 对应于正交向量组 y1,y2,,yn ,我们得到正交组 x~1,x~2,,x~n ,其中 x~1=y1y1,x~2=y2y2,,x~n=y2yn,yi=(yi,yi) 是向量 yi 的欧氏模. - x1=(011),x2=(101),x3=(110) . 由此可得

y1=x1=(011) 和 x~1=12(011);y2=x2(x2,y1)(y1,y1)y1=(11/21/2) 和 x~2=16(211);

y3=x3(x3,y1)(y1,y1)y1(x3,y2)(y2,y2)y2=(2/32/32/3)x~3=13(111).

2. 主轴变换、相似变换

对于每个实对称矩阵 A ,存在正交矩阵 U 和对角矩阵 D 满足

(4.198)A=UDUT.

D 的对角元素是 A 的特征值,且 U 的列是对应的规范化特征向量. 由 (4.198) 显然有

(4.199)D=UTAU.

(4.199) 称作主轴变换. 这样将 A 归结为对角矩阵 (还可参见第 362 页 4.1.2,2.).

如果方阵 A (不必对称) 通过正则方阵 G 被变换为

(4.200)G1AG=A~,

那么称它是相似变换. 矩阵 AA~ 称为相似,并且它们有下列性质:

(1) 矩阵 AA~ 有相同的特征值,即相似变换不影响特征值.

(2) 如果 A 对称且 G 正交,那么 A~ 对称,还有

(4.201)A~=GTAG, 以及 GTG=I.

关系式 (4.201) 称为正交相似变换. 在此术语下,(4.199) 表明实对称矩阵 A 可以被变换为与某个实对角矩阵 D 正交相似.

4.6.2.3 二次型的主轴变换

1. 实二次型定义

变量 x1,x2,,xn 的实二次型有形式:

(4.202)Q=i=1nj=1naijxixj=xTAx,

其中 x=(x1,x2,,xn)T 是实变量向量,矩阵 A 是实对称矩阵.

如果型 Q 除当 x1=x2==xn=0 情形取值零外只取正值或只取负值, 那么它分别称为正定的或负定的.

Q 称为半正定的或半负定的,如果它所取的非零值仅是正的或仅是负的,并且当非零向量也可能取值零.

实二次型称为不定的,如果它取正值也取负值. 依据 Q 的性状,与它相关的实对称矩阵称为正定的、负定的、半正定的或不定的.

2. 实正定二次型, 性质

(1) 在实正定二次型 Q 中,对应的实对称矩阵 A 的主对角元都是正的,即有

(4.203)aii>0(i=1,2,,n).

(4.203) 表述了正定矩阵的一个很重要的性质.

(2)实二次型 Q 是正定的,当且仅当对应的实对称矩阵 A 的所有特征值是正的.

(3) 设对应于实二次型 Q=xTAx 的矩阵 A 的秩等于 r ,那么二次型可以通过线性变换

(4.204)x=Cx~

化为纯二次项之和, 即所谓标准形

(4.205)Q=x~TKx~=i=1rpix~i2,

其中 pi=(signλi)ki ,并且 k1,k2,,kr 是任意预先给定的正常数.

注 对于任何将秩为 r 的实二次型变换为标准形 (4.205) 的非奇异变换 (4.204), 标准形中正系数个数 p 和负系数个数 q=rp 是不变的 (西尔维斯特惯性定理). 值 p 称为二次型的惯性指数.

3. 标准形的生成

应用变换 (4.205) 的一个实用方法是从主轴变换 (4.199) 得来的. 首先通过正交矩阵 U 实施坐标系的旋转,这里 U 的各列是 A 的特征向量 (即新坐标系的轴的方向是特征向量的方向). 这给出型

(4.206)Q=x~TLx~=i=1rλix~i2.

这里 L 是对角元为 A 的特征值的对角矩阵. 然后通过对角矩阵 D 实施伸缩,这里 D 的对角元是 di=ki|λi| . 于是整个变换由矩阵

(4.207)C=UD

给出, 并且我们得到

Q=x~TAx~=(UDx~)TA(UDx~)=x~T(DTUTAUD)x~(4.208)=x~TDTLDx~=x~TKx~.

注 二次型的主轴变换在二阶曲线和曲面的的分类中起着本质性作用 (参见第 277 页 3.5.2.11 及第 306 页 3.5.3.14).

4. 若尔当标准形

A 是任意 n 阶实或复矩阵,那么存在非奇异矩阵 T 使得

(4.209)T1AT=J,

其中 J 称为 A 的若尔当矩阵或若尔当标准形. 若尔当矩阵有 (4.210) 形式的分块对角结构,其中 J 的元素 Jj 称为若尔当块:

(4.210)J=(J1J2OOJk1Jk).(4.211)J=(λ1λ2OOλn1λn).

它们有下列结构:

(1) 如果 A 只有单特征值 λj ,那么 Jj=λj ,并且 k=n ,即 J 是对角矩阵(4.211).

(2) 如果 λj 是重数为 pj 的特征值,那么存在一个或多个 (4.212) 形式的块:

(4.212)Jj=(λj1λj1OOλj1λj),

这里所有这样的块的大小之和等于 pj ,并且 j=1kpj=n . 若尔当块的精确结构取决于特征矩阵 AλI 的初等因子的结构.

进一步的信息见 [4.18], [19.3](第 1 卷).

4.6.2.4 对于特征值的数值计算的建议

(1) 特征值可以作为特征方程 (4.195b) 的根计算. 为了求出它们必须确定矩阵 A 的特征多项式的系数 ai(i=0,1,2,,n1) . 但是我们必须避开这些计算方法, 因为这些方法是极不稳定的,也就是说,多项式系数 ai 的微小变化会导致根 λj 的大的变化.

(2) 有许多解对称矩阵特征值问题的算法. 它们可区分为两种类型 (见 [4.7]):

a) 变换方法, 例如, 雅可比方法、豪斯霍尔德三对角化、QR 算法.

b) 迭代法, 例如, 向量迭代、瑞利-里茨算法、逆迭代、兰乔斯方法、对分法. 作为例子我们在此讨论米泽斯乘幂法.

(3) 米泽斯乘幂法A 是实对称矩阵,并且只有唯一主特征值. 迭代法确定这个特征值及相应的特征向量. 设主特征值记作 λ1 ,于是

(4.213)|λ1|>|λ2||λ3||λn|.

x1,x2,,xn 是相应的线性无关的特征向量,那么

**a) Axi=λixi(i=1,2,,n) .(4.214)

b) 每个元素 xRn 可以表示为这些特征向量 xi 的线性组合:

(4.215)x=c1x1+c2x2++cnxn(ci 是常数; i=1,2,,n).

在 (4.215) 两边用 Ak 次,那么应用 (4.214) 得到

Akx=c1λ1kx1+c2λ2kx2++cnλnkxn(4.216)=λ1k(c1x1+c2(λ2λ1)kx2++cn(λnλ1)kxn).

由此关系式和 (4.213) 可见当 k 时,

(4.217)Akxλ1kc1x1, 即 Akxc1λ1kx1.

这是下列迭代程序的基础:

步骤 1 选择任意初始向量 x(0)Rn .

步骤 2 迭代计算

(4.218)x(k+1)=Axk(k=0,1,2,;x(0) 给定 ).

由 (4.218) 并且注意 (4.217) 可得到

(4.219)x(k)=Akx(0)c1λ1kx1.

步骤 3 由 (4.218) 和 (4.219) 得到

x(k+1)=Ax(k)=A(Akx(0)),A(Akx(0))A(c1λ1kx1)=c1λ1k(Ax1),c1(λ1kAx1)=λ1(c1λ1kx1)λ1x(k),

因此,

(4.220)x(k+1)λ1x(k),

这就是说,对于大的 k 值相继向量 x(k+1)x(k) 近似地相差一个因子 λ1 .

步骤 4 关系式 (4.219) 和 (4.220) 蕴涵对于 x1λ1

(4.221)x1x(k+1),λ1(x(k),x(k+1))(x(k),x(k)).

例如, 设

A=(3.231.151.771.159.252.131.772.131.56),x(0)=(100).

x(0)

x(1)

x(2)

x(3)

规范化

x(4)

x(5)

规范化

1

3.23

14.89

88.27

1

7.58

67.75

1

0

-1.15

-18.12

-208.03

-2.36

-24.93

-256.85

-3.79

0

1.77

10.93

82.00

0.93

8.24

79.37

1.17

λ1

9.964

10.177

x(6)

x(7)

规范化

x(8)

x(9)

规范化

9.66

96.40

1

10.09

102.33

-38.78

-394.09

-4.09

-41.58

-422.49

(14.1291.229)x1

11.67

117.78

1.22

12.38

125.73

10.16

10.161λ1

注 (1) 因为除常数因子外特征向量是唯一确定的, 所以如例题所示将向量 x(k) 规范化是更为可取的.

(2)具有最小绝对值的特征值及相应的特征向量可以将米泽斯乘幂法应用于 A1 而得到. 如果 A1 不存在,那么 0 就是这个特征值,并且 A 的零空间中的任何向量都可选作相应的特征向量.

(3) A 的其他特征值及相应的特征向量可以通过反复应用下列想法而得到. 选取初始向量与已知向量 x1 正交,并且在这个子空间中 λ2 成为主特征值,这可以应用乘幂法得到. 为了求 λ3 ,初始向量与已知向量必须与 x1x2 正交,等等. 这个方法称为矩阵压缩.

(4) 基于 (4.218), 乘幂法有时称作向量迭代.

version 1.24.0