矩阵若尔当标准型解法的探讨与应用
2024-01-07孙华
摘要:本文比较了求解矩阵若尔当标准型的四种方法,即初等变换法、行列式因子法、特征向量法和求特征值法的优劣。特别地,利用相似变换求解出了一类2n阶矩阵的若尔当标准型。
關键词:矩阵;若尔当标准型;相似变换
一、初等矩阵及相似变换
(一)初等变换
下面三种变换称之为矩阵的初等变换:(1)非零数k乘以矩阵某一行(列)中的所有元素;(2)把矩阵的某一行(列)所有元素的k倍加到另一行(列)对应元素上去;(3)对换矩阵的两行(列)。
(二)初等矩阵
由单位矩阵E经过一次初等变换得到的矩阵称为初等矩阵,初等矩阵分为三类:第一类是互换矩阵E的第k行和第j行元素(第k列和第j列元素),记为Pjk;第二类为用数域K中的非零数c乘E的i行(非零数c乘E的i列),记为Pi(c);第三类是把矩阵E的第k行的γ倍加到第j行(把矩阵E的第j列的γ倍加到第k列),记为Pjk(γ)。研究一般的可逆线性变换可以转化为研究初等变换。相似变换是一些特殊的初等变换的合成,矩阵在相似变换下保留了原有的一些很好的性质。因此,初等变换、初等矩阵以及相似变换在线性代数研究中起着非常重要的作用。
(三)矩阵的特征值与特征向量
矩阵的特征值与特征向量是线性代数中非常重要的一部分内容,在工程技术中有广泛的应用。
定义1[1]:一个n级复矩阵A,如果存在数λ和非零n维列向量x使得关系式Ax=λx成立,则称λ为矩阵A的特征值,向量x为矩阵A对应特征值λ的特征向量,称det(λE-A)为矩阵A的特征多项式,其中det(λE-A)表示矩阵λE-A的行列式。
(四)矩阵的相似
对于矩阵A,如果存在可逆矩阵P使得P-1AP=B,则称A与B相似,也称从矩阵A到矩阵B的相似变换。而可逆矩阵P可写成一些初等矩阵的乘积,特别地,如果P就是一个初等矩阵,则称矩阵A到矩阵B的一个初等相似变换。
二、矩阵的若尔当标准型
形式为J(λ,t)=λ0…000
1λ…000
00…1λ0
00…01λ的矩阵称之为t级若尔当块(其中λ是复数)。即若尔当块矩阵对角线上为相同的复数λ,下方(或上方)次对角线上全为1,其余元素全为0。
由若干个若尔当块组成的准对角矩阵称之为若尔当标准型,其一般形式为A1
A2
As,其中Ai=λi
1λi
1
λi
1λi,并且λ1,λ2,…,λs中有一些可以相等。
下面我们给出矩阵若尔当标准型的五种方法。首先我们介绍一些相关的定义。对于矩阵A,称λE-A为A的λ矩阵。
定义2[1]:设λ矩阵A(λ)的秩为r,对于正整数k,1
r,A(λ)的全部k阶子式的首一最大公因式Dk(λ)称为A(λ)的k阶行列式因子。令d1(λ)=D1(λ),d2(λ)=D2(λ)D1(λ),…,dn(λ)=Dn(λ)Dn-1(λ),则d1(λ),d2(λ),…dr(λ)称为λ矩阵A(λ)的不变因子。把矩阵A的每个次数大于零的不变因子分解成互不相同的首项为1的一次因式方幂的乘积,所有这些一次因式方幂称为矩阵A的初等因子。下面给出求解矩阵若尔当标准型的方法。
方法一(初等变换法[1]):
第一步:通过其对应λ矩阵的初等变换求出矩阵A的初等因子;第二步:写成每个初等因子对应的若尔当块;第三步:写出若尔当标准型。
例1.求矩阵A=-1-26
-103
-1-14的若尔当标准型。
解:由于:
λE-A=λ+12-6
1λ-3
11λ-4→100
0λ-10
00(λ-1)2
从而可得矩阵A的初等因子为(λ-1),(λ-1)2。(λ-1)对应的若尔当块为J(1,1)。(λ-1)2对应的若尔当块为J(1,2)。因此,A的若尔当标准型为100
011
001。
对于阶数较低且数字较小的矩阵可通过该种方式,其λ矩阵可经过有限次初等变换变为对角型矩阵,然后直接写出初等因子。当矩阵的阶数很高或者矩阵很复杂,则该方式的计算量过于复杂,不可取。因此初等变换法适用于较为简单的矩阵的若尔当标准型的求解。
方法二(行列式因子法[1]):
第一步:先求出λE-A的n个行列式因子式Dk(λ),1
n;第三步:求出矩阵A的初等因子,以及若尔当标准型。
例2.求矩阵A=1234
0123
0012
0001的若尔当标准型。
解:因为λE-A=λ-1-2-3-4
0λ-1-2-3
00λ-1-2
000λ-1,则D4(λ)=det(λE-A)=(λ-1)4,又因为在λE-A中有三阶子式-2-3-4
λ-1-2-3
0λ-1-2=-4λ(λ+1)且D3(λ)整除每个三阶子式,且为D3(λ)D4(λ),所以D3(λ)=1,从而D2(λ)=D1(λ)=1,于是得A的不变因子为d1(λ)=d2(λ)=d3(λ)=1,d4(λ)=(λ-1)4,即A只有一个初等因子(λ-1)4,故A的若尔当标准形为11
11
11
1。
该方法实用于比较特殊的矩阵的若尔当标准型的求法,该例题发现了一个三阶子式为-4λ(λ+1)而D4(λ)=(λ-1)4,D3(λ)是-4λ(λ+1)的因子,又因为D3(λ)是D4(λ)的因子,从而得出了D3(λ)=1,于是可直接得出结果。但是一般情况下Dn-1(λ)不等于1,这就需要计算D1(λ),D1(λ),…,Dn-1(λ),如果该矩阵阶数较高,这一过程非常复杂,亦不可取。
方法三(特征向量法[2]):
第一步:按重数求出矩阵所有的特征值;第二步:找出每个特征值线性无关的特征向量。
如果λi是矩阵A的单特征值,则对应一阶若尔当块,如果λi是矩阵A的ri(ri>1)重特征值,则对应λi有几个线性无关的特征向量就有几个以λi为对角元素的若尔当块,这些若尔当块阶数之和等于ri。
例3.求矩阵A=31-1
-202
-1-13的若尔当标准型。
解:令|λE-A|=0,解得λ1=λ2=λ3=2,对应的线性无关的特征向量为(-1,1,0)T和(1,0,1)T,故A的若而当标准型为200
021
002。
特征向量法的计算比较简单,但是当阶数较高时对应的若尔当块阶数可能无法确定,因此特征向量法也有一定的局限性,适合处理低阶且较为简单的矩阵。
方法四(求特征值法[3]):
第一步:求出矩阵的特征值;第二步:求出每一个特征值的几何重数(代表该特征值对应的若尔当块的个数)=特征矩阵的列数减去特征矩阵的秩;第三步:求出每一个特征值对应的若尔当块的最大阶数以及块数。具体过程如下:对于n阶矩阵A,若得到rank(λiE-A)=s1,rank(λiE-A)2=s2,rank(λiE-A)3=s3,…,rank(λiE-A)l=sl,rank(λiE-A)l+1=sl,則对于λ=λi的若尔当块数情况分析如下:共有n-s1个若尔当块,其中阶数最高的为l阶。阶数大于等于2的若尔当块有s1-s2个,阶数大于等于3的若尔当块有s2-s3个,阶数大于等于4的若尔当块有s3-s4个,…,阶数等于l阶的若尔当块有sl-1-sl个。
例4.求矩阵A=2-11-1
22-1-1
12-12
0003的若尔当标准型。
解:令|λE-A|=0,解得λ1=λ2=λ3=1,λ4=3,对于特征值为1的若尔当块有如下分析:rank(E-A)=3,rank(E-A)2=2,rank(E-A)3=1,rank(E-A)4=1,从而特征值为1的若尔当块仅有一块,且最高阶数为3,且阶数大于等于2的若尔当块仅有一块,阶数等于3的若尔当块也仅有一块。由于A是4阶矩阵,从而可得A的若尔当标准型为11
11
1
3。
该方法适合求低阶及高阶矩阵的若尔当标准型,但当遇到n阶矩阵时,求解其特征值过程可能会非常复杂,因此该方法在某种程度上也存在一定的局限性。
本文最后,我们将给出求解幂零矩阵若尔当标准型的一种特有的方法。
总结:理论上,方法一对于任意的有限阶矩阵都可用,但是对于高阶矩阵,求初等因子的过程就比较复杂。方法二适用于比较特殊的矩阵,如易求得Dn-1(λ)=1,此时只需求出该λ矩阵的行列式就可得到不变因子,对于一般的矩阵,如果Dn-1(λ)不等于1,此时方法二的计算量会很大,特别对于高阶矩阵。方法三在处理高阶若尔当块的时候特征向量的计算量较大,因此一般不可取。方法四从计算过程的角度可以解决一般的矩阵,也可用来处理高阶矩阵,但是当矩阵的阶数不确定时,矩阵的特征值不一定可以确定。以上几种方式都适合处理低阶矩阵或者有限阶矩阵的若尔当标准型,一般情况下求解n阶若尔当标准型比较困难。但是如果该矩阵比较特殊,则我们可以先尝试能否通过初等相似变换把该矩阵简单化。
本文最后,我们给出了一类2n阶矩阵的若尔当标准型的求解过程。
例5.令:
n-1的若尔当标准型,其中an-l=0,当j≠n-l时,aj≠0,bl=0,当j≠l时,bj≠0,并且有
bl+1bl+2…bn-1bn+a1a2…an-l-1an=0。
分析:Al为2n×2n阶分块矩阵,n是一个不确定的正整数。当n=2或者n=3时Al分别为4阶和6阶矩阵,其若尔当标准型可以通过以上几种方法求解,当n4时通过以上方法计算比较复杂。但是通过观察Al的结构,我们首先把分块Xl和Zl中的an和bn去掉,于是对Al作初等相似变换,目的就是把Al化简。
结论
计算高阶或者阶数不确定的矩阵的若尔当标准型时,如果用以上几种方法操作起来比较复杂,则可以考虑把该矩阵先通过初等相似变换转换成比较简单的矩阵再利用以上方法求解。
参考文献:
[1]北京大学数学系几何与代数教研室前代数小组.高等代数[M].王萼芳,石生明,修订.北京:高等教育出版社,2003.
[2]徐仲,张凯院,陆全,等.矩阵论简明教程[M].第二版.科学出版社,2010.
[3]史荣昌,魏丰.矩阵分析[M].北京理工大学出版社,2010.
作者简介:孙华(1989—),男,汉族,重庆人,博士,讲师,研究方向:代数学。