本文主要讲矩阵对角化的证明及应用。
矩阵对角化条件
定义一:若存在可逆矩阵SSS,使得S−1ASS^{-1}ASS−1AS为对角矩阵,则称为矩阵AAA是可对角化的(diagonalized)。
设n×nn\times nn×n矩阵有nnn个线性无关的特征向量x1,...,xnx_1,...,x_nx1,...,xn,令S=(x1,...,xn)S =(x_1,...,x_n)S=(x1,...,xn),则:
AS=A(x1,...,xn)=(λ1x1,...,λnxn)=(x1,...,xn)(λ1...λn)AS = A(x_1,...,x_n) = (\lambda _1 x_1,...,\lambda_n x_n ) = (x_1,...,x_n)\begin{pmatrix}\lambda_1 & & \\\\ & ... & \\\\ & & \lambda_n\end{pmatrix}AS=A(x1,...,xn)=(λ1x1,...,λnxn)=(x1,...,xn)⎝⎜⎜⎜⎜⎛λ1...λn⎠⎟⎟⎟⎟⎞
AS=SΛ⇒S−1AS=ΛAS = S\Lambda \Rightarrow S^{-1}AS = \LambdaAS=SΛ⇒S−1AS=Λ
A
定义二:n×nn \times nn×n矩阵AAA可对角化的充要条件是AAA有nnn个线性无关的特征向量。
那么什么样的方阵有线性无关的特征向量呢?
定义三:λ1,..,λn\lambda_1,..,\lambda_nλ1,..,λn是矩阵AAA的互异特征值,x1,...,xnx_1,...,x_nx1,...,xn是相应的特征向量,则x1,...,xnx_1,...,x_nx1,...,xn线性无关。
可利用vandermonde行列式证明
可用反证法证明
同一个特征值对应的特征向量不一定都线性无关。
定义四:若n×nn\times nn×n矩阵有nnn个互异的特征值,则矩阵可以对角化。
但若矩阵有相同的特征值,也可能可以对角化。
思考
矩阵可对角化和矩阵可逆有什么关系吗?
没有明显关系。
若矩阵可对角化,不一定可逆。
例如,全一矩阵(实对称矩阵)可对角化,但不可逆。因为特征值为0在可对角化中是允许的。
若矩阵可逆,不一定可对角化。
例如,将单位矩阵的任意非零元变为1,则依然可逆,但不可对角化。
若nnn阶矩阵AAA与BBB相似,则AAA与BBB特征多项式相同。
相似矩阵特征值相同。
相似矩阵行列式相同。
具有相同的可逆性。
几何重数与代数重数
定义:设det(A−λI)=(λ1−λ)n1...(λk−λ)nkdet(A - \lambda I) = (\lambda_1 - \lambda)^{n_1} ... (\lambda_k - \lambda)^{n_k}det(A−λI)=(λ1−λ)n1...(λk−λ)nk,称nin_ini为特征值λi\lambda _iλi的代数重数(algebraic multiplicity),记做AM(λi)=niAM(\lambda_i) = n_iAM(λi)=ni,称dimN(A−λiI)dimN(A-\lambda_iI)dimN(A−λiI)为特征值λi\lambda _iλi的几何重数(geometric multiplicity),记做GM(λi)=dimN(A−λ+iI)GM(\lambda_i) = dimN(A-\lambda+i I)GM(λi)=dimN(A−λ+iI)。
从直观上看,代数重数就是对应的特征值的次数,几何重数是特征向量的维数,探究的就是特征值和特征向量之间的关系。
任意复方阵相似于上三角阵,且对角元为上三角矩阵的特征值。
GM(λ)≤AM(λ)\boldsymbol {GM(\lambda) \le AM(\lambda)}GM(λ)≤AM(λ)
由定理2,AAA相似于上三角矩阵TTT,则AAA和TTT有相同的特征值,且对于任意特征值λi\lambda _iλi,GMA(λi)=GMT(λi)GM_A(\lambda_i) = GM_T(\lambda_i)GMA(λi)=GMT(λi)。
因此,不妨设AAA是上三角阵,即A=(a11...ann)A =\begin{pmatrix}a_{11} & & \\\\ & ... & \\\\ & & a_{nn}\end{pmatrix} A=⎝⎜⎜⎜⎜⎛a11...ann⎠⎟⎟⎟⎟⎞。
因此A−λiIA-\lambda _i IA−λiI为对角线上对应的特征值为0,但这一行不一定为0(最多矩阵的特征值少1),因此新的矩阵r(A−λiI)≥n−AM(λi)r(A-\lambda _i I) \ge n - AM(\lambda_i)r(A−λiI)≥n−AM(λi)
所以GM(λi)=n−r(A−λiI)≤AM(λi)GM(\lambda_i) = n - r(A - \lambda_i I) \le AM(\lambda_i)GM(λi)=n−r(A−λiI)≤AM(λi)。
若复方阵AAA可对角化⇔\Leftrightarrow ⇔对任意特征值λi\lambda_iλi,GM(λi)=AM(λi)GM(\lambda_i) = AM(\lambda_i)GM(λi)=AM(λi)。
因为若GM(λi)=AM(λi)GM(\lambda_i) = AM(\lambda_i)GM(λi)=AM(λi),则矩阵有nnn个线性无关的特征向量。
矩阵对角化判断
求出矩阵的所有特征值。
对于每个特征值,计算特征向量,并检查r(A−λiI)=n−AM(λi)r(A-\lambda _i I) = n - AM(\lambda_i)r(A−λiI)=n−AM(λi)是否成立。
若都成立,则计算特征向量(基础解系)。
最后将特征向量与特征值对应起来,就可以写出P−1AP=ΛP^{-1}AP= \LambdaP−1AP=Λ。
注意:使矩阵对角化的特征向量不是唯一的(可以乘上常数倍)。
矩阵对角化的应用
可快速计算AkA^kAk。
可计算Markov过程中的平稳分布π\piπ。
可得到方程:πP=ππ1=1\pi P = \pi \quad \pi 1 = 1πP=ππ1=1。
计算Fibonacci数列。
差分方程uk+1=Auku_{k+1} = Au_{k}uk+1=Auk描述的离散动力系统的长期行为
设AAA可对角化,即存在可逆矩阵S=(x1,...,xn)S=(x_1,...,x_n)S=(x1,...,xn),使得S−1AS=ΛS^{-1 }A S = \LambdaS−1AS=Λ
设S−1u0=(c1,...,cn)TS^{-1} u_0 = (c_1,...,c_n)^TS−1u0=(c1,...,cn)T,即u0=c1x1+...+cnxnu_0 = c_1x_1 + ... +c_nx_nu0=c1x1+...+cnxn。
uk=Aku0=SΛkS−1u0=c1λ1kx1+...+cnλnkxnu_k = A^ku_0 = S\Lambda ^kS^{-1}u_0 = c_1\lambda_1^kx_1 + ... + c_n\lambda_n^kx_nuk=Aku0=SΛkS−1u0=c1λ1kx1+...+cnλnkxn
可以看出,uku_kuk的增长因子λik\lambda_i^kλik支配,因此系统的稳定性依赖于AAA的特征值。
当所有特征值∣λi∣<1|\lambda_i|<1∣λi∣<1时,是稳定的;
当所有特征值∣λi∣≤1|\lambda_i|\le1∣λi∣≤1时,是中性稳定的;
当至少有一个特征值∣λi∣>1|\lambda_i|>1∣λi∣>1时,是不稳定的;
同时对角化
定理:若AAA、BBB有相同的特征向量矩阵PPP,使得P−1AP=Λ1,P−1BP=Λ2P^{-1}AP= \Lambda_1,P^{-1}BP= \Lambda _2P−1AP=Λ1,P−1BP=Λ2,则AB=BAAB = BAAB=BA。
逆命题也成立:若AAA、BBB都可对角化,并且AB=BAAB = BAAB=BA,则AAA、BBB可同时对角化。