矩阵论复习笔记

1. 线性空间与线性变换

(1)线性空间的定义:

为元素的非空集合,数域,定义两种运算加法数乘满足8条:加法交换律、加法结合律、数乘结合律、两个分配律,0元存在,1元存在,负元存在。称 为数域上的线性空间


(2)证明一组向量是线性空间的基,两步走:

  • 证明这组向量线性无关;
  • 证明线性空间任意向量可由这组向量表示。

(3)如果是矩阵空间的一组基,则

注:这里有前提条件,实际上并不是总等于,如2015年填空题第2题


(4)是线性空间的一组基,对于,

\beta = (\alpha_1 \; \alpha_2 \; ... \; \alpha_n)
\begin{bmatrix}
x_1\\ 
x_2\\ 
...\\ 
x_n
\end{bmatrix}
= (\alpha_1 \; \alpha_2 \; ... \; \alpha_n)X

其中称为向量在基下对应的坐标。

中向量组线性相关的充要条件是坐标向量组是线性相关组。


(5)设维线性空间中的两组基,则有

(\beta_1 \; \beta_2 \; ... \; \beta_n) = (\alpha_1 \; \alpha_2 \; ... \; \alpha_n)C

其中称为从基设过渡矩阵

重要推论:如果向量在两组基下对应坐标分别是,则有

\alpha = (\alpha_1 \; \alpha_2 \; ... \; \alpha_n)X
\alpha = (\beta_1 \; \beta_2 \; ... \; \beta_n)Y

显然有:


(6)设是线性空间的非空子集合,则的子空间的充要条件是:

  • ,则
  • ,则

也就是说只需要验证对加法和数乘封闭即可。


(7)设是线性空间的子空间,则:

  • 交空间为:
  • 和空间为:

两个重要的维数公式

直和子空间:如果,并且,那么称的直和子空间,表示为

直和补子空间:维空间的任何子空间,设的基,,把它们扩充为的基成立,则称的直和补子空间


(8)若是线性空间的一组基,则

V_n(F) = L \{\alpha_1, \alpha_2, .., \alpha_n\}

 对一个矩阵,可以得到两个与相关的子空间:

N(A) = \{X |AX=0 \} \subseteq F^n
R(A) = L\{A_1, A_2, ...,A_n \} \subseteq F^m

其中称为矩阵零空间称为矩阵列空间


(9)内积:

  • 欧氏空间的内积
  • 酉空间的内积

柯西不等式:

正交补子空间:为内积空间的一个子空间,定义上的一个子集称为的正交补子空间,有


(10)设是线性空间上的线性变换,则满足,则有:

像空间上的子空间,称为的像空间;称为

零空间上的子空间,称为的零空间;称为零度


(11)设上的线性变换,的基,若存在阶方阵,有:

T(\alpha_1 \; \alpha_2 \; ... \; \alpha_n) = (\alpha_1 \; \alpha_2 \; ... \; \alpha_n)A

在基下的矩阵。

  • 在基下的坐标分别是,则有:

  • 的两组基,且有在两组基下的变换矩阵分别是,则****。


(12)设是线性空间上的线性变换,的子空间,如果,即值域,则称不变子空间

重要例题

是欧式空间上的线性变换,对中单位矢量,问:T的不变子空间的直和分解以及相应的矩阵分解。

答:对向量blockformula_editorT(u) = u - (1-k)(u,u)u= u - (1-k)u = ku

所以以为基向量的空间是不变子空间,表示为
同理,对于的正交补子空间,对于任意向量,有 blockformula_editorT(X) = X - (1-k)(X,u)u = X-0=X

于是另一个不变子空间为;即

显然有是一维空间,特征值对应的特征向量是;那么就是二维空间,特征值对应两个线性无关的特征向量,可以找到两个单位正交特征向量,所以相应的矩阵分解为 ,对应的特征向量组 为标准正交基。


(13)正交变换(酉变换):线性变换不改变向量内积,即

  • 正交变换关于任一标准正交基的矩阵满足;酉变换关于任一标准正交基的矩阵满足
  • 正交矩阵的行列式为;酉矩阵的行列式的模长为

(14)常见的正交变换

  • 绕原点逆时针旋转角的线性变换称为正交变换,在标准正交基下对应的变换矩阵正交矩阵

  • 空间绕过原点的直线旋转角的变化正交变换,在标准正交基下对应的变换矩阵正交矩阵


2. Jordan标准形

(1)若有,称的特征值,的特征向量。如果是线性变换对应的矩阵,那么,也是的特征值和特征向量。


(2)设上线性变换个互异特征值,特征子空间,其中,则:

  • 不变子空间
  • 时,
  • 重(代数重数)的,几何重数,则有

(3)线性变换有对角矩阵表示的充分必要条件是 个线性无关的特征向量

幂等矩阵:相似于对角矩阵,其中为矩阵的秩。

乘方矩阵:相似于对角阵,其中


(4)关于秩的不等式:

blockformula_editorrank(A \pm B) \leqslant rank(A) + rank(B)

blockformula_editorrank(A) + rank(B) -n \leqslant rank(A_{m \times n}B_{n \times m}) \leqslant \min(r(A), r(B))

blockformula_editorif \;A_{m \times n}B_{n \times m}=0, \quad rank(A) + rank(B) \leqslant n


(5)形如,称为Jordan块。Jordan块呈上三角,主对角线是它的全部特征值,特点是主对角线上元素相等,紧邻上方元素,其余元素为0


(6)每个阶方阵都相似于一个Jordan矩阵,即存在可逆矩阵,有:

P^{-1}AP = J_A = \begin{bmatrix}
J_1(\lambda_1) &  &  & \\ 
 & J_2(\lambda_2) &  & \\ 
 &  & ... & \\ 
 &  &  & J_s(\lambda_s)
\end{bmatrix}

其中称为Jordan标准形


(7)Jordan标准形的求法:

  • 求矩阵的特征多项式,其中是特征值代数重数,决定了对角线上特征值的个数

  • ,由,求线性无关的特征向量,其中是特征值几何重数,决定了Jordan块的个数

    • 如果,即代数重数等于几何重数,说明对应的Jordan块是对角阵;
    • 如果,就选择合适的特征向量,利用**求Jordan链**,确定每一个小Jordan块的阶数。
  • 将所有特征值对应的Jordan块组合起来,形成Jordan矩阵


(8)矩阵多项式可以表示为,由于有,所以有:

g(A) = P \begin{bmatrix}
g(J_1(\lambda_1)) &  &  & \\ 
 & g(J_2(\lambda_2)) &  & \\ 
 &  & ... & \\ 
 &  &  & g(J_s(\lambda_s)) 
\end{bmatrix} P^{-1}

而对于则有:

g(J(\lambda)) = \begin{bmatrix}
g(\lambda) & g'(\lambda) & ... & \frac{g^{(r-1)}(\lambda)}{(r-1)!} \\ 
 & g(\lambda) & ... & .\\ 
 &  & ... & .\\ 
 &  &  & g(\lambda)
\end{bmatrix}

对于常用的幂指数形式有:

J^k(\lambda) = \begin{bmatrix}
\lambda^k & \frac{(\lambda^k)'}{1!} & \frac{(\lambda^k)''}{2!} &... \\ 
 &  \lambda^k& ... & .\\ 
 &  & ... & .\\ 
 &  &  &  \lambda^k
\end{bmatrix}

(9)使的多项式称为化零多项式特征多项式必是矩阵的化零多项式

注:化零多项式的根一定包含了所有的特征值,但不能说化零多项式的根一定是特征值


(10)对于最小多项式

  • 最高项系数为1
  • 的一个化零多项式;
  • 是化零多项式中次数最低的那一个。

最小多项式的根一定包含了所有的特征值,子式的幂等于Jordan标准形中关于特征值的Jordan块中的最高阶数

比如矩阵有一个代数重数为3的特征值2,该特征值对应两个Jordan块,分别是 以及, 说明其中其最高阶数为2,那么在最小多项式中对应的子式为


3. 矩阵的分解

(1)等价标准形

 对于,存在可逆矩阵,使得

A = P \begin{bmatrix}
I_r & 0  \\ 
0 & 0
\end{bmatrix}Q

其中是矩阵的秩。


(2)相似标准形

 存在可逆矩阵,有

A = P \begin{bmatrix}
\lambda_1 &  &  & \\ 
 & \lambda_2 &  & \\ 
 &  & ... & \\ 
 &  &  & \lambda_n
\end{bmatrix} P^{-1}

(3)LU分解

定义:是下三角矩阵,是上三角矩阵

求法:

  • 对于只用第行乘数加到第行()型初等变换将化为上三角形,可以得到
  • 可知,于是有,则

(4)LDV分解

定义:分别是对角线元素为1的下三角矩阵和上三角矩阵,为对角矩阵,

求法:

方法一:

  • 由LU分解得到
  • 通过每行除以对应的对角线上元素的值,的对角线元素化为1,得到

方法二:

  • 取矩阵对角线第一个元素,得到矩阵,则有

  • 取包含对角线前两个元素的二阶矩阵,则有矩阵,其中,求得未知量

  • 以此类推,最终得到


(5)满秩分解

定义:对于的矩阵,若存在秩为的矩阵,有,称为矩阵的满秩分解。

求法:方法较多,一般只用最简单的第3种。

  • 行初等变换化为Hermite标准形;
  • 依Hermite标准形中向量所在的列的位置第列,相应地取出的第,得到 列向量极大无关组;
  • 的Hermite矩阵中的非零行构成矩阵,得到满秩分解

举个例子:

求矩阵的满秩分解。

答: 用行初等变换化为Hermite标准形:

A = \begin{bmatrix}
1 & 1 & 2\\ 
0 & 2 & 2\\ 
1 & 0 & 1
\end{bmatrix} \rightarrow \begin{bmatrix}
1 & 1 & 2\\ 
0 & 2 & 2\\ 
0 & -1 & -1
\end{bmatrix} \rightarrow \begin{bmatrix}
1 & 0 & 1\\ 
0 & 1 & 1\\ 
0 &0 &0 
\end{bmatrix}

可知的前两列线性无关,取出构成;取出的Hermite标准形的前两行作为,有:

B = \begin{bmatrix}
 1&1  \\ 
 0&2  \\ 
 1&0  
\end{bmatrix}, C = \begin{bmatrix}
1 & 0 & 1\\ 
0 & 1 & 1
\end{bmatrix}, A=BC

(6)谱分解

定义:矩阵互异的特征值称为矩阵可相似对角化是可以谱分解的充要条件

求法:

  • 通过求特征值和特征向量得到
  • 对角阵,令
  • 得到,其中

(7)Schur分解

定义:对可逆矩阵,存在酉矩阵主对角线上元素都为正的上三角矩阵,使

求法:

  • 取矩阵的列向量,进行施密特正交化,得到,有
  • 再由得到,于是

(8)几种特殊矩阵:

  • 正规矩阵正规矩阵酉相似于对角阵
  • 酉矩阵
  • Hermite矩阵

(9)奇异值分解(SVD分解)

奇异值:对的矩阵,矩阵非零特征值,则称正数为矩阵的奇异值。

定义:对的矩阵,奇异值有,则存在酉矩阵,分块矩阵,有,其中

求解:

  • 由特征多项式求得特征值,(务必按照从大到小排列),以及每个特征值对应的特征向量
  • 对特征向量进行施密特正交化和单位化(一般只需要单位化),得到单位正交向量组,则
  • 对于非零特征值对应奇异值,于是有****,这样得到了个列向量,剩余的设为,通过正交的特性即可求得,
  • 于是得到

(10)极分解

定义:对于的矩阵,可以被分解为,其中为半正定矩阵,为酉矩阵。

求法:

  • 进行奇异值分解,得到;
  • 可以得到,于是

4. 矩阵的广义逆

(1)设,若有,则称的一个左逆

等价条件:

  • 的零空间
  • ,即列满秩的
  • 可逆

(2)设,有,则称的一个右逆

等价条件:

  • 的列空间
  • ,即行满秩的
  • 可逆

(3)对于,有,称的一个减号广义逆

求法:

  • 的矩阵,有矩阵进行初等变换,对行变换时保持同步,对列变换时,保持同步,将化为最简形,得到
  • ,其中是满足固定阶次的任意矩阵。

(4)加号广义逆(M-P逆)

定义:对于矩阵,满足4条

的M-P逆。

求法

方法一

  • 对矩阵进行满秩分解,得到;
  • 则****,也就是等于C的右逆 x B的左逆

方法二

  • 对矩阵进行奇异值分解,得到
  • 则****。

性质


(5)投影变换

定义,投影变换就是把映射成子空间,称是从沿子空间到子空间的投影变换,在一组基下对应的矩阵称为投影矩阵,子空间称为投影子空间。显然有,子空间就是的像空间就是的核空间,于是

是投影变换的充要条件是关于某组基下的矩阵幂等矩阵,即

求法

  • 找出像空间的一组基,得到矩阵;找出的一组基,得到矩阵
  • 于是有投影矩阵****。

(6)正交投影变换

定义:若正交补空间,称正交投影变换,其在标准正交基下对应的矩阵称为正交投影矩阵。

是正交投影变换的充要条件是幂等Hermite矩阵,即

求法

A = (B | 0)(B|C)^{-1} = (B|0)((B|C)^H(B|C))^{-1}(B|C)^H = {\color{red} {B(B^HB)^{-1}B^H}}

(7)最佳最小二乘解

,则****是线性方程组的最佳最小二乘解。

,则****是的最佳最小二乘解。


5. 矩阵分析

(1)向量范数满足正定性、齐次性和三角不等式,定义了范数的内积空间称为赋范空间


(2)重要的向量范数

 对于复向量,有:

  • 2-范数:
  • 1-范数:
  • ∞范数:

有限维线性空间的任意两种向量范数都是等价的


(3)矩阵范数满足正定性、齐次性、三角不等式以及相容性


(4)重要的矩阵范数诱导范数

  • F范数
  • 列和范数 ,即每一列各元素模相加其中的最大值
  • 谱范数,其中最大特征值
  • 行和范数,即每一行各元素模相加其中的最大值

(5)向量收敛和矩阵收敛必须其中的每一个元素都收敛。

向量按分量收敛的充要条件是它按任意一个向量范数收敛

时,,称矩阵序列按矩阵范数收敛于

(6)谱半径

定义是矩阵的全部特征值,称****为谱半径

的充要条件是

的谱半径是的任意一种矩阵范数的下确界


(7)矩阵幂级数

 若复变量的幂级数收敛半径为,而方阵谱半径为,则

  • 当****时,矩阵幂级数收敛
  • 当****时,矩阵幂级数发散

当求解的特征值比较困难时,由于的每个范数都是谱半径的上界,只需要找到一种特殊的矩阵范数,使得,就能说明矩阵幂级数收敛。(优先考虑行和、列和范数


(8)常用的幂级数

收敛域是整个复平面的幂级数

blockformula_editore^A = \sum_{k=0}^{\infty} \frac{1}{k!}A^k

blockformula_editor\cos A = \sum_{k=0}^{\infty}\frac{(-1)^k}{(2k)!}A^{2k}

blockformula_editor\sin A = \sum_{k=0}^{\infty}\frac{(-1)^k}{(2k+1)!}A^{2k+1}

收敛域为复平面的幂级数

blockformula_editor(I-A)^{-1} = \sum_{k=0}^{\infty}A^k, \quad \rho(A) < 1

blockformula_editor\ln(I+A) = \sum_{k=1}^{\infty}\frac{(-1)^{k-1}}{k}A^k, \quad \rho(A) < 1


(9)矩阵函数的两种求法

方法一:Jordan标准形法

  • 求矩阵的Jordan标准形,得到****
  • 设解析函数为,则对每一个Jordan块有,得到
  • 最后得到

这种方法的难点在于需要求Jordan链,过程中可以会遇到麻烦。如果不同特征值个数较多,建议使用第一种;而如果特征值比较单一,并且 代数重数 - 几何重数 > 2,建议使用第二种

方法二:最小多项式法

  • 先计算的Jordan标准形,由此得到最小多项式,其中幂次和有

  • 得到,并令,解得系数

  • 最后得到

不同特征值的个数比较多或者最小多项式幂次较高时,计算起来比较复杂,建议使用第一种。


(10)两个知识点:

重要的导数

矩阵指数函数的行列式


(11)矩阵函数应用

一阶常系数齐次微分方程组blockformula_editor\begin{cases}\dot{x}(t) = Ax(t)\\x(t_0) = C_{n \times 1}\end{cases}

解为:


一阶线性常系数非齐次线性方程组blockformula_editor\begin{cases}\dot{x}(t) = Ax(t) + f(t)\\x(t_0) = C\end{cases}

解为:


6. K积

(1)对于矩阵,则K积为:

A \otimes B = \begin{bmatrix}a_{11}B & a_{12}B & ... & a_{1n}B\\ a_{21}B & a_{22}B & ... & a_{2n}B\\ 
... & ... &  & ...\\ a_{n1}B & a_{n2}B & ... & a_{nn}B\end{bmatrix}

K积不具有交换律,即


(2)重要性质

  • 这里的n表示B的阶数,m表示A的阶数

(3)K和:设


(4)若的特征值是,相应的特征向量是的特征值是,相应的特征向量为;则:

  • 的特征值是,对应的特征向量是
  • 的特征值是,对应的特征向量是

(5)设是解析函数,存在,则


(6)设矩阵,则


(7)求解矩阵方程,将两边同时取向量化算子,得到****,最后通过常规的求非齐次线性方程组的方法求解。


(8)求微分方程:

  • 用向量化算子作用在方程两边,得到
  • ,通过求解普通微分方程的方法得到
  • 带入化简求得

本文章使用limfx的vscode插件快速发布