将实向量或矩阵集合推广到复数向量或矩阵集合
任意方阵:
行列式:
迹:
全体特征值:(含重复),又叫的谱。
T(\lambda) = |\lambda I_n -A| \overset{展开后}{=} \lambda^n + C_{n-1}\lambda^{n-1} + \cdots + C_1\lambda_1 + C_0
其中
C_{n-1}=-(a_{11}+a_{22}+ \cdots + a_{nn}) = -\mathrm{tr}(A)\\
C_0 = |-A| = (-1)^n|A| = (-1)^n\mathrm{det}(A)
的根为的特征根,且有:
\sum_i^n \lambda_i = \mathrm{tr}(A)\\
\prod_i^n \lambda_i = \mathrm{det}(A)
若(相似变换),则,有相同特征根。
\mathrm{tr}(A)=\mathrm{tr}(B)\,,\,\lambda(A)=\lambda(B)\,,\,T_A(\lambda)=T_B(\lambda)
上三角或下三角
若
A=
\begin{bmatrix}
a_1& & &*\\
&a_2& & \\
& &\ddots& \\
0& & &a_n
\end{bmatrix}
或
A=
\begin{bmatrix}
a_1& & &0\\
&a_2& & \\
& &\ddots& \\
*& & &a_n
\end{bmatrix}
则
\lambda(A)=\{a_1,a_2,\cdots,a_n\}
与有相同特征根 与有相似变换
\left(
\begin{array}{c|c}
A & C\\
\hline
O & B
\end{array}
\right)
=
|A||B|
=
\left(
\begin{array}{c|c}
A & O\\
\hline
D & B
\end{array}
\right)
\,\,\,(A,B为方阵)
且其特征根为
若各行和相同,则为一特征向量,行和为一特征根;
若各列和相等,则列和为一特征根;
若各行相等,等于,则。
当时,,则。于是。
令矩阵,则为方阵,一般情况下。但:
特征多项式:。特别地,当时,若,则;
特征根:与只差个零根,非零根完全相同。特别地,当时,;
迹:。
证:
构造方阵:
M=
\begin{pmatrix}
(AB)_{n\times n} & O\\
B&O_{p\times p}
\end{pmatrix}_{(n+p)\times(n+p)}
\overset{\Delta}{=}
\begin{pmatrix}
AB & O\\
B&O
\end{pmatrix}\\
N=
\begin{pmatrix}
O_{n\times n}&O\\
B&(BA)_{p\times p}
\end{pmatrix}_{(n+p)\times(n+p)}
\overset{\Delta}{=}
\begin{pmatrix}
O&O\\
B&BA
\end{pmatrix}\\
P=
\begin{pmatrix}
I_{n\times n}&A\\
O&I_{p\times p}
\end{pmatrix}_{n+p}
\overset{\Delta}{=}
\begin{pmatrix}
I&A\\
O&I
\end{pmatrix}
计算得:
MP=
\begin{pmatrix}
AB&ABA\\
B&BA
\end{pmatrix}
\,\,\,\,\,\,
PN=
\begin{pmatrix}
AB&ABA\\
B&BA
\end{pmatrix}\\
|P|=|I||I|=1\,\,\,(P可逆)
所以相似于,其特征多项式相同:,即
\begin{vmatrix}
\lambda I_{n\times n} - AB&O\\
-B&\lambda I_{p\times p}
\end{vmatrix}
=
\begin{vmatrix}
\lambda I_{n\times n}&O\\
-B&\lambda I_{p\times p} - BA
\end{vmatrix}\\
按分块下三角计算得:
|\lambda I-AB|=\lambda^{n-p}|\lambda I -BA|
得证
推论: 令代入1中:
;
(以代替)。
另外也可以看出:横放矩阵(行数大于列数)乘立放矩阵(列数大于行数)形成的方阵的行列式为零。以此可得:若,则。
略
今后可记
略
规定,,任取多项式,则的特征值为:
\lambda[f(A)]=\{f(\lambda_1)\,,\,f(\lambda_2)\,,\,\cdots\,,\,f(\lambda_n)\}
且的全体特征向量都是的特征向量。
平移法则和倍法是其一次多项式的特殊情况。
由换位公式可以证得:
若,秩,则,其中,且有,全体特征根为。且有,即为对应的特征向量。其余特征向量为的n-1个解;
秩二公式:
若方阵,秩,,,则与只差个零特征根。
秩r公式:
若,秩,则,其中,,且
\mathrm{det}(\lambda I-A)=\lambda^{n-r}\mathrm{det}(\lambda I-CB)
,其特征多项式为,则必有
f(A)=(A-\lambda_1)(A-\lambda_2)\cdots(A-\lambda_n)=O
且特征值对应的特征向量为的各非零列。(注:)
任一方阵均可相似上三角化,即:
\forall A\in \mathbb{C}^{n\times n}\,\exists\,P \, s.t.\\
P^{-1}AP=B=
\left(
\begin{array}{ccc}
\lambda_1&&*\\
&\ddots&\\
0&&\lambda_n
\end{array}
\right)
这种三角化不唯一,可将其化为唯一的Jordan标准形:
\forall A\in \mathbb{C}^{n\times n}\,\exists\,P \, s.t.\\
P^{-1}AP=J=
\left(
\begin{array}{cccc}
\lambda_1&*&&&0\\
&\lambda_2&*&&\\
&&\ddots&\ddots&\\
&&&\lambda_{n-1}&*\\
0&&&&\lambda_n
\end{array}
\right)
其中,重根写在一起,重根之间,不同根之间。
共轭转置与Hermite(方)阵
设,则其共轭转置为。
Hermite阵
A为Hermite阵,则:
A^\mathrm{H}=A\,\,\,(A \in C^{n\times n})
斜Hermite阵
A为斜Hermite阵,则:
A^\mathrm{H}=-A\,\,\,(A \in C^{n\times n})
有:
\begin{aligned}
&A \in Hermite \iff \mathrm{i}A \in 斜Hermite\\
&A \in Hermite \iff \frac{1}{\mathrm{i}}A \in 斜Hermite\\
&\forall A \in \mathbb{C}^{m,n} s.t. A^\mathrm{H}A,AA^\mathrm{H} \in Hermite\\
&\forall A \in Hermite^{n,n}\,,\,X \in \mathbb{C}^n\,\,s.t.\,f(X)=X^\mathrm{H}AX \in R
\end{aligned}
雷商公式
\forall \lambda_1 \in \lambda(A) \,\, \exists X \neq 0\,\,s.t.\\
\lambda_1 = \frac{X^\mathrm{H}AX}{|X|^2}
秩公式
\mathrm{r}(A^\mathrm{H}A)=\mathrm{r}(AA^\mathrm{H})=\mathrm{r}(A)\\
\mathrm{r}(\overline{A})=\mathrm{r}(A^\mathrm{H})=\mathrm{r}(A)
对于映射到中的二元运算,若满足:
正定性:
(\forall X \in \mathbb{C}^n\,\,s.t.\,\,(X,X)\geq 0)\bigwedge(X=0 \iff (X,X)=0)
共轭对称:
(Y,X)=\overline{(X,Y)}
齐次性:
(kX,Y)=k(X,Y)\,\,(X,kY)=k(X,Y)
分配律:
(X+Y,W)=(X,W)+(Y,W)\\
(W,X+Y)=(W,X)+(W,Y)
则称此运算为内积。
X \in \mathbb{C}^n\,\,Y \in \mathbb{C}^n\\
(X|Y)=Y^\mathrm{H}X=x_1\overline{y}_1+x_2\overline{y}_2+\cdots+x_n\overline{y}_n
并记为的模长。
X\perp Y \iff (X,Y)=0
X \perp Y \perp W \perp \cdots \Longrightarrow |aX+bY+cW+\cdots|^2=|a|^2|X|^2+|b|^2|Y|^2+|c|^2|W|^2+\cdots
预优阵:
中,则n阶方阵为预优阵。
优阵: 所有列的模为1的预优阵。
预优阵和优阵的性质:
半预优阵
A_{m\times n}=(\alpha_1,\alpha_2,\cdots,\alpha_n)为半预优阵 \iff A^\mathrm{H}A = \mathrm{diag}(|\alpha_1|^2,|\alpha_2|^2,\cdots,|\alpha_n|^2)
预优阵
A_{m\times n}=(\alpha_1,\alpha_2,\cdots,\alpha_n)为预优阵 \iff A^\mathrm{H}A = \mathrm{I}
可以知道:
A=(\alpha_1,\alpha_2,\cdots,\alpha_n) \in (半)预优阵 \Longrightarrow \tilde{A}=(\frac{\alpha_1}{|\alpha_1|},\frac{\alpha_2}{|\alpha_2|},\cdots,\frac{\alpha_n}{|\alpha_n|}) \in (半)优阵
总结:若,则有如下表格
各列模长为1 | 各列模长不为1 | |
---|---|---|
方阵 | 优阵 | 预优阵 |
非方阵 | 半优阵 | 半预优阵 |
若线性无关,则:
\begin{aligned}
&Y_1 = &\alpha_1&\\
&Y_2 = &\alpha_2 &- \frac{(\alpha_2|Y_1)}{|Y_1|^2}Y_1\\
&Y_3 = &\alpha_3 &- \frac{(\alpha_3|Y_1)}{|Y_1|^2}Y_1 - \frac{(\alpha_3|Y_2)}{|Y_2|^2}Y_2\\
&&\vdots&\\
&Y_n = &\alpha_n &- \frac{(\alpha_n|Y_1)}{|Y_1|^2}Y_1 - \cdots - \frac{(\alpha_n|Y_{n-1})}{|Y_{n-1}|^2}Y_{n-1}
\end{aligned}
注:对同一特征值的不同特征向量进行施密特正交化后,它们仍为对应该特征值的特征向量。
\forall A \in \mathbb{C}^{n,n} \, \exists 优阵U \in \mathbb{C}^{n,n} \,s.t.\\
U^\mathrm{H}AU = B =
\left(
\begin{array}{ccc}
\lambda_1&&*\\
&\ddots&\\
0&&\lambda_n
\end{array}
\right)
X \in \mathbb{C}^n \, A \in U^{n,n} X \overset{U变换}{\longrightarrow} AX
保长:;
保正交:。
以()为法向量的镜面阵:
A = I - \frac{2XX^\mathrm{H}}{|X|^2}
可以看出:
镜面阵是优阵,也是Hermite阵();
对法向量的镜面变换,方向为负值:;
对垂直于法向量的向量作镜面变换,向量不变:;
(分别为2,3中的,为的镜面向量)
利用两个模长相等的向量构造
\forall \alpha,\beta\in \mathbb{C}^n,\alpha\neq\beta,|\alpha|=|\beta|\,,\,\exists X=\alpha-\beta,P=I - \frac{2XX^\mathrm{H}}{|X|^2}\,s.t.\\
(P\alpha=\beta)\wedge(P\beta=\alpha)
利用镜面变换将向量变换到坐标轴上
\forall \alpha = (a_1,a_2,\cdots,a_n)^\mathrm{T} \in \mathbb{C}^n\,\,\alpha \neq 0\\
e_r为空间中第r个基底向量,a_r为\alpha的第r个分量
令
k_r = \pm\frac{a_r}{|a_r|}|\alpha|\,,\,
\beta = k_re_r\\
X=\alpha-\beta=\alpha-k_re_r\\
P=I-\frac{2XX^\mathrm{H}}{|X|^2}
则有:
P\alpha=k_re_r=\beta
为经镜面变换后在第r个基底方向的向量。
由一已知向量扩大正交组
\forall \alpha \in \mathbb{C}^n\,\,\alpha \neq 0
令
k_r = \pm\frac{a_1}{|a_1|}|\alpha|\\
X=\alpha-k_1e_1\\
P=I-\frac{2XX^\mathrm{H}}{|X|^2}
则
P\alpha=|\alpha|e_1\,\,\,Pe_1=\frac{\alpha}{|\alpha|}
由于P是优阵,则P中各列正交,即:
Pe_1=\frac{\alpha}{|\alpha|} \perp Pe_2 \perp Pe_3 \perp \cdots \perp Pe_n
进而:
\alpha \perp \alpha_2 \perp \alpha_3 \perp \cdots \perp \alpha_n\\
(\alpha_2,\alpha_3,\cdots,\alpha_n为P的第2至n列)
,其中。将矩阵分解为高阵(列满秩)和低阵(行满秩)乘积。
高低分解必存在不唯一。
利用初等行变换将A化为行最简型矩阵D,取D的阶梯头所在列对应的A的列组成高阵B,取D的前r行作为低阵C。
,将矩阵分解为半优阵和上三角阵之积。
为列满秩(高阵)。则有,其中为上三角阵,为半优阵(),且中对角元素为正。
特别地,时,方阵满秩,可逆,必有,为优阵(),对角线元素为正。()
证明与构造方法:
设高阵,则线性无关。
利用施密特正交化,可得到一组正交向量组:,将其单位化后组成一个半优阵:。
由施密特正交化的变换式得:
\left\{
\begin{aligned}
&\alpha_1=\beta_1\\
&\alpha_2=k_{12}\beta_1+\beta_2\\
&\alpha_3=k_{13}\beta_1+k_{12}\beta_2+\beta_3\\
&\vdots\\
&\alpha_p=k_{1n}\beta_1+k_{2n}\beta_2+\cdots+k_{n-1\,n}\beta_{n-1}+\beta_p
\end{aligned}
\right.
则有:
\begin{aligned}
A&=
\begin{pmatrix}
\alpha_1&\alpha_2&\cdots&\alpha_p
\end{pmatrix}
=
\begin{pmatrix}
\beta_1&\beta_2&\cdots&\beta_p
\end{pmatrix}
\begin{pmatrix}
1&k_{12}&k_{13}&\cdots&k_{1p}\\
&1&k_{23}&\cdots&k_{2p}\\
&&1&\cdots&k_{3p}\\
&&&\ddots&\vdots\\
&&&&1
\end{pmatrix}\\
&=
\begin{pmatrix}
\frac{\beta_1}{|\beta_1|}&\frac{\beta_2}{|\beta_2|}&\cdots&\frac{\beta_p}{|\beta_p|}
\end{pmatrix}
\begin{pmatrix}
|\beta_1|&&&\\
&|\beta_2|&&\\
&&\ddots&\\
&&&|\beta_p|
\end{pmatrix}
\begin{pmatrix}
1&k_{12}&k_{13}&\cdots&k_{1p}\\
&1&k_{23}&\cdots&k_{2p}\\
&&1&\cdots&k_{3p}\\
&&&\ddots&\vdots\\
&&&&1
\end{pmatrix}\\
&=
\begin{pmatrix}
\frac{\beta_1}{|\beta_1|}&\frac{\beta_2}{|\beta_2|}&\cdots&\frac{\beta_p}{|\beta_p|}
\end{pmatrix}
\begin{pmatrix}
|\beta_1|&k_{12}|\beta_1|&k_{13}|\beta_1|&\cdots&k_{1p}|\beta_1|\\
&|\beta_2|&k_{23}|\beta_2|&\cdots&k_{2p}|\beta_2|\\
&&|\beta_3|&\cdots&k_{3p}|\beta_3|\\
&&&\ddots&\vdots\\
&&&&|\beta_p|
\end{pmatrix}\\
&\overset{\Delta}{=}QR
\end{aligned}
即,A可QR分解,同时有:
\begin{aligned}
&Q=
\begin{pmatrix}
\frac{\beta_1}{|\beta_1|}&\frac{\beta_2}{|\beta_2|}&\cdots&\frac{\beta_p}{|\beta_p|}
\end{pmatrix}\,\,\,(\beta_1\cdots\beta_p由A中各列按顺序施密特正交化得到)\\
&R=Q^\mathrm{H}A\,\,\,(R为上三角且主对角线元素为正)
\end{aligned}
任取n阶方阵,必有QR分解:,为优阵,可利用镜面阵构造:
设
取镜面阵
P_1 = I - \frac{2X_1X_1^\mathrm{H}}{|X_1|^2}\,\,,\,\,X_1=\alpha_1-|\alpha_1|e_1\overset{\Delta}{=}\alpha_1-k_1e_1
于是
P_1A=(P_1\alpha,\cdots)=
\left(
\begin{array}{c|c}
k_1&*\\
\hline
0&\tilde{A}_2
\end{array}
\right)_{n\times n}
设
\tilde{A}_2=(\tilde{\alpha}_2,\cdots)_{(n-1)\times(n-1)}\\
(\tilde{\alpha_2}为去掉\alpha_2第一个元素的向量)
取镜面阵
\tilde{P}_2 = I - \frac{2X_2X_2^\mathrm{H}}{|X_2|^2}\,\,,\,\,X_2=\tilde{\alpha}_2-|\tilde{\alpha}_2|e_2\overset{\Delta}{=}\tilde{\alpha}_2-k_2e_2\\
所以
\tilde{P}_2\tilde{A}_2=(\tilde{P}_2\tilde{\alpha}_2,\cdots)=
\left(
\begin{array}{cc}
k_2&*\\
0&\tilde{A}_3
\end{array}
\right)_{(n-1)\times(n-1)}
令
P_2=
\left(
\begin{array}{cc}
1&\\
&\tilde{P}_2
\end{array}
\right)_{n\times n}
则:
P_2P_1A=
\left(
\begin{array}{cccc}
k_1&&&*\\
&k_2&&\\
0&&&\tilde{A_3}
\end{array}
\right)_{n\times n}
依次下去:
若
\tilde{P}_m\tilde{A}_m=
\left(
\begin{array}{c|c}
k_m&*\\
\hline
0&\tilde{A}_{m+1}
\end{array}
\right)_{(n-m+1)\times(n-m+1)}
可继续构造出:
\tilde{P}_{m+1}\tilde{A}_{m+1}=
\left(
\begin{array}{c|c}
k_{m+1}&*\\
\hline
0&\tilde{A}_{m+2}
\end{array}
\right)_{(n-m+2)\times(n-m+2)}
令
P_{m+1}=
\left(
\begin{array}{c|c}
I&0\\
\hline
0&\tilde{P}_{m+1}
\end{array}
\right)_{n\times n}
得
P_{m+1}P_{m}\cdots P_1A=
\left(
\begin{array}{ccccc}
\begin{array}{cccc}
k_1&&&\\
&k_2&&\\
&&\ddots&\\
&&&k_{m+1}
\end{array}&*\\
0&\tilde{A}_{m+2}
\end{array}
\right)_{n\times n}
如此构造可得:
P_{n-1}P_{n-2}\cdots P_2P_1A=
\left(
\begin{array}{ccccc}
\begin{array}{cccc}
k_1&&&\\
&k_2&&\\
&&\ddots&\\
\end{array}&*\\
0&k_n
\end{array}
\right)_{n\times n}
令
\begin{aligned}
&Q=(P_{n-1}P_{n-2}\cdots P_1)^\mathrm{H},为优阵\\
&R=
\left(
\begin{array}{ccccc}
\begin{array}{cccc}
k_1&&&\\
&k_2&&\\
&&\ddots&\\
\end{array}&*\\
0&k_n
\end{array}
\right)
\end{aligned},为上三角阵
则有QR分解:。
正规阵:满足的矩阵。(必为方阵)
常见正规阵:Hermite阵、斜Hermite阵、优阵、对角阵
正规阵的常见性质:
若三角阵正规,其必为对角阵。(严格三角阵必不正规)
对于正规阵:两个特征向量垂直这两个特征向量对应不同特征值。
若正规,则必有分解
或写作:(Q为优阵),
即正规阵必优相似于对角阵。
正规分解可利用正规阵的特征向量并施密特正交化和单位化得到。
若A为Hermite阵,A优相似于实对角阵,其优相似分解被称为Hermite分解。(Hermite阵的特征值必为实数)
若A为斜Hermite阵,A优相似于纯虚对角阵。(斜Hermite阵的特征值必为纯虚数)
若A为任意方阵,,则B为Hermite阵,C为斜Hermite阵。则A可分解为B和C正规分解之和。
若A正规,全体不同特征根为,,,,,则有:
, 被称为谱阵,且有:
;
正交;
, 幂等,为Hermite阵。
有谱阵公式:
G_i=
\frac{(A-\lambda_1)\cdots\sout{(A-\lambda_i)}\cdots(A-\lambda_k)}{(\lambda_i-\lambda_1)\cdots\sout{(\lambda_i-\lambda_i)}\cdots(\lambda_i-\lambda_k)}=
\prod_{j=1}^{k,i\neq j}\frac{A-\lambda_j}{\lambda_i-\lambda_j}
易证明,A能正规阵谱分解A为正规阵。
利用正规阵的谱分解,可以求其多项式或级数:
f(x)=\sum_{p=0}^\infin c_px^p\\
f(A)=\sum_{p=0}^\infin c_pA^p=\sum_{p=0}^\infin \sum_{q=1}^kc_p\lambda_q^pG_q=\sum_{q=1}^{k} f(\lambda_q)G_q
平方根定理:
若(半正定),则存在Hermite阵,使得,则称B为A的平方根,记为;
若(正定),上述B也正定;
有平方根公式:。
单阵:相似于对角阵的方阵。
若A为单阵,则存在可逆阵P,使得:
A=PDP^{-1}\\
D=\mathrm{diag}(\lambda_1,\cdots,\lambda_n)
可利用特征向量构造。
A为单阵A有n个线性无关的特征向量;
A为单阵A有n个不同特征根;
A为单阵(为所有互异的特征根)。
单阵:
正规阵:Hermite阵,优阵,……
……
非单阵:
……
A为单阵(各互不相同),且:
;
正交;
幂等阵,但不一定是Hermite阵; 其中:
G_i=\frac{(A-\lambda_1)\cdots\sout{(A-\lambda_i)}\cdots(A-\lambda_k)}{(\lambda_i-\lambda_1)\cdots\sout{(\lambda_i-\lambda_i)}\cdots(\lambda_i-\lambda_k)}=\prod_{j=1}^{k,i\neq j}\frac{A-\lambda_j}{\lambda_i-\lambda_j}
同样地,可以求单阵矩阵级数:
f(x)=\sum_{p=0}^\infin c_px^p\\
f(A)=\sum_{p=0}^\infin c_pA^p=\sum_{p=0}^\infin \sum_{q=1}^kc_p\lambda_q^pG_q
\begin{aligned}
&任意方阵\supset单阵\supset正规阵(Hermite阵,斜Hermite阵,优阵,对角阵,……)\\
&任意方阵优相似于上三角阵\\
&单阵相似于对角阵\\
&正规阵优相似于对角阵\\
&Hermite阵优相似于实对角阵\\
&斜Hermite阵优相似于纯虚对角阵
\end{aligned}
由换位公式得,和的非零特征根相同。又和为Hermite阵,半正定。所以二者有相同正根无负根。由秩公式得,,则和的正根个数为r。
设()正根为,称为A的正奇异值,记为:
S^+(A)=\{\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r}\}=S^+(A^\mathrm{H})
的特征根为(且),称为A的奇异值,记为:
S(A)=\{\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r},\sqrt{\lambda_{r+1}},\cdots,\sqrt{\lambda_n}\}=\{\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r},0,\cdots,0\}
分解定理:
\forall A\in \mathbb{C}^{m,n}\,\,\exists 半优阵P\in\mathbb{C}^{n,r},Q\in\mathbb{C}^{m,r}\,s.t.\\
A=P\Delta Q^\mathrm{H},\Delta=\mathrm{diag}(\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r})
分解方法:
求的正根,即:,并求出其中正根对应的特征向量,并施密特正交化得:;
构造P和Q:
\begin{aligned}
&P=
\begin{pmatrix}
\frac{AX_1}{|AX_1|}&\cdots&\frac{AX_r}{|AX_r|}
\end{pmatrix}_{m\times r}\,\,\,半优阵\\
&Q=
\begin{pmatrix}
\frac{X_1}{|X_1|}&\cdots&\frac{X_r}{|X_r|}
\end{pmatrix}_{n\times r}\,\,\,半优阵
\end{aligned}
可得
分解定理:
\forall A\in\mathbb{C}^{m,n},\mathrm{rank}(A^\mathrm{H}A)=r,\exists 优阵W\in\mathbb{C}^{m,m},V\in\mathbb{C}^{n,n}\,s.t.\\
A=WDV^\mathrm{H}\\
D=
\begin{pmatrix}
\Delta&O\\
O&O
\end{pmatrix}_{m\times n}
\,\,\,\Delta=\mathrm{diag}(\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_r})\\
\Delta为A的正奇异值组成的对角阵
分解方法:
在正SVD的基础上,将填入0扩充为;
在后面扩充m-r列相互正交且与前面向量正交的单位向量(可利用前面几列与后面几列正交的关系构造线性方程组,求得m-r个解,再将这些解向量施密特正交化和单位化),使扩充为。同样步骤在后面扩充n-r列相互正交且与前面向量正交的单位向量,扩充为;
得。
A\otimes B=(a_{ij}B)_{mp\times nq}=
\begin{pmatrix}
a_{11}B&a_{12}B&\cdots&a_{1n}B\\
a_{21}B&a_{22}B&\cdots&a_{2n}B\\
\vdots&\vdots&&\vdots\\
a_{n1}B&a_{n2}B&\cdots&a_{nn}B
\end{pmatrix}
\in \mathbb{C}^{mp,nq}
即:将A作为框架,A上的每个元素乘上B。
行(列)向量直积:
(a_1,a_2,\cdots,a_p)\otimes(b_1,b_2,\cdots,b_q)=(a_1b_1,a_1b_2,a_1b_3,\cdots,a_pb_{q-1},a_pb_q)
\in \mathbb{C}^{1,pq}\\
(a_1,a_2,\cdots,a_p)^\mathrm{T}\otimes(b_1,b_2,\cdots,b_q)^\mathrm{T}=(a_1b_1,a_1b_2,a_1b_3,\cdots,a_pb_{q-1},a_pb_q)^\mathrm{T}
\in \mathbb{C}^{pq}\\
字典序排列的行(列)向量。
上(下)三角阵直积:
\begin{pmatrix}
a_{11}&a_{12}&\cdots&a_{1n}\\
&a_{22}&\cdots&a_{2n}\\
&&\ddots&\vdots\\
&&&a_{mn}
\end{pmatrix}
\otimes
\begin{pmatrix}
b_{11}&b_{12}&\cdots&b_{1n}\\
&b_{22}&\cdots&b_{2n}\\
&&\ddots&\vdots\\
&&&b_{pq}
\end{pmatrix}
=\\
\begin{pmatrix}
\begin{matrix}
a_{11}b_{11}&a_{11}b_{12}&\cdots&a_{11}b_{1q}\\
&a_{11}b_{22}&\cdots&a_{11}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{11}b_{pq}
\end{matrix}&
\begin{matrix}
a_{12}b_{11}&a_{12}b_{12}&\cdots&a_{12}b_{1q}\\
&a_{12}b_{22}&\cdots&a_{12}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{12}b_{pq}
\end{matrix}&
\cdots&
\begin{matrix}
a_{1n}b_{11}&a_{1n}b_{12}&\cdots&a_{1n}b_{1q}\\
&a_{1n}b_{22}&\cdots&a_{1n}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{1n}b_{pq}
\end{matrix}\\
&
\begin{matrix}
a_{22}b_{11}&a_{22}b_{12}&\cdots&a_{22}b_{1q}\\
&a_{22}b_{22}&\cdots&a_{22}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{22}b_{pq}
\end{matrix}&
\cdots&
\begin{matrix}
a_{2n}b_{11}&a_{2n}b_{12}&\cdots&a_{2n}b_{1q}\\
&a_{2n}b_{22}&\cdots&a_{2n}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{2n}b_{pq}
\end{matrix}\\
&&\ddots&\vdots\\
&&&
\begin{matrix}
a_{mn}b_{11}&a_{mn}b_{12}&\cdots&a_{mn}b_{1q}\\
&a_{mn}b_{22}&\cdots&a_{mn}b_{2q}\\
&&\ddots&\vdots\\
&&&a_{mn}b_{pq}
\end{matrix}
\end{pmatrix}
字典序排列的上(下)三角阵。
倍数:
分配律:
结合律:
吸收公式:(其中的矩阵乘法能实现),推广: ,
逆:
转置:
秩:
迹:
行列式:
优阵:
——张量和
,则:张量积的特征值为,特征向量为,二者依次对应。
,则:张量和的特征值为,特征向量为,二者依次对应。
高阵左逆:列满秩(),则存在左逆,满足;
低阵右逆:行满秩(),则存在右逆,满足。
设,若存在满足:
;
;
(Hermite阵);
(Hermite阵),
则称为的一个加号逆(M-P逆)或伪逆,记为。
;
;
(幂等);
,为半正定;
;
;
若,则
若可逆,则;
若为高阵,则;
若为低阵,则;
;
;
,(含个1);
,;
。
A=
\left(
\begin{array}{c|c}
B&O\\
\hline
O&D
\end{array}
\right)
\iff
A^+=
\left(
\begin{array}{c|c}
B^+&O^+\\
\hline
O^+&D^+
\end{array}
\right)\\
A=
\begin{pmatrix}
B\\
\hline
O
\end{pmatrix}
\iff
A^+=(B^+|O^+)
若,则有
A^+=\frac{1}{\sum|a_{ij}|^2}A^\mathrm{H}
\forall A\in\mathrm{C}^{m,n},A\xlongequal{正SVD}P\Delta Q^\mathrm{H},A^+=Q\Delta^{-1} P^\mathrm{H}
\forall A\in \mathbb{C}^{m,n},A\xlongequal{高低分解}BC,A^+=C^+B^+,\\
B^+=B_\mathrm{L}=(B^\mathrm{H}B)^{-1}B^\mathrm{H}\,,\,C^+=C_\mathrm{R}=C^\mathrm{H}(CC^\mathrm{H})^{-1}
A^+=(A^\mathrm{H}A)^+A^\mathrm{H}
A^+=A^\mathrm{H}(AA^\mathrm{H})^+
:
核空间:(和同解),即齐次方程组的全体解向量;
像空间:,n维空间上全体向量经矩阵A变换后的集合。
核空间和像空间对加法和倍数封闭,是线性空间。
当方程有解时,设,为其一个特解。
解集为:
\widetilde{W}=\{X|AX=b\}=\{X|X=X_0+Y,Y\in\mathcal{N}(A)\}
对加法不封闭。
,设,有:
核空间正交引理:
X_0 \perp \mathcal{N}(A)
像空间正交引理:
(AX_0-b)\perp \mathcal{R}(A)
最小二乘解:满足的向量。
可利用像空间正交引理证明最小二乘解必存在,为其中一个特解;
的全体最小二乘解为:。
最佳最小二乘解:范数(常用模长)最小的最小二乘解。
可利用核空间正交引理证明为最佳最小二乘解。
AXB=D
相容有特解
(可用逆否命题判定不相容)
A的范数取(F-范数)
的最小范数解为:
\{X_解|||AXB-D||\geq||AX_解B-D||,X\in\mathbb{C}^n\}
若,则称
为最佳最小范数解。
为的最佳最小范数解。
满足
AA^-A=A
满足
AA^{(1,3)}A=A\\
(AA^{(1,3)})^\mathrm{H}=AA^{(1,3)}
满足
AA^{(1,4)}A=A\\
(A^{(1,4)}A)^\mathrm{H}=A^{(1,4)}A
解析函数:
\left\{
\begin{aligned}
&\mathrm{e}^x=\sum_{k=0}^\infin\frac{x^k}{k!}\\
&\sin x=\sum_{m=0}^\infin\frac{(-1)^mx^{2m+1}}{(2m+1)!}\\
&\cos x=\sum_{m=0}^\infin\frac{(-1)^mx^{2m}}{(2m)!}
\end{aligned}
\right.
推广为矩阵函数:(规定)
\left\{
\begin{aligned}
&\mathrm{e}^A=\sum_{k=0}^\infin\frac{A^k}{k!}\\
&\sin A=\sum_{m=0}^\infin\frac{(-1)^mA^{2m+1}}{(2m+1)!}\\
&\cos A=\sum_{m=0}^\infin\frac{(-1)^mA^{2m}}{(2m)!}
\end{aligned}
\right.
\forall A\in\mathbb{C}^{n,n}:\\
\left\{
\begin{aligned}
&\mathrm{e}^{\mathrm{i}A}=\cos A + \mathrm{i}\sin A\\
&\cos A=\frac{1}{2}(\mathrm{e}^{\mathrm{i}A}+\mathrm{e}^{-\mathrm{i}A})\\
&\sin A=\frac{1}{2\mathrm{i}}(\mathrm{e}^{\mathrm{i}A}-\mathrm{e}^{-\mathrm{i}A})\\
&\sin^2A+\cos^2A=I\\
&若AB=BA,则\mathrm{e}^{A}\mathrm{e}^{B}=\mathrm{e}^{B}\mathrm{e}^{A}=\mathrm{e}^{A+B}(一般地,三者并不相等)\\
&\mathrm{e}^{A}\mathrm{e}^{-A}=\mathrm{e}^{-A}\mathrm{e}^{A}=I,(\mathrm{e}^{A})^{-1}=\mathrm{e}^{-A}
\end{aligned}
\right.
若A幂等(),则
f(A)=\sum_{i=0}^\infin \frac{f^{(i)}(0)}{i!}A^i=f(0)I + \sum_{i=1}^\infin \frac{f^{(i)}(0)}{i!}x^i|_{x=1}A=f(0)I + (f(1)-f(0))A
特别地,若,有
\mathrm{e}^{tA}=I+(\mathrm{e}^t-1)A
若A为对角阵(),则
f(A)=\mathrm{diag}(f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n))
A为单阵,则
f(A)=f(\lambda_1)G_1+f(\lambda_2)G_2\cdots+f(\lambda_k)G_k
例:
设,求:和。
解:
可知A为正规阵,可进行谱分解。
由于
A+\mathrm{i}=
\begin{pmatrix}
\mathrm{i}&1\\
-1&\mathrm{i}
\end{pmatrix}
=
\begin{pmatrix}
i\\
-1
\end{pmatrix}
\begin{pmatrix}
1&-\mathrm{i}
\end{pmatrix}\\
(秩一阵)
所以,进而
令,则
G_1=\frac{A-\lambda_2}{\lambda_1-\lambda_2}=\frac{1}{2\mathrm{i}}
\begin{pmatrix}
\mathrm{i}&1\\
-1&\mathrm{i}
\end{pmatrix}\,,\,
G_2=\frac{A-\lambda_1}{\lambda_2-\lambda_1}=\frac{1}{2\mathrm{i}}
\begin{pmatrix}
\mathrm{i}&-1\\
1&\mathrm{i}
\end{pmatrix}
所以有:
f(A)=f(\lambda_1)G_1+f(\lambda_2)G_2
令得:
\mathrm{e}^{tA}=\mathrm{e}^{t\lambda_1}G_1+\mathrm{e}^{t\lambda_2}G_2=
\begin{pmatrix}
\frac{\mathrm{e}^{\mathrm{i}t} + \mathrm{e}^{-\mathrm{i}t}}{2} & \frac{\mathrm{e}^{\mathrm{i}t} - \mathrm{e}^{-\mathrm{i}t}}{2}\\
\frac{-\mathrm{e}^{\mathrm{i}t} + \mathrm{e}^{-\mathrm{i}t}}{2} & \frac{\mathrm{e}^{\mathrm{i}t} + \mathrm{e}^{-\mathrm{i}t}}{2}
\end{pmatrix}
=
\begin{pmatrix}
\cos t & \sin t\\
-\sin t &\cos t
\end{pmatrix}
把换成得:
\mathrm{e}^{-tA}=
\begin{pmatrix}
\cos t & -\sin t\\
\sin t &\cos t
\end{pmatrix}
补:
若令
B=
\begin{pmatrix}
0&-\alpha\\
\alpha&0
\end{pmatrix}
则
\mathrm{e}^B=
\begin{pmatrix}
\cos \alpha & -\sin \alpha\\
\sin \alpha & \cos \alpha
\end{pmatrix}
这是将一个平面笛卡尔坐标系旋转后,新坐标系的过渡矩阵。即,这个过渡矩阵也可以写成
\mathrm{exp}
\begin{pmatrix}
0&-\alpha\\
\alpha&0
\end{pmatrix}
若方阵A有零化式,则
f(A)=\sum_{i=0}^{k-1}\frac{f^{(i)}(a)(A-a)^i}{i!}
若
A=
\begin{pmatrix}
B&O\\
O&D
\end{pmatrix}
则
f(A)=
\begin{pmatrix}
f(B)&O\\
O&f(D)
\end{pmatrix}
若A有有零化式,则
f(A)=f(b)G+f(a)D_0+f'(a)D_1+f''(b)D_2+\cdots+f^{(k-1)}(b)D_{k-1}
上式对任意解析函数成立,改变,利用待定系数法求得。譬如令:
\left\{
\begin{aligned}
&f(x)=1\\
&f(x)=x-a\\
&f(x)=x-b\\
&f(x)=\frac{1}{2}x^2-ax\\
&\vdots
\end{aligned}
\right.
\lambda(f(A))=\{f(\lambda_1),f(\lambda_2),\cdots,f(\lambda_n)\}
\frac{\mathrm{d}A(t)}{\mathrm{d}t}=(a_{ij}')_{m\times n}
\int_a^bA(t)\mathrm{d}t=\Big(\int_a^ba_{ij}\mathrm{d}t\Big)_{m\times n}
\left\{
\begin{aligned}
&\frac{\mathrm{d}[A(t)B(t)]}{\mathrm{d}t}=\frac{\mathrm{d}A(t)}{\mathrm{d}t}B(t)+A(t)\frac{\mathrm{d}B(t)}{\mathrm{d}t}\\
&\frac{\mathrm{d}kA(t)}{\mathrm{d}t}=k\frac{\mathrm{d}A(t)}{\mathrm{d}t}\\
&\frac{\mathrm{d}(A+B)}{\mathrm{d}t}=\frac{\mathrm{d}A}{\mathrm{d}t}+\frac{\mathrm{d}B}{\mathrm{d}t}\\
&\frac{\mathrm{d}A}{\mathrm{d}t}=O \iff A(t)为常矩阵
\end{aligned}
\right.
\frac{\mathrm{d}X}{\mathrm{d}t}=AX
通解为
X=\mathrm{e}^{tA}C\,\,\,(C为任意常矩阵)
例:
(用矩阵法)解微分方程:,其中常数,是的函数。
解:
由题设:
a^{-1}x''+ax=0
设则:
y'=-ax
令,利用以上两式可得:
\frac{\mathrm{d}X}{\mathrm{d}t}
=AX\,\,,\,\,
A=
\begin{pmatrix}
0&a\\
-a&0
\end{pmatrix}
是齐次微分方程,则:
\begin{pmatrix}
x\\
y
\end{pmatrix}
=X=
\mathrm{e}^{tA}C=
\begin{pmatrix}
\cos at&\sin at\\
-\sin at&\cos at
\end{pmatrix}
\begin{pmatrix}
c_1\\
c_2
\end{pmatrix}
则原方程的通解为:
x=c_1\cos at + c_2\sin at
\frac{\mathrm{d}X}{\mathrm{d}t}=AX+F(t)
通解为
X=\mathrm{e}^{tA}\Big(\int \mathrm{e}^{-tA}F(t)\mathrm{d}t + C\Big)
满足以下3条运算性质,由向量映射至实数的单目运算:
正性:且;
齐次性:;
三角形:。
1-范数:
||X||_1=|x_1|+|x_2|+\cdots+|x_n|
2-范数(模长,F-范数):
||X||_2=|X|=||X||_\mathrm{F}=\sqrt{X^\mathrm{H}X}=\sqrt{|x_1|^2+|x_2|^2+\cdots+|x_n|^2}
无穷范数:
||X||_\infin=\mathrm{max}\{|x_1|,|x_2|,\cdots,|x_n|\}\,\,\,(最大模)
p-范数:
||X||_\mathrm{p}=(|x_1|^p+|x_2|^p+\cdots+|x_n|^p)^\frac{1}{p}\\
(且有:\lim_{p\rightarrow\infin}||X||_\mathrm{p}=||X||_\infin)
内积范数:
||X||_{内积}=\phi(X)=\sqrt{X^\mathrm{H}AX}\,\,\,(A为某一矩阵)
满足下列四条性质,由矩阵映射至实数的单目运算:
正性:且;
齐次性:;
三角形:;
次乘性:若为方阵,。
A=(a_{ij})_{n\times n}=
\begin{pmatrix}
A_1\\
A_2\\
\vdots\\
A_n
\end{pmatrix}=
(\alpha_1,\alpha_2,\cdots,\alpha_n)
最大行和范数:
||A||_1=\mathrm{max}\{||A_1||_1,||A_2||_1,\cdots,||A_n||_1\}\\
(即:所有行中最大的1-范数)
最大列范数:
||A||_\infin=\mathrm{max}\{||\alpha_1||_1,||\alpha_2||_1,\cdots,||\alpha_n||_1\}\\
(即:所有列中最大的1-范数)
谱范数:
\rho(A)=||A||_2=\sqrt{\lambda_1}\,\,,\,\,\lambda_1=\mathrm{max}(\lambda(A^\mathrm{H}A))
F-范数:
||A||_\mathrm{F}=\sqrt{\sum|a_{ij}|^2}=\sqrt{\mathrm{tr}(A^\mathrm{H}A)}\\
(A对自身作内积)
总和范数:
||A||_\mathrm{M}=\sum|a_{ij}|
G-范数:
||A||_\mathrm{G}=n\cdot\mathrm{max}\{|a_{ij}|\}\,\,,\,\,n为A的阶数
设为上任意向量范数,规定上对应函数:
\phi(A)\overset{\Delta}{=}\mathrm{max}\Big\{\frac{||AX||}{||X||}\Big\}=\mathrm{max}\{||AY||\}\,\,\,(Y=\frac{X}{||X||})
称为对应向量范数的A的算子范数。
对给定的向量范数和矩阵范数,如果对于任意向量和满足:
||AX||\leq||A||||X||
则称所给的矩阵范数与向量范数相容。
可以证明任给矩阵范数总有向量范数与之相容。算子范数与原向量范数相容。
\forall 两种向量范数||\cdot||_a,||\cdot||_b,\forall X\in\mathbb{C}^n,\exists k_1,k_2>0\,\,\,s.t.\\
k_1\leq\frac{||X||_a}{||X||_b}\leq k_2\\
k_1||X||_b\leq||X||_a\leq k_2||X||_b
\forall ||\cdot||,\forall X\neq 0\,\,s.t.\\
\Big|\Big|\frac{X}{||X||}\Big|\Big|=\frac{||X||}{||XX||}=1
\forall X,Y \in \mathbb{C}^n\,\,\,s.t.\\
|(X|Y)|\leq ||X||_\mathrm{F}||Y||_\mathrm{F}\\
(\sqrt{Y^\mathrm{H}X}\leq\sqrt{X^\mathrm{H}X}\sqrt{Y^\mathrm{H}Y})
任给一个矩阵,谱范数为值最小的范数。
或;
;
或
为已知矩阵范数,,也为范数。
\forall A\in\mathbb{C}^{n,n},\epsilon > 0,\exists 小范数||\cdot||_小\,\,\,s.t.\\
||\cdot||_小<\rho(A)+\epsilon
泛函在处连续。
\sum A_k = \sum (a_{ij})_{n\times n}
\sum A_k 收敛 \iff \sum\sum_{i=1,j=1}^{n,n}a_{ij} 收敛
\sum A_k 收敛 \Longrightarrow A_k \rightarrow O \,\,\,(k\rightarrow\infin)
\sum A_k 收敛 \Longrightarrow ||A_k|| \rightarrow 0 \,\,\,(k\rightarrow\infin)
幂级数:
引理:
||A||<1 \Longrightarrow A^k \rightarrow O\\
\rho(A)<1 \iff A^k \rightarrow O
幂级数收敛的充要条件:
\rho(A)<1 \iff \sum A^k 收敛
谱范数小于1
矩阵级数绝对收敛的必要条件:
\sum||A_k|| 收敛 \Longrightarrow \sum A_k 收敛
幂级数绝对收敛的充分条件:
若,则收敛;
若,则收敛。
方阵具有n个盖尔圆盘,其盖尔半径为:
\left\{
\begin{aligned}
&R_1=\sout{|a_{11}|}+|a_{12}|+\cdots+|a_{1n}|\\
&R_2=|a_{21}|+\sout{|a_{22}|}+\cdots+|a_{2n}|\\
&\vdots\\
&R_n=|a_{n1}|+|a_{n2}|+\cdots+\sout{|a_{nn}|}
\end{aligned}
\right.
第k个圆盘为
圆盘定理1:,即n个盖尔圆盘覆盖了所有特征根。
复平面中所有相连的盖尔圆盘组成一个分支,不与其他盖尔圆相连的为一个独立圆。
圆盘定理2:由k个圆盘构成的一个分支内恰有k个根。特别地,独立圆中恰有一个根。
对于实方阵,由于实系数多项式的根全为共轭根,实方阵的盖尔圆沿实轴对称,于是:
独立圆中恰有一个根,为实根。
由奇数个圆盘组成的分支中必有一个实根。
若A的每个,称A为严格对角占优。
严格对角占优的方阵的每个盖尔圆必然不含原点,则A可逆。
由于转置阵与有相同特征根,的行为的列,于是按照列形成的盖尔圆也能估计特征根。可以行列配合使用。
\begin{aligned}
&\forall A\in \mathbb{C}^{n,n},\\
&|\lambda_1|^2+|\lambda_2|^2+\cdots+|\lambda_n|^2 \leq \sum_{i=1,j=1}^{n,n}|a_{ij}|^2,\\
&|\lambda_1|^2+|\lambda_2|^2+\cdots+|\lambda_n|^2 = \sum_{i=1,j=1}^{n,n}|a_{ij}|^2 \iff A^\mathrm{H}A=AA^\mathrm{H}\,\,\,(A正规).
\end{aligned}
本文章使用limfx的vscode插件快速发布