Schur 定理

最后更新于:2023年2月24日 下午

在研究一个数学对象时,我们经常会对它进行分类。比如我们通常把数分为:实数,虚数;实数又分成有理数,无理数;当然也有按照正负来分的。还有整数分成素数(也叫质数)和合数,等等。现在我们谈谈矩阵的分类,以下默认矩阵是方的。

数学中分类一般是按照等价关系划分等价类的

所谓等价关系其实就是满足反身性,对称性,传递性的二元关系(总结一下我们等于号的全部性质就知道了) 矩阵中最常见的三种等价关系分别是

  1. 相抵等价---初等变换
  2. 合同等价---合同变换
  3. 相似等价---相似变换

相抵等价完全由秩确定,合同变换我们一般只针对实对称矩阵处理。相似变化是我们讨论最多的也是最复杂的,我们总想把复杂的东西变简单,对于一个矩阵我们总想做变换把它变成最简单形式(称为标准型),相抵等价的标准型和对称矩阵合同等价的标准型都十分简单,但是很不幸的也是最幸运的是,并非所有的矩阵都可以相似于对角阵,相似变换标准型称为若尔当标准型,以纪念若尔当对矩阵相似变换所做的贡献。

然而今天主题并不是上面的任何一种,而是由伟大的数学家 Issai Schur 提出的酉相似,酉变换的概念和相应定理。

任意复方阵酉相似于上三角矩阵

酉矩阵和酉相似

一个矩阵称为酉矩阵,如果它的共轭转置是它的逆。复矩阵 \(A\)\(B\) 称为酉相似的,如果存在酉矩阵 \(U\) 使得 \(B=U^ \star AU\) ,这里\(U^ \star\) 表示 \(U\) 的共轭转置。

定理 1. 对任意复方阵 \(A\),存在酉矩阵 \(U\) 使得

\[ A = U \left( \begin{matrix} \lambda_1 & \star & \star & \star \\ & \lambda_2 & \star & \star \\ & & \ddots & \star \\ & & & \lambda_n \end{matrix} \right)U^\star \]

其中\(\lambda_1,\lambda_2,\cdots,\lambda_n\)\(A\)的全部特征值。

Proof:设 \(\alpha_1\)\(A\)的特征值 \(\lambda_1\) 对应的特征向量,将 \(\alpha_1\) 扩充为\(\mathbf{C}^n\)的一组标准正交基 \(P=(\alpha_1,\alpha_2,\cdots,\alpha_n)\) ,则 \(A = P \left( \begin{matrix} \lambda_1 & \star \\ \mathbf{0} & B \end{matrix} \right)P^\star\) 。对复矩阵的阶数应用数学归纳法,存在\(n-1\) 阶酉矩阵 \(Q\) 使得 \[ B = Q \left( \begin{matrix} \lambda_2 & \star & \star \\ & \ddots & \star \\ & & \lambda_n \end{matrix} \right) Q^ \star \] 因此 \[ A = U \left( \begin{matrix} \lambda_1 & \star & \star & \star \\ & \lambda_2 & \star & \star \\ & & \ddots & \star \\ & & & \lambda_n \end{matrix} \right)U^\star \] 其中 \(U = P \left( \begin{matrix} 1 & \\ & Q \end{matrix} \right)\)\(n\) 阶酉矩阵,证毕。

矩阵酉相似于对角阵当且仅当它是正规矩阵

矩阵 \(A\) 称为正规矩阵(normal matrix),如果$ A^ A=AA^ $。显然酉矩阵,Hermite 阵,反 Hermite 阵都是正规矩阵。

定理 2(Issai Schur)矩阵 \(A\) 酉相似于对角阵的充分必要条件是 \(A\) 是正规矩阵

Proof:必要性显然,下证明充分性:

由定理 1 知,存在酉矩阵 \(U\) 使得

\[ A = U \left( \begin{matrix} \lambda_1 & \star & \star & \star \\ & \lambda_2 & \star & \star \\ & & \ddots & \star \\ & & & \lambda_n \end{matrix} \right)U^\star \]

\(A\) 是正规矩阵,则有

$$ ( \[\begin{matrix} \overline{\lambda_1} & & & \\ \star & \overline{\lambda_2} & & \\ \star & \star & \ddots & \\ \star & \star & \star & \overline{\lambda_n} \end{matrix}\]

) (\begin{matrix} _1 & & & \ & _2 & & \ & & & \ & & & _n \end{matrix} ) =

( \begin{matrix} _1 & & & \ & _2 & & \ & & & \ & & & _n \end{matrix} ) ( \[\begin{matrix} \overline{\lambda_1} & & & \\ \star & \overline{\lambda_2} & & \\ \star & \star & \ddots & \\ \star & \star & \star & \overline{\lambda_n} \end{matrix}\]

) \[ 考虑矩阵两端$(1,1)$位置得到: \] _1 = _1 +^2 \[ 其中$ \sigma^2 $是上三角矩阵 \] ( \begin{matrix} _1 & & & \ & _2 & & \ & & & \ & & & _n \end{matrix} ) $$ 的第一行的非对角元绝对值之平方和,因此由 \(\sigma^2\) 可知上三角矩阵的第一行非对角元全为 0,类似的考察矩阵两端 \((2,2)\) 的位置,一直到 \((n,n)\) 的位置即可知道上面矩阵是对角阵,证毕。

上述定理给出了酉相似于对角型的充分必要条件,而且条件十分易于判断。整个过程简洁优美。另外由于酉矩阵条件数恒定为 1,有其数值稳定性,因此经常用于实际计算中,例如 QR 方法涉及的两个矩阵变换 Househoulder 变换和 Givens 变换都是酉变换。