特征值和特征向量

本文最后更新于:2022年9月27日 下午

特征值和特征向量是矩阵的重要性质,本文记录相关内容。

我们知道,矩阵乘法对应了一个变换,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。
实际上,上述的一段话既讲了矩阵变换特征值及特征向量的几何意义(图形变换)也讲了其物理含义。物理的含义就是运动的图景:特征向量在一个矩阵的作用下作伸缩运动,伸缩的幅度由特征值确定。特征值大于1,所有属于此特征值的特征向量身形暴长;特征值大于0小于1,特征向量身形猛缩;特征值小于0,特征向量缩过了界,反方向到0点那边去了。
关于特征值和特征向量,这里请注意两个亮点。这两个亮点一个是线性不变量的含义,二个是振动的谱含义。

——《线性代数的几何意义》

定义

  • 对于一个给定的方阵 ${\displaystyle A}$,定义它的特征向量(eigenvector,也译固有向量、本征向量)为非零向量${\displaystyle v}$ ,$v$ 经过这个线性变换${\displaystyle A}$之后,得到的新向量仍然与原来的 ${\displaystyle v}$ 保持在同一条直线上,但其长度或方向也许会改变,公式表示为:

$$
A v = \lambda v
$$

  • $\lambda$ 为标量,即特征向量的长度在该线性变换下缩放的比例,称 ${\displaystyle \lambda }$ 为方阵 $A$ (或线性变换 $A$) 的特征值(eigenvalue,也译固有值、本征值)。
  • 解得的 ${\displaystyle \lambda }$ 可能为重根,那么这个根重复的次数为 ${\displaystyle \lambda }$ 的代数重数

如果特征值为正,则表示 ${\displaystyle v}$ 在经过线性变换的作用后方向也不变;如果特征值为负,说明方向会反转;如果特征值为0,则是表示缩回零点。但无论怎样,仍在同一条直线上。

  • 特征值 $\lambda$ 解得的所有非零向量 $v$ 均可称为 $A$ 的特征向量,可以看作是关于系数 ${\displaystyle \lambda }$ 的方程的非零解:

$$
\mathbf{T}(x)=\lambda x
$$

  • 矩阵的特征向量不是固定的,特征值 ${\displaystyle \lambda }$ 对应的所有特征向量和零向量一起可以组成一个向量空间,这个空间称为 $A$ 的一个特征空间

  • 这个特征空间如果是有限维的,那么它的维数叫做 ${\displaystyle \lambda }$ 的几何重数

  • 模最大的特征值对应的特征向量为 ${\displaystyle A}$ 的主特征向量

  • 有限维向量空间上的一个变换 ${\displaystyle A}$ 的所有特征值的集合称为 $A$ 的

计算特征值/特征向量

  • $\mathbf {A}$ 的特征向量 ${\displaystyle \mathbf {x} }$ ,按照定义,是在变换 ${\displaystyle \mathbf {A} }$的作用下会得到$\mathbf {x}$ 自身的若干倍的非零向量。假设在 ${\displaystyle \mathbf {A} }$的作用下${\displaystyle \mathbf {x} }$ 变成了自身的 ${\displaystyle \lambda }$,也就是

$$
\mathbf{A} \mathbf{x}=\lambda \mathbf{x}
$$

  • 在等式两边的左侧乘以单位矩阵 $I$,得到:
$$ \begin{array} \mathbf{I A} \mathbf{x}=\mathbf{I} \cdot \lambda \mathbf{x} \\ \mathbf{A} \mathbf{x}=(\lambda I) \mathbf{x} \end{array} $$
  • 因此

$$
(\mathbf{A}-\lambda \mathbf{I}) \mathbf{x}=0
$$

  • 根据线性方程组理论,为了使这个方程有非零解,矩阵 ${\displaystyle \mathbf {A} -\lambda \mathbf {I} }$的行列式必须是零:

$$
\operatorname{det}(\mathbf{A}-\lambda \mathbf{I})=0
$$

  • 按照行列式的展开定义,上面式子的左端是一个关于 ${\displaystyle \lambda }$ 的多项式,称为特征多项式。这个多项式的系数只和 ${\displaystyle \mathbf {A} }$ 有关。
  • 若$A $ 是一个 $n×n $矩阵,则 ${\displaystyle p_{A}}$ 为 $n$ 次多项式,因而 $A$ 最多有 $n$ 个特征值。
  • 如果A的系数是在一个代数闭域里面(比如说复数域),那么代数基本定理说明这个方程刚好有 $n$ 个根(如果重根也计算在内的话)。
  • 所有奇数次的多项式必有一个实数根,因此当 $n$ 为奇数的时候,每个n维实系数矩阵至少有一个实数特征值。当矩阵系数是实数的时候,非实数的特征值会成共轭对出现。
  • 一旦找到特征值λ,相应的特征向量就可以通过求解如下方程得到:

$$
(A-\lambda I) v=0
$$

特点

  1. 只有方阵才有特征值和特征向量
  2. 不同特征值对应的特征向量是线性无关的
  3. 方阵总有特征值, 实系数的矩阵不一定有实数特征值
  • 考虑矩阵:
$$ \left[\begin{array}{cc}0 & 1 \\ -1 & 0\end{array}\right] $$
  1. 对于 $n\times n$ 的矩阵 $A$ 来说,复数域上特征值的代数重数的和为 $n$,几何重数小于等于代数重数,若几何重数小于代数重数则无法进行特征值分解
  • 考虑矩阵:
$$ A=\left[\begin{array}{ll}1 & 1 \\ 0 & 1\end{array}\right] $$
  • 它只有一个特征值,也就是 $λ = 1$。
  • 其特征多项式是 $(\lambda-1)^2$,所以这个特征值代数重次为2。
  • 但是,相应特征空间是通常称为 $x$ 轴的数轴,由向量 $ \begin{bmatrix} 1 \\ 0 \end{bmatrix} $ 线性生成,所以几何重数是1。
  • 该矩阵无法进行特征分解,即找不到 2 个正交的特征向量
  1. 一个 $n×n$ 矩阵如果有 $n$不同特征值,则总是可以对角化的。

  2. 因为,也就是矩阵主对角线元素之和,在酉等价下不变,若尔当标准型说明它等于所有特征值之和

  3. 对于实对称矩阵或埃尔米特矩阵来说,不同特征值对应的特征向量必定正交(相互垂直)

参考资料


特征值和特征向量
https://www.zywvvd.com/notes/study/linear-algebra/basic-knowledge/eigenvalues-and-eigenvectors/eigenvalues-and-eigenvectors/
作者
Yiwei Zhang
发布于
2022年9月9日
许可协议