スポンサーリンク

「行列の三角化①、ハミルトン-ケーリーの定理」【線型代数学の基礎シリーズ】固有値編 その3

固有値、固有ベクトル

本記事の内容

本記事は行列の三角化について解説する記事です。

本記事を読むにあたり、行列の対角化について知っている必要があるため、以下の記事も合わせてご覧ください。

三角化?

\(n\)次正方行列\(A\)が与えられたとき、\(A\)が必ずしも以下の定理を満たすとは限りません。

定理1.

\(n\)次正方行列\(A\)について次の4条件は同値である。
  1. \(A\)は対角化可能である。
  2. \(A\)の固有多項式は重複を込めて\(n\)個の解を持ち、かつ各固有値の重複度はその固有値に属する固有空間の次元に一致する。
  3. すなわち、\(A\)の異なる固有値を\(\lambda_1,\dots,\lambda_s\)とし、\(\lambda_i\)の重複度を\(k_i\)、\(\lambda_i\)に属する固有空間を\(V(\lambda_i)\)とするとき、 $$ \sum_{i=1}^sk_i=n,\quad k_i=\dim(V(\lambda_i))\ (i=1,\dots,s) $$ が成り立つ。
  4. \(A\)の各固有値に属する固有空間の次元の和は\(n\)になる。
  5. すなわち、\(A\)の異なる固有値を\(\lambda_1,\dots,\lambda_s\)とし、\(\lambda_i\)に属する固有空間を\(V(\lambda_i)\)とするとき、 $$ \sum_{i=1}^s\dim\left( V(\lambda_i)\right)=n $$ が成り立つ。
  6. \(n\)個の線型独立な\(A\)の固有ベクトルが存在する。

従って、対角化できるとは限りません。
では、少し条件を緩めた状況でのの程度まで簡単な形に変換できるか、を考えてみよう、というのが三角化です。
要するに、対角化は対角行列に変換すること、三角化は三角行列に変換することです。
この考察は有名なハミルトン-ケーリー(ハミルトン-ケーリー)の定理に発展します。

で、三角化って?

対角化と似たようなもんです。

三角化

\(n\)次正方行列\(A\)が与えられたとき、\(B=P^{-1}AP\)が三角行列となるような正則行列\(P\)と三角行列\(B\)を求めることを行列\(A\)の三角化という。そして、このような\(P\)と\(B\)が存在するとき、\(A\)は三角化可能であるという。

要するに、「対角行列にできないんだったら三角行列に変換できません?」ということです。

ここで、直交行列について復習しておきます。

直交行列

\(n\)次正方行列\(P\)が $$ PP^\top=I_n $$ を満たすとき、\(P\)を直交行列という。

固有値と三角化

定理2.(固有値と三角化)

\(n\)次正方行列\(A\)が、重複も含めて\(n\)個の固有値\(\lambda_1,\dots,\lambda_n\)をもつとき(すなわち、\(\varphi_A(t)=(\lambda_1-t)\cdots(\lambda_n-t)\)となるとき)、\(A\)は適当な正則行列\(P\)によって次の形に三角化される。 $$ P^{-1}AP= \begin{pmatrix} \lambda_1&&&\huge{*}\\ &\lambda_2&&\\ &&\ddots&\\ \huge{O}&&&\lambda_n \end{pmatrix} $$

定理2.の証明

\(A\)の次数についての数学的帰納法で証明します。

\(n=1\)のとき、定理は成り立ちます。
実際、固有値\(\lambda_1\)がただ一つ定まり、\(P\)として\(1\)を取れば良いからです。

\(n\geq2\)として、\(n-1\)次以下の正方行列について、定理が成り立つとしましょう。

\(A\)を\(n\)次正方行列、\(\lambda_1\)を\(A\)の固有値のうちの1つとし、\(\boldsymbol{x}_1\)を固有値\(\lambda_1\)に属する固有ベクトルとします。
\(\mathbb{R}^{n}\)の\(n-1\)個のベクトル\(\boldsymbol{x}_2,\dots,\boldsymbol{x}_n\)を選んで、\(\boldsymbol{x}_1,\dots,\boldsymbol{x}_n\)が\(\mathbb{R}^n\)の基底になるようにします。

このとき、\(\boldsymbol{x}_1,\dots,\boldsymbol{x}_n\)を列ベクトルに持つ行列
$$
P_1=(\boldsymbol{x}_1\ \dots\ \boldsymbol{x}_n)
$$
は正則行列で、
$$
AP_1
=P_1
\left(\begin{array}{c|ccc}
\lambda_1&&*&\\ \hline
0&&&\\
\vdots&&A_1\\
0&&&
\end{array}\right)
$$
の形に書くことができます。
ここで、\(A_1\)は\(n-1\)次正方行列です。
従って、
$$
{P_1}^{-1}AP_1
=
\left(\begin{array}{c|ccc}
\lambda_1&&*&\\ \hline
0&&&\\
\vdots&&A_1\\
0&&&
\end{array}\right)
$$
となります。
ここで、次の事実を使います。

定理3.

\(n\)次正方行列\(A\)および\(B\)が相似であれば、 $$ \varphi_A(t)=\varphi_B(t) $$ である。従って、\(A\)と\(B\)の固有値全体は重複を込めて一致する。

定理3.の証明は【線型代数学の基礎シリーズ】固有値編 その1を御覧ください。

定理3.から\(A\)と\(P^{-1}AP\)の固有値の全体は一致するので、次の事実から\(A_1\)の固有値の全体は\(\lambda_2,\dots,\lambda_n\)です。

定理4.

\(X\)を\(n\)次正方行列とし、\(n=r+s\)を満たすような自然数\(r,s\)に対して、\(A\)を\(r\)次正方行列、\(B\)を\((r,s)\)型の行列、\(O\)を\((s,r)\)型の零行列、\(D\)を\(s\)次正方行列とする。このとき、 $$ |X|= \left| \begin{array}{c} A&B\\ O&D\\ \end{array} \right|=|A|\cdot|D| $$ である。

定理4.の証明は、【線型代数学の基礎シリーズ】固有値編 その1を御覧ください。

さて、\(n-1\)次正方行列\(A_1\)は帰納法の仮定から適当な\(n-1\)次正則行列\(P_2\)によって三角化されて、
$$
{P_2}^{-1}AP_2=
\begin{pmatrix}
\lambda_2&&\huge{*}\
&\ddots&\
\huge{O}&&\lambda_n
\end{pmatrix}
$$
となります。
そこで、
$$
P=P_1
\left(\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)
$$
とすれば、\(P\)は正則行列で、しかも
\begin{eqnarray}
P^{-1}AP&=&
\left(
P_1
\left(\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)
\right)^{-1}AP_1
\left(\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)\\
&=&
\left(
\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)^{-1}{P_1}^{-1}AP_1
\left(
\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)\\
&=&
\left(
\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&{P_2}^{-1}\\
0&&&
\end{array}\right)
\left(\begin{array}{c|ccc}
\lambda_1&&*&\\ \hline
0&&&\\
\vdots&&A_1\\
0&&&
\end{array}\right)
\left(
\begin{array}{c|ccc}
1&0&\cdots&0\\ \hline
0&&&\\
\vdots&&P_2\\
0&&&
\end{array}\right)\\
&=&
\left(\begin{array}{c|ccc}
\lambda_1&&*&\\ \hline
0&&&\\
\vdots&&{P_2}^{-1}A_1P_2\\
0&&&
\end{array}\right)\\
&=&
\begin{pmatrix}
\lambda_1&&&\huge{*}\\
&\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n
\end{pmatrix}
\end{eqnarray}
となります。

(※以下については内積やシュミットの直交化法についての知識が必要ですが、それは次回か次次回で解説します。)
以上において、\(\boldsymbol{x}_1,\dots,\boldsymbol{x}_n\)を\(\mathbb{R}^n\)の標準的な内積に関して大きさが\(1\)で互いに直交するような基底となるように選ぶことで、\(P_1\)は直交行列とできます。
\(P_2\)も帰納法の仮定から直交行列として取れるので、結局の所\(P\)として直交行列を取ることができます。
※これについては内積やシュミットの直交化法についての知識が必要ですが、それは次回か次次回で解説します。

定理2.の証明終わり

三角化の複素数バージョン

行列の三角化の複素数バージョンを考えてみます。
そこでユニタリ行列について復習します。

ユニタリ行列

複素数を成分とする行列\(U\)が\(UU^*=U\overline{U}^\top=I_n\)を満たすとき、\(U\)をユニタリ行列という。

では、定理2.の複素数バージョンについて見ていきましょう。

定理5.

\(n\)次複素正方行列\(A\)に対して、適当な正則行列\(P\)を取れば、\(P^{-1}AP\)は三角行列となる。すなわち、 $$ P^{-1}AP= \begin{pmatrix} \lambda_1&&&\huge{*}\\ &\lambda_2&&\\ &&\ddots&\\ \huge{O}&&&\lambda_n \end{pmatrix} $$ である。\(P\)としてユニタリ行列をとることもできる。

定理5.の証明

複素数の線型空間のカテゴリーにおいては、\(n\)次正方行列\(A\)は重複を含めて常に\(n\)個の固有値を持ちます。
故に、定理2.の証明をそのまんま適用させる事ができるので、適当な正則行列\(P\)によって\(P^{-1}AP\)が三角行列にできます。

(※以下については内積やシュミットの直交化法についての知識が必要ですが、それは次回か次次回で解説します。)
そして、\(\mathbb{C}^n\)上の標準的な(エルミート)内積(次回解説します)に関して、定理2.の証明中の\(\boldsymbol{x}_1,\dots,\boldsymbol{x}_n\)として、大きさが\(1\)で互いに直交するような基底を選ぶと、\(P_1\)はユニタリ行列です。

\(P_2\)も帰納法の仮定から、ユニタリ行列として取れるので、結局の所は\(P\)としてユニタリ行列が取れます。

定理5.の証明終わり

行列の多項式

実は、行列の多項式に関する諸性質を導くのに、行列の三角化のテクニックは重要な役割を果たします。
要するに、多項式の行列バージョン、といったところです。

行列の多項式

\(x\)の多項式 $$ f(x)=a_mx^m+a_{m-1}x^{m-1}+\cdots+a_0 $$ と\(n\)次正方行列\(A\)が与えられたとき、 $$ f(A)=a_mA^m+a_{m-1}A^{m-1}+\cdots+a_0I_n $$ と定める。ただし、\(A^n\)は\(n\)個の\(A\)の積である。この\(f(A)\)を多項式\(f(x)\)に行列\(A\)を代入して得られた行列という。

まさに、多項式に行列を代入したもの、ということです。
ただ、\(\varphi_A(t)\)は数であるのに対して、\(\varphi_A(A)\)は行列であることに注意してください。

ハミルトン-ケーリーの定理

実は、筆者が高校生のときは行列がカリキュラムに入っていたので、一足先にハミルトン-ケーリーの定理を学んでいました。
筆者と同年代の方は「懐かしいな」と思うかもしれません。

定理6.(ハミルトン-ケーリーの定理)

\(A\)を任意の正方行列、\(\varphi_A(t)\)を\(A\)の固有多項式とするとき、 $$ \varphi_A(A)=O $$ が成り立つ。

定理6.の証明

与えられた\(n\)次正方行列\(A\)が実数を成分とする行列だったとしても、\(A\)を複素線型空間の線型変換
$$
A: \mathbb{C}^n\to\mathbb{C}^n
$$
とみなすことができます。
実際、任意の実数は複素数\(a+ib\ (a,b\in\mathbb{R}\)、\(i\)は虚数単位)の\(b=0\)の場合なので、\(b=0\)の場合の複素数と捉えることができるからです。
勿論、行列\(A\)が最初から複素数を成分とする行列で、\(A\)が複素線型空間の線型変換として与えられている場合はそのままでOKです。

さて、このとき、行列\(A\)は重複を込めて\(n\)個の固有値を持ちます(代数学の基本定理から)。
それらを\(\lambda_1,\dots,\lambda_n\)としましょう。
\lambda_1,\dots,\lambda_nは固有方程式\(\varphi_A(t)=0\)の解なので、固有多項式\(\varphi_A(t)\)は次のように因数分解されます。
$$
\varphi_A(t)=(\lambda_1-t)\cdots(\lambda_n-t)
$$
ただし、固有値\(\lambda_1,\dots,\lambda_n\)は重複を含めていますので、\(\lambda_1,\dots,\lambda_n\)の中には一致しているものもあります。

ここで、\(A\)と\(\lambda_iI_n\)は可換、すなわち
$$
A(\lambda_iI_n)=(\lambda_iI_n)A
$$
なので、固有多項式\(\varphi_A(t)\)に\(A\)を代入したものと、固有多項式を上のように因数分解してから代入したものは一致しています。
一般の行列の積は可換ではないのですが、今回は可換なので、一致しています。
すなわち、
$$
\varphi_A(A)=(\lambda_1I_n-A)(\lambda_2I_n-A)\cdots(\lambda_nI_n-A)
$$
が成り立ちます。
(※ちなみに、この式の右辺を整理するときに、\(A(\lambda_iI_n)=(\lambda_iI_n)A\)が必要になります。)

さて、定理5.から適当な\(n\)次正方行列\(P\)によって\(A\)を三角化して、
$$
P^{-1}AP=
\begin{pmatrix}
\lambda_1&&&\huge{*}\\
&\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n
\end{pmatrix}
$$
とできます。
そして、
\begin{eqnarray}
P^{-1}\varphi_A(A)P&=&P^{-1}(\lambda_1I_n-A)(\lambda_2I_n-A)\cdots(\lambda_nI_n-A)P\\
&=&P^{-1}(\lambda_1I_n-A)PP^{-1}(\lambda_2I_n-A)PP^{-1}\cdots PP^{-1}(\lambda_nI_n-A)P\\
\end{eqnarray}
です。
ここで、\(P\)と\(\lambda_iI_n\)も可換なので、\(i=1,2,\dots,n\)に対して
\begin{eqnarray}
P^{-1}(\lambda_iI_n-A)P&=&P^{-1}(\lambda_iI_n)P-P^{-1}AP\\
&=&\lambda_iP^{-1}I_nP-P^{-1}AP\\
&=&\lambda_iP^{-1}P-P^{-1}AP\\
&=&\lambda_iI_n-P^{-1}AP\\
\end{eqnarray}
となります。
従って、
\begin{eqnarray}
P^{-1}\varphi_A(A)P&=&P^{-1}(\lambda_1I_n-A)PP^{-1}(\lambda_2I_n-A)PP^{-1}\cdots PP^{-1}(\lambda_nI_n-A)P\\
&=&(\lambda_1I_n-P^{-1}AP)(\lambda_2I_n-P^{-1}AP)\cdots(\lambda_nI_n-P^{-1}AP)
\end{eqnarray}
となります。
このとき、任意の\(k=1,2,\dots,n\)に対して
$$
(\lambda_1I_n-P^{-1}AP)\cdots(\lambda_kI_n-P^{-1}AP)=
\left(
\begin{array}{ccc|c}
0&\cdots&0&\\
\vdots&&\vdots&\huge{*}\\
0&\cdots&0&
\\\end{array}\right)
$$
となることを示します。
ただし、上記の行列の左側の\(0\)のみからなる行列は列が\(k\)個あります。

\(k\)についての数学的帰納法で証明します。

\(k=1\)のとき、
\begin{eqnarray}
\lambda_1I_n-P^{-1}AP&=&
\begin{pmatrix}
\lambda_1&&&\huge{O}\\
&\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n
\end{pmatrix}-
\begin{pmatrix}
\lambda_1&&&\huge{*}\\
&\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n
\end{pmatrix}\\
&=&
\begin{pmatrix}
\lambda_1-\lambda_1&&&\huge{*}\\
&\lambda_2-\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n-\lambda_n
\end{pmatrix}\\
&=&
\begin{pmatrix}
0&&&\huge{*}\\
&\lambda_2-\lambda_2&&\\
&&\ddots&\\
\huge{O}&&&\lambda_n-\lambda_n
\end{pmatrix}\\
\end{eqnarray}
となるので、成り立ちます。

では、\(k\)のときに成り立つとして、\(k+1\)のときに成り立つことを示しましょう。
\begin{eqnarray}
&&(\lambda_1I_n-P^{-1}AP)\cdots(\lambda_kI_n-P^{-1}AP)(\lambda_{k+1}I_n-P^{-1}AP)\\
&=&\left(
\begin{array}{ccc|c}
0&\cdots&0&\\
&&&\\
\vdots&&\vdots&\huge{*}\\
&&&\\
0&\cdots&0&
\\\end{array}\right)
\begin{pmatrix}
\lambda_{k+1}-\lambda_1&&&&\huge{*}\\
&\ddots&&&\\
&&0&&\\
&&&\ddots&\\
\huge{O}&&&&\lambda_{k+1}-\lambda_n
\end{pmatrix}\\
&=&
\left(
\begin{array}{cccc|c}
0&\cdots&0&0&\\
\vdots&&\vdots&\vdots&\huge{*}\\
\vdots&&\vdots&\vdots&\\
0&\cdots&0&0&
\\\end{array}\right)
\end{eqnarray}
となります。
ただし、1つ目の\(=\)の左側の\(0\)のみからなる行列の一部分の列の数が\(k\)個、2つ目の左側の\(0\)のみからなる行列の一部分の列の数が\(k+1\)個です。

従って、\(k+1\)のときにも成り立ちます。
今、\(k=n\)とすれば、*の部分が無くなるので、
$$
P^{-1}\varphi_A(A)P=(\lambda_1I_n-P^{-1}AP)(\lambda_2I_n-P^{-1}AP)\cdots(\lambda_nI_n-P^{-1}AP)=O
$$
となります。
従って、この式の左から\(P\)を、右から\(P^{-1}\)をかけると
$$
PP^{-1}\varphi_A(A)PP^{-1}=POP^{-1}\Leftrightarrow \varphi_A(A)=O
$$
となります。
従って、証明完了です。

定理6.の証明終わり

どうやって三角化すんの?

これについては次次回に、シュミットの直交化法を解説してから、改めて計算してみます。

今回は、行列の三角化とハミルトン-ケーリーの定理について解説しました。
正方行列は必ずしも対角化できないのですが、固有値さえ持てば三角化が可能だ、ということが分かりました。
また、この場合適当な正則行列\(P\)として直交行列を取ることができます。

次回は、内積、シュミットの直交化法、そして正規行列の対角化について解説します。

乞うご期待!質問、コメント等お待ちしております!

コメントをする

タイトルとURLをコピーしました