本記事の内容
本記事はエルミート行列、ユニタリ行列、直交行列について解説する記事です。
本記事を読むにあたり「行列とは何か?」ということについて知っている必要があるため、以下の記事も合わせてご覧ください。
複素行列
成分がすべて実数であるような行列を実行列と言いました。
それに対して、成分が複素数であるような行列を複素行列といいます。
複素行列
複素数を成分とする行列を複素行列という。前々回(【線型代数学の基礎シリーズ】行列編 その2)証明した行列の演算とその諸性質は、成分を実数に限定していないので、成分が複素数であっても全く同じことが成り立ちます。
例えば、どんなのが複素数列なのか?というと
$$
\begin{pmatrix}
1+i&3&2+4i\\
7i&4-5i&8\\
\end{pmatrix}
$$
は\((2,3)\)型の複素行列です。
ただし、\(i\)は虚数単位です。
複素共役行列
複素共役行列って?
先程、「前々回示した行列の演算とその諸性質は複素行列でも成り立ちますよ〜」という話をしました。
複素行列を考えることで、すなわち成分が複素数であるということを考えることで、実行列に比べて1つだけ新しい演算を考えることができます。
それが「共役」です。
一言で言ってしまえば、
という話です。
これをしっかり表すと、
複素共役行列
\(m,n\in\mathbb{N}\)、\(A=(a_{st})\)を\((m,n)\)型の複素行列とする。 このとき、\(A\)の各成分\(a_{st}\)の共役複素数\(\\overline{a_{st}}\)を第\((s,t)\)成分とする行列を\(\overline{A}\)で表し、\(A\)の複素共役行列という。 すなわち、虚数単位\(i\)を用いて $$ (\forall s,t\in\mathbb{N};1\leq s\leq m,\ 1\leq t\leq m)\ a_{st}=x_{st}+iy_{st}\quad (x_{st},y_{st}\in\mathbb{R}) $$ とし、 $$A= \begin{pmatrix} x_{11}+iy_{11}&x_{12}+iy_{12}&\cdots &x_{1n}+iy_{1n}\\ x_{21}+iy_{21}&x_{22}+iy_{22}&\cdots &x_{2n}+iy_{2n}\\ \vdots&\vdots& \ddots&\vdots\\ x_{m1}+iy_{m1}&x_{m2}+iy_{m2}&\cdots &x_{mn}+iy_{mn}\\ \end{pmatrix} $$ と書いたとき、 $$ \overline{A}= \begin{pmatrix} x_{11}-iy_{11}&x_{12}-iy_{12}&\cdots &x_{1n}-iy_{1n}\\ x_{21}-iy_{21}&x_{22}-iy_{22}&\cdots &x_{2n}-iy_{2n}\\ \vdots&\vdots& \ddots&\vdots\\ x_{m1}-iy_{m1}&x_{m2}-iy_{m2}&\cdots &x_{mn}-iy_{mn}\\ \end{pmatrix} $$ を\(A\)の複素共役行列という。$$
X=
\begin{pmatrix}
1+i&3&2+4i\\
7i&4-5i&8\\
\end{pmatrix}
$$
の複素共役行列\(\overline{X}\)は
$$
\overline{X}=
\begin{pmatrix}
1-i&3&2-4i\\
-7i&4+5i&8\\
\end{pmatrix}
$$
です。
複素共役行列の演算の性質
簡単です。
ノリとしては複素数と共役複素数との関係と同じです。
(演算の諸性質と言っても結局は成分同士の掛け算やらの話をするのだから、そりゃ同じっしょといったところですが)
次が成り立ちます。
定理1.(複素共役行列の演算の性質)
\(m,n,r\in\mathbb{N}\)、\(k\in\mathbb{C}\)とするとき、次が成り立つ。- \(A\)および\(B\)が共に\((m,n)\)型の複素行列であるとき、\(\overline{A+B}=\overline{A}+\overline{B}\)である。
- \(A\)が\((m,n)\)型の複素行列とするとき、\(\overline{kA}=\overline{k}\overline{A}\)である。
- \(A\)および\(B\)がそれぞれ\((m,n)\)型、\((n,r)\)型の複素行列であるとき、\(\overline{AB}=\overline{A}\overline{B}\)である。
- \(A\)が\((m,n)\)型の複素行列であるとき、\(\overline{\overline{A}}=A\)
この証明は単に計算するだけです。
定理1.の証明
\(m,n,r\in\mathbb{N}\)、\(k\in\mathbb{C}\)とします。
(1.\(\overline{A+B}=\overline{A}+\overline{B}\)の証明)
\(A=(a_{st})\)および\(B=(b_{st})\)が共に\((m,n)\)型の複素行列であるとし、
$$
(\forall s,t\in\mathbb{N};1\leq s\leq m,\ 1\leq t\leq m)\ a_{st}=x_{st}+iy_{st},\ b_{st}=z_{st}+iw_{st},\quad (x_{st},y_{st},z_{st},w_{st}\in\mathbb{R})
$$
を用いて
$$
A=
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix},\quad
B=
\begin{pmatrix}
z_{11}+iw_{11}&\cdots &z_{1n}+iw_{1n}\\
\vdots& \ddots&\vdots\\
z_{m1}+iw_{m1}&\cdots &z_{mn}+iw_{mn}\\
\end{pmatrix}
$$
と書いたとします。
このとき、
\begin{eqnarray}
\overline{A+B}&=&
\overline{
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}+
\begin{pmatrix}
z_{11}+iw_{11}&\cdots &z_{1n}+iw_{1n}\\
\vdots& \ddots&\vdots\\
z_{m1}+iw_{m1}&\cdots &z_{mn}+iw_{mn}\\
\end{pmatrix}
}\\
&=&
\overline{
\begin{pmatrix}
(x_{11}+z_{11})+i(y_{11}+w_{11})&\cdots &(x_{1n}+z_{1n})+i(y_{1n}+w_{1n})\\
\vdots& \ddots&\vdots\\
(x_{m1}+z_{m1})+i(y_{m1}+w_{m1})&\cdots &(x_{mn}+z_{mn})+i(y_{mn}+w_{mn})\\
\end{pmatrix}}\\
&=&
\begin{pmatrix}
(x_{11}+z_{11})-i(y_{11}+w_{11})&\cdots &(x_{1n}+z_{1n})-i(y_{1n}+w_{1n})\\
\vdots& \ddots&\vdots\\
(x_{m1}+z_{m1})-i(y_{m1}+w_{m1})&\cdots &(x_{mn}+z_{mn})-i(y_{mn}+w_{mn})\\
\end{pmatrix}\\
&=&
\begin{pmatrix}
(x_{11}-iy_{11})+(z_{11}-iw_{11})&\cdots &(x_{1n}-iy_{1n})+(z_{1n}-iw_{1n})\\
\vdots& \ddots&\vdots\\
(x_{m1}-iy_{m1})+(z_{m1}-iw_{m1})&\cdots &(x_{mn}-iy_{mn})+(z_{mn}-iw_{mn})\\
\end{pmatrix}\\
&=&
\begin{pmatrix}
x_{11}-iy_{11}&\cdots &x_{1n}-iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}-iy_{m1}&\cdots &x_{mn}-iy_{mn}\\
\end{pmatrix}+
\begin{pmatrix}
z_{11}-iw_{11}&\cdots &z_{1n}-iw_{1n}\\
\vdots& \ddots&\vdots\\
z_{m1}-iw_{m1}&\cdots &z_{mn}-iw_{mn}\\
\end{pmatrix}\\
&=&
\overline{A}+\overline{B}
\end{eqnarray}
となって、成り立ちます。
(2.\(\overline{kA}=\overline{k}\overline{A}\)の証明)
\(k\in\mathbb{C}\)を\(p,q\mathbb{R}\)を用いて\(k=p+iq\)、\(A\)を\((m,n)\)型の複素行列として、1.のときと同様に
$$
A=
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}
$$
(ただし、\(x_{st},y_{st}\in\mathbb{R}\))
と書いたとします。
このとき、
\begin{eqnarray}
\overline{kA}&=&
\overline{
(p+iq)
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}
}\\
&=&
\overline{
\begin{pmatrix}
(p+iq)(x_{11}+iy_{11})&\cdots &(p+iq)(x_{1n}+iy_{1n})\\
\vdots& \ddots&\vdots\\
(p+iq)(x_{m1}+iy_{m1})&\cdots &(p+iq)(x_{mn}+iy_{mn})\\
\end{pmatrix}
}\\
&=&
\overline{
\begin{pmatrix}
(px_{11}-qy_{11})+i(py_{11}+qx_{11})&\cdots &(px_{1n}-qy_{1n})+i(py_{1n}+qx_{1n})\\
\vdots& \ddots&\vdots\\
(px_{m1}-qy_{m1})+i(py_{m1}+qx_{m1})&\cdots &(px_{mn}-qy_{mn})+i(py_{mn}+qx_{mn})\\
\end{pmatrix}
}\\
&=&
\begin{pmatrix}
(px_{11}-qy_{11})-i(py_{11}+qx_{11})&\cdots &(px_{1n}-qy_{1n})-i(py_{1n}+qx_{1n})\\
\vdots& \ddots&\vdots\\
(px_{m1}-qy_{m1})-i(py_{m1}+qx_{m1})&\cdots &(px_{mn}-qy_{mn})-i(py_{mn}+qx_{mn})\\
\end{pmatrix}\\
&=&
\begin{pmatrix}
px_{11}+i^2qy_{11})-ipy_{11}-iqx_{11}&\cdots &px_{1n}+i^2qy_{1n})-ipy_{1n}-iqx_{1n}\\
\vdots& \ddots&\vdots\\
px_{m1}+i^2qy_{m1})-ipy_{m1}-iqx_{m1}&\cdots &px_{mn}+i^2qy_{mn})-ipy_{mn}-iqx_{mn}\\
\end{pmatrix}\\
&=&
\begin{pmatrix}
x_{11}(p-iq)-iy_{11}(-iq+p)&\cdots&x_{1n}(p-iq)-iy_{1n}(-iq+p)\\
\vdots& \ddots&\vdots\\
x_{m1}(p-iq)-iy_{m1}(-iq+p)&\cdots &x_{mn}(p-iq)-iy_{mn}(-iq+p)\\
\end{pmatrix}\\
&=&
\begin{pmatrix}
(p-iq)(x_{11}-iy_{11})&\cdots &(p-iq)(x_{1n}-iy_{1n})\\
\vdots& \ddots&\vdots\\
(p-iq)(x_{m1}-iy_{m1})&\cdots &(p-iq)(x_{mn}-iy_{mn})\\
\end{pmatrix}\\
&=&
(p-iq)
\begin{pmatrix}
x_{11}-iy_{11}&\cdots &x_{1n}-iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}-iy_{m1}&\cdots &x_{mn}-iy_{mn}\\
\end{pmatrix}\\
&=&
\overline{k}\overline{A}
\end{eqnarray}
となって成り立ちます。
(3.\(\overline{AB}=\overline{A}\overline{B}\)の証明)
\(A=(a_{st})\)および\(B=(b_{uv})\)がそれぞれ\((m,n)\)型、\((n,r)\)型の複素行列であるとし、
$$
(\forall s,t\in\mathbb{N};1\leq s\leq m,\ 1\leq t\leq m)\ a_{st}=x_{st}+iy_{st}\quad (x_{st},y_{st}\in\mathbb{R})\\
(\forall u,v\in\mathbb{N};1\leq u\leq n,\ 1\leq v\leq r)\ b_{uv}=z_{st}+iw_{st}\quad (u_{st},v_{st}\in\mathbb{R})
$$
を用いて
$$
A=
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix},\quad
B=
\begin{pmatrix}
z_{11}+iw_{11}&\cdots &z_{1n}+iw_{1r}\\
\vdots& \ddots&\vdots\\
z_{n1}+iw_{m1}&\cdots &z_{mn}+iw_{nr}\\
\end{pmatrix}
$$
と書いたとします。
このとき、
\begin{eqnarray}
\overline{AB}&=&
\overline{
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}
\begin{pmatrix}
z_{11}+iw_{11}&\cdots &z_{1n}+iw_{1r}\\
\vdots& \ddots&\vdots\\
z_{n1}+iw_{m1}&\cdots &z_{mn}+iw_{nr}\\
\end{pmatrix}}\\
&=&
\overline{
\begin{pmatrix}
\displaystyle\sum_{h=1}^n\big\{ (x_{1h}z_{h1}-y_{1h}w_{h1})+i(x_{1h}w_{h1}+y_{1h}z_{h1}) \big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{ (x_{1h}z_{hr}-y_{1h}w_{hr})+i(x_{1h}w_{hr}+y_{1h}z_{hr}) \big\}\\
\vdots& \ddots&\vdots\\
\displaystyle\sum_{h=1}^n\big\{ (x_{mh}z_{h1}-y_{mh}w_{h1})+i(x_{mh}w_{h1}+y_{mh}z_{h1}) \big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{ (x_{mh}z_{hr}-y_{mh}w_{hr})+i(x_{mh}w_{hr}+y_{mh}z_{hr}) \big\}
\end{pmatrix}
}\\
&=&
\begin{pmatrix}
\displaystyle\sum_{h=1}^n\big\{ (x_{1h}z_{h1}-y_{1h}w_{h1})-i(x_{1h}w_{h1}+y_{1h}z_{h1}) \big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{ (x_{1h}z_{hr}-y_{1h}w_{hr})-i(x_{1h}w_{hr}+y_{1h}z_{hr}) \big\}\\
\vdots& \ddots&\vdots\\
\displaystyle\sum_{h=1}^n\big\{ (x_{mh}z_{h1}-y_{mh}w_{h1})-i(x_{mh}w_{h1}+y_{mh}z_{h1}) \big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{ (x_{mh}z_{hr}-y_{mh}w_{hr})-i(x_{mh}w_{hr}+y_{mh}z_{hr}) \big\}
\end{pmatrix}\\
&=&
\begin{pmatrix}
\displaystyle\sum_{h=1}^n(x_{1h}z_{h1}+i^2y_{1h}w_{h1}-ix_{1h}w_{h1}-iy_{1h}z_{h1})&\cdots &\displaystyle\sum_{h=1}^n(x_{1h}z_{hr}+i^2y_{1h}w_{hr}-ix_{1h}w_{hr}-iy_{1h}z_{hr})\\
\vdots& \ddots&\vdots\\
\displaystyle\sum_{h=1}^n(x_{mh}z_{h1}+i^2y_{mh}w_{h1}-ix_{mh}w_{h1}-iy_{mh}z_{h1})&\cdots &\displaystyle\sum_{h=1}^n(x_{mh}z_{hr}+i^2y_{mh}w_{hr}-ix_{mh}w_{hr}-iy_{mh}z_{hr})
\end{pmatrix}\\
&=&
\begin{pmatrix}
\displaystyle\sum_{h=1}^n\big\{x_{1h}(z_{h1}-iw_{h1})-iy_{1h}(-iw_{h1}+z_{h1})\big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{x_{1h}(z_{hr}-iw_{hr})-iy_{1h}(-iw_{hr}+z_{hr})\big\}\\
\vdots& \ddots&\vdots\\
\displaystyle\sum_{h=1}^n\big\{x_{mh}(z_{h1}-iw_{h1})-iy_{mh}(-iw_{h1}+z_{h1})\big\}&\cdots &\displaystyle\sum_{h=1}^n\big\{x_{mh}(z_{hr}-iw_{hr})-iy_{mh}(-iw_{hr}+z_{hr})\big\}
\end{pmatrix}\\
&=&
\begin{pmatrix}
x_{11}-iy_{11}&\cdots &x_{1n}-iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}-iy_{m1}&\cdots &x_{mn}-iy_{mn}\\
\end{pmatrix}
\begin{pmatrix}
z_{11}-iw_{11}&\cdots &z_{1n}-iw_{1r}\\
\vdots& \ddots&\vdots\\
z_{n1}-iw_{m1}&\cdots &z_{mn}-iw_{nr}\\
\end{pmatrix}\\
&=&
\overline{
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}}\
\overline{
\begin{pmatrix}
z_{11}+iw_{11}&\cdots &z_{1n}+iw_{1r}\\
\vdots& \ddots&\vdots\\
z_{n1}+iw_{m1}&\cdots &z_{mn}+iw_{nr}\\
\end{pmatrix}}\\
&=&
\overline{A}\ \overline{B}
\end{eqnarray}
となって、成り立ちます。
(4.\(\overline{\overline{A}}=A\)の証明)
\(A\)を\((m,n)\)型の複素行列として、1.のときと同様に
$$
A=
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}
$$
(ただし、\(x_{st},y_{st}\in\mathbb{R}\))
と書いたとします。
このとき、
\begin{eqnarray}
\overline{\overline{A}}&=&
\overline{\overline{
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}}}\\
&=&
\overline{
\begin{pmatrix}
x_{11}-iy_{11}&\cdots &x_{1n}-iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}-iy_{m1}&\cdots &x_{mn}-iy_{mn}\\
\end{pmatrix}
}\\
&=&
\begin{pmatrix}
x_{11}+iy_{11}&\cdots &x_{1n}+iy_{1n}\\
\vdots& \ddots&\vdots\\
x_{m1}+iy_{m1}&\cdots &x_{mn}+iy_{mn}\\
\end{pmatrix}=A
\end{eqnarray}
となって、成り立ちます。
定理1.の証明終わり
随伴行列
随伴行列って?
一言で述べてしまえば、
です。
記号で書けば、複素行列\(A\)に対して、\(\bar{A}^\top\)のことです。
正確に書くと、以下です。
随伴行列
\(m,n\in\mathbb{N}\)とし、\(A\)を\((m,n)\)型の複素行列とする。 このとき、\(A\)の複素共役行列\(\overline{A}\)を転置した行列を\(A\)の随伴行列という。 すなわち、\(\displaystyle\overline{A}^\top\)を随伴行列という。 このとき、\(A\)の随伴行列を\(A^*\)で書く。例えば、
$$
X=
\begin{pmatrix}
1+i&3&2+4i\\
7i&4-5i&8\\
\end{pmatrix}
$$
の随伴行列\(X^*\)は
$$
X^*=
\begin{pmatrix}
1-i&-7\\
3&4+5i\\
2-4i&8
\end{pmatrix}
$$
です。
随伴行列の演算の性質
定理2.(随伴行列の演算の性質)
\(m,n,r\in\mathbb{N}\)、\(k\in\mathbb{C}\)とするとき、次が成り立つ。- \(A\)および\(B\)が共に\((m,n)\)型の複素行列であるとき、\((A+B)^*=A^*+B^*\)である。
- \(A\)が\((m,n)\)型の複素行列とするとき、\((kA)^*=\overline{k}A^*\)である。
- \(A\)および\(B\)がそれぞれ\((m,n)\)型、\((n,r)\)型の複素行列であるとき、\((AB)^*=B^*A^*\)である。
- \(A\)が\((m,n)\)型の複素行列であるとき、\((A)^*)^*=A\)
この定理2.は定理1.と前々回証明した、和、差、積、スカラー倍の性質および転置行列を含む行列の演算の性質から導けます。
これらを列挙します。
定理2.の証明に使う定理集
定理1.(複素共役行列の演算の性質)(再掲)
\(m,n,r\in\mathbb{N}\)、\(k\in\mathbb{C}\)とするとき、次が成り立つ。- \(A\)および\(B\)が共に\((m,n)\)型の複素行列であるとき、\(\overline{A+B}=\overline{A}+\overline{B}\)である。
- \(A\)が\((m,n)\)型の複素行列とするとき、\(\overline{kA}=\overline{k}\overline{A}\)である。
- \(A\)および\(B\)がそれぞれ\((m,n)\)型、\((n,r)\)型の複素行列であるとき、\(\overline{AB}=\overline{A}\overline{B}\)である。
- \(A\)が\((m,n)\)型の複素行列であるとき、\(\overline{\overline{A}}=A\)
定理3.(和、差、積、スカラー倍の性質、分配法則)
\(k,h\in\mathbb{C}\)とし、\(m,n,r,s\in\mathbb{N}\)とする。- 和、差の性質 2つの\((m,n)\)型行列\(A\)および\(B\)に対して、以下が成り立つ。
- \(A+B=B+A\quad\)(交換則)
- \((A+B)+C=A+(B+C)\quad\)(和の結合則)
- \(A+O=A\quad\)(\(O\)は\((m,n)\)型の零行列)
- \(A+(-A)=O\quad\)(\(O\)は\((m,n)\)型の零行列)
- 積の性質 \((m,n)\)型行列\(A\)、\((n,r)\)型行列\(B\)、\((r,s)\)型行列\(C\)に対して、以下が成り立つ。
- \((AB)C=A(BC)\quad\)(積の結合則)
- \(AI_n=I_nA=A\quad\)(\(I_n\)は\(n\)次単位行列)
- \(AO_n=O_mA=O_{mn}\quad\) ただし、\(O_n\)は\(n\)次正方行列の零行列、\(O_m\)は\(m\)次正方行列の零行列、\(O_{mn}\)は\((m,n)\)型の零行列を指す。
- スカラー倍の性質 \(k,h\in\mathbb{C}\)と\((m,n)\)型行列\(A\)と\((n,r)\)型行列\(B\)に対して次が成り立つ。
- \((kh)A=k(hA)\)
- \(k(AB)=(kA)B=A(kB)\)
- \(0A=O_{mn}\quad\)
- \(1A=A\)
- 分配則 \(k,h\in\mathbb{C}\)と3つの行列\(A\)、\(B\)、\(C\)に対して次が成り立つ。
- \(A\)が\((m,n)\)型、\(B\)及び\(C\)が\((n,r)\)型のとき、\(A(B+C)=AB+AC\)
- \(A\)と\(B\)が\((m,n)\)型、\(C\)が\((n,r)\)型のとき、\((A+B)C=AC+BC\)
- \(A\)および\(B\)が共に\((m,n)\)型のとき、\(k(A+B)=kA+kB\)
- \(A\)および\(B\)が共に\((m,n)\)型のとき、\((k+h)A=kA+hA\)
この定理3.(和、差、積、スカラー倍の性質、分配法則)の証明は【線型代数学の基礎シリーズ】行列編 その2を御覧ください。
定理4.(転置行列を含む行列の演算の性質)
\(k\in\mathbb{C}\)、\(m,n,r\in\mathbb{N}\)とし、行列\(A\)、\(B\)、\(k\)に対して、以下が成り立つ。- \(A\)が\((m,n)\)型の行列のとき、すなわち任意の行列に対して、\(\left(A^\top\right)^\top=A\)
- \(A\)および\(B\)が共に\((m,n)\)型のとき、\(\left(A+B\right)^\top=A^\top+B^\top\)
- \(A\)が\((m,n)\)型、\(B\)が\((n,r)\)型のとき、\((AB)^\top=B^\top A^\top\quad\)(順番に注意)
- \(A\)が\((m,n)\)型の行列のとき、すなわち任意の行列に対して、\((kA)^\top=kA^\top\)
この定理4.(転置行列を含む行列の演算の性質)の証明は【線型代数学の基礎シリーズ】行列編 その2を御覧ください。
定理2.の証明
\(m,n,r\in\mathbb{N}\)、\(k\in\mathbb{C}\)とします。
(1.\((A+B)^=A^*+B^*\)の証明)
\(A\)および\(B\)が共に\((m,n)\)型の複素行列であるとします。
定理1.の1.(\(\overline{X+Y}=\overline{X}+\overline{Y}\))を使うと、
$$
(A+B)^*=\overline{A+B}^\top=\left( \overline{A}+\overline{B}\right)^\top
$$
です。
ここで、定理4.の2.(\(\displaystyle(X+Y)^\top=X^\top+Y^\top\))を使うと、
$$
\left( \overline{A}+\overline{B}\right)^\top=\overline{A}^\top+\overline{B}^\top=A^*+B^*
$$
となって、成り立ちます。
(2.\((kA)^*=\overline{k}A^\top\)の証明)
\(A\)を\((m,n)\)型の複素行列とします。
定理1.の2.(\(\overline{kA}=\overline{k}\overline{A}\))を使うと、
$$
(kA)^*=(\overline{kA})^\top=(\overline{k}\overline{A})^\top
$$
です。
ここで、定理4.の4.(\((kA)^\top=kA^\top\))を使うと、
$$
(\overline{k}\overline{A})^\top=\overline{k}\overline{A}^\top=\overline{k}A^*
$$
となるので、成り立ちます。
(3.((AB)^*=B^*A^*\)の証明)
\(A\)および\(B\)をそれぞれ\((m,n)\)型、\((n,r)\)型の複素行列とします。
定理1.の3.(\(\overline{XY}=\overline{X}\ \overline{Y}\))を使うと、
$$
(AB)^*=\overline{AB}^\top=\left( \overline{A}\ \overline{B}\right)^\top
$$
です。
ここで、定理4.の3.(\((XY)^\top=Y^\top X^\top\))を使うと、
$$
\left( \overline{A}\ \overline{B}\right)^\top=\overline{B}^\top\overline{A}^\top=B^*A^*
$$
となるため、成り立ちます。
(4.\(\left( A^*\right)^*=A\)の証明)
\(A\)を\((m,n)\)型の複素行列とします。
定理1.の4.(\(\overline{\overline{A}}=A\))を使うと、
$$
\left( A^*\right)^*=\left( \overline{A}^\top\right)^*=\left( \overline{\overline{A}^\top}\right)^\top=\left(A^\top\right)^\top
$$
です。
ここで、定理4.の1.(\(\displaystyle\left( X^\top\right)^\top=X\))を使うと、
$$
\left(A^\top\right)^\top=A
$$
となるので、成り立ちます。
定理2.の証明終わり
(書くのが大変だったけど積の性質とかを証明しておいてよかったぁ…と心の中の声をつぶやく)
エルミート行列、ユニタリ行列、直交行列
では、よく出現する複素行列を紹介します。
これらがなぜ必要なのか、いつ使うのか、ということを詳しく述べるのは固有値や固有ベクトルやらの話をする後の記事に回します。
エルミート行列
エルミート行列って何スか?
エルミート行列を一言で言えば、
です。
これをしっかり書くと以下です。
エルミート行列
\(m,n\in\mathbb{N}\)、\(A\)を\((m,n)\)型の複素行列とする。 このとき、 $$ A^*=A $$ が成り立つならば、\(A\)はエルミート行列という。例えばどんなのっスか?
例えば、どんなのがエルミート行列なのか、というと
$$
X=
\begin{pmatrix}
0& 1+i&2-3i\\
1-i&3&2\\
2+3i&2&-4
\end{pmatrix}
$$
です。
実際、
\begin{eqnarray}
X^*=\overline{X}^\top&=&\overline{
\begin{pmatrix}
0& 1+i&2-3i\\
1-i&3&2\\
2+3i&2&-4
\end{pmatrix}}^\top\\
&=&
\begin{pmatrix}
0& 1-i&2+3i\\
1+i&3&2\\
2-3i&2&-4
\end{pmatrix}^\top\\
&=&
\begin{pmatrix}
0& 1+i&2-3i\\
1-i&3&2\\
2+3i&2&-4
\end{pmatrix}=X
\end{eqnarray}
だからです。
ちなみに、\(A^\top=A\)を満たすような行列を対称行列といいます。
対称行列の成分がすべて実数であるとき、その対称行列は実対称行列といいます。
\(A\)を実対称行列とすると、\(\overline{A}=A\)ですので、必ずエルミート行列になります。
すなわち、エルミート行列は実対称行列の一般化になっているということです。
とはいえ、エルミート行列といったらば複素行列を指すことが多いです。
つまり、実対称行列のことをエルミート行列とは呼びません。
いつ使うんスか?
「いつ使うか?」というと固有値、固有ベクトルの話をするときに使います。
というのも、エルミート行列には次のような性質があるからです。
- エルミート行列は正則行列である。(逆行列が存在する)
- エルミート行列の固有値はすべて実数である。(行列の成分は複素数なのに、エルミート行列の固有値と呼ばれるものは必ず実数)
- エルミート行列の相異なる固有値の固有ベクトルは直交(内積\(=0\))する。(固有ベクトルは必ずしも直交しませんが、エルミート行列の固有ベクトルはすべて直交します)
要するに、「めっちゃ考えやすい、良い性質を持ってるんだZE!Yeah!」ということです。
ユニタリ(ユニタリー、ユニタリ)行列と直交行列
ユニタリ行列と直交行列って何スか?
ユニタリ行列を一言でいうと、
逆行列とは何だったか、というと、以下でした。
逆行列
\(n\in\mathbb{N}\)、\(A\)を\(n\)次正方行列とする。このとき、 $$ AB=BA=I_n $$ を満たすような\(B\)が存在するとき、\(B\)を\(A\)の逆行列という。 またこのとき、 $$ B=A^{-1} $$ と書く。ユニタリ行列をしっかり書くと以下です。
ユニタリ行列
\(m\in\mathbb{N}\)とし、\(A\)を\(m\)次正方行列(すなわち\((m,m)\)型の行列)とする。 このとき、 $$ AA^*=A^*A=I_m $$ が成り立つならば、\(A\)をユニタリ(ユニタリー、ユニタリ)行列という。これはまさに、\(A^*\)が\(A\)の逆行列であるときを示しています。
特に、\(A\)が実行列であるとき、\(\overline{A}=A\)ですから、実行列\(A\)がユニタリ行列である、という条件は
$$
AA^\top=A^\top A=I_m
$$
となります。
このときに\(A\)は直交行列と呼びます。
これをしっかり書くと以下です。
直交行列
\(m\in\mathbb{N}\)とし、\(A\)を成分がすべて実数であるような\(m\)次正方行列とする。このとき、 $$ AA^\top=A^\top A=I_m $$ が成り立つならば、\(A\)を直交行列という。ちなみに、直交行列がどうして直交行列と呼ばれるのかについてちょと解説します。
\(m\in\mathbb{N}\)として、\(A\)を\(m\)次の直交行列として、
$$
A=
\begin{pmatrix}
a_{11}&a_{12}&\cdots &a_{1m}\\
a_{21}&a_{22}&\cdots &a_{2m}\\
\vdots&\vdots& \ddots&\vdots\\
a_{m1}&a_{m2}&\cdots &a_{mm}\\
\end{pmatrix}
$$
と書いたとします。
このとき、
$$
\boldsymbol{a}_1=
\left(\begin{array}{c}
a_{11}\\
a_{21}\\
\vdots\\
a_{m1}
\end{array}
\right),\quad
\boldsymbol{a}_2=
\left(\begin{array}{c}
a_{12}\\
a_{22}\\
\vdots\\
a_{m2}
\end{array}
\right),\quad\cdots,
\boldsymbol{a}_m=
\left(\begin{array}{c}
a_{1m}\\
a_{2m}\\
\vdots\\
a_{mm}
\end{array}
\right)
$$
とすれば、
$$
A=(\boldsymbol{a}_1\ \boldsymbol{a}_1\ \cdots\ \boldsymbol{a}_m\ )
$$
と書くことができます。
同様にして、
\begin{eqnarray}
A^\top=(\boldsymbol{a}_1\ \boldsymbol{a}_1\ \cdots\ \boldsymbol{a}_m\ )^\top=
\left(\begin{array}{c}
\boldsymbol{a}_1^\top\\
\boldsymbol{a}_2^\top\\
\vdots\\
\boldsymbol{a}_n^\top
\end{array}\right)
\end{eqnarray}
です。
\(A\)は直交行列ですので、\(A^\top A=I_m\)ですから、
\begin{eqnarray}
AA^\top&=&
\left(\begin{array}{c}
\boldsymbol{a}_1^\top\\
\boldsymbol{a}_2^\top\\
\vdots\\
\boldsymbol{a}_n^\top
\end{array}\right)(\boldsymbol{a}_1\ \boldsymbol{a}_1\ \cdots\ \boldsymbol{a}_n\ )\\
&=&
\begin{pmatrix}
\boldsymbol{a}_1^\top\boldsymbol{a}_1&\boldsymbol{a}_1^\top\boldsymbol{a}_2&\cdots &\boldsymbol{a}_1^\top\boldsymbol{a}_m\\
\boldsymbol{a}_2^\top\boldsymbol{a}_1&\boldsymbol{a}_2^\top\boldsymbol{a}_2&\cdots &\boldsymbol{a}_2^\top\boldsymbol{a}_m\\
\vdots&\vdots& \ddots&\vdots\\
\boldsymbol{a}_m^\top\boldsymbol{a}_1&\boldsymbol{a}_m^\top\boldsymbol{a}_2&\cdots &\boldsymbol{a}_m^\top\boldsymbol{a}_m\\
\end{pmatrix}=
\begin{pmatrix}
1&&&&\\
&1&&\huge{0}& \\
&&\ddots&&\\
&\huge{0}&&\ddots&\\
&&&&1\\
\end{pmatrix}
\end{eqnarray}
すなわち、任意の\(1\leq i,j\leq m\)を満たす\(i,j\in\mathbb{N}\)に対して、
$$
\boldsymbol{a}_i^\top\boldsymbol{a}_j=
\begin{cases}
1&(i=j)\\
0&(i\neq j)\end{cases}
$$
です。
また、\(\boldsymbol{a}_i^\top\boldsymbol{a}_j\)は\(\boldsymbol{a}_i\)と\(\boldsymbol{a}_j\)の内積ですので、直交行列であれば、必ずどの列ベクトルも直交するして、かつ大きさが\(1\)というわけです。
同様にして、
$$
\boldsymbol{a}^\prime_1=(a_{11}\ a_{12}\ \cdots\ a_{1n}),\\
\boldsymbol{a}^\prime_2=(a_{21}\ a_{22}\ \cdots\ a_{2n}),\\
\vdots\\
\boldsymbol{a}^\prime_m=(a_{m1}\ a_{m2}\ \cdots\ a_{mm})
$$
とすれば、
$$
A=
\left(\begin{array}{c}
\boldsymbol{a}^\prime_1\\
\boldsymbol{a}^\prime_2\\
\vdots \\
\boldsymbol{a}^\prime_m
\end{array}\right)
$$
と書くことができるので、\(AA^\top=I_m\)から、任意の\(1\leq i,j\leq m\)を満たす\(i,j\in\mathbb{N}\)に対して、
$$
\boldsymbol{a}_i^\prime\left(\boldsymbol{a}_j^\prime\right)^\top=
\begin{cases}
1&(i=j)\\
0&(i\neq j)\end{cases}
$$
が導かれます。
従って、直交行列の行ベクトルもすべて直交して、かつ大きさが\(1\)ということです。
こういう理由で直交行列と呼ばれます。
例えばどんなのっスか?
例えば、
$$
Y=
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}
$$
です。
実際、
\begin{eqnarray}
YY^*&=&
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}\overline{
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}}^\top\\
&=&
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}
\begin{pmatrix}
0& 1&0\\
-i&0&0\\
0&0&-1
\end{pmatrix}\\
&=&
\begin{pmatrix}
i\times (-i)& 0&0\\
0&1\times1&0\\
0&0&(-1)\times(-1)
\end{pmatrix}\\
&=&
\begin{pmatrix}
1& 0&0\\
0&1&0\\
0&0&1
\end{pmatrix}=I_3
\end{eqnarray}
であり、かつ
\begin{eqnarray}
Y^*Y&=&
\overline{
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}}^\top
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}\\
&=&
\begin{pmatrix}
0& 1&0\\
-i&0&0\\
0&0&-1
\end{pmatrix}
\begin{pmatrix}
0& i&0\\
1&0&0\\
0&0&-1
\end{pmatrix}\\
&=&
\begin{pmatrix}
1\times1& 0&0\\
0&(-i)\times(-i)&0\\
0&0&(-1)\times(-1)
\end{pmatrix}\\
&=&
\begin{pmatrix}
1& 0&0\\
0&1&0\\
0&0&1
\end{pmatrix}=I_3
\end{eqnarray}
となるからです。
いつ使うんスか?
ユニタリ行列、直交はいつ使うのか、と聞かれると行列式と対角化の部分で使います。
というもの、ユニタリ行列には以下のような性質があるからです。
- ユニタリ行列は対角化可能である。(平たく言うと、うまく計算することで対角成分以外の成分をすべて\(0\)になるように変形できる)
- ユニタリの行列式の値は\(\pm1\)である。(すごい)
- 直交行列の行ベクトルおよび列ベクトルは正規直交基底である。(めちゃくちゃ平たく言うと、座標軸みたいなもん)
結
今回は、複素行列について、特に随伴行列、エルミート行列、ユニタリ行列を解説し、ユニタリ行列の実行列バージョンの直交行列について解説しました。
結局の所、成分が複素数であっても、共役という演算が増えるだけで、特に行列の演算の規則が変わるわけではありません。
また、誠にサラッとですが、それそれがいつ使われるのか、ということも解説しました。
次回は「線型写像とその性質」です。
乞うご期待!質問、コメントなどお待ちしております!
コメントをする