スポンサーリンク

「連立一次方程式の解の存在定理と解き方」【線型代数学の基礎シリーズ】行列編 その7

線型代数学

本記事の内容

本記事は「連立一次方程式の解の存在定理」と「実際に解くときにどう解くのか」ということについて解説する記事です。

本記事を読むにあたり、線型空間の次元について知っている必要があるため、以下の記事も合わせてご覧ください。

連立方程式の解の不定と不能

中学校での話

連立方程式については、中学校で習ったかと思います。
そのときに、「未知数の数と式の数が一緒だったら答えがありますよ」という主旨のことを習ったかと思います。
これは正しいです。
これの事実はすでに行列を用いて証明しています。

これからの話

上記を行列の言葉で表してみます。

連立一次方程式
$$
A\boldsymbol{x}=\boldsymbol{b}
$$
で、未知数の個数と式の数が等しい、すなわち\(A\)が正方行列であって、かつ正則であるようなときに解が一意的に定まる。

ということでした。
実際、\(A\)が正則であれば、\(A\)の逆行列\(A^{-1}\)が存在するので、解は\(A^{-1}\boldsymbol{b}\)となるからです。

これからは、未知数の数と式の数が必ずしも一致しない場合、つまり\(A\)が必ずしも正方行列とは限らない場合と、\(A\)が正方行列であっても正則行列でない場合について考えます。

そのためにイメージしとして1次方程式を思い出してみます。

1次方程式の不定と不能

1次方程式
$$
ax=b
$$
において、\(a\neq0\)のとき、
$$
x=\frac{b}{a}
$$
と解けます。
しかしながら\(a=0\)のときは必ずしもそうではありません。
この場合は以下の2パターンに分けられます。

  • \(b=0\)の場合
  • \(b\neq0\)の場合

です。
前者の場合は\(x\)は任意の数が解になります(\(x\)がどんな数であっても\(0=0\)ということになるから)。
\(x\)本当に何でも良い、というわけです。
この場合は解は不定であるといいます。

後者の場合は\(x\)がどんな数れあれ、\(0=b\neq0\)となってしまうので解が存在しません。
この場合、解は不能であるといいます。

実は、これらと同様の減少が一般の連立一次方程式についても起こるのです。

連立一次方程式の解の存在定理

では、解が存在することの必要十分条件について説明します。

拡大係数行列

まずは、拡大係数行列というものを説明します。
これは、実際に連立一次方程式を解くときに使う特殊な行列です。

拡大係数行列

\(x_1,x_2,\dots,x_n\)を未知数とする連立一次方程式 $$ \begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2\\ \cdots\cdots\cdots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_m\\ \end{cases} $$ は、 $$ A= \begin{pmatrix} a_{11}&\cdots &a_{1n}\\ \vdots& \ddots&\vdots\\ a_{m1}&\cdots &a_{mn}\\ \end{pmatrix},\quad \boldsymbol{x}= \left( \begin{array}{c} x_1\\ \vdots\\ x_n \end{array} \right),\quad \boldsymbol{b}= \left( \begin{array}{c} b_1\\ \vdots\\ b_m \end{array} \right) $$ とおくことにより、 $$ A\boldsymbol{x}=\boldsymbol{b} $$ と書くことができる。このとき、次の\((m,n+1)\)型の行列 \begin{pmatrix} a_{11}&\cdots &a_{1n}&b_1\\ \vdots& \ddots&\vdots&\vdots\\ a_{m1}&\cdots &a_{mn}&b_m\\ \end{pmatrix} を与えられた連立一次方程式の拡大係数行列といい、 $$ (A,\boldsymbol{b}) $$ と書く。

要するに、拡大係数行列というのは、連立一次方程式の係数を集めてできる行列に、方程式の\(=\)の右側の数のベクトルをくっつけたものです。

連立一次方程式の解の存在定理

では、必要十分条件を述べます。

定理1.(連立一次方程式の解の存在定理)

連立一次方程式\(A\boldsymbol{x}=\boldsymbol{b}\)が解をもつための必要十分条件は、線型写像\(A:\mathbb{R}^n \to\mathbb{R}^m\)の像空間\({\rm Image}(A)\)に定数項のベクトル\(\boldsymbol{b}\)が含まれることである。 すなわち、 $$ \boldsymbol{b}\in{\rm Image(A)} $$ である。

これはもはや証明が不要と言ってもいいくらいなのですが、書きます。

定理1.の証明

連立一次方程式\(A\boldsymbol{x}=\boldsymbol{b}\)が解を持つ、ということは\(A\boldsymbol{x}=\boldsymbol{b}\)を満たすような\(\boldsymbol{x}\)が存在する、ということです。
\(A\boldsymbol{x}=\boldsymbol{b}\)を満たすような\(\boldsymbol{x}\)が存在する、ということはまさに\(\boldsymbol{b}\in {\rm Image(A)}\)ということに他なりません。

定理1.の証明終わり

「え?そんなん当たり前じゃね?」と思うかもしれませんが、そうです。その通りです。
トートロジーに近いのですが、行列\(A\)を線型写像として捉える視点が重要なのであって、すべての基本となります。

実は、拡大係数行列のランクが解の存在とも関わってきます。

定理2.

\(m,n\in\mathbb{N}\)、\(A\)を\((m,n)\)型の行列とする。このとき連立一次方程式\(A\boldsymbol{x}=\boldsymbol{b}\)が解を持つための必要十分条件は\(A,\boldsymbol{b}\)が $$ {\rm rank}(A)={\rm rank}(A,\boldsymbol{b}) $$ を満たすことである。

定理2.の証明

割と簡単に証明できます。

\(A\)の列ベクトルを\(\displaystyle\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime\)と書いたとします。
つまり\(A=\left( \boldsymbol{a}_1^\prime\ \cdots\ \boldsymbol{a}_r^\prime\right)\)です。

このとき、次の同値の積み重ねによって証明できます。

\begin{eqnarray}
(\exists \boldsymbol{x})\ {\rm s.t.}\ A\boldsymbol{x}=\boldsymbol{b}&\Leftrightarrow&
\boldsymbol{b}\in{\rm Image}(A)\\
&\Leftrightarrow&\left(\exists \boldsymbol{x}=
\left(\begin{array}{c}
x_1\\
\vdots\\
x_n
\end{array}
\right)\right)\ {\rm s.t.}\ x_1\boldsymbol{a}_1^\prime+\dots+x_n\boldsymbol{a}_n^\prime=\boldsymbol{b}\\
&\Leftrightarrow&\boldsymbol{b}\in S[\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime]\\
&\Leftrightarrow&S[\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime]=S[\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime,\boldsymbol{b}]\\
&\Leftrightarrow&\dim\left( S[\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime]\right)=\dim\left( S[\boldsymbol{a}_1^\prime,\dots,\boldsymbol{a}_n^\prime,\boldsymbol{b}]\right)\\
&\Leftrightarrow&{\rm rank}(A)={\rm rank}(A,\boldsymbol{b})
\end{eqnarray}
となって証明完了です。
ただし、以下の定理を使いました。

定理3.

\(m,n\in\mathbb{N}\)、\(A=\left( a_{ij}\right)\)を\((m,n)\)型の行列とし、\(\boldsymbol{a}_1^\prime,\boldsymbol{a}_2^\prime,\dots,\boldsymbol{a}_n^\prime\)を\(A\)の列ベクトルとする。このとき、 $$ {\rm rank}(A)=\dim\left( S[\boldsymbol{a}_1^\prime,\boldsymbol{a}_2^\prime,\dots,\boldsymbol{a}_n^\prime]\right) $$ である。

定理3.の証明は【線型代数学の基礎シリーズ】行列編 その6を御覧ください。

定理2.の証明終わり

ちなみに、\(ax=b\)において、\(a=0,b\neq0\)の不能の場合は、この定理でいうところの\({\rm rank}(A)=0\)かつ\({\rm rank}(A,\boldsymbol{b})=1\)であり、\(a=b=0\)の場合は\({\rm rank}(A)={\rm rank}(A,\boldsymbol{b})=0\)です。

この定理から、行列のランクを計算することで解が存在するのかどうかが分かるわけです。
しかし「え?毎回毎回像空間の次元を考えなきゃいけないの?面倒くさくない?」と思うかもしれません。
筆者はそうでした。
しかし、実は実用的に行列のランクを求める方法があります。
それについては次回解説します。

実用的な連立斉一次方程式の解き方

今までは理論的なことを見てきましたが、これからは実用的なことについて述べます。

連立一次方程式の基本変形(掃き出し法、消去法)

連立一次方程式の基本変形は以下の3つです。

  • (基本変形Ⅰ):1つの式に\(0\)でない数をかける。
  • (基本変形Ⅱ):1つの式にある数をかけたものを他の式に加える。
  • (基本変形Ⅲ):2つの式を入れ替える。

ここで「んぉ?なんか知ってるかも?」と思った方、鋭いです。
その通り。これは行列の行基本変形です。

実は、中学校で習った消去法は行列の言葉で書くと、行基本変形を行っている、ということなのです。

ちょいと計算してみようZE

例4. 次の連立一次方程式を考えてみましょう。
$$
(\alpha)
\begin{cases}
2x+y-z=2&(1)\\
x-2y+3z=9&(2)\\
4x+2y+7z=31&(3)
\end{cases}
$$
(1)および(2)を入れ替えます(基本変形Ⅲ)。
$$
(\beta)
\begin{cases}
x-2y+3z=9&(1)_1\\
2x+y-z=2&(2)_1\\
4x+2y+7z=31&(3)_1
\end{cases}
$$

\((\beta)\)は基本変形Ⅲを行って得られたのですが、逆に\((\beta)\)から基本変形Ⅲを行って\((\alpha)\)が得られるので、連立一次方程式\((\alpha)\)と\((\beta)\)は同値です。

次に、\((2)_1-(1)_1\times2\)と\((3)_1-(1)_1\times4\)という基本変形Ⅱを行い、\(x\)を消去します(まさに消去法!)。
これらの式と\((1)_1\)とを組んで次の連立一次方程式を得ます。

$$
(\gamma)
\begin{cases}
x-2y+3z=9&(1)_2\\
5y-7z=-16&(2)_2\\
10y-5z=-5&(3)_2
\end{cases}
$$
逆に、\((\gamma)\)から基本変形Ⅱによって\((\beta)\)が得られます。
従って、\((\beta)\)と\((\gamma)\)は同値です。

次に\((\gamma)\)において\(\displaystyle\frac{1}{9}((3)_2-(3)_2\times2)\)という基本変形ⅡとⅠを行うと\(z\)が求まります。
この結果の式を\((3)_3\)として、\((1)_2\)と\((2)_2\)と組んで次の連立一次方程式を得ます。
$$
(\delta)
\begin{cases}
x-2y+3z=9&(1)_3\\
5y-7z=-16&(2)_3\\
z=3&(3)_3
\end{cases}
$$
これもまた\((\delta)\)から\((\gamma)\)が得られますので、\((\gamma)\)と\((\delta)\)は同値です。

次に、\(\displaystyle\frac{1}{5}((2)_3+(3)_3\times7)\)という基本変形ⅡとⅠを行うと\(y\)が求まります。
この結果の式を\((2)_4\)として\((1)_3\)と\((3)_3\)と組んで次の連立一次方程式を得ます。
$$
(\epsilon)
\begin{cases}
x-2y+3z=9&(1)_4\\
y=1&(2)_4\\
z=3&(3)_4
\end{cases}
$$

最後に\((\epsilon)\)において\((1)_4+(2)_2\times2-(3)_4\times3\)という基本変形ⅡとⅠを行うと\(x\)が求まります。
この結果の式を\((1)_5\)として、\((2)_4\)と\((3)_4\)と組んで次の連立一次方程式を得ます。
$$
(\zeta)
\begin{cases}
x=2&(1)_5\\
y=1&(2)_5\\
z=3&(3)_5
\end{cases}
$$
これもまた\((\epsilon)\)と\((\zeta)\)は同値です。
最後の式は\(x,y,z\)が具体的に与えられているので、最初の連立一次方程式の解に他なりません。

連立一次方程式の基本変形は可逆なんです。

そうなんです。可逆なんです。
これを明示すると、以下です。

定理5.

連立一次方程式の基本変形は可逆である。すなわち、基本変形を繰り返して連立一次方程式\((\alpha)\)が\((\beta)\)に移ったとすると、逆に\((\beta)\)は適当な基本変形を繰り返して\((\alpha)\)に移る。つまり、連立一次方程式として\((\alpha)\)と\((\beta)\)は同値である。

定理5.の証明

なんてことありません。

  1. (Ⅰ)1つの式に\(c\neq0\)をかけるという変形に対しては、同じ式に\(\displaystyle\frac{1}{c}\) をかけることでもとに戻ります。
  2. (Ⅱ)\(p\neq q\)とするとき、\((p)\)式の\(a\)倍を\((q)\)式に加えるという変形に対しては、\((p)\)式の\(-a\)倍を\((q)\)式に加えることによりもとに戻ります。
  3. (Ⅲ)\(p\neq q\)とするとき、\((p)\)式と\((q)\)式を入れ替えるという変形に対しては、もう一度\((p)\)式と\((q)\)式を入れ替えることによりもとに戻ります。

以上のことから基本変形(Ⅰ)、(Ⅱ)、(Ⅲ)はそれぞれ可逆です。

定理5.の証明終わり

行基本変形

今までの連立一次方程式の変形を見てみると、連立一次方程式の基本変形の”式”が行列において”行”に対応していることが分かると思います。
ここでは今までの連立一次方程式の基本変形の操作を行列の言葉で、すなわち行基本変形について少々書こうと思います。
行基本変形はランクとも関係がありますが、それは次回解説します。

行基本変形についてはサラッと学んでいますが、再度列挙します。

行列の行基本変形

行列の次の3つの変形を行基本変形という。
  • (Ⅰ)1つの行に\(0\)出ない数をかける。
  • (Ⅱ)1つの行にある数をかけたものを他の行に加える。
  • (Ⅲ)2つの行を入れ替える。

例4.の連立一次方程式を解くにあたって行った計算は、拡大係数行列の基本変形にほかならないのです。
実際にどうなるのか、ということを見てみましょう。

\begin{eqnarray}
&&\begin{pmatrix}
2&1&-1 &2\\
1&-2&3&9\\
4&2&7&31\\
\end{pmatrix}
\xrightarrow{Ⅲ}
\begin{pmatrix}
1&-2&3 &9\\
2&1&-1&2\\
4&2&7&31\\
\end{pmatrix}\\
&&
\xrightarrow{Ⅱ}
\begin{pmatrix}
1&-2&3 &9\\
0&5&-7&-16\\
0&10&-5&-5\\
\end{pmatrix}
\xrightarrow{Ⅱ,Ⅰ}
\begin{pmatrix}
1&-2&3 &9\\
0&5&-7&-16\\
0&0&1&3\\
\end{pmatrix}\\
&&
\xrightarrow{Ⅱ,Ⅰ}
\begin{pmatrix}
1&-2&3 &9\\
0&1&0&1\\
0&0&1&3\\
\end{pmatrix}
\xrightarrow{Ⅱ}
\begin{pmatrix}
1&0&0&2\\
0&1&0&1\\
0&0&1&3\\
\end{pmatrix}
\end{eqnarray}
ということです。
この結果、\((x,y,z)=(2,1,3)\)が解になります。

これ、やばいでしょ?簡単でしょ?
急に言葉が乱れましたが、それくらい筆者は凄いな、と初めて学んだときに思いました。

要するに、拡大係数行列の係数行列の部分を行基本変形でもって単位行列にすることで解が求まるということで、その道中で、
$$
\begin{pmatrix}
\square&\cdots&\square&\bigcirc\\
\vdots&\cdots&\vdots&\vdots\\
0&\cdots&0&3\\
\end{pmatrix}
$$
のようになってしまうと、\(0=3\)(例えばの話)という等式が出てきて矛盾なので、解は存在しないことが分かります。

さらに、
$$
\begin{pmatrix}
\square&\cdots&\square&\bigcirc\\
\vdots&\cdots&\vdots&\vdots\\
0&\cdots&0&0\\
\end{pmatrix}
$$
というようになったら、変数の数と式の数が一致しないので一意的には解けない、ということが分かります。

行基本変形については次回あらためてランクとの関係性を見ていきます。

行基本変形は可逆なんです。

そうなんです。
これは今までの話から直ちに分かることだと思いますが、定理として明示します。

定理6.

行列の行基本変形は可逆である。すなわち、基本変形を繰り返して行列\(A\)が\(B\)に移ったとすると、逆に\(B\)は適当な行基本変形を繰り返して\(A\)に移る。

「列基本変形はしないの?」「しません。やってはいけません。」

連立一次方程式を解くときには、行列の列基本変形をしてはダメです。

なぜかと言うことを先程の例を流用して説明します。

拡大係数行列
$$
\begin{pmatrix}
2&1&-1 &2\\
1&-2&3&9\\
4&2&7&31\\
\end{pmatrix}
$$
に列基本変形をしてみましょう。
例えば、第3列を第1列に加えてみると、
$$
\begin{pmatrix}
1&1&-1 &2\\
4&-2&3&9\\
11&2&7&31\\
\end{pmatrix}
$$
となります。
この拡大係数行列が表す連立一次方程式は
$$
\begin{cases}
x+y-z=2\\
4x-2y+3z=9\\
11x+2y+7z=31
\end{cases}
$$
ですので、連立一次方程式として別物になってしまうからです。
実際に中学校のときもこのようなことはしなかったはずです。

要するに、列基本変形をしてしまうと連立一次方程式として別物になってしまうので、列基本変形は連立一次方程式の拡大係数行列に対して行ってはいけません。

今回は連立一次方程式の解の存在定理と連立一次方程式を実際にどうやって行列で解くのかということについて解説しました。
そのために拡大係数行列という行列を導入しました。

結論としては、行基本変形をすることで、拡大係数行列の係数行列の部分を単位行列に変形して解く、ということです。

次回は行基本変形、列基本変形とランクの関係性について解説します。

乞うご期待!質問、コメントなどお待ちしております!

コメントをする

タイトルとURLをコピーしました