スポンサーリンク

「逆関数定理①〜なぜ必要?1変数の場合を証明しよう!〜」【解析学の基礎シリーズ】偏微分編 その11

微分法

本記事の内容

本記事は逆関数定理がどういう定理か、そして逆関数定理の証明に必要なことを解説して、1変数の場合を証明する記事です。

本記事を読むにあたり、1変数の逆関数の微分法と中間値の定理について知っている必要があるめ以下の記事も合わせてご覧ください。

↓逆関数の微分法の記事

↓中間値の定理の記事

逆関数定理は非常に強力な定理です。

まずは逆写像(逆関数)について軽く意味を説明します。

逆関数(逆写像)については、

「写像\(f\)が逆写像\(f^{-1}\)を持つためには\(f\)が全単射であることが必要かつ十分である。」

というのが基本中の基本です。

また、与えられた関数\(f\)そのものが全単射出なかったとしても、その定義域を制限したものが全単射になって、その逆写像(逆関数)が便利、というのは実はよくある話です。

例えば、単純に\(y=f(x)\)という関数が与えられたとして、\(f\)が全単射だったとします。
このとき、\(f\)の逆関数\(f^{-1}\)が存在して\(x=f^{-1}(y)\)と書けます。
通常、\(f\)は写像なのですから、\(x\)に対して\(y\)がただ一つ定まっているため、\(x\)が分かれば\(y\)の正体がわかります。

では逆はどうでしょうか。
「\(y\)の値は分かっているんだけれど、その\(y\)をとる\(x\)ってどんなのかな?」という問題を考えるときには、逆関数\(x=f^{-1}(y)\)を使うわけです。

良い例かどうかは少々疑問ですが、より現実に即した例を挙げてみます。
例えば、拡声器を考えてみます。
拡声器は入力された声の大きさを2倍にするようなものだとします(本来は違うのかもしれませんが)。
ということは、拡声器は”声”に対して”2倍の大きさの声”を対応させる写像と考えることができます。

仮に、人間の声の大きさが実数値で測れるとすると、拡声器は\(f:\mathbb{R}\to\mathbb{R}\)で、\(y=2x\)で定められる写像ということになります。

拡声器で話す人が大きさ\(5\)の声で話したとすると、拡声器から出力される声の大きさは\(y=2x\)ですから、\(2\times 5\)により\(10\)です。
一方で、観測者が大きさ\(10\)の声を観測したとします。
そしたらば、今、\(y=2x\)により逆関数は\(\displaystyle x=\frac{y}{2}\)となりますので、\(y=10\)を代入して、\(x=5\)と導けます。
すなわち、逆関数が分かれば、「大きさが\(10\)の声が聞こえたから、話す人は大きさ\(5\)の声で話したんだな」と分かるわけです。

とどのつまり、「この入力に対して、どんな出力が得られるか」は通常の写像で考えることができて、「この出力に対して、どんな入力があったか」を知ることができるのが逆関数、ということなのです。

このように「出力に対して入力を求めるという問題」を逆問題と言ったりもします。
もっと平たく言えば、「結果から原因を探る問題が逆問題です」とも表現できます。

で、逆関数定理ってどうして強力なの?

数学でなにか関数を考えるときは、さも当然のように「\(y=f(x)\)」と書きます。
若干屁理屈かもしれませんが、これは「\(y=\)の形にできる」ということを暗に仮定しています。

しかしながら、必ずしもそうではありません。
例えば、\(x=\sin y\)で定められる写像だって考えうるわけです。
これは既に学習しているので「ああ。それって\(y=\arcsin x\)でしょ?」と思われるかもしれませんが、あくまでこれは「\(x=\sin y\)を\(y=\)の形にしたものを\(\arcsin x\)と書きましょうね」という言わばお約束みたいなものです。
実際、「\(y=\arcsin x\)は、\(x=\sin y\)を満たすような\(x\)に対して定められる写像」と説明されます。

さて、\(x=\sin y\)の\(y\)に対する変化量を求めたい(つまり、導関数と微分係数を求めたい)、となったときにどうするでしょうか。
勿論、逆関数の微分法を用います。

1変数関数の逆関数の微分を軽く復習します。

定理1.(1変数の逆関数の微分法)

\(I,\ J\in\mathbb{R}\)を\(\mathbb{R}\)の開区間、\(\varphi:I\to J\)は全単射、\(\varphi^{-1}:J\to I\)は\(\varphi\)の逆写像(逆関数)とする。このとき、\(\varphi,\ \varphi^{-1}\)がそれぞれ\(I\)、\(J\)で微分可能であれば、次が成り立つ。
\(\displaystyle(\varphi^{-1})^\prime(y)=\left( \varphi^\prime(x)\right)^{-1}\left(=\frac{1}{\varphi^\prime(x)} \right)\quad\)(ただし、\(y=\varphi(x))\)

定理1.の証明は【解析学の基礎シリーズ】1変数実数値関数の微分編 その4を御覧ください。

これを見て「ん?\(\varphi^{-1}\)が微分可能ならば?」となった方、誠に鋭いです。
そうです。
この定理は「\(\varphi\)の逆関数\(\varphi^{-1}\)が微分可能であれば」の話なのです。

一方で多変数の場合はどうだったかと言うと、以下でした。

定理2.(多変数の逆関数の微分法)

\(U\)と\(V\)は\(\mathbb{R}^n\)の開集合で、\(\boldsymbol{\varphi}:U\to V\)は全単射、\(\boldsymbol{a}\in U\)、\(\boldsymbol{b}=\boldsymbol{\varphi}(\boldsymbol{a})\)は\(\boldsymbol{a}\)で、\(\boldsymbol{\varphi}^{-1}\)は\(\boldsymbol{b}\)で全微分可能であるならば、 $$ \left( \varphi^{-1}\right)(\boldsymbol{b})=\left(\boldsymbol{\varphi}^\prime(\boldsymbol{a}) \right)^{-1} $$ である。ただし、左辺の\(^{-1}\)は逆関数を表し、右辺の\(^{-1}\)は逆行列を表している。

定理2.の証明は【解析学の基礎シリーズ】偏微分編 その5を御覧ください。

これもまた「\(\boldsymbol{\varphi}\)の逆関数\(\boldsymbol{\varphi}^{-1}\)が全微分可能であれば」の話なのです。

これらの主張にちょっとイチャモンをつけてみます。

逆関数の微分法は、微分可能な逆関数が存在すればの話でしょ?
もし微分可能な逆関数が1つも存在しなければ、逆関数の微分法なんて何の意味も無いよね?

もし「微分可能な逆関数が1つも存在しなければ」そのとおりです。

このイチャモンを一撃で論破する定理が逆関数定理なのです。

つまり、逆関数定理というのは、平たく言うと微分可能な逆関数というものが存在しますよ、という定理なのです。
しかも他にも色々おいしい性質が成り立っています。

とどのつまり、「逆関数って有用だよね〜。その逆関数を微分するときには逆関数の微分法を使うから、関数の微分法も有用だよね〜。じゃあ、微分可能な逆関数の存在を保証している逆関数定理って凄いよね〜。」という話です。

1変数の逆関数定理の明示とその証明

では、1変数の場合の逆関数定理を明示して証明します。

定理3.(1変数の逆関数定理)

\(\varphi:(\alpha,\beta)\to\mathbb{R}\)は\(C^1\)級で、\(x_0\in(\alpha,\beta)\)に対して、\(\varphi^\prime(x_0)\neq0\)とするとき、次の条件を満たす開区間\((a,b)\)が存在する。
  1. \(x_0\in(a,b)\subset(\alpha,\beta)\),
  2. \(\Phi:(a,b)\to\varphi\left( (a,b)\right)\)を任意の\(x\in(a,b)\)に対して\(\Phi(x)=\varphi(x)\)で定めるとき、\(\Phi\)は全単射で逆関数も\(C^1\)級である。

定理3.の証明

\(\varphi^\prime(x_0)\neq0\)ですから、\(\varphi^\prime(x_0)>0\)かまたは\(\varphi^\prime(x_0)<0\)のいずれか一方が成り立ちます。

かりに\(\varphi^\prime(x_0)>0\)だったとしましょう。
\(\varphi\)が\(C^1\)級ですので、\(\varphi^\prime\)は連続な関数です。
従って、\(\varphi^\prime\)が\([x_0-\varepsilon,x_0+\varepsilon]\)で\(\varphi^\prime>0\)となるような\(\varepsilon>0\)が存在します。
すなわち、
$$
(\exists \varepsilon>0)\ {\rm s.t.}\ \left( \varphi^\prime>0\ {\rm on}\ [x_0-\varepsilon,x_0+\varepsilon]\right)
$$
です。
さらに言い換えれば、\(\alpha<x_0-\varepsilon<x_0<x_0+\varepsilon<\beta\)で、\([x_0-\varepsilon,x_0+\varepsilon]\)で\(\varphi^\prime>0\)となる\(\varepsilon\)が存在するというわけです。
ここで、
$$
a=x_0-\varepsilon,\quad b=x_0+\varepsilon
$$
とすれば、
このとき、\([a,b]\)で\(\varphi^\prime>0\)なので、\(\varphi\)は\([a,b]\)で狭義単調増加です。
実際、次が成り立つからです。

定理4.

\(f:[a,b]\to\mathbb{R}\)が連続で、\((a,b)\)で微分可能、任意の\(c\in(a,b)\)に対して\(f^\prime(c)>0\)ならば、\(f\)は\([a,b]\)で狭義単調増加関数である。すなわち、\(f:[a,b]\to\mathbb{R}\)が連続で、\((a,b)\)で微分可能であるとき $$ (\forall c\in(a,b))\ f^\prime(c)>0\Rightarrow \left(a\leq x_1<x_2\leq b\Rightarrow f(x_1)<f(x_2)\right) $$ が成り立つ。

定理4.の証明は【解析学の基礎シリーズ】1変数実数値関数の微分編 その9を御覧ください。

さて、
\begin{eqnarray}
A&=&\varphi(a),\\
B&=&\varphi(b),\\
I&=&(a,b),\\
J&=&(A,B)
\end{eqnarray}
として、\(\Phi:I\to J\)そ\(\Phi(x)=\varphi(x)\ (x\in I)\)で定めると、\(\varphi\)は狭義単調増加な関数なので、\(\Phi\)は単射です(相異なる定義域の点の行き先も相異なる)。
実際、もし仮に単射でなければ、\(x\neq y\Rightarrow \phi(x)=\phi(y)\)という\(x,y\)が存在することになりますが、\(\varphi\)が狭義単調増加であることから\(\varphi(x)\)と\(\varphi(y)\)は等しくなりえないので矛盾です。

ここで、中間値の定理を用います。
中間値の定理は以下でした。

定理5.(1変数の場合の中間値の定理)

関数\(f:[a,b]\to\mathbb{R}\)が\([a,b]\)で連続であり、\(f(a)<f(b)\)とする。 このとき、\(f(a)<D<f(b)\)を満たす任意の\(D\in\mathbb{R}\)に対して\(f(d)=D\)を満たす\(d\in(a,b)\)が存在する。 すなわち、 $$\forall D\in\mathbb{R}:f(a)<D<f(b)\Rightarrow(\exists d\in(a,b)\ {\rm s.t.}\ f(d)=D)$$ が成り立つ。

定理5.の証明は【解析学の基礎シリーズ】関数の極限編 その14を御覧ください。

この中間値の定理から、\(\Phi\)は全射であることが分かります。
従って、\(\Phi\)は全単射です。
故に、\(\Phi\)には逆写像\(\Phi^{-1}:J\to I\)が存在して、狭義単調増加です。

②\(\Phi\)が連続であることの証明

任意の\(y\in J\)に対して、\(x=\Phi^{-1}(y)\)とします。
このとき、\(0<\varepsilon_0<\min\{x-a,b-x\}\)を満たすような任意の\(\varepsilon_0\)に対して、
$$
\delta=\min\left\{ \varphi(x+\varepsilon_0)-\varphi(x),\varphi(x)-\varphi(x-\varepsilon_0) \right\}
$$
とすれば、\(\delta>0\)です(\(\varphi\)が狭義単調増加だから)。
さらに、\(|y^\prime-y|<\delta\)ならば、\(\left|\Phi^{-1}(y^\prime)-\Phi^{-1}(y) \right|<\varepsilon\)が成り立ちます。
これはまさに\(\Phi^{-1}\)が\(y\)で連続であるということを指しています。

③\(\Phi^{-1}\)が微分可能であることの証明

任意の\(y\in J\)に対して、\(x=\Phi^{-1}(y)\)とします。
\(y+h\in J\)となるような任意の\(h\neq0\)に対して、\(k=\Phi^{-1}(y+h)-\Phi^{-1}(y)\)とすると、\(h=\varphi(x+k)-\varphi(x)\)となります。
実際、\(\Phi^{-1}(y+h)=\Phi^{-1}(y)+k=x+h\)ですので、\(\varphi\)を施して\(y+h=\varphi(x+h)\)で、移項して\(h=\varphi(x+k)-y=\varphi(x+k)-\varphi(x)\)だからです。

従って、
$$
\frac{\Phi^{-1}(y+h)-\Phi^{-1}(y)}{h}=\frac{k}{\varphi(x+k)-\varphi(x)}
$$
です。
ここで、\(h\to 0\)とすると、\(\Phi\)が連続であることから\(k\to0\)となり、\(\varphi\)が微分可能であるから、上記の式の値は\(\displaystyle\frac{1}{\varphi^\prime(x)}\)に収束します。
故に、\(\Phi^{-1}\)は\(y\)で微分可能で、\(\displaystyle\left( \Phi^{-1}\right)^\prime(y)=\frac{1}{\varphi^\prime(x)}\)です。

④\(\left( \Phi^{-1}\right)^\prime\)が連続であることの証明

\(\displaystyle\left( \Phi^{-1}\right)^\prime(y)=\frac{1}{\varphi^\prime\left( \Phi^{-1}(y)\right)}\)で、かつ\(\varphi^\prime\)と\(\Phi^{-1}\)が連続であることから、\(\left( \Phi^{-1}\right)^\prime\)は連続です。

定理3.の証明終わり

1変数とはいえ、結構骨が折れますね…

多変数の逆関数定理を示すために必要な線型代数の話(線型写像の基本定理)

では、最後に多変数の逆関数定理を証明するにあたって必要な線型代数の事実、線型写像の基本定理について解説します。

定理6.(線型写像の基本定理)

\(V,W\)を線型空間、\(f:V\to W\)を線型写像とする。このとき、 $$ \dim V=\dim{\rm Ker}(f)+\dim{\rm Image}(f) $$ が成り立つ。

ここで、証明に入る前に注意ですが、\(f\)は線型写像なので、行列で表現できます。
それを\(A\)と書いたとしましょう。
このとき、
$$\dim {\rm Image}(f)=\dim {\rm Image}(A)$$
であり、かつ
$$
\dim {\rm Image}(A)={\rm rank}(A)
$$
なのですから、定理の主張は
$$
\dim V=\dim{\rm Ker}(A)+\dim{\rm Image}(A)
$$
と書き換えることができます。

定理6.の証明

\(s=\dim {\rm Ker}(f)\)、\(r=\dim{\rm Image}(f)\)とします。
\({\rm Ker}(f)\)の1組の基底\(\boldsymbol{v}_1,\dots,\boldsymbol{v}_s\)および\({\rm Image}(f)\)の1組の基底\(\boldsymbol{w}_1,\dots,\boldsymbol{w}_r\)を取ります。
各\(\boldsymbol{w}_i\)に対して、\(f(\boldsymbol{u}_i)=\boldsymbol{w}_i\)となる\(\boldsymbol{u}_i\in V\ (i=1,\dots,r)\)を取ります。
このとき、\(s+r\)個のベクトル
$$
\boldsymbol{v}_1,\dots,\boldsymbol{v}_s,\ \boldsymbol{w}_1,\dots,\boldsymbol{w}_r
$$
が\(V\)の規定となっていることを示せば、定理の主張が証明できたことになります。

①\(\boldsymbol{v}_1,\dots,\boldsymbol{v}_s,\ \boldsymbol{u}_1,\dots,\boldsymbol{u}_r\)が\(V\)を生成することの証明

\(\boldsymbol{x}\)を\(V\)の任意のベクトルとします。
当然ながら\(f(\boldsymbol{x})\in{\rm Image}(f)\)なわけですので、\(f(\boldsymbol{x})\)は\(\boldsymbol{w}_1,\dots,\boldsymbol{w}_r\)の線型結合で表すことができます。
それを
$$
f(\boldsymbol{x})=b_1\boldsymbol{w}_1+\dots+b_r\boldsymbol{w}_r\quad (b_i\in\mathbb{R})
$$
としましょう。
そこで、次の計算をします。
\(f\)が線型写像であることを使えば、
\begin{eqnarray}
f(\boldsymbol{x}-b_1\boldsymbol{u}_1-\dots-b_r\boldsymbol{u}_r)&=&f(\boldsymbol{x})-b_1f(\boldsymbol{u}_1)-\dots-b_rf(\boldsymbol{u}_r)\\
&=&f(\boldsymbol{x})-b_1\boldsymbol{w}_1-\dots-b_r\boldsymbol{w}_r=\boldsymbol{0}
\end{eqnarray}
です。
故に
$$
\boldsymbol{x}-b_1\boldsymbol{u}_1-\dots-b_r\boldsymbol{u}_r\in{\rm Ker}(f)
$$
です。

従って、このベクトルは\({\rm Ker}(f)\)の基底の線型結合で表されます。
それを
$$
\boldsymbol{x}-b_1\boldsymbol{u}_1-\dots-b_r\boldsymbol{u}_r=a_1\boldsymbol{v}_1+\dots+a_s\boldsymbol{v}_s\quad (a_i\in\mathbb{R})
$$
としましょう。
その結果、
$$
\boldsymbol{x}=a_1\boldsymbol{v}_1+\dots+a_s\boldsymbol{v}_s+b_1\boldsymbol{u}_1+\dots+b_r\boldsymbol{u}_r
$$
となるので、\(V\)はベクトルの組
$$\boldsymbol{v}_1,\dots,\boldsymbol{v}_s,\ \boldsymbol{u}_1,\dots,\boldsymbol{u}_r$$
で生成されることが示されました。

②\(\boldsymbol{v}_1,\dots,\boldsymbol{v}_s,\ \boldsymbol{u}_1,\dots,\boldsymbol{u}_r\)が線型独立であることの証明

今、線型関係
$$
a_1\boldsymbol{v}_1+\dots+a_s\boldsymbol{v}_s+b_1\boldsymbol{u}_1+\dots+b_r\boldsymbol{u}_r=\boldsymbol{0}\quad (a_i,b_j\in\mathbb{R})
$$
に対して、両辺を線型写像\(f\)で写すと、
$$
f(\boldsymbol{v}_i)=\boldsymbol{0}\ (1\leq i\leq s),\quad f(\boldsymbol{u}_j)=\boldsymbol{w}_j\ (1\leq j\leq r)
$$
となるから、
$$
b_1\boldsymbol{w}_1+\dots+b_r\boldsymbol{w}_r=\boldsymbol{0}
$$
という線型関係式になります。
しかしながら、\(\boldsymbol{w}_1,\dots,\boldsymbol{w}_r\)は仮定から線型独立であるので、\(b_1=\dots=b_r=0\)です。
故に、最初の線型関係式は
$$
a_1\boldsymbol{v}_1+\dots+a_s\boldsymbol{v}_s=\boldsymbol{0}
$$
となります。
ところが、\(\boldsymbol{v}_1,\dots,\boldsymbol{v}_s\)もまた線型独立なので、\(a_1=\dots=a_s=0\)です。
従って、\(\boldsymbol{v}_1,\dots,\boldsymbol{v}_s,\ \boldsymbol{u}_1,\dots,\boldsymbol{u}_r\)が線型独立です。

定理6.の証明終わり

ここからが重要です。
これはもし仮に\(f\)が全単射であれば、\(V\)と\(W\)の次元が一致している、ということを指しています。
逆に\(V\)と\(W\)の次元が一致していれば、\(f\)は全単射であるということでもあるので、\(f^{-1}\)が存在して、\(f\)は行列\(A\)で表現すると\(f^{-1}\)は\(A\)の逆行列\(A^{-1}\)に対応します。
従って、\(\det\left( A\right)\neq0\)です。

要するにまとめると、

全単射な線型写像が存在するために、定義域と終域の線型空間の次元が等しいことが必要で、
それが成り立つという前提のもとで、与えられた線型写像が全単射であるためには、その行列式が\(0\)でないことが必要十分である。

読者の皆様のコメントを下さい!

筆者は最初に逆関数の微分法を学んだときに「逆関数の微分可能性を仮定している」なんてことは一切気が付きませんでした。
しかし、後になって「本当だ。仮定してるじゃん。本当にそれって仮定して大丈夫なの?」と気が付きました。
勿論、逆関数定理が存在を保証しているのでOKなのですが。

読者の皆様はそういう経験はありますか?
後になって考えてみると、「あれ?暗に認めてない?」ということを経験したことがあれば是非コメントで教えて下さい!

今回は逆関数定理がなぜ必要なのか、それから1変数の場合の逆関数定理を証明しました。
「偏微分編」と銘打っておきながら一切偏微分の話が出てきませんでしたが。

逆関数定理というのは、平たく言うと微分可能な逆関数というものが存在しますよ、という定理なのでした。

次回は多変数の場合の逆関数定理について解説します。

乞うご期待!
質問、コメントなどお待ちしております!
どんな些細なことでも構いませんし、「定理〇〇の△△が分からない!」などいただければ全てお答えします!
お問い合わせの内容にもよりますが、ご質問はおおよそ3日以内にお答えします。
もし直ちに回答が欲しければその旨もコメントでお知らせください。直ちに対応いたします。

Twitterでもリプ、DM問わず質問、コメントを大募集しております!

コメントをする

  1. >次の条件を満たす解区間

    開区間 ですよね?

    • 名無し様

      コメントありがとうございます。

      >>次の条件を満たす解区間 開区間 ですよね?
      とのご指摘ですが、そのとおりでございます。
      訂正いたしました。ご指摘ありがとうございました。