- 本記事の内容
- 「逆関数定理ってどんな定理?なぜ必要?」を軽く復習
- 多変数の逆関数定理の明示
- 逆関数定理の証明
- ステップ1:示したいことを言い換える。
- ステップ2:ある条件を満たすような、aを内点とする閉集合U⊂Rnが存在することの証明
- ステップ3:(∀x1,x2∈U) ‖x1−x2‖≤2‖f(x1)−f(x2)‖であることの証明
- ステップ4:B=Ub(Uの境界)、d=infy∈f(B)‖y−f(a)‖とすると、d>0です。
- ステップ5:(∀y∈W) (∃!ˉx∈U∖B) s.t. f(ˉx)=yの証明
- ステップ6:V=(U∖B)∩f−1(W)とすると、Vはaの開近傍であることの証明
- ステップ7:f|−1Vが連続であることの証明
- ステップ8:(∀x∈V)に対して、f|−1Vはy=f(x)で微分可能であることの証明
- ステップ9:f|−1VがC1級であることの証明
- 逆関数定理の証明終わり
- 読者の皆様のコメントを下さい!
- 結
本記事の内容
本記事は多変数の場合の逆関数定理を説明、証明する記事です。
本記事を読むにあたり、1変数の場合の逆関数定理とヤコビ行列について知っている必要があるため、以下の記事も合わせてご覧ください。
↓1変数の場合の逆関数定理の記事
↓ヤコビ行列の記事
「逆関数定理ってどんな定理?なぜ必要?」を軽く復習
「逆関数定理ってどんな定理?」「なぜ必要?」ということに関しては、前回で語っているので、詳しくは【解析学の基礎シリーズ】偏微分編 その11を御覧ください。
ここでは、それをサラッと復習します。
逆関数を使うことで、出力から入力を得ることができます。
もう少しだけ詳しく言うと、「この入力に対して、どんな出力が得られるか」は通常の写像で考えることができて、「この出力に対して、どんな入力があったか」を知ることができるのが逆関数ということです。
逆関数定理は、平たく言うと「微分可能な逆関数が存在しますよ」という定理です。
この定理のおかげで、合成関数の微分法ができるのです。
多変数の逆関数定理の明示
では、早速本題に入っていきます。
定理1.(逆関数定理)
ΩはRnの開集合、f:Ω→RnはC1級、a∈Ω、det(f′(a))≠0とするとき、以下が成り立つ。s.t. (˜f=f|U:U∋x↦f(x)∈Vは全単射で、逆関数˜f−1:V→UもC1級である。)
少々小難しいことを書いているように見えて、実は主張自体はシンプルです。
先に述べた通り、ある条件下ではC1級の逆関数が存在しますよ、という話です。
逆関数定理の証明
では、証明に入っていきます。
先に述べておくと、逆関数定理の証明は割と長丁場です。
しかし、流れはシンプルで、Uを見つけて、Vを見つけると、fをUに制限した写像が定まって、実はそれが全単射だから逆写像が存在して、そしてそれが連続かつ微分可能であることを示す、という流れです。
とはいえ、Uを見つけたりVを見つけたりすることが結構大変です。
そこでいくつかのステップに分けます。
ステップ1:示したいことを言い換える。
A=f′(a)とすると、仮定からdet(f′(a))≠0なので、det(A)≠0です。
従って、Aの逆行列A−1が存在します。
そこで、ˉf=A−1∘fとすると、(ˉf)′(a)=I(Iは単位行列)となります。
今定めたˉfに対して定理を証明すれば、f=A∘ˉfについて示せたことになります。
従って、ˉfを新たにfと書くことにして、f′(a)=Iとして話を進めます。
ステップ2:ある条件を満たすような、aを内点とする閉集合U⊂Rnが存在することの証明
- (∀x∈U∖{a}) f(x)≠f(a),
- (∀x∈U) det(f′(x))≠0
- (∀x∈U) ‖f′(x)−f′(a)‖<12
主張その1.の証明
fはC1級なので、f′は連続です。
従って、値f(a)の周りには必ずf′の値が定まっていてるため、3.の
(∀x∈U) |f′(x)−f′(a)|<12
となるようにUを取る事ができます。
さらに、det(f′(a))=det(I)=1≠0なわけですので、同様にして十分小さくUを取れば、2.の
(∀x∈U) det(f′(x))≠0
を満たすようにできます。
1.については、まずfがaで微分可能であることから、
limx→a‖f(x)−f(a)−f′(a)(x−a)‖‖x−a‖=0
が成り立っています。
すなわち、任意のε>0に対して、あるδ>0が存在して
0<‖x−a‖<δ⇒‖f(x)−f(a)−f′(a)(x−a)‖‖x−a‖<ε
が成り立っていて、ε>0は任意なので、ε=12としても成り立ちます。
すなわち、あるδ>0が存在して
0<‖x−a‖<δ⇒‖f(x)−f(a)−f′(a)(x−a)‖‖x−a‖<12
が成り立っています。
ところが、仮にf(x)=f(a)とすると、
‖f(x)−f(a)−f′(a)(x−a)‖‖x−a‖=‖0−I(x−a)‖‖x−a‖=‖x−a‖‖x−a‖=1
となり矛盾です。
故に、0<‖x−a‖<δならば、f(x)≠f(a)が成り立ちます。
ステップ3:(∀x1,x2∈U) ‖x1−x2‖≤2‖f(x1)−f(x2)‖であることの証明
(∀x1,x2∈U) ‖x1−x2‖≤2‖f(x1)−f(x2)‖
主張その2.の証明
証明の前に、この主張その2.が成り立てば、f|Uの単射性がすぐに分かり、後述の逆写像が連続であることの証明のカギとなります。
さて、g(x)=f(x)−xとすると、
g′(x)=f′(x)−I=f′(x)−f′(a)
なのだから、
‖g(x1)−g(x2)‖≤supξ∈U‖g′(ξ)‖⋅‖x1−x2‖=supξ∈U‖f′(ξ)−f′(a)‖⋅‖x1−x2‖≤‖x1−x2‖2
です。
すなわち、
‖f(x1)−f(x2)−(x1−x2)‖≤12‖x1−x2‖
ということです。
故に、
‖x1−x2‖−‖f(x1)−f(x2)‖≤12‖x1−x2‖
です。
従って、移行して両辺を2倍すれば、
‖x1−x2‖≤2‖f(x1)−f(x2)‖
です。
ステップ4:B=Ub(Uの境界)、d=infy∈f(B)‖y−f(a)‖とすると、d>0です。
B=Ub(Uの境界)、d=infy∈f(B)‖y−f(a)‖とすると、d>0です。
実際、
- 主張その1.の1.からf(a)∉f(B)、
- BはRnの有界閉集合だから、連続な関数fによる像f(B)も有界閉集合、
- 「閉集合とそれに属さない点との距離は正である」から。
です(d=0とすると、f(a)∈f(B)となり矛盾する)。
初等的な証明としては、仮にd=0であったとすると、以下の2つを満たすような数列{yn}n∈Nが存在します。
- (∀n∈N) yn∈f(B)
- ‖yn−f(a)‖⟶0
f(B)が閉集合であるから、f(a)∈f(B)となり、矛盾します。
まだ学習していないものも含まれるので、「ふーん。そーなんだー。」と思って下さい(後の別分野の記事で解説します)。
さて、W=B(f(a);d2)とすると、
y∈W,x∈B⟹‖y−f(a)‖<‖y−f(x)‖⋯①
です。
まず、Wの条件を思い出すと、
‖y−f(a)‖<d2
です。
一方で、x∈Bなので、
‖f(x)−f(a)‖≥infy∈f(B)‖y−f(a)‖=d
ですから、
‖f(x)−y‖=‖f(x)−f(a)+f(a)−y‖≥‖f(x)−f(a)‖−‖f(a)−y‖>d−d2=d2>‖y−f(a)‖
ステップ5:(∀y∈W) (∃!ˉx∈U∖B) s.t. f(ˉx)=yの証明
(∀y∈W) (∃!ˉx∈U∖B) s.t. f(ˉx)=y
主張その3.の証明
関数h:U→Rを
h(x)=‖y−f(x)‖2=(y−f(x),y−f(x))
で定めます。
これは有界閉集合U上の連続関数なので、ワイエルシュトラスの最大値(最小値)定理から
最小値h(ˉx) (ˉx∈U)を取ります。
ちなみに、ワイエルシュトラスの最大値定理は以下でした。
定理2.(多次元版ワイエルシュトラスの最大値定理)
KはRnの空でない有界な閉集合であり、f:K→RはKで連続であるとする。このとき、fは最大値を持つ。すなわち、 (∃c∈K) (∀x∈K) f(c)≥f(x) が成り立つ。 最小値についても同様である。定理2.の証明は【解析学の基礎シリーズ】多変数関数編 その18を御覧ください。
ところで、①により、
x∈B⟹h(a)<h(x)
です。
故に、ˉx∉B、すなわち、ˉx∈U∘=Rn∖¯Rn∖Uです。
故にhは内点ˉxで最小値を取ることになり、∇h(ˉx)=0です。
さて、∇h(ˉx)=f′(ˉx)⊤(f(ˉx)−y)であり、主張その1.の2.からf′(ˉx)は正則なので、f′(ˉx)−y=0です。
すなわち、f(ˉx)=yです。
一意性については主張その2.から分かります。
ステップ6:V=(U∖B)∩f−1(W)とすると、Vはaの開近傍であることの証明
V=(U∖B)∩f−1(W)
とすると、Vはaの開近傍です。
実際、Wは開球なので、開集合であり、連続写像fによる逆像f−1(W)は開集合です(これもまだ学習していないので「ふーん。そーなんだー。」と思って下さい。後の別シリーズで解説します)。
U∖BはUの内部なので、勿論開集合です。
2つの開集合の共有部分ですので、Vは開集合です。
一方で、a∈U、aB̸は直ちに分かります。
f(a)∈W=B(f(a);d2)により、a∈f−1(W)ですから、a∈Vです。
さて、主張その3.から、
f|V:V→W
は逆関数f|−1Vを持ちます。
ステップ7:f|−1Vが連続であることの証明
f|−1V連続です。
実際、主張その2.からy1,y2∈Wとするとき、
‖f|−1V(y1)−f|−1V(y2)‖≤2‖y1−y2‖
が成り立つので、‖y1−y2‖→0とすれば、まさに連続であることを表しています。
ステップ8:(∀x∈V)に対して、f|−1Vはy=f(x)で微分可能であることの証明
(∀x∈V)に対して、f|−1Vはy=f(x)で微分可能で (f|−1V)′(y)=(f′(x))−1 である。
主張その4.の証明
任意のx0∈Vに対して、A=f′(x0)とします。
fが全微分可能であるから、
f(x)−f(x0)=A(x−x0)+ε(x)⋯②
と書いたときに、
limx→x0‖ε(x)‖‖x−x0‖=0
が成り立っています。
さて、任意のy∈Wに対して、x=f|−1V(y)とすると、x∈Vで、かつf(x)=yです。
そこで、②の両辺にA−1をかけて、y0,yで書き直すと、
A−1(y−y0)=f|−1V(y)−f|−1V(y0)+A−1ε(f|−1V(y))
となります。
故に、
f|−1V(y)−f|V(y0)=A−1(y−y0)−A−1ε(f|−1V(y))
となります。
今、f|−1Vが微分可能であることを示したいので、結局の所
limy→y0‖A−1ε(f|−1V(y))‖‖y−y0‖=0
となることを示せばOKです。
さらにこれを示すには、
limy→y0‖ε(f|−1V(y))‖‖y−y0‖=0
が示されればOKです。
‖ε(f|−1V(y))‖‖y−y0‖=‖ε(f|−1V(y))‖‖f|−1V(y)−f|−1V(y0)‖⋅‖f|−1V(y)−f|−1V(y0)‖‖y−y0‖
です。
今、f|−1Vは連続なので、y→y0のときにf|−1V(y)→f|−1V(y0)です。
従って、右辺の第1因子は
‖ε(f|−1V(y))‖‖f|−1V(y)−f|−1V(y0)‖→0
です。一方で第2因子は
‖f|−1V(y)−f|−1V(y0)‖‖y−y0‖≤2
です(ステップ7から)。
ステップ9:f|−1VがC1級であることの証明
f|−1Vのヤコビ行列(f|−1V)′(y)は、f′(x)の逆行列です。
ここで、以下の事実を使います。
定理3.
正方行列Aが正則であるための必要十分条件は、det(A)≠0である。このとき、Aの逆行列A−1は A−1=1det(A)˜A であたえられる。ただし、˜AはAの余因子行列である。定理3.の証明は【線型代数学の基礎シリーズ】行列式編 その6を御覧ください。
定理3.から、(f|−1V)′(y)の風貌は分母がdet(f′(x))、分子は∂fi∂xj(x)の多項式です。
従って、これはyの関数と見て連続です。
故にf|−1VはC1級です。
逆関数定理の証明終わり
いやあ、長かったですね。
お疲れさまでした。
逆関数定理は重要ですので、人生に一度でいいので真面目に証明してみることをおすすめします。
読者の皆様のコメントを下さい!
今回扱った逆関数定理の証明は非常に長丁場でした。
世の中には証明のページ数が何百となる証明がいくつもあります。
例えば、フェルマーの最終定理なんてえらいこっちゃ、という量です(筆者は読んだことがありませんし、読んでも恐らく理解できません)。
証明は短いと確かにエレガントだな、と思う反面、正しさが重要だと思います。
故に主張によっては量が多くなってしまうのはある種仕方がないことだと思います。
今回の逆関数定理の証明は証明の量が長い部類に入ると思います。
そこで、読者の皆様にお聞きしたいのが、「この定理の証明はめちゃくちゃ長くて苦労した」という定理を是非コメントで教えて下さい!
結
今回は、多変数版の逆関数定理を証明しました。
長丁場で、しかも中身を少々難しいのですが、流れとしてはシンプルで、与えられた関数をうまく制限して、その制限した新たな関数は、実は全単射だから、逆写像が存在して、その逆写像がC1級だ、ということを示す、という流れです。
この逆関数定理のおかげで逆関数の微分法が正しいことが担保されています。
次回は逆関数定理と双璧をなす陰関数定理について解説します。
乞うご期待!
質問、コメントなどお待ちしております!
どんな些細なことでも構いませんし、「定理〇〇の△△が分からない!」などいただければお答えします!
Twitterでもリプ、DM問わず質問、コメントを大募集しております!
コメントをする
工学部1年ワイ、数学が嫌いで無事死亡www
名無し様
コメントありがとうございます!
返信が遅れてしまい申し訳ありません。
確かに私の印象では、理学部よりも工学部のほうが数学の講義の進度が早い印象があります。
また、理学部の講義では扱わない概念を扱ったりと毛色が違うという話を聞きます。
本ブログは理学寄りですが、名無しさんの勉強の一助となれば嬉しいです。
最近学びなおしをしており、こちらの記事を参考にさせていただいております。
証明のステップ4について質問があります。ステップ4の主張が成り立つことを説明する際に、3つの根拠を提示しておられますが、私には主張その1.の1.のみからステップ4の主張が成立するように思えるのですが、なぜ3つの根拠すべてが必要なのでしょうか?
また、「この定理の証明はめちゃくちゃ長くて苦労した」という定理について私が思いつくのは、測度の拡張定理ですね。大変だったわりにその後その定理を使うことはありませんでした。
μ様
コメントありがとうございます。
>最近学びなおしをしており、こちらの記事を参考にさせていただいております。
本ブログがμ様の学びの一助となれば幸いです。
>証明のステップ4について質問があります。ステップ4の主張が成り立つことを説明する際に、3つの根拠を提示しておられますが、私には主張その1.の1.のみからステップ4の主張が成立するように思えるのですが、なぜ3つの根拠すべてが必要なのでしょうか?
とのお問い合わせですが、回答いたします。
結論から申し上げまして、私の文章が誤解を招く表現でした。申し訳ございません。
d>0を示すにあたり、間接的に用いています。
証明としては、仮にd=0であったとすると、以下の2つを満たすような数列{yn}n∈Nが存在します。
f(B)が閉集合であるから、f(a)∈f(B)となり、f(a)∉f(B)に矛盾する、ということです。
>「この定理の証明はめちゃくちゃ長くて苦労した」という定理について私が思いつくのは、測度の拡張定理ですね。大変だったわりにその後その定理を使うことはありませんでした。
カラテオドリの拡張定理のことでしょうか?私は測度論を真面目に学習した経験がないため、なんとも言えないですが、書籍で見かけたことがありますが「なんかえらい大変そうだな。こういうのって証明が大変でも案外使う機会が少なかったりするんだよな…」と思ってました。
オノ様
8/15に質問させていただいたμです。ご回答ありがとうございます。疑問が解けました。
私はf(a)がf(B)に属していないことからd>0が従うと勘違いしていましたが、dはinfで定義されているので、f(a)がf(B)に属していなくても(f(B)に条件を付けなければ)d=0となる可能性があるということですね。
したがって、そのようなことが起こらないことを示すためにf(B)が閉集合であることを用いたのだと理解しました。
授業で証明を飛ばしたので助かりました。めっちゃわかりやすかったです、ありがとうございます!
授業で証明飛ばしたので助かりました。めっちゃわかりやすかったです、ありがとうございます!