本記事の内容
本記事は、多変数の平均値の定理について解説する記事です。
本記事を読むにあたり、偏微分、全微分について知っている必要があるため、以下の記事も合わせてご覧ください。
↓偏微分の記事
↓全微分の記事
多変数の合成関数の微分法を用いると、多変数関数版の平均値の定理とテイラーの定理が得られます。
前回(【解析学の基礎シリーズ】偏微分編 その5)で解説した多変数の合成関数の微分法を用いると、多変数関数ver.の平均値の定理とテイラーの定理(次次回に解説します)が得られます。
しかもその証明方法は殆ど1変数の場合をうまく使うことで証明が可能です。
つまり、「うまく」1変数の場合の主張を適用させることで一瞬で証明可能なのです(少なくとも多変数関数ver.の平均値の定理は一瞬です)。
ただし、多変数関数ver.の平均値の定理において重要なことは
ということです。
「え?できないの?」と筆者は初めて学んだときに思いました。
これについては後述します。
まずは1変数の場合の平均値の定理の復習
1変数の場合の平均値の定理を軽く復習します。

1変数の場合の平均値の定理の証明は【解析学の基礎シリーズ】1変数実数値関数の微分編 その8を御覧ください。
要するに、1変数実数値関数の場合の平均値の定理は、
ということです。
厳密ではないですが、イメージとしては、ある点で微分可能な関数に対して、その点での微分係数を極限を使わずに値を求めることができる、とも言えます。
多変数の平均値の定理の問題意識
これは多変数の場合のテイラーの定理にも通づることです。
ΩがRnの開集合、f:Ω→R、a∈Ωとするときに、f(a+h)−f(a)の値はどうなる?ということです。
hの大きさが”ほぼ”0、すなわちhが”ほぼ”零ベクトルであれば、f(a+h)−f(a)とf′(a)hは”ほぼ”値が同じでしょう、ということです。
これをあえて記号を用いて書くと、
f(a+h)−f(a)≒f′(a)h=∇f(a)⋅h
ということです。
しかしながら、≒を用いた式というのは数学的な主張とはみなせません。
「似ている」かどうかなんて人それぞれ評価が分かれてしまうので、論理的な主張とはみなせないからです。
この「どれだけ値が似ているか」ということを数学でしっかり記述しよう、ということが問題意識になります。
多変数の場合の平均値の定理のイメージ
まだ多変数の平均値の定理を明示していませんが、イメージを述べます。
1変数の場合の平均値の定理を別の見方をしてみます。
1変数の場合のイメージは「接線の傾き」ということで説明しましたが、別の見方をしてみます。
1変数の場合の平均値の定理に出現する式を変形してみます。
f(b)−f(a)b−a=f′(c)⇔f(b)−f(a)=f′(c)(b−a)⇔f(b)=f(a)+f′(c)(b−a)
です。
このとき、b−a=Sと新たに記号を導入してみます。
すると、b=a+Sですので、
f(b)−f(a)b−a=f′(c)⇔f(b)=f(a)+f′(c)(b−a)⇔f(a+S)=f(a)+f′(c)S
です。
今、a<c<bですので、a<c<a+Sだから、これを変形して0<c−aS<1となります。
ここで、再度θ=c−aSとすると、c=a+θSとなります。
従って、
f(b)−f(a)b−a=f′(c)⇔f(a+S)=f(a)+f′(c)S⇔f(a+S)=f(a)+f′(a+θS)⋅S(0<θ<1)
となります。
すなわち、1変数の平均値の定理は
f(a+S)=f(a)+f′(a+θS)⋅S
となるような0<θ<1が存在する、という主張になります。
これを言葉で説明すると、
ということになります。
多変数の場合でも同様のことが成り立ちます。
多変数の場合の平均値の定理のイメージ
ネタバラシになってしまいますが、多変数の場合平均値の定理を平たく言うと次になります。
f(a+h,b+k)=f(a,b)+fx(a+θh,b+θk)h+fy(a+θh,b+θk)k となるような0<θ<1が存在する。
つまり、先程の1変数の場合と同様に
という主張になります。
これは次次回で解説するテイラーの定理にも通じるイメージです。
読者の皆様のコメントを下さい!
数学の主張の”イメージ”というと、何を思い浮かべますか?
私は結構幾何的な(図形的な)イメージを思い浮かべます。
多変数の平均値の定理のイメージは、「値がどれだけズレているか」という話をしましたが、「もっとうまいイメージが無いものかなあ」と思っています。
もしご存知であれば、是非コメントを下さい!この記事を改変します。
また、「この定理のこのイメージは本当にいいイメージだなあ」と思ったものがあれば合わせてコメントで教えて下さい!
多変数の場合の平均値の定理の証明のアイデア
多変数といえど、平均値の定理です。
つまり、「1変数の場合の平均値の定理を使えないか?」ということです。
“うまく”1変数の場合の平均値の定理を使うためのアイデアが必要になります。
さて、先程多変数の場合の平均値の定理の主張のイメージは「点(a,b)から(h,k)だけ動かした点での関数の値は、f(a,b)からfx(a+θh,b+θk)h+fy(a+θh,b+θk)kだけずれている!」と説明しました。
「点(a,b)から(h,k)だけ動かした点」というのは実は変数を一つ用意するだけで数式で表現可能です。
というのも、aとhとt∈[0,1]に対して、f(a+th)とすることで、aからちょっとだけずらした点での関数fの値を表現できるからです。
ここまで分かればあとはなんてことありません。
結局はtに対する1変数関数なわけですので、新たにF(t)=f(a+th)として、このFに1変数の平均値の定理と1変数のテイラーの定理を使います。
まず、F(0)=f(a)、F(1)=f(a+h)であるので、
f(a+h)−f(a)=F(1)−F(0)
です。
このFは1変数関数ですので、1変数関の場合の平均値の定理を使うことができます。
では、「Fの導関数F′はどうなるの?」という話になってくるわけですが、φ(t)=a+thとすることで、F(t)=f(φ(t)))となるので、Fはfとφの合成関数です。
つまり、F=f∘φです。
ここで、φ′(t)=hです。
実際、
φ(t)=a+th=(a1+th1a2+th2⋮an+thn)
ですので、
φ′(t)=((a1+th1)′(a2+th2)′⋮(an+thn)′)=(h1h2⋮hn)=h
だからです。
故に合成関数の微分法から、
F′(t)=ddtf(a+th)=f′(φ(t))φ′(t)=f′(a+th)h=∇f(a+th)⋅h
となります。
特に、
F′(0)=ddtf(a+th)|t=0=f′(a)h=∇f(a)h=∇f(a)⋅h
です。
ただし、ddtf(a+th)|t=0は導関数ddtf(a+th)にt=0を代入した値、という意味です。
このF′(0)をaにおけるfのh方向の方向微分係数と呼び、∂f∂h(a)で表します。
あくまで記号です。
つまり、
ddtf(a+th)|t=0=f′(a)h=∇f(a)h=∇f(a)⋅h
をaにおけるfのh方向の方向微分係数と呼ぶ、という話です。
さて、ではいよいよ多変数の場合の平均値の定理の明示とその証明を行っていきます。
多変数の場合の平均値の定理の明示とその証明
では行きましょう!
多変数の場合の平均値の定理の明示
定理1.(多変数関数の平均値の定理)
ΩはRnの開集合、f:Ω→Rは全微分可能、a,b∈Ω、a≠b、[a,b]⊂Ωとするとき、 (∃c∈(a,b)) s.t. f(b)−f(a)=f′(c)(b−a) である。ただし、 [a,b]={(1−t)a+tb | t∈[0,1]},(a,b)={(1−t)a+tb | t∈(0,1)} である。[a,b]と(a,b)という妙な記号を導入しましたが、これらはaとbを通る線分で、前者が点aとbを含むようなaとbを通る線分、後者は点aとbを含まないようなaとbを通る線分のことです。
ここで注意なのですが、1変数の平均値の定理の場合のように
f(b)−f(a)b−a=f′(c)
と書いてはいけません。
なぜならf(b)−f(a)もb−aもベクトルなので、ベクトル同士は割り算ができないからです。
では、証明しましょう!
多変数の場合の平均値の定理の証明
定理1.の証明
h=b−a、F(t)=f(a+th) (t∈R)とすると、
f(b)−f(a)=F(1)−F(0),F′(t)=f′(aLth)h
です。
ここで、1変数の場合の平均値の定理を使います。
1変数の場合の平均値の定理の証明は【解析学の基礎シリーズ】1変数実数値関数の微分編 その8を御覧ください。
1変数の場合の平均値の定理を別の見方をしてみます。で述べた通り、1変数の場合の平均値の定理の主張は
(∃θ∈(0,1)) s.t. f(a+S)−f(a)=f′(a+θS)⋅S
と書き換えられる、というわけですので、これをa=0、S=1としてFに適用させると、
(∃θ∈(0,1)) s.t. F(1)−F(0)=F′(θ)⋅1
となります。
さて、
f(b)−f(a)=F(1)−F(0),F′(t)=f′(aLth)h
だったわけですので、
(∃θ∈(0,1)) s.t. f(b)−f(a)=f′(a+θh)h
が成り立っています。
ここで、c=a+θhとすると、c∈(a,b)で、f(b)−f(a)=f′(c)(b−a)です。
定理1.の証明終わり
平均値の定理をベクトル値関数に適用させることはできません。
平均値の定理をベクトル値関数に適用させることはできないのです。
なぜかと言うと、実数値関数の場合の定理の証明を振り返って遡ると、実数値関数の最大値の存在(ワイエルシュトラスの最大値定理)まで行き着きます。
この証明をベクトル値まで拡張するのは難しいのです。
平均値の定理がベクトル値関数では成り立たない、という例を1つ挙げます。
例2.f:R∋x↦(cosxsinx)∈R2はcosxとsinxがC∞級ですので、C1級ですから、fは全微分可能です。
a=0、b=2πとしたとき、
f(b)−f(a)=(10)−(10)=(00)=0
です。
一方で、
f′(x)=((cosx)′(sinx)′)=(−sinxcosx)
で、このノルムは√sin2x+cos2x=1ですので、f′(x)≠0です。
特に、c∈(a,b)に対して、f′(c)(b−a)≠0です。
従って、f(b)−f(a)とf′(c)(b−a)は等しくありません。
結
今回は、多変数の平均値の定理を証明して、平均値の定理はベクトル値関数には適用できない、ということを解説しました。
結局は”うまく”やることで1変数の場合に帰着できて、証明自体は誠にシンプルです。
ただ、注意なのが、多変数実数値関数には平均値の定理が成り立ちますが、ベクトル値関数の場合には必ずしも成り立たない、ということです。
次回は多変数のテイラーの定理の準備をします。
質問、コメントなどお待ちしております!
どんな些細なことでも構いませんし、「定理〇〇の△△が分からない!」などいただければ全てお答えします!
お問い合わせの内容にもよりますが、ご質問はおおよそ3日以内にお答えします。
もし直ちに回答が欲しければその旨もコメントでお知らせください。直ちに対応いたします。
Twitterでもリプ、DM問わず質問、コメントを大募集しております!
コメントは下記コメント欄から投稿でき、Twitterは右のサイドバーからフォローできます!
※本文中に皆様のご意見を求めましたが、それについてのコメントもお待ちしております。
コメントをする