本記事の内容
本記事は多変数の場合のテイラーの定理の証明のために必要な準備をする記事です。
特に、2変数関数の高階導関数と多項定理について解説する記事です。
本記事を読むにあたり、偏微分、全微分について知っている必要があるため、以下の記事もあわせて御覧ください。
↓偏微分の記事
↓全微分の記事
多変数の場合もテイラーの定理が成り立ちます。
多変数関数の場合もテイラーの定理が成り立ちます。
むしろテイラーの定理は多変数の場合の方がよく使われると思います。
言ってしまえば、多変数のテイラーの定理が分かってしまえば、1変数の場合は変数を減らすだけですので、多変数のテイラーの定理を理解すれば事足ります。
そもそもテイラーの定理は、ある条件下の関数に対して高階導関数の微分係数を用いて多項式展開する、という話でしたので、多変数になると、多変数の場合の高階導関数と多項式展開が必要になります。
そこで、今回は高階導関数と多項定理について解説します。
2変数関数の高階導関数
多変数の高階導関数を話すために、ここで計算をしてみます。
C∞級の2変数関数f:R2→R (x,y)と、(a,b)∈R2、(h,k)∈R2があるとき、
F(t)=f(a+th,b+tk)(t∈R)
で定めます。
このとき、Fの2階偏導関数と3階偏導関数を計算してみましょう。
まずは1階偏導関数の計算
これは多変数の1階の合成関数の微分をすれば良いだけです。
故に
F′(t)=∂f∂x(a+th,b+tk)h+∂f∂x(a+th,b+tk)h
です。
次に2階偏導関数を計算してみます。
F′(t)を更にtで微分してみます。
F(2)(t)=F′(t)dt=ddt(∂f∂x(a+th,b+tk)h+∂f∂x(a+th,b+tk)h)=∂2f∂x2(a+th,b+tk)h2+∂2f∂x∂y(a+th,b+tk)hk+∂2f∂y∂x(a+th,b+tk)hk+∂2f∂y2(a+th,b+tk)k2
ここで、以下の事実を使います。
定理1.
ΩはRnの開集合、f:Ω→RmはC2級とするとき、任意のi,j∈{1,…,n}およびa∈Ωに対して、 ∂2f∂xi∂xj(a)=∂2f∂xj∂xi(a)定理1.の証明は【解析学の基礎シリーズ】偏微分編 その2を御覧ください。
今、fはC∞級ですので、fはC2級です。
従って定理1.から
∂2f∂x∂y(a+th,b+tk)hk=∂2f∂y∂x(a+th,b+tk)h
が成り立ちます。
故に
F(2)(t)=∂2f∂x2(a+th,b+tk)h2+∂2f∂x∂y(a+th,b+tk)hk+∂2f∂y∂x(a+th,b+tk)h+∂2f∂y2(a+th,b+tk)k2=∂2f∂x2(a+th,b+tk)h2+2∂2f∂x∂y(a+th,b+tk)hk+∂2f∂y2(a+th,b+tk)k2
となります。
ここで、「おや?係数が(a+b)2=a2+2ab+b2と同じじゃね?しかも2階偏微分を2乗と捉えればまさに(a+b)2=a2+2ab+b2の形じゃね?」となった方、鋭いです。
最後に3階の偏導関数を求めてみます。
更に3階偏導関数を計算してみます。
これも同じです。
ゴリゴリ計算します。
F(3)(t)=dF(2)dt(t)=ddt(∂2f∂x2(a+th,b+tk)h2+2∂2f∂x∂y(a+th,b+tk)hk+∂2f∂y2(a+th,b+tk)k2)=∂3f∂x3(a+th,b+tk)h3+∂3f∂y2∂x(a+th,b+tk)hk2+∂3f∂y∂x∂y(a+th,b+tk)hk2+∂3f∂x∂y2(a+th,b+tk)h2k+∂3f∂x2∂y(a+th,b+tk)h2k+∂3f∂x∂y∂x(a+th,b+tk)h2k+∂3f∂y∂x2(a+th,b+tk)h2k+∂3f∂x3(a+th,b+tk)h3
です。
ここで、再度定理1.を使うと、
∂3f∂x2∂y=∂3f∂x∂y∂x=∂3f∂y∂x2∂3f∂y2∂x=∂3f∂y∂x∂y=∂3f∂x∂y2
ですから、
F(3)(t)=∂3f∂x3(a+th,b+tk)h3+3∂3f∂x2∂y(a+th,b+tk)h2k+3∂3f∂x∂y2(a+th,b+tk)h2k+∂3f∂y3(a+th,b+tk)k3
となります。
この場合もまた(a+b)3=a2+3a2b+3ab2+b3と似た形をしていますね。
m階偏導関数はどうなりますか?
どうなるかと言うと、以下になります。
F(m)(t)=m∑r=0nCr∂mf∂xr∂ym−r(a+th,b+tk)hrkm−r=(h∂∂x+k∂∂y)mf(a+th,b+tk)
これの証明は特定の場合、すなわちf(a+th,b+tk)の場合の話ですので証明は省略します。
ただ、数学的帰納法で証明ができます。
とはいえ、これを2変数ではなくn変数に一般化した事実を後述し、証明します。
さて、上の事実からm階偏導関数を計算するときには、二項定理が必要になります。
それを二項だけでなくm項に対して一般化した事実を多項定理といいます。
これを証明します。
多項定理 〜(a1+⋯+an)mの展開公式〜
では、主張を明示します。
定理3.(多項定理(the multinomial theorem))
n,m∈N、n≥2とするとき、 (a1+⋯+an)m=∑1≤i1,i2,…,im≤nai1ai2⋯aim=∑α1,α2,…,αn∈N∪{0}α1+α2+⋯+αn=mm!α1!α2!…αn!aα11aα22…aαnnこの定理3.の証明の方針は、分配法則でとにかくゴリゴリにバラして行くということです。
定理3.の証明
(前半の証明)
まずは、定理3.の主張の式の前半
∑1≤i1,i2,…,im≤nai1ai2⋯aim
を証明しましょう。
分配法則は
(a1+a2+⋯+an)A=a1A+a2A+⋯+anA
ですから、つまり
(n∑i=1ai)A=n∑i=1(aiA)
です。
これを2回使うと、
(a1+a2+⋯+an)2=(n∑i=1ai)(n∑j=1aj)=n∑i=1(a1n∑j=1aj)=n∑i=1n∑j=1(aiaj)
となります。
同様にして、m個の積の場合、m−1回だけ分配法則を使って
(a1+a2+⋯+an)m=n∑i1=1n∑i2=1⋯n∑im=1(ai1ai2…aim)
となります。
この右辺の和の記号∑を省略して
∑1≤i1,i2,…,im≤nai1ai2⋯aim
と書く、というわけです。
(後半の証明のための準備)
さて、後半の証明の参考のために、二項定理を復習しておきます。
定理4.(二項定理)
(a+b)m=m∑k=0mCkam−kbk=m∑k=0mCkakbm−k二項係数mCkについての次の公式はパスカルの三角形を作るときにも使われますので、よく知っているかもしれませんが、明示して証明します。
補題5.
mCk−1+mCk=m+1Ck補題5.の証明
mCk−1+mCk=m!(k−1)!(m−(k−1))!+m!k!(m−k)!=m!(m−k+1)!+m!k!(m−k)!=kk(k−1)!⋅m!(m−k+1)!+m!k!⋅m−k+1(m−k+1)(m−k)!=m!k!(m−k+1)!(k+(m−k+1))=m!(m+1)k!(m−k+1)!=(m+1)!k!((m+1)−k)!=m+1Ck
補題5.の証明終わり
定理4.(二項定理)の証明
数学的帰納法で証明します。
m=1のとき、
a+b=1∑k=01Cka1−kbk=1∑k=01Ckakb1−k
が成り立ちますので、m=1のときには成り立ちます。
m=kのときに成り立つとします。
すると、
(a+b)k+1=(a+b)(a+b)k=(a+b)n∑r=0kCrak−rbr=k∑r=0kCrak+1−rbr+k∑r=0kCrak−rbr+1
です。
右辺第一項は
k∑r=0kCrak+1−rbr=ak+1+k∑r=1kCrak+1−rbr
です。
また、右辺第二項は、途中でr+1をr′と置き換えて
k∑r=0kCrak−rbr+1=k∑r=0kCra(k+1)−(r+1)br+1=k+1∑r′=1kCr′−1ak+1−r′br′=k∑r=1kCr−1ak+1−rbr+bk+1
です。
従って、
(a+b)k+1=ak+1+k∑r=1(kCr+kCr−1)ak+1−rbr+bk+1=ak+1+k∑r=1k+1Crak+1−rbr+bk+1=k+1∑r=0k+1Crak+1−rbr+bk+1
となるので、m=k+1のときでも成り立っています。
故に任意の自然数mに対して成り立っています。
定理4.(二項定理)の証明終わり
ここで、二項定理が
(a+b)n=n∑r=0nCrarbn−r=∑α+β=nn!α!β!aαbβ
と書けることに注意しておきます。
さて、では定理3.の証明に戻ります。
(後半の証明)
nについての数学的帰納法で証明します。
n=2の場合は定理4.の二項定理そのものですので、成り立ちます。
n=kのときに成り立っている、すなわち
(a1+⋯+ak)m=∑1≤i1,i2,…,im≤kai1ai2⋯aim=∑α1,α2,…,αk∈N∪0α1+α2+⋯+αk=mm!α1!α2!…αk!aα11aα22…aαkk
が成り立っているとします。
このとき、
(a1+a2+⋯+ak+ak+1)m=((a1+a2+⋯+ak)+ak+1)m=∑α+β=mm!α!β!(a1+a2+⋯+ak)αaβk+1=∑α+β=mm!α!β!∑α1,α2,…,αk∈N∪0α1+α2+⋯+αk=αα!α1!α2!…αk!β!aα11aα22…aαkkaβk+1=∑α1,α2,…,αk,β∈N∪0α1+α2+⋯+αk+β=mα!α1!α2!…αk!β!aα11aα22…aαkkaβk+1}
です。
これはまさにn=k+1のときに成り立っている、ということですので、2以上の任意の自然数に対して定理3.が成り立っているということを示しています。
定理3.の証明終わり
読者の皆様のコメントを下さい!
数学をやっていると「なんだこれ。分からない。」ということがよくあります。
例えばテストが近くて「わからないから、事実だけ覚えてしまおう。」ということはあるかもしれませんが、基本的には「なぜそうなるんだろうか」ということをしっかり考えると思います。
しかし、分からないことが直ちに分かることはむしろ少ないと思います。
それ故、「なんでだろうなあ」ということを頭の隅に置いておいて、ふとした時に考え直す、ということをするかと思います。
筆者の場合「分からない→考えてみる→やっぱり分からない→時間を置く→ふとしたときに考え直す→それでも分からない→半ばあきらめて頭の隅に追いやる→ひょんなことから思い出して考える→どうしても分からない→困る→一旦忘れる→もう一回だけ考えてみる→突然分かる」という感じです。
ご経験がある方はお分かりかと思いますが、本当に”突然”分かりますよね。
筆者の場合は一度お風呂で頭を洗っているときに”突然”分かったことがあります。
その時は急いで頭を洗い流して思いついたことを書き留めました。
みなさんはどういうときに突然分かりましたか?是非コメントで教えて下さい!
m次微分(高階偏導関数)
では、多変数のテイラーの定理で出現する高階偏導関数について解説します。
そのためにまずは記号を導入します。
記号のお話
m次微分の記述を簡単にするために以下の記号を導入します。
m次微分
(dmf)x(h)=∑1≤i1,i2,⋯,im≤n∂mf∂xi1∂xi2⋯∂xim(x)hi1hi2⋯him をfのxにおけるm次微分と呼ぶ。これはhに関するm次同時多項式(m次形式)である。少しネタバラシをすると、m=1,2の場合が重要です。
m=1のとき、(d1f)a(h)=f′(a)hで、m=2のとき、(d2f)a(h)は後の記事で解説するfのaにおけるヘッセ行列(Hesse行列、ヘシアンとも)H(a)=(∂2f∂xi∂xj(a))を係数とする二次形式(H(a)h,h)=n∑i,j=1∂2f∂xi∂xj(a)hihjです。
多変数のテイラーの定理の証明に必要な事実
この記事で一番重要なことを述べます。
定理6.
ΩがRnの開集合、k∈N、f:\Omega\to\mathbb{R}はC^k級、\boldsymbol{a}\in\Omega、\boldsymbol{h}\in\mathbb{R}^n、[\boldsymbol{a},\boldsymbol{a}+\boldsymbol{h}]\subset\Omegaとする。ただし [\boldsymbol{a},\boldsymbol{a}+\boldsymbol{h}]=\{(1-t)\boldsymbol{a}+t(\boldsymbol{a}+\boldsymbol{h})\ |\ t\in[0,1]\} である。このとき F(t)=f(\boldsymbol{a}+t\boldsymbol{h})\quad(t\in[0,1]) とおくと、F:[0,1]\to\mathbb{R}はC^k級で、\forall m\in\{1,\dots,k\}に対して F^{(m)}(t)=\left( d^mf\right)_{\boldsymbol{a}+t\boldsymbol{h}}(\boldsymbol{h}) である。証明はなんてことありません。
数学的帰納法で証明するだけです。
定理6.の証明
mに関する数学的帰納法で証明します。
m=1の場合については以下の連鎖律を使います。
定理7.(合成関数の微分法、chain rule (連鎖律))
\Omega、Dはそれぞれ\mathbb{R}^n、\mathbb{R}^mの開集合で、\boldsymbol{a}\in\Omega、\boldsymbol{f}:\Omega\to\mathbb{R}^m、\boldsymbol{g}:D\to\mathbb{R}^l、\boldsymbol{f}(\Omega)\subset D、\boldsymbol{b}=\boldsymbol{f}(\boldsymbol{a})、\boldsymbol{f}は\boldsymbol{a}で全微分可能、\boldsymbol{g}は\boldsymbol{b}で全微分可能ならば、\boldsymbol{g}\circ\boldsymbol{f}は\boldsymbol{a}で微分可能で、 (\boldsymbol{g}\circ\boldsymbol{f})^\prime(\boldsymbol{a})=\boldsymbol{g}^\prime(\boldsymbol{b})\cdot\boldsymbol{f}^\prime(\boldsymbol{a}) である。\boldsymbol{y}=\boldsymbol{f}(\boldsymbol{x})、\boldsymbol{z}=\boldsymbol{g}(\boldsymbol{y})と書けば、上式の第(i,j)成分は \frac{\partial z_i}{\partial x_j}=\sum_{k=1}^m\frac{\partial z_i}{\partial y_k}\frac{\partial y_k}{\partial x_j}\quad (1\leq i\leq l,\ 1\leq j\leq n) である。
定理7.の証明は【解析学の基礎シリーズ】偏微分編 その5を御覧ください。
さて、定理7.から
\begin{eqnarray} F^{(1)}(t)=F^\prime(t)&=&\frac{d}{dt}f(\boldsymbol{a}+t\boldsymbol{h})\\ &=&f^\prime(\boldsymbol{a}+t\boldsymbol{h})\frac{d}{dt}(\boldsymbol{a}+t\boldsymbol{h})\\ &=&f^\prime(\boldsymbol{a}+t\boldsymbol{h})\boldsymbol{h}\\ &=&\sum_{i=1}^n\frac{\partial f}{\partial x_i}(\boldsymbol{a}+t\boldsymbol{h})h_i \end{eqnarray}
となります。
だたし、最後の等式
f^\prime(\boldsymbol{a}+t\boldsymbol{h})\boldsymbol{h} =\sum_{i=1}^n\frac{\partial f}{\partial x_i}(\boldsymbol{a}+t\boldsymbol{h})h_i
については、f^\prime(\boldsymbol{a}+t\boldsymbol{h})が(1,n)型の横ベクトル、\boldsymbol{h}が(n,1)型の縦ベクトルですので、f^\prime(\boldsymbol{a}+t\boldsymbol{h})\boldsymbol{h}はf^\prime(\boldsymbol{a}+t\boldsymbol{h})と\boldsymbol{h}の内積を表しているため、実数値となります。
さて、
\sum_{i=1}^n\frac{\partial f}{\partial x_i}(\boldsymbol{a}+t\boldsymbol{h})h_i=\sum_{1\leq i_1\leq n}\frac{\partial f}{\partial x_{i_1}}(\boldsymbol{a}+t\boldsymbol{h})h_{i_1}
と書き直すことができます。
すなわち、m=1の場合は成り立ちます。
mのときに成り立つとしましょう。
すなわち、
F^{(m)}(t)=\sum_{1\leq i_1,i_2,\cdots,i_m\leq n}\frac{\partial^mf}{\partial x_{i_1}\partial x_{i_2}\cdots\partial x_{i_m}}(\boldsymbol{a}+t\boldsymbol{h})h_{i_1}h_{i_2}\cdots h_{i_m}
が成り立っているとしましょう。
このとき、fはk級で、1\leq m\leq kなのですから、m階微分の順序が交換可能であることに注意すると、
\begin{eqnarray} F^{(m)}(t)=\frac{d}{dt}F^{(m)}(t)&=& \sum_{1\leq i_1,i_2,\cdots,i_m\leq n}\frac{d}{dt}\frac{\partial^mf}{\partial x_{i_1}\partial x_{i_2}\cdots\partial x_{i_m}}(\boldsymbol{a}+t\boldsymbol{h})h_{i_1}h_{i_2}\cdots h_{i_m}\\ &=& \sum_{1\leq i_1,i_2,\cdots,i_m\leq n}\left(\sum_{i=1}^n\frac{\partial^{m+1}f}{\partial x_i\partial x_{i_1}\partial x_{i_2}\cdots\partial x_{i_m}}( \boldsymbol{a}+t\boldsymbol{h})h_i\right)h_{i_1}h_{i_2}\cdots h_{i_m}\\ &=& \sum_{1\leq i_1,i_2,\cdots,i_m,i_{m+1}\leq n}\sum_{i=1}^n\frac{\partial^{m+1}f}{\partial x_{i_1}\partial x_{i_2}\cdots\partial x_{i_m}\partial x_{i_{m+1}}}( \boldsymbol{a}+t\boldsymbol{h})h_{i_1}h_{i_2}\cdots h_{i_m}h_{i_{m+1}} \end{eqnarray}
となります。
これはまさにm+1の場合でも成り立っている、ということを指していますので、m(\leq k)について成り立ちます。
定理6.の証明終わり
m次微分を計算してみましょう!
してみましょう。
例8.f(x_1,x_2)=\sin x_1x_2とします。
このとき、\boldsymbol{a}=(a,b)=(0,0)、\boldsymbol{h}=(1,1)として、
F(t)=f(\boldsymbol{a}+t\boldsymbol{h})=f\left( (0,0)+t(1,1)\right)=f(t,t)=\sin t^2\quad (t\in[0,1])
としてF^{(3)}(t)を計算してみます。
まずは、真正直に計算してみましょう。
\begin{eqnarray} F^{(1)}(t)&=&\frac{d}{dt}\sin t^2=\left( \cos t^2\right)\cdot 2t=2t\cos t^2\\ F^{(2)}(t)&=&\frac{d}{dt}F^{(1)}(t)=\frac{d}{dt}\left(2t\cos t^2\right)\\ &=&2\cos t^2+2t(-\sin t^2)\cdot2t=2\cos t^2-4t^2\sin t^2\\ F^{(3)}(t)&=&\frac{d}{dt}F^{(2)}(t)=\frac{d}{dt}\left(2\cos t^2-4t^2\sin t^2\right)\\ &=&2t\cdot(-2\sin t^2)-8t\sin t^2-4t^2\cdot2t\cdot\cos t^2\\ &=&-12t\sin t^2-8t^3\cos t^2 \end{eqnarray}
さて、では先程証明した定理6.からF^{(3)}(t)を導出してみましょう。
\boldsymbol{h}=(1,1)ですからh_{i_1},h_{i_2},h_{i_3}=1に注意すると、
\begin{eqnarray} F^{(3)}(t)&=&\sum_{1\leq i_1,i_2,i_3\leq 2}\frac{\partial^3f}{\partial x_{i_1}\partial x_{i_2}\partial x_{i_3}}((0,0)+t(1,1))h_{i_1}h_{i_2}h_{i_3}\\ &=&\sum_{1\leq i_1,i_2,i_3\leq 2}\frac{\partial^3f}{\partial x_{i_1}\partial x_{i_2}\partial x_{i_3}}(t,t)\\ &=&\frac{\partial^3f }{\partial x_1^3}(t,t)+\frac{\partial^3 f}{\partial x_2\partial x_1}(t,t)+ \frac{\partial^3 f}{\partial x_1\partial x_2\partial x_1}(t,t)+\frac{\partial^3 f}{\partial x_2^2\partial x_1}(t,t)\\ &&+\frac{\partial^3 f}{\partial _1^2\partial x_2}(t,t)+\frac{\partial^3 f}{\partial x_2\partial x_1\partial x_2}(t,t)+\frac{\partial^3 f}{\partial x_1\partial x_2^2}(t,t)+\frac{\partial^3 f}{\partial x_2^3}(t,t) \end{eqnarray}
となります。
さて、
\begin{eqnarray} \frac{\partial^3f }{\partial x_1^3}(t,t)&=&-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_2\partial x_1}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_1\partial x_2\partial x_1}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_2^2\partial x_1}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial _1^2\partial x_2}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_2\partial x_1\partial x_2}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_1\partial x_2^2}(t,t)&=&-2t\sin t^2-t^3\cos t^2\\ \frac{\partial^3 f}{\partial x_2^3}(t,t)&=&-t^3\cos t^2 \end{eqnarray}
です。
従って、
\begin{eqnarray} F^{(3)}(t)&=&2(-t^3\cos t^2)+6(-2t\sin t^2-t^3\cos t^2)\\ &=&-12t\sin t^2-8t^3\cos t^2 \end{eqnarray}
となり、ま正直に計算した値と一致します。
結
今回は、多変数のテイラーの定理の準備ということで、多項定理とm次微分について解説しました。
1変数のテイラーの定理を思い出すと、ある条件下の関数に対して高階導関数の微分係数を用いて多項式展開する、という話でしたので、多変数になると、多変数の場合の高階導関数と多項式展開が必要になります。
今回はそれについて解説した、ということです。
次回は新企画「エレガントな解答を求む!に1時間でチャレンジしてみる」です。
本記事の続きの多変数のテイラーの定理は次次回に行います。
質問、コメントなどお待ちしております!
どんな些細なことでも構いませんし、「定理〇〇の△△が分からない!」などいただければ全てお答えします!
お問い合わせの内容にもよりますが、ご質問はおおよそ3日以内にお答えします。
もし直ちに回答が欲しければその旨もコメントでお知らせください。直ちに対応いたします。
Twitterでもリプ、DM問わず質問、コメントを大募集しております!
コメントをする