1. Taylor展開と関数近似
2020/1/4公開
Last updated
Was this helpful?
2020/1/4公開
Last updated
Was this helpful?
Taylor 展開による関数近似は直線探索法(line search method)と呼ばれる連続最適化手法を理解する上での基礎になる。
Taylor 展開可能な関数の、点の周りの Taylor 展開は、の変数変換のもとで
で与えられる。が定数でが新たな変数である。つまり点からだけ移動した点における点におけるの値が (1.1.1) 式によって任意の精度で近似できる。
Taylor 展開をの項で打ち切った関数
をの次近似という(次の Taylor 多項式ともいう)。本書で紹介する連続最適化で使われるのは主に1次近似と2次近似であり、それぞれ
である。3次以上の項に着目することは少ない(c.f. self-concordant function)。
の変数変換のもとで、
で与えられる。一般項は表記が面倒な上に、どうせ2次の項までしか使わないので書かなかった。
として定義すると、
であるから、内積
を用いて、(1.1.4) 式の1次の項は
である。
2次の項についても同様の行列形式による表記を行いたい。次の
である。
目的関数が複雑な形状をしていても1次近似や2次近似は計算できることが多く、2次近似した関数の最適解は2次関数の頂点を求める問題とほぼ同じなので比較的容易に計算できる。
であって
同様に、Taylor 展開可能な関数の点の周りの Taylor 展開は、
ここでナブラ演算子を列ベクトル
と書ける。幾何的な意味づけとしてはは点における関数の勾配だから
で定義されるは Hesse 行列と呼ばれる。Hesse 行列を用いれば (1.1.4) 式の2次の項は
と書ける。ただしであり、どの点における Hesse 行列なのかを明記している。書物によってはを単にと書いていたりするので注意する。
Hesse 行列はユークリッド空間上での Hessian 演算子 の行列表記であり、ユークリッド空間では
(1.1.4) 式に (1.1.5), (1.1.6), (1.1.7), (1.1.8) 式の結果を用いれば、関数の1次近似と2次近似はそれぞれ
と書ける。やを用いた表記は幾何的な意味との対応がついているので、ユークリッド空間以外でもを定義すれば適用できる(本書でも Riemannian 最適化で登場する)。
現代科学で扱われる大抵の問題は目的関数の最適解が直接的(代数的)には求まらない。代わりに「関数を近似する近似した関数の最適解へ進む」という手順を繰り返して最終的に近似する前のもとの関数の最適解に到達するような手法を構成する(解析的に求める)。
また連続最適化は、点からある方向にだけ進んだ点がの極限で最適解(または極値)に収束するような手法として構成されることが多いので、ある点の近傍での関数の形状を近似する Taylor 展開が連続最適化でよく登場するのである。
点は探索の起点であり固定するから Taylor 展開におけるとみなせて、は点からの変化なのでに対応する。つまり
の2式が対応している。今後はなどを用いる方の説明がメインになるが、(1.2.1), (1.2.2) 式を用いた式の書き換えは断りなしに行うことがあるので注意してほしい。