dummy

RAWCODE

1 Description

牛顿法的基本思想是利用迭代点\(x_0\)处的一阶导数(梯度)和二阶导数(Hessen矩阵)对目标函数进行二次函数(非线性)近 似,然后把二次模型的极小点作为新的迭代点,并不断重复这一过程,直至求得满足精度的近似极小值.

原理是利用泰勒公式展开.

\(x_0\)处展开:

\[ f(x) = f(x_0) + f'(x_0)(x - x_0) + \dfrac{f''(x_0)(x - x_0)^2}{2!} + \cdots + \dfrac{f^{(n)}(x_0)(x -x_0)^n}{n!} + R_n(x) \label{Newton_Taylor} \tag{1} \]

2 Applications

2.1 求方程的根

取公式(\(\ref{Newton_Taylor}\))前两项(线性部分), 并令其等于0:

\[ f(x) \approx f(x_0) + f'(x_0) (x - x_0) = 0 \tag{2} \]

求解: \(f'(x_0) \neq 0\) and \(x = x_0 - \dfrac{f(x_0)}{f'(x_0)}\)

2.2 求最优解

取公式(\(\ref{Newton_Taylor}\))前三项:

\[ f(x) \approx f(x_0) + f'(x_0) (x - x_0) + \dfrac{f''(x_0)(x - x_0)^2}{2!} \tag{3} \]

\(min\{f(x)\}\) 转化为: \(min\{f(x_0) + f'(x_0) (x - x_0) + \dfrac{f''(x_0)(x - x_0)^2}{2!}\} \label{4} \tag{4}\)

即对(\(\ref{4}\))二次函数(抛物线函数)求最小值, 对(\(\ref{4}\))求导, 并另其等于0(切线斜率为0, 函数的极值点):

\[ f'(x_0) + f''(x_0)(x-x_0) = 0 \Rightarrow x = x_0 - \dfrac{1}{f''(x_0)} f'(x_0) \label{5} \tag{5} \]

上面公式中\(\dfrac{1}{f''(x_0)}\)为牛顿迭代每次的步长.

3 迭代图

4 References