1 Description
牛顿法的基本思想是利用迭代点x0处的一阶导数(梯度)和二阶导数(Hessen矩阵)对目标函数进行二次函数(非线性)近 似,然后把二次模型的极小点作为新的迭代点,并不断重复这一过程,直至求得满足精度的近似极小值.
原理是利用泰勒公式展开.
在x0处展开:
f(x)=f(x0)+f′(x0)(x−x0)+f′′(x0)(x−x0)22!+⋯+f(n)(x0)(x−x0)nn!+Rn(x)(1)
2 Applications
2.1 求方程的根
取公式(1)前两项(线性部分), 并令其等于0:
f(x)≈f(x0)+f′(x0)(x−x0)=0(2)
求解: f′(x0)≠0 and x=x0−f(x0)f′(x0)
2.2 求最优解
取公式(1)前三项:
f(x)≈f(x0)+f′(x0)(x−x0)+f′′(x0)(x−x0)22!(3)
则min{f(x)} 转化为: min{f(x0)+f′(x0)(x−x0)+f′′(x0)(x−x0)22!}(4)
即对(4)二次函数(抛物线函数)求最小值, 对(4)求导, 并另其等于0(切线斜率为0, 函数的极值点):
f′(x0)+f′′(x0)(x−x0)=0⇒x=x0−1f′′(x0)f′(x0)(5)
上面公式中1f′′(x0)为牛顿迭代每次的步长.
v1.3.9