张瑞
中国科学技术大学数学科学学院
rui@ustc.edu.cn |
不定常迭代法
不定常迭代包括2类:
- 求解对称正定阵的最速下降法(steepest descent method)和共轭梯度法(cg)
- 求解不对称阵的广义极小残量法(Gerneral Minimal RESidual,简写成GMRES)
最速下降法和共轭梯度法本质上来说是一种变分方法,对应于求一个二次函数的极值,是一种极小化方法。
共轭梯度法在最初是当作直接法出现在20世纪50年代。到了八九十年代,预处理共轭梯度法得到很大的发展,成为求解大型稀疏对称正定矩阵的最有效方法。
最速下降法
设阶方阵对称正定,, 为阶向量,对于线性方程组,
先给出等价的变分问题。定义元二次函数,
其中。
设, ,则
二次函数具有如下特性:
(1) 可以得到
也就是说,函数的梯度为
(2) 对于, ,有
(3) 若为方程的解,则有
且,对于,有
定理 1.
对称正定,是方程的解的充要条件是为二次函数的极小值点,即
证明. 必要性: 设,则由性质(3)
上式为的二次型,由的正定性知,,即
充要性: 设,则有
即
由性质(2)知,
所以,。即有
如何找到的极小值点呢?
- 由点出发,沿指定的方向搜索点,使最小。
- 选择的方式不同,算法也不同
记(称为对应的残量),由性质(2)
这是一个关于的二次多项式,
由的正定性知,由二次多项式的性质知,当
时,取到最小值。
且,有
当时,
注意到对于任意非实数,有
- 的下降量只与的方向有关,而与长度无关。
- 函数在处下降最快的方向是该点的负梯度方向,由性质(1)知,取
这样,得到整个最速下降法算法为
- 选定初值
- 对,计算:
-
-
-
定理 2.
对称正定,,分别是的最大和最小的特征值。则由最速下降法得到的序列满足误差估计
其中是方程的根,是中的向量范数。
注.
可以算出,当时,收敛会很慢
共轭梯度法
- 最速下降法中,取负梯度方向从局部来说,是最佳的搜索方向。但从整体来看,并非最优。
- 在每一步使用小代价得到新的搜索方向,使得整体比最速下降法要快
现在,搜索方向不再是,假定新的搜索方向是。
则由前知
时,取到最小。这样,有
可以得到
不失一般性,令,则
现在,希望不仅对最小,同时对也最小。
记,求对和的最小值。
可以得到
上式的交叉项不好处理,为此,令
即,对,成立
定义 1.
对称正定,若中向量组满足
则称向量组为中的一个-共轭向量组,或-正交向量组,或共轭的
当是共轭时,有
设,利用A正交性,可以得到
共轭梯度法算法
- 选定初值,计算
- 对,计算:
-
-
-
- 若足够小,得到解
- 否则
-
-
定理 3.
由共轭梯度法得到的向量组和满足
- ,
- , ,
- , ,
注.
由此,可以证明,共轭梯度法最多经过步迭代后,可以得到精确解。
定理 4.
对称正定,,分别是的最大和最小的特征值。则由共轭梯度法得到的序列满足误差估计
其中是方程的根,是中的向量范数。
注.
由
知,共轭梯度法比最速下降法的收敛性要好很多
广义极小残量法
求解非对称线性方程组的算法:广义极小残量法(General Minimal RESidual)。现在已经成为当前求解大型稀疏非对称线性方程组的主要手段。
预处理技术
由于浮点运算的误差,共轭梯度法和广义极小残量法在计算中得到的向量会逐渐失去正交性。况且在大型稀疏矩阵中,步收敛仍然不能令人满意。
预处理技术用来加速收敛。
简单地说,以较小的代价找到矩阵,然后解方程
或
得到解的算法。分别称为左预处理或右预处理的迭代方法。若存在使得,则可以解
称为对称预处理方法。对称预处理方法在共轭梯度法中经常使用。称为预处理矩阵
预处理矩阵需要满足:
- 构造的代价很小
- 跟足够接近
- 关于的线性方程组很容易求解
如,取,就是一个常用的预处理矩阵。
- 预处理后的矩阵(或,)的特征值越集中,收敛效果越好。
[#ex9-1-0].
参考书:
现代数值计算(第2版),同济大学计算数学教研室,人民邮电出版社
P171 , 最速下降法误差估计