基于模型函数与L-曲线的正则化参数选取方法

2014-01-18徐会林王泽文喻建华

江西师范大学学报（自然科学版） 2014年6期

胡彬，徐会林，王泽文，喻建华

(东华理工大学理学院，江西南昌330013;2.河南理工大学数学与信息科学学院，河南焦作454000)

0 引言

反问题研究已是计算数学及应用数学领域研究的热点问题之一.反问题一般是不适定的［1］，其不适定性在数值计算上表现为解不连续依赖测量数据.即使在实际测量过程中测量误差非常小，也会引起解的巨大波动.目前求解不适定问题最具有普遍性、完备性的是Tikhonov正则化方法，但该方法的有效性取决于选取到合适的正则化参数.目前比较有代表性的正则化参数选取策略有:Morozov偏差原理、广义交叉检验、L-曲线(L-curve)等准则.当误差水平已知或可估计时，Morozov偏差原理是最常采用的正则化参数选取策略之一，但是当不适定算子方程右端项的误差水平δ未知时，Morozov偏差原理就失效了.为了克服Morozov偏差原理需要已知误差水平的局限性，P.C.Hansen等提出基于L-曲线的正则化参数选取方法［2-3］，可以在误差水平未知的情形下找到近似最佳的正则化参数.

在利用Morozov偏差原理确定正则化参数时需要借助牛顿迭代，而牛顿迭代的计算量比较大，为了克服这一缺点，文献［4-7］中提出了1种新的确定正则化参数的方法—模型函数法.它是将Tikhonov泛函定义为关于α的函数，再用1个简单的具有显示表达式的模型函数来近似F(α)，通过简单迭代确定正则化参数.

本文在上述2种方法的基础上研究了基于模型函数的修正L-曲线准则，证明了所得序列点是局部收敛的，给出了相应的迭代算法.通过算例验证了该准则的有效性，同时也指出了目前还存在的不足和今后进一步研究的方向.

1 模型函数法

线性反问题一般可归结为解第1类不适定算子方程:

其中K是Hilbert空间X到Y上的有界线性算子.由于观测数据存在误差，所以一般把方程(1)改写为

其中δ为误差水平，‖yδ-y‖≤δ.Tikhonov正则化方法是将求不适定方程(2)的解转为求Tikhonov泛函

的最优解，其中α＞0是正则化参数.对于固定的正则化参数α，记最优函数为

引理1［4］设K:X→Y是有界线性算子，X，Y均为Hilbert空间.∀α ＞0，(3)式的唯一解x(α)是无穷次可微的，且g=dnx(α)dαn∈X可由

递推求解得到.

定理1［4-5］最优函数F(α)在(0，+∞)内是无限次可微的，且∀α ＞0，F(α)满足

模型函数的方法就是在αk附近构造F(α)的局部近似函数Fk(α)，使其满足微分方程(4)，即

若假设‖Kx(α)‖2≈ Tk‖x(α)‖2，代入(5)式并注意到 F'(α)= ‖x(α)‖2，解得

即得到双曲模型函数:

由于 Kx(α)≈ yδ，故可设 ‖Kx(α)‖2≈‖yδ‖2-Tk，代入(5)式得

解微分方程(6)，得Fk(α)=Tk+Ckα，其中Ck、Tk是待定参数且由方程组

确定，即

于是，得到更为简洁的双曲模型函数:

文献［8］研究了非精确数据下的线性模型函数选取正则化参数.虽然线性模型函数具有计算简单、收敛性较好等优点，但是却不能将它与L-曲线准则相结合而得到选取正则化参数的算法.文献［9］将双曲模型函数m1(α)应用于L-曲线选取准则获得选取正则化参数的新算法.本文是前述研究的继续和深入，基于双曲模型函数m2(α)研究修正的L-曲线选取准则，从而获得选取正则化参数选取的新方法.

2 修正的L-曲线准则

L-曲线准则是残差‖Kx(α)-yδ‖2与正则化解‖x(α)‖2在一组正则化参数下所构成的图像，也就是由(‖Kx(α)-yδ‖2，‖x(α)‖2)所构成的平面曲线.最优的正则化参数α出现在曲线的拐点处. 通常转化为对应的(2log‖Kx(α)-yδ‖，2log‖x(α)‖)曲线，因为曲线形状如字母L(见图1)，故称为L-曲线准则.从图像上很容易找到曲线的拐点，即最优正则化参数α在对应曲线的“角点”出现.记u(α)=2log‖Kx(α)-yδ‖，v(α)=2log‖x(α)‖，则L曲线上各点的曲率公式［10-11］为

曲率最大的点对应正则化参数即为所需正则化参数.

图1 L-曲线示意图

由文献［12］知，若L-曲线在点α=α*处取到最大曲率，且在该点处曲线的斜率为 -1/μ，则下列泛函:

在α=α*处取得极小值.因此，选取正则化参数的L-曲线准则等价为求泛函(8)的极小值点.修正的L-曲线准则就是通过求(8)的极小值来获得合适的正则化参数.由于是α的非线性隐式函数，不便于计算.本文利用模型函数的方法将(8)式显化，从而简化计算，提高计算效率.

3 基于模型函数的修正L-曲线算法

对于任意给定的α＞0，最优函数F(α)为

且F'(α)= ‖x(α)‖2，则(8)式可改写成F(α)的形式，即

模型函数m(α)是F(α)的局部近似，则(9)式的局部近似为

本文主要研究了双曲模型函数m2(α)，代入(10)式得 ω(α)=(T+2C/α)(-C/α2)μ.

对 ω(α)求导，得

令 ω'(α)=0，解得 α=-C(1+2μ)(μT).

对于正则化参数 αk，求得对应的正则化解x(αk)，再根据方程组(7)可确定参数 Ck，Tk，则

由(11)式及Ck＜0，Tk＞0知αk+1＞0且它是唯一的.该算法比文献［9］中的更为简单，因为文献［9］给出的是关于α的2次方程，选取其中较大的作为正则化参数αk+1.

综合上面分析，得到基于双曲模型函数m2(α)与修正的L-曲线正则化参数选取策略的新算法:

算法1 给定 ε ＞ 0，yδ，K，μ ＞ 0;

Step 1 给定1个初始值α0＞α*，置k=0;

Step 2 解正则化方程αkx+K*Kx=Kyδ;

Step 3 求出 Ck，Tk，αk+1;

Step 5 停止迭代，输出正则化参数αk+1.

定理2 如果

则在算法1中函数ωk(α)在点αk处是局部严格单调递减的.

证算法1中产生的函数ωk(α)为

ωk(α)=(Tk+2Ck/α)(-Ck/α2)μ，则 ωk'(α)=(-Ck)μ(-2Ck+(αTk+2Ck)·(-2μ))/α2μ+2.取 α= αk，把(7)式中解得 Ck，Tk的表达式代入得

由已知条件得ω'k(αk)＜0，即函数ωk(α)在点αk处是局部严格单调递减的.

定理3 给定初始值α0满足(12)式，则算法1产生严格单调递减序列{αk}且收敛.

证由定理2 的证明过程知，

令 φ(α)=-2Ck+(αTk+2Ck)(-2μ)，显然φ(αk)＜ 0，φ'(αk)＜ 0.所以函数φ(α)是严格单调递减的.由算法1知φ(αk+1)=0，所以αk＞ αk+1.又∀k均有αk＞0，故收敛性成立.

4 数值算例

例1 求解第1类Fredholm积分方程［13］:

其中，核 K(s，t)=1 ［1+100(t-s)2］，

本文用等距节点复化梯形公式来离散第1类Fredholm 积分方程(13)，得线性方程组Ax－=y－，其中把积分核K(s，t)离散成矩阵Am×n，x(s)离散成n维列向量x－.对方程组右端加入随机扰动为

其中r为Matlab中的随机函数.取不同的误差值δ，求出对应不同误差值δ的正则化参数，并把不同正则化参数求出的正则化解对比(见图2～4)，其中实线表示无扰动下的精确解，星形线表示不同正则化参数下的数值近似解.

情形1 当δ=5.8378e-4，α=3.7320e-4，正则化解的相对误差ρ=0.0678.正则化解与真解如图2和图3所示，其中图2是该情形下未作正则化处理的计算所得解(即当α=0时的最小二乘解)，图3为算法1计算所得解.

情形2 当δ=8.5401e-8，α=6.6470 e-4，正则化解的相对误差ρ=0.0500，算法1计算结果如图4所示.

图2 α=0

图3 α=3.7320e-4

图4 α=6.6470e-4

例2 求解第1类Fredholm积分方程［14-15］:

x(s)=a1e-c1(s-t1)2+a2e-c2(s-t2)2，a1=2，a2=1，c1=6，c2=2，t1=0.8，t2=-0.5，K(s，t)=(cos(s)+cos(t))2(sin(u)u)，u= πsin(s).

情形1 当δ=0.0022，α=0.0470时，正则化解的相对误差ρ=0.1746.正则化解与真解如图5和图6所示，其中图5是未作正则化处理的计算所得解，图6为算法1计算所得解.

图5 α=0

图6 α=0.0470

情形2 当δ=2.2268e-5，α=0.0466时，正则化解的相对误差ρ=0.1744，算法1计算结果如图7所示.

图7 α=0.0466

5 结论

本文基于模型函数方法研究了正则化参数选取的修正L-曲线准则，使得计算上更加简单.从算例的模拟结果可以看出，基于双曲模型函数m2(α)的所得修正后的L-曲线准则是有效的.但是，本文只证明了初始正则化参数选取满足一定前提条件下，算法1产生的序列是局部收敛的.对于是否存在全局收敛性的算法［16］，还有μ值选取原则等问题还需进一步研究.

［1］刘继军.不适定问题的正则化方法及应用［M］.北京:科学出版社，2005.

［2］Hansen P C，O’Leary D P.The use of the L-curve in the regularization of discrete ill-posed problems［J］.SIAM J Sci Comput，1993，14(6):1487-1503.

［3］ Hansen P C.Analysis of discrete ill-posed problems bymeans of the L-curve ［J］.SIAM Review，1992，34(4):561-580.

［4］Xie Jianli，Zou Jun.An improvedmodel functionmethod for choosing regularization parameters in linear inverse problems［J］.Inverse Problems，2002，18(5):631-643.

［5］王泽文，徐定华.线性不适定问题中选取Tikhonov正则化参数的线性模型函数方法［J］.工程数学学报，2013，30(3):451-466.

［6］Wang Zewen，Liu Jijun.Newmodel functionmethods for determining regularization parameters in linear inverse problems［J］.Applied Numerical Mathematics，2009，59(10):2489-2506.

［7］Wang Zewen.Multi-parameter Tiknonov regularization andmodel function approach to the damped Morozov principle for choosing regularization parameters［J］.Journal of Computational andApplied Mathematics.2012，236(7):1815-1832.

［8］胡彬，夏赟，喻建华.算子非精确条件下确定正则化参数的一种方法［J］，江西师范大学学报:自然科学版，2014，38(1):65-69.

［9］Heng Yi，Lu Shuai，MhamdiA，et al.Model functions in themodified L-curvemethod-case study:the heat flux reconstruction in pool boiling［J］.Inverse Problems，2010，26(5):1-13.

［10］张立涛，李兆霞，张宇峰，等.结构识别计算中基于L-曲线的模型确认方法研究［J］.运动与冲击刊，2011，30(11):36-41.

［11］王宏志，赵爽，胡艳君.基于L-曲线正则化的MAP超分辨率图像复原［J］.吉林大学学报:理学版，2008，46(2):275-278.

［12］ Reginska T.A regularization parameter in discrete illposed problems［J］.SIAM J Sci Comput，1996，17(3):740-749.

［13］樊树芳，马青华，王彦飞.算子及观测数据都非精确情况下一种新的正则化参数选择方法［J］.北京师范大学学报:自然科学版，2006，42(1):25-31.

［14］王彦飞.反问题的计算方法及应用［M］.北京:高等教育出版社，2007.

［15］郭文彬.奇异值分解及其广义逆理论中的应用［M］.北京:中国科学院研究生院，2003.

［16］高炜，朱林立，梁立.基于图正则化模型的本体映射算法［J］.西南大学学报:自然科学版，2012，34(3):118-121.