APP下载

基于模型函数与L-曲线的正则化参数选取方法

2014-01-18徐会林王泽文喻建华

关键词:双曲正则准则

胡 彬,徐会林,王泽文,喻建华

(东华理工大学理学院,江西南昌330013;2.河南理工大学数学与信息科学学院,河南焦作454000)

0 引言

反问题研究已是计算数学及应用数学领域研究的热点问题之一.反问题一般是不适定的[1],其不适定性在数值计算上表现为解不连续依赖测量数据.即使在实际测量过程中测量误差非常小,也会引起解的巨大波动.目前求解不适定问题最具有普遍性、完备性的是Tikhonov正则化方法,但该方法的有效性取决于选取到合适的正则化参数.目前比较有代表性的正则化参数选取策略有:Morozov偏差原理、广义交叉检验、L-曲线(L-curve)等准则.当误差水平已知或可估计时,Morozov偏差原理是最常采用的正则化参数选取策略之一,但是当不适定算子方程右端项的误差水平δ未知时,Morozov偏差原理就失效了.为了克服Morozov偏差原理需要已知误差水平的局限性,P.C.Hansen等提出基于L-曲线的正则化参数选取方法[2-3],可以在误差水平未知的情形下找到近似最佳的正则化参数.

在利用Morozov偏差原理确定正则化参数时需要借助牛顿迭代,而牛顿迭代的计算量比较大,为了克服这一缺点,文献[4-7]中提出了1种新的确定正则化参数的方法—模型函数法.它是将Tikhonov泛函定义为关于α的函数,再用1个简单的具有显示表达式的模型函数来近似F(α),通过简单迭代确定正则化参数.

本文在上述2种方法的基础上研究了基于模型函数的修正L-曲线准则,证明了所得序列点是局部收敛的,给出了相应的迭代算法.通过算例验证了该准则的有效性,同时也指出了目前还存在的不足和今后进一步研究的方向.

1 模型函数法

线性反问题一般可归结为解第1类不适定算子方程:

其中K是Hilbert空间X到Y上的有界线性算子.由于观测数据存在误差,所以一般把方程(1)改写为

其中δ为误差水平,‖yδ-y‖≤δ.Tikhonov正则化方法是将求不适定方程(2)的解转为求Tikhonov泛函

的最优解,其中α>0是正则化参数.对于固定的正则化参数α,记最优函数为

引理1[4]设K:X→Y是有界线性算子,X,Y均为Hilbert空间.∀α >0,(3)式的唯一解x(α)是无穷次可微的,且g=dnx(α)dαn∈X可由

递推求解得到.

定理1[4-5]最优函数F(α)在(0,+∞)内是无限次可微的,且∀α >0,F(α)满足

模型函数的方法就是在αk附近构造F(α)的局部近似函数Fk(α),使其满足微分方程(4),即

若假设‖Kx(α)‖2≈ Tk‖x(α)‖2,代入(5)式并注意到 F'(α)= ‖x(α)‖2,解得

即得到双曲模型函数:

由于 Kx(α)≈ yδ,故可设 ‖Kx(α)‖2≈‖yδ‖2-Tk,代入(5)式得

解微分方程(6),得Fk(α)=Tk+Ckα,其中Ck、Tk是待定参数且由方程组

确定,即

于是,得到更为简洁的双曲模型函数:

文献[8]研究了非精确数据下的线性模型函数选取正则化参数.虽然线性模型函数具有计算简单、收敛性较好等优点,但是却不能将它与L-曲线准则相结合而得到选取正则化参数的算法.文献[9]将双曲模型函数m1(α)应用于L-曲线选取准则获得选取正则化参数的新算法.本文是前述研究的继续和深入,基于双曲模型函数m2(α)研究修正的L-曲线选取准则,从而获得选取正则化参数选取的新方法.

2 修正的L-曲线准则

L-曲线准则是残差‖Kx(α)-yδ‖2与正则化解‖x(α)‖2在一组正则化参数下所构成的图像,也就是由(‖Kx(α)-yδ‖2,‖x(α)‖2)所构成的平面曲线.最优的正则化参数α出现在曲线的拐点处. 通常转化为对应的(2log‖Kx(α)-yδ‖,2log‖x(α)‖)曲线,因为曲线形状如字母L(见图1),故称为L-曲线准则.从图像上很容易找到曲线的拐点,即最优正则化参数α在对应曲线的“角点”出现.记u(α)=2log‖Kx(α)-yδ‖,v(α)=2log‖x(α)‖,则L曲线上各点的曲率公式[10-11]为

曲率最大的点对应正则化参数即为所需正则化参数.

图1 L-曲线示意图

由文献[12]知,若L-曲线在点α=α*处取到最大曲率,且在该点处曲线的斜率为 -1/μ,则下列泛函:

在α=α*处取得极小值.因此,选取正则化参数的L-曲线准则等价为求泛函(8)的极小值点.修正的L-曲线准则就是通过求(8)的极小值来获得合适的正则化参数.由于是α的非线性隐式函数,不便于计算.本文利用模型函数的方法将(8)式显化,从而简化计算,提高计算效率.

3 基于模型函数的修正L-曲线算法

对于任意给定的α>0,最优函数F(α)为

且F'(α)= ‖x(α)‖2,则(8)式可改写成F(α)的形式,即

模型函数m(α)是F(α)的局部近似,则(9)式的局部近似为

本文主要研究了双曲模型函数m2(α),代入(10)式得 ω(α)=(T+2C/α)(-C/α2)μ.

对 ω(α)求导,得

令 ω'(α)=0,解得 α=-C(1+2μ)(μT).

对于正则化参数 αk,求得对应的正则化解x(αk),再根据方程组(7)可确定参数 Ck,Tk,则

由(11)式及Ck<0,Tk>0知αk+1>0且它是唯一的.该算法比文献[9]中的更为简单,因为文献[9]给出的是关于α的2次方程,选取其中较大的作为正则化参数αk+1.

综合上面分析,得到基于双曲模型函数m2(α)与修正的L-曲线正则化参数选取策略的新算法:

算法1 给定 ε > 0,yδ,K,μ > 0;

Step 1 给定1个初始值α0>α*,置k=0;

Step 2 解正则化方程αkx+K*Kx=Kyδ;

Step 3 求出 Ck,Tk,αk+1;

Step 5 停止迭代,输出正则化参数αk+1.

定理2 如果

则在算法1中函数ωk(α)在点αk处是局部严格单调递减的.

证算法1中产生的函数ωk(α)为

ωk(α)=(Tk+2Ck/α)(-Ck/α2)μ,则 ωk'(α)=(-Ck)μ(-2Ck+(αTk+2Ck)·(-2μ))/α2μ+2.取 α= αk,把(7)式中解得 Ck,Tk的表达式代入得

由已知条件得ω'k(αk)<0,即函数ωk(α)在点αk处是局部严格单调递减的.

定理3 给定初始值α0满足(12)式,则算法1产生严格单调递减序列{αk}且收敛.

证由定理2 的证明过程知,

令 φ(α)=-2Ck+(αTk+2Ck)(-2μ),显然φ(αk)< 0,φ'(αk)< 0.所以函数φ(α)是严格单调递减的.由算法1知φ(αk+1)=0,所以αk> αk+1.又∀k均有αk>0,故收敛性成立.

4 数值算例

例1 求解第1类Fredholm积分方程[13]:

其中,核 K(s,t)=1 [1+100(t-s)2],

本文用等距节点复化梯形公式来离散第1类Fredholm 积分方程(13),得线性方程组Ax-=y-,其中把积分核K(s,t)离散成矩阵Am×n,x(s)离散成n维列向量x-.对方程组右端加入随机扰动为

其中r为Matlab中的随机函数.取不同的误差值δ,求出对应不同误差值δ的正则化参数,并把不同正则化参数求出的正则化解对比(见图2~4),其中实线表示无扰动下的精确解,星形线表示不同正则化参数下的数值近似解.

情形1 当δ=5.8378e-4,α=3.7320e-4,正则化解的相对误差ρ=0.0678.正则化解与真解如图2和图3所示,其中图2是该情形下未作正则化处理的计算所得解(即当α=0时的最小二乘解),图3为算法1计算所得解.

情形2 当δ=8.5401e-8,α=6.6470 e-4,正则化解的相对误差ρ=0.0500,算法1计算结果如图4所示.

图2 α=0

图3 α=3.7320e-4

图4 α=6.6470e-4

例2 求解第1类Fredholm积分方程[14-15]:

x(s)=a1e-c1(s-t1)2+a2e-c2(s-t2)2,a1=2,a2=1,c1=6,c2=2,t1=0.8,t2=-0.5,K(s,t)=(cos(s)+cos(t))2(sin(u)u),u= πsin(s).

情形1 当δ=0.0022,α=0.0470时,正则化解的相对误差ρ=0.1746.正则化解与真解如图5和图6所示,其中图5是未作正则化处理的计算所得解,图6为算法1计算所得解.

图5 α=0

图6 α=0.0470

情形2 当δ=2.2268e-5,α=0.0466时,正则化解的相对误差ρ=0.1744,算法1计算结果如图7所示.

图7 α=0.0466

5 结论

本文基于模型函数方法研究了正则化参数选取的修正L-曲线准则,使得计算上更加简单.从算例的模拟结果可以看出,基于双曲模型函数m2(α)的所得修正后的L-曲线准则是有效的.但是,本文只证明了初始正则化参数选取满足一定前提条件下,算法1产生的序列是局部收敛的.对于是否存在全局收敛性的算法[16],还有μ值选取原则等问题还需进一步研究.

[1]刘继军.不适定问题的正则化方法及应用[M].北京:科学出版社,2005.

[2]Hansen P C,O’Leary D P.The use of the L-curve in the regularization of discrete ill-posed problems[J].SIAM J Sci Comput,1993,14(6):1487-1503.

[3] Hansen P C.Analysis of discrete ill-posed problems bymeans of the L-curve [J].SIAM Review,1992,34(4):561-580.

[4]Xie Jianli,Zou Jun.An improvedmodel functionmethod for choosing regularization parameters in linear inverse problems[J].Inverse Problems,2002,18(5):631-643.

[5]王泽文,徐定华.线性不适定问题中选取Tikhonov正则化参数的线性模型函数方法[J].工程数学学报,2013,30(3):451-466.

[6]Wang Zewen,Liu Jijun.Newmodel functionmethods for determining regularization parameters in linear inverse problems[J].Applied Numerical Mathematics,2009,59(10):2489-2506.

[7]Wang Zewen.Multi-parameter Tiknonov regularization andmodel function approach to the damped Morozov principle for choosing regularization parameters[J].Journal of Computational andApplied Mathematics.2012,236(7):1815-1832.

[8]胡彬,夏赟,喻建华.算子非精确条件下确定正则化参数的一种方法[J],江西师范大学学报:自然科学版,2014,38(1):65-69.

[9]Heng Yi,Lu Shuai,MhamdiA,et al.Model functions in themodified L-curvemethod-case study:the heat flux reconstruction in pool boiling[J].Inverse Problems,2010,26(5):1-13.

[10]张立涛,李兆霞,张宇峰,等.结构识别计算中基于L-曲线的模型确认方法研究[J].运动与冲击刊,2011,30(11):36-41.

[11]王宏志,赵爽,胡艳君.基于L-曲线正则化的MAP超分辨率图像复原[J].吉林大学学报:理学版,2008,46(2):275-278.

[12] Reginska T.A regularization parameter in discrete illposed problems[J].SIAM J Sci Comput,1996,17(3):740-749.

[13]樊树芳,马青华,王彦飞.算子及观测数据都非精确情况下一种新的正则化参数选择方法[J].北京师范大学学报:自然科学版,2006,42(1):25-31.

[14]王彦飞.反问题的计算方法及应用[M].北京:高等教育出版社,2007.

[15]郭文彬.奇异值分解及其广义逆理论中的应用[M].北京:中国科学院研究生院,2003.

[16]高炜,朱林立,梁立.基于图正则化模型的本体映射算法[J].西南大学学报:自然科学版,2012,34(3):118-121.

猜你喜欢

双曲正则准则
中国科学技术馆之“双曲隧道”
具非线性中立项的二阶延迟微分方程的Philos型准则
双曲型交换四元数的极表示
剩余有限Minimax可解群的4阶正则自同构
类似于VNL环的环
一阶双曲型偏微分方程的模糊边界控制
基于Canny振荡抑制准则的改进匹配滤波器
基于双曲和代数多项式的HC-Bézier曲线
一图读懂《中国共产党廉洁自律准则》
有限秩的可解群的正则自同构