信赖域子问题的一种非精确光滑牛顿法

2022-09-16凌文静芮绍平

淮北师范大学学报(自然科学版) 2022年3期

凌文静，芮绍平

（淮北师范大学数学科学学院，安徽淮北 235000）

0 引言

信赖域方法最早由Powell［1］提出，因其具有较为理想的全局收敛性和稳定性备受广大学者的青睐.信赖域算法的基本思想是：在给定的信赖域半径内，以当前迭代点为中心做一个闭球区域，在此区域内求解信赖域子问题来确定迭代步dk，产生新的迭代点.也就是说在每次迭代时都需要求解信赖域子问题，所以信赖域方法中信赖域子问题的求解是算法实现的关键.考虑信赖域子问题

其中gk=∇f(xk)，Bk为Hesse矩阵∇2f(xk)的第k次近似，Δk为信赖域半径，‖‖·是Euclidean范数.

常见求解信赖域子问题的方法是折线法［2］、特征值分解法［2］、共轭梯度法［3-5］以及精确光滑牛顿法［6］等，这些方法各有优点和不足，如特征值分解法对于二维或低维子空间问题算法有效，折线法当下降方向不靠近牛顿方向时下降速度较慢，精确光滑牛顿法需要在迭代点靠近最小值时才能保证收敛性等.本文提出一种求解信赖域子问题的非精确光滑牛顿法，当Hesse矩阵∇2f(xk)的第k次近似矩阵Bk为对称正定矩阵时，该方法具有迭代次数少、迭代时间快等特点，还可推广到求解高维子空间的信赖域子问题.受文献［7-8］光滑函数的启发，本文提出一个新的光滑互补函数，在此基础上，应用非精确牛顿法求解信赖域子问题.

1 基础知识

通过下述引理将求解信赖域子问题（1）转化为求解互补问题.

引理1［9］d是子问题（1）的解当且仅当

并且Bk+λI是半定矩阵.

定义1［9］设向量值函数F:Rn→Rm，x∈Rn，若存在Lipschitz常数L＞0，使得对任意的y∈Rn，满足‖F(x)-F(y)‖≤L‖x-y‖，则称F在x处是Lipschitz连续的.若对任意的x,y∈Rn都成立，则称F在Rn内是全局Lipschitz连续的.

定义2［9］满足以下三条性质的函数称为V上的范数‖·‖:V→R

（1）正定性：‖x‖≥0,∀x∈V且‖x‖=0⇔x=0；

（2）正齐次性：‖αx‖=|α|‖x‖,∀α∈R,∀x∈V；

（3）三角不等式：‖x+y‖≤‖x‖+‖y‖,∀x,y∈V.

定义3［8］对于非光滑函数g:Rn→Rm，含有参数μ的函数gμ:Rn→Rm满足下列性质

（1）对于任意的μ＞0，gμ是可微的；

定义4［9］设算法产生的点列{xk}收敛于极小点x*，并且，则称该算法是局部二次收敛的.

定义5［10-11］设H:Rn→Rm是局部Lipschitz连续的，0＜p≤1.如果对∀h→0和D∈∂H(x+h)，有Dh-H′(x;h)=O(‖‖h1+p)，则称H是p-阶半光滑，特别是p=1时称为强半光滑.

引理2［12］假设函数F:Rn→Rm在x处是p-阶半光滑，函数G:Rm→Rn在F(x)处是p-阶半光滑，则复合函数H=G◦F在x处是p-阶半光滑.

2 光滑函数及性质

一个经典的光滑函数是著名的Chen-Harker-Kanzow-Smale（CHKS）光滑函数［13］，即

本文中构造函数φ:R+×R×R→R：

定理1令(μ,a,b)∈R+×R×R，φ(μ,a,b)由式（3）定义，则下述结论成立

（i）φ(μ,a,b)是φ(0,a,b)的一个光滑函数；

（ii）φ是全局Lipschitz连续且当μ＞0时强半光滑，φ在(μ,a,b)∈R+×R×R是连续可微的，且其雅可比矩阵为

证明（i）令，则式（3）可写成φ:=(1+μ)(a+b)-K.对K求偏导有，

则对于任意μ＞0，K(w)的偏导在任意(μ,a,b)∈R+×R×R都存在，φ(μ,a,b)的偏导在任意(μ,a,b)∈R+×R×R也存在，于是φ(μ,a,b)在定义域内每一点都可微，又，则由定义3可知，φ(μ,a,b)是φ(0,a,b)的一个光滑函数.

（ii）先证明φ是全局Lipschitz连续的.

不妨设a＞b，对任意μ＞0，有

对∀(μ,a1,b1),(μ,a2,b2)∈R+×R×R，结合式（5）～（6）有

即

由式（7）有

由（i）知，φ在点(μ,a,b)∈R+×R×R连续可微，注意到φ(μ,a,b)=φCHKS(μ,(1+μ)a,(1+μ)b)，由文献［14］可知，当μ＞0时，φCHKS是强光滑的，又函数(1+μ)a和(1+μ)b也是强半光滑的，由引理2知φ是强半光滑的.

下证式（4）成立.对于任意z=(μ,a,b)∈R+×R×R，通过式（5）及求微分的链式法则可知

即式（4）成立.令z=(μ,λ,d)∈R+×R+×Rn.由引理1可知问题（1）等价于

其中

3 非精确光滑牛顿法及收敛性

基于光滑函数（3），将信赖域子问题的互补模型（2）转化为等价方程组式（8），给出求解信赖域子问题的非精确光滑牛顿法.

算法3.1（非精确光滑牛顿法）

步骤0任取z0=(μ0,λ0,d0)∈R+×R+×Rn，选取常数δ∈(0,1)，σ∈(0,1)，γ∈(0,1)，使得γμ0＜1，另取序列{ηk}满足ηk∈[0,η]，这里为一个常数，k:=0.

步骤1若‖H(zk)‖=0，则终止.

步骤2由下式计算Δzk=(Δμk,Δλk,Δdk)：

这里βk=β(zk):=γ‖H(zk)‖min{1,‖H(zk)‖}，rk∈Rn满足‖rk‖≤ηk‖H(zk)‖.

步骤3让λk为1,δ,δ2,…中使下式成立的最大值：

步骤4令zk+1:=zk+λkΔzk，k:=k+1，返回步骤1.

定理2令若Bk对称正定，则对

任意的z=(μ,λ,d)∈R+×R+×Rn,雅可比矩阵H′(z)是非奇异的，且算法3.1中的步骤2和步骤3是适定的.

证明任取μ＞0，令Δz=(Δμ,Δλ,Δd)∈R+×R+×Rn.假设

只需要证Δz=0.

由式（9）、式（10）可得

于是-(1-θk)(Bk+λI)Δd=2(1+θk)ddTΔd.若Δd≠0，则-(1-θk)ΔdT(Bk+λI)Δd=2(1+θk)(dTΔd)2，由于0＜θk＜1，Bk+λI半正定，等式左边小于0，等式右边大于0，等式两边不相等，矛盾.于是Δd=0，从而Δλ=0，故Δz=(Δμ,Δλ,Δd)=( 0,0,0).即证雅可比矩阵H′(z)是非奇异的.步骤2和步骤3适定性的证明与参考文献［10］中的证明类似，在此不再赘述.

定理3［8］设函数H单调连续可微，且z*=(μ*,x*,y*)是算法3.1所产生的迭代点列{zk}的一个聚点，则

（i）z*=(μ*,x*,y*)是H(zk)=0的一个解；

（ii）如果所有的V∈∂H(z*)可逆，且∇HLipschitz连续，则{zk}局部二阶收敛于z*，即

证明与文献［8］中定理4证明类似.

4 数值实验

针对无约束优化的信赖域子问题（1），本节对不同的信赖域半径，给出算法3.1的数值结果，并与双割线折线法［15］进行数值比较，比较结果列在表1和表2中，其中Δ表示信赖域半径，qk(d)表示函数值，DSD表示双割线折线法，ISN表示非精确光滑牛顿法，qDSD-qISN表示使用双割线折线法与非精确光滑牛顿法得到的最优解的差值，该差值越大，表明非精确光滑牛顿法越好.为进一步观察非精确光滑牛顿法的性能，表3列出部分Δ下迭代次数k与CPU时间（单位：s），其中CPU时间和迭代次数均是多次求解后的平均值.算法中参数取值为：