一类凸复合函数的共轭和次微分及应用
2022-10-28何丹露冯世强
徐 刚,何丹露,冯世强
(西华师范大学 数学与信息学院,四川 南充 637000)
凸复合优化构成了一类非凸优化问题,引出了在现代优化模型理论和实践中研究的各种优化模型,包括非线性规划、非凸极大极小问题、非凸系统识别以及大规模数据分析和机器学习中的大多数非凸问题.在19世纪,就有学者对复合优化问题进行了研究.其中,Burke在1985年对复合不可微问题进行研究,提出了一类下降法[1],并与Poliquin在1992年研究了非有限值凸复合函数的最优性条件[2].
最近,因为凸复合优化问题对许多问题在现代优化、机器学习、大规模数据分析等方面具有重要性,许多学者又重新对这个问题产生了极大的兴趣.其中,Duchi J C, Ruan F在2018年提出凸复合弱凸优化问题的随机方法[3],在2019年研究了鲁棒相位检索的复合优化[4];Burke在2013年研究了上图收敛光滑化及其在凸复合函数中的应用[5],在2020年和Engle A研究了分段线性二次凸组合优化 karush-kuhn-tucker 映射的强度量(子)正则性及牛顿法的二次收敛性[6],在2021年与Tim H以及Nguyen Q V基于下卷积研究了凸复合函数的共轭函数和次微分的性质[7].
笔者将Burke,Tim和Nguyen的研究[7]推广到一种带算子的凸复合函数的形式,即:
其中A是E1→E2的线性算子,F是E2→E3连续并且几乎光滑的函数,f和g分别是E1→R∪{+∞}和E3→R∪{+∞}的非空闭凸函数.当A是单位算子时,Φ(x)就退化为原来的问题:
相比与式(2),式(1)的适用性更广.
本文的主要工作有:在式(2)为式(1)的形式时,研究了凸复合函数的K-凸性质;函数由Φ1(x)变为Φ(x)时,Φ1(x)的共轭和次微分性质会发生怎样的一个变化?问题(1)的最优解存在时,算子A需要满足怎样的性质?将结果应用到一个锥约束优化问题上,给出了锥约束问题最优解的存在性条件.
1 预备知识
E表示一个欧几里得空间,其內积用〈·,·〉表示.对于A,B⊂E的Minkowski加法被定义为A+B={a+b|a∈A,b∈B},在这种情况下x+B∶={x}+B,将实数域扩展为,假设L是E1→E2的线性映射,L的伴随算子用L*表示.
集合K如果满足λx∈K(λ≥0,x∈K),则K就是一个锥.K的极锥用K°表示,K°∶={v∈E|〈v,x〉≤ 0(x∈K)}.K是凸锥当且仅当K+K⊂K;K是尖的当且仅当K∩-K={0}.
根据文献[8]中推论3.38,假设一个锥K⊂E,并且K是尖和凸的,则偏序关系被定义为x≤K yy-x∈K(x,y∈E). 如果满足条件x≤K +∞·,则对E附加一个最大元素+∞·,将E拓展到E·=E∪{+∞·}.
令K⊂E2,F∶E1→E2,F是凸函数当且仅当K-epiF={(x,v)∈E1×E2|F(Ax)≤Kv}是凸的,所以F是K-凸的当且仅当F(A(λx+(1-λ)y))≤KλF(Ax)+(1-λ)F(Ay).F(x)是K-凸的,则F(Ax)是K-凸的.假设C⊂E是一个凸集,C的仿射包用affC表示,相对内部用riC表示,C的水平锥被定义为. 函数f∶E→R的上图epif∶={(x,a)∈E×R|f(x)≤a}是凸的时候,f是凸函数.当函数f的上图在E×R上是闭的,函数f是下半连续的.
根据文献[9],函数f的闭包是c1f,且:
特殊地,任何函数值取不到-∞的凸函数都是下半连续的,当且仅当函数等于它自己的闭包. 在本文中,把部分条件简化为下面符号:Γ(E)∶={f∶E→R∪{+∞}|f是闭凸的},Γ0(E)∶={f∈Γ(E)|f是下半连续的}.
函 数f∶E→R的fenchel共轭函数.被定义为,f的双重共轭函数f **∶=(f *)*.根据文献[9]的定理12.2可以知道对任意的凸函数f, c1f=f **.函数f在∈domf处的次微分是:.
并且f的次微分算子和共轭算子满足Fenchel-Young不等式:
函数f的水平锥hznf∶={v|f(x+v)≤f(x)(x∈domf)},并且由文献[9]中定理8.7可以得hznf= levf(a)∞,其中levf(a)∶={x∈E|f(x)≤a}是f对于水平线a∈R的任意水平非空集.
函数f和g的最小卷积被定义为:
如果式(5)的最小值对所有的domf □ g=domf+domg都能取到,式(5)就可写为:
引理1和引理2阐明了凸函数加法与最小卷积之间的共轭关系.
引理1令f,g∈Γ(E),则(c1f+c1g)*=c1(f *□g*).若ri(domf)∩ri(domg)≠φ,则(f+g)*=(f *□g*),并对所有的y∈dom(f *□g*),有:.
给定闭凸函数g和线性映射F以及线性算子A得到(g°F°A)*=c1(A*F*g*)是函数(A*F*g*)(y)= inf{g*∶(F°A)*=y}的下半连续闭包.为确保结论成立,默认有效域是非空的,即A-1°F-1(ri(domg))≠φ成立[7].
因此,当条件0∈ri(domg-F°A(domf))时可以得到关于问题:
引理2令式(1)的假设成立,如果F对于-hzng是凸的,即:
其中hzng∶={v∈E2|g(x+v)≤g(x)(x∈domg)},则Φ1是一个凸函数[7].
令F∶E1→E3·,g∶E3→R∪{+∞},A是一个线性算子,定义它们的复合函数为:
特殊地,给定v∈E3,则内积〈v,·〉∶,若x∈domF,
关于集合S⊂E的示性函数是:它的共轭函数是关于S的支撑函数δS∶E→R∪{+∞},即:
2 K-凸性
本节主要对带线性算子的复合函数的K-凸性进行研究,并得到了几个重要结论,这几个结论在第3节推导凸复合函数的次微分和分析最优解条件的推导过程中非常重要.
引理3令K⊂E3是凸锥,并且F∶E2→E3是有意义的并且是K-凸的映射,A是一个线性算子,则:ri(K-epiF°A)={(x,v)|x∈ri domF°A,F(Ax)≤riKv}=((riK)-epiF°A)∩(ri(domF°A)×E3).
特殊地,如果domF=E1,则ri(K-epiF)=(riK)-epiF[7].
定理 1假设K是一个锥,F∶E2→E3·,A是一个线性算子,如果K是闭凸的,那么F°A是K-凸的当且仅当〈v,F°A〉对所有的v∈-K°都是凸的.
证假设F是K-凸的,并且令v∈-K°,x,y∈domF=dom〈v,F〉 并且λ∈[0,1], 因为λF(Ax)+ (1-λ)F(Ay)-F(A(λx+(1-λ)y))∈K,则可得到:
于是有:λ〈v,F〉(Ax)+(1-λ)〈v,F〉(Ay)=〈v,λF(Ax)+(1-λ)F(Ay)〉≥〈v,F(λAx+(1-λ)Ay)〉=〈v,F〉(A(λx+(1-λ)y)).
令x,y∈E1,λ∈[0,1]并且v∈-K°,因为〈v,F°A〉是凸的,所以:
于是:λF°A(x)+(1-λ)F°A(y)-F°A(λx+(1-λ)y)∈-(-K°)°=K,所以K是闭凸的,定理得证.
推论1令F∶E2→E3·,A是一个线性算子,K∈E3是一个闭凸锥,对于所有的(u,v)∈E1×E3,则下列式子成立:a.σK-epiF°A(u,v)=σgphF°A(u,v)+δK°(v);b.σgphF°A(u,-v)=〈v,F°A〉*(u);c.如果F是线性的,则〈v,F°A〉*=δ{A*F*(v)}.
证首先证明式a,由:
最后证明式c,由F是线性的可知:
接下来用到一个常用假设,这个假设来自于文献[10],即保证复合函数g°F°A是凸的需要满足的条件是:
定理2令K是一个闭凸锥,假设F∶E2→E3使得{〈v,F°A〉|v∈-K°}⊂Γ0(E1),g∈Γ0(E3)并且是一个K-增的函数,A是一个线性算子,定义函数:
则ψ*(x,u)=g(u+F(Ax)).
证根据已知条件,可得:
结论得证.
3 带结构复合函数的共轭和次微分
本节主要内容是通过基于简单凸复合函数的共轭和次微分,进而推导出带结构的凸复合函数的共轭和次微分.在整个过程当中使用了一个长期假设,即domF°A≠φ.
定理3假设K是一个闭凸锥,F是一个E2→E3的K-凸函数并且g∈Γ(E3),A是一个线性算子,同时g(F°A(x))≤g(y)((x,y)∈K-epiF°A), 则有结论:
①假如η(p)=+〈v,F°A〉*(p), 则(g°F°A)*≤clη.特殊地,当v∈-K°,〈v,F〉∈Γ0(E2), rgeF°A∩domg≠φ,g是下半连续并且是K-增时,等号成立,即(g°F°A)*=clη.
②如果有:
则结论①中的函数η是闭凸的,并且它的下确界就是最小值.
③如果结论②的假设成立,则(g°F°A)*(p)=+〈v,F°A〉*(p),并且.
证为证明结论①,首先定义一个函数γ∶E1×E3→R∪∶(x,y)→g(y),可以得到:
因此可发现:
则有:
结论②得证.
再证明结论③,根据结论①、结论②和引理1,得到:(g°F°A)*(p)=+〈v,F°A〉*(p).
推论2假 设g∶,A是 线 性 算 子,则∈domg°F°A时,∂(g°F°A)()⊇∂〈v,F°A〉(x). 特殊地,在定理3的假设下,等号成立.
证假设∂〈v,F°A〉(x),则存在一个v∈∂g(F°A(x))使得y∈∂〈v,F°A〉(x), 由于:
将y=F°A(x)(x∈E1)代入式(14)得到:
与式(15)相加可以得到:g(F°A(x))+〈y,x-x〉≤g(F°A(x))(x∈E1),这就表明y∈∂(g°F°A)(x).
得到:y∈∂(v,F°A)(x).
定理4在定理3的假设下,, 当A*是满射,A是单射时,等号成立.
证假设, 则使得x*=A*y*.于是有,所以,得到.当A*是 满 射,A是 单 射 时,假 设,则x∈E1,所以,于是,因此x*∈A*∂〈v,F〉().
推论3在定理3的假设下,令式(8)成立,f∈Γ(E1)并且有限制条件:
则有结论成立:
(Ⅱ)当x∈domf∩domg°F°A时,有:
证为证明结论(Ⅰ),定义函数g(x,y)∶=s+g(y), 然后g∈Γ0(R×E3),并且有:
更多地,有:
现在证明充分性,令y∈∂〈v,F°A〉(x), 通过式(4)和式(20)得到:
因此存在v∈-k°使得:
并得到:
一方面,将Fenchel-yang不等式应用到g上,得到:, 应用到上,得到, 另一方面通过对偶性质可以得到:〈x,y〉≥f(x)+
则〈v,F°A(x)〉≥g(F°A(x))+g*(v),因此v∈∂g(F°A(x)).由推论2可以得到:∂(f +g°F°A)+又根据定理4可得到:A*∂〈v,F〉(Ax).
以下结论是对上面次微分结果的探究,主要研究满足什么样的性质时(18)能够取等,并且遵循一个原则,即:
推论4假设K⊂E3是一个闭凸锥,函数F是一个E2→E3·的一个K-凸函数,A是一个线性算子,g∈Γ(E3)并且是K-增函数,同时使得条件(23)满足,尤其是当A是单射,A*是满射时,有:(g°F°A)*,且:
证由于g是K-增的,根据定理3和推论2,定理4得到结论.
推论5假设g∈Γ0(E3), 并且函数F是一个E2→E3·的一个(-hzng)-凸函数,A是一个线性算子,A是单射,A*是满射,同时F°A(ri(domF°A))∩ri(domg)≠φ, 于是:〈v,F°A〉*(p),且:
4 应用
考虑一般的问题,即:
其中f∈Γ(E1),F是K-凸的,并且K是一个闭凸锥,A是线性算子,根据推论4假设g=δ-k, 则问题(25)等价于:
δ-K是K-增的,如果v=-K,则u=u-v+v∈-K-K=-K, 因此在所有的有效域中:g(u)≤g(v),则充分条件(17)变为:
问题(25)和(26)的Fenchel-对偶问题是,Lagrange-对 偶问题 是
定理5假设K⊂E2是一个闭凸锥,F是E2→E3的一个K-凸函数,A是一个线性算子,如果条件(27)成立,则:
证由题可知,根据推论4得到:
定理6其中K是一个闭凸锥,F是E2→E3的K-凸函数,A是E1→E2的算子,则有:
满足是(25)的最小值的充分条件.在条件(27)下,式(28)也是必要的.
证设g=δ-K,根据推论5和式(28),可得:0∈∂(f+g°F°A)(x), 所以x是f+g°F°A的最小值,同样由推论5,∂(f+g°F°A)()等于右边,于是结论得证.
5 结语
在本文中,基于最小卷积在弱假设(没有较低的半连续性和弱单调性)的函数限定条件下,给出一类带结构的复合函数的共轭和次微分及其对偶形式,并且将结果运用到锥约束问题上,探究了锥约束问题的最优性条件.本文的主要结果主要是第2~4节,是对Burke等人的结果的推广,但相比于文献[6]当中所研究的问题,本文所研究的带结构的复合优化问题范围更广,所得到的共轭函数以及次微分的结果比文献[6]的结果适用性更强.在以后的研究当中,希望可以将理论结果用在数值实验当中,或者把带结构的凸问题推广到集值优化上.