APP下载

L1正则化问题的对偶性理论*

2015-06-13吴焚供

关键词:对偶正则定理

吴焚供

(1. 华南师范大学数学科学学院,广州 广东 510631;2. 广东第二师范学院数学系,广州 广东 510303)



L1正则化问题的对偶性理论*

吴焚供1,2

(1. 华南师范大学数学科学学院,广州 广东 510631;2. 广东第二师范学院数学系,广州 广东 510303)

L1正则化问题是一个非光滑的无约束最优化问题,在变量选择,数据压缩和图像处理等领域有广泛的应用。给出了L1问题最优解存在的新的必要条件和充分条件,利用这些条件构造出L1正则化问题的一个Mond-Weir型对偶问题,最后给出了相应的弱对偶定理和强对偶定理。

L1正则化;最优解;对偶问题

正则化问题近年来备受关注,许多研究者考虑如下的Lp最小化问题

minF(x)=f(x)+ρ‖

其中f(x):Rn→R 为一光滑函数,ρ为一给定的非负正则化参数,p∈[0,1],变量x∈Rn,‖x‖p为定义在Rn上的Lp拟范数,当0

Lp正则化问题的一个重要的情况是如下的L2-

Lp最小化问题

(1)

其中‖·‖为欧几里得范数,A∈Rm×n,m

minF(x)=f(x)+ρ‖x‖1

(2)

该问题在文[7]和文[1]中分别被称为LASSO和BasisPursuit。他们证明了L1正则化问题与L0正则化问题在稀疏重建的意义下是等价的,从而L0正则化所要求的NP组合优化问题可以转化为L1罚优化问题。基于上述学者的工作,L1正则化成为当今数据分析的主流工具之一。

(3)

其中▽if(x)=∂f(x)/∂xi,sign(t)为符号函数。条件(3)在文[9]中被叙述为如下的等价形式在这些理论的基础上

x= sign (x-τ▽f(x))⊙

max{ |x-τ▽f(x)|-τρ,0} ,τ> 0

max{▽f(x)-ρ,min{x,▽f(x)+ρ}}=0

在这些理论的基础上,一些有效求解L1问题的算法得以建立,具体可参考文[9-11]等。

然而L1正则化问题毕竟是非光滑优化问题,若能构造出其光滑的对偶问题,则更有效的求解该问题便是有可能的。另一方面,早在1974年Mond[12]和1981年Mond和Weir[13]便考虑了一类特殊的不可微优化问题的对偶问题, 受其工作的启发,运用类似的方法构造出L1正则化问题的一个光滑的对偶问题,我们称之为Mond-Weir型对偶。

1 最优性条件

考虑原始问题(P)

minF(x)=f(x)+ρ‖x‖1

证明 记S={y|y=▽f(x0)+ρw,wTx0=‖x0‖1,w∈Rn,|wi|≤1,i=1,2,…,n},若不存在w∈Rn使命题成立,则0∉S,由于S是闭凸集,根据凸集分离定理,存在z′∈Rn及α∈R,使得

z′Ty≤α<0,∀y∈S

(4)

取w∈Rn,使得

这与假设Z0=Ø矛盾。

定理2(必要条件) 若x0是问题(P)的解,则存在w∈Rn,使得

▽f(x0)+ρw=0

(5)

(6)

(7)

证明 若x0是问题(P)的解,则对任意给定的z∈Rn,及任意的实数α>0,有

F(x0+αz)-F(x0) =

两边除以α并令α→0+,则对任意的z∈Rn,

即Z0=Ø,所以由引理,定理结论成立。

定理3(充分条件) 若f为凸函数,且存在x0,w∈Rn使(x0,w)满足▽f(x0)+ρw=0及‖w‖1≤1,则x0是问题(P)的解。

证明 对任意的x∈Rn,由f(x)是凸函数,所以

F(x)-F(x0)=f(x)+ρ‖x‖1-f(x0)-ρ‖x0‖1≥

(x-x0)T▽f(x0)+ρ‖x‖1-ρ‖x0‖1

再由式(5)-(6)及xTw≤‖x‖1·‖w‖1,有

2 对偶性定理

以下我们均假设f是凸函数,我们将建立起原问题(P)与如下问题(D)的对偶关系。

(D) maxG(u)=f(u)-uT▽f(u)

s.t.▽f(u)+ρw=0

(8)

‖w‖1≤1

(9)

记问题(P)的可行域为ΩP,问题(D)的可行域为ΩD。

定理4(弱对偶定理) 问题(P)的下确界大于或等于问题(D)的上确界。

证明 对任意x∈ΩP,(u,w)∈ΩD,

F(x)-G(u)=f(x)+ρ‖x‖1-f(u)+

uT▽f(u)≥(x-u)T▽f(u)+ρ‖x‖1+uT▽f(u)

根据式(8)-(9),有

F(x)-G(u)≥ρ(‖x‖1-xTw)≥0

所以结论成立。

定理5(强对偶定理) 若x0∈Rn是原问题(P)的一个最优解,则若存在w∈Rn,使(x0,w)∈ΩD,则(x0,w)必是问题(D)的解,且两问题的最值相等。

证明 若x0是问题(P)的解,则由定理2存在w使式(5)-(7)成立,而且有

▽f(x0)=

再由定理4,只要(x0,w)∈ΩD,则(x0,w)∈ΩD必是(D)的解。

[1]CHENSS,DONOHODL,SAUNDERSMA.Atomicdecompositionbybasispursuit[J].SIAMJournalonScientificComputing, 1998, 20(1): 33-61.

[2]CHARTRANDR.Exactreconstructionofsparsesignalsvianonconvexminimization[J].SignalProcessingLetters,IEEE, 2007, 14(10): 707-710.

[3]CHARTRANDR,STANEVAV.Restrictedisometrypropertiesandnonconvexcompressivesensing[J].InverseProblems, 2008, 24(3): 035020.

[4]CHENX,ZHOUW.Smoothingnonlinearconjugategradientmethodforimagerestorationusingnonsmoothnonconvexminimization[J].SIAMJournalonImagingSciences, 2010, 3(4): 765-790.

[5]DONOHODL.Compressedsensing[J].InformationTheory,IEEETransactionson, 2006, 52(4): 1289-1306.

[6]FANJ,LIR.Variableselectionvianonconcavepenalizedlikelihoodanditsoracleproperties[J].JournaloftheAmericanStatisticalAssociation, 2001, 96(456): 1348-1360.

[7]TIBSHIRANIR.Regressionshrinkageandselectionviathelasso[J].JournaloftheRoyalStatisticalSociety:SeriesB(Methodological), 1996: 267-288.

[8]CLARKEFH.Optimizationandnonsmoothanalysis[M].SIAM, 1990.

[9]HALEET,YINW,ZHANGY.Fixed-pointcontinuationforl1-minimization:Methodologyandconvergence[J].SIAMJournalonOptimization, 2008, 19(3): 1107-1130.

[10]SHEVADESK,KEERTHISS.Asimpleandefficientalgorithmforgeneselectionusingsparselogisticregression[J].Bioinformatics, 2003, 19(17): 2246-2253.

[11]FUWJ.Penalizedregressions:thebridgeversusthelasso[J].JournalofComputationalandGraphicalStatistics, 1998, 7(3): 397-416.

[12]BERTRAMM.Aclassofnondifferentiablemathematicalprogrammingproblems[J].JournalofMathematicalAnalysisandApplications,1974, 46:169-174.

[13]MONDB,WEIRT.Generalizedconcavityandduality[C].GeneralizedConcavityinOptimizationandEconomics, 1981: 263-279.

Duality Theorem forL1-Regularization Problem

WUFengong1,2

(1. Department of Mathematics, South China Normal University, Guangzhou 510631, China; 2. Department of Mathematics, Guangdong University of Education, Guangzhou 510303, China)

L1-regularizationproblemisanon-smoothunconstrainedoptimizationproblem,whichiswidelyusedinthefieldssuchasvariableselection,datacompressionandimageprocessing.OptimalityconditionsforthesolutionofL1-regularizationproblemisgiven.AndaMond-WeirtypedualproblemforL1-regularizationproblemisformulated,byusingtheseoptimalconditions.Finallyaweakdualitytheoremandastrongdualitytheoremareproved.

L1-regularization;optimalitycondition;dualproblem

2014-03-07

广东省教育厅科研项目“育苗工程”(自然科学)资助项目(2013LYM_0061)

吴焚供(1980年生),男;研究方向:最优化算法理论;E-mail:wufengong@gdei.edu.cn

10.1347/j.cnki.acta.snus.2015.01.003

O

A

0529-6579(2015)01-0010-03

猜你喜欢

对偶正则定理
J. Liouville定理
对偶τ-Rickart模
聚焦二项式定理创新题
J-正则模与J-正则环
π-正则半群的全π-正则子半群格
Virtually正则模
A Study on English listening status of students in vocational school
任意半环上正则元的广义逆
例析对偶式在解三角问题中的妙用
怎样利用对偶式处理高考解几问题