基于改进萤火虫算法优化KELM的投标人画像评价研究
2021-05-18张晋维
张晋维,马 迪
(南方电网物资有限公司,广东 广州 511458)
近几年,用户画像评价在医疗、电信、政务和金融等领域已得到广泛应用,但在招标投标领域的应用研究还不多见[1-2]。目前在采购过程中,采购人面临诸如供应商选择过于依赖个人经验和水平、因资质业绩条件或者技术参数设置过高或者标包划分不合理等因素导致投标人不足;当采购品种繁多时,采购人难以有效获取市场真实价格等问题,直接影响供应商的选择[3-4]。利用现有数据和相关供应商信息数据对供应商或投标人进行画像评价,有助于掌握供应商或投标人的综合能力信息,为供应商或投标人的最优选择提供科学决策依据。为实现投标人的准确画像评价,笔者结合南方电网供应商分类分级研究成果,提出一种改进的萤火虫算法优化核极限学习机(CMFA-KLEM)的投标人画像评价模型。
1 改进的萤火虫算法
1.1 萤火虫算法
萤火虫算法(firefly algorithm,FA)是一种新型的智能优化算法[5-6],其模拟萤火虫群体行为,将目标函数值等效为萤火虫光亮度,通过群内信息迭代交流,进而实现全局最优解求解。
萤火虫的亮度I、吸引度β、萤火虫之间的距离rij分别定义为:
(1)
式中:I0为最大亮度;β0为最大吸引度;γ为光强吸收系数;xi和xj分别为萤火虫i和j所处的空间位置;xi,k和xj,k分别为第i只和第j只萤火虫空间坐标xi和xj的第k维坐标值;d为问题维数。对于萤火虫i,其位置xi更新公式为:
xi=xi+β×(xj-xi)+α×(rand-1/2)
(2)
式中:α,rand为随机数。
1.2 云模型(cloud model)
(3)
则称x在定量域U上的分布为正态云。其中x为数据数列,μ为隶属度。
1.3 云萤火虫算法
该群内个体具有较好的适应度,为此设定CR(调整因子,本文取值0.2)为较小值。
该群内个体数量众多,且适应度处于中等水平,为此采用正态云生成器[10]产生CR:
(4)
En′=Normrnd(En,He2)
(5)
(6)
式中:k1,k2为控制参数;Normrnd(En,He2)为服从均值为En、标准差为He的正态分布的随机数。
该群内个体适应度值最差,需采用较大CR(本文取值0.9)来扩大个体搜索范围。
为提高标准萤火虫算法的收敛速度,避免陷入局部最优,结合FA算法内部种群的划分特性,提出一种云模型产生调整因子CR改进萤火虫个体位置更新公式的云模型萤火虫算法(cloud model firefly algorithm,CMFA):
xi=CR×xi+β×(xj-xi)+α×(rand-1/2)
(7)
其中CR∈[0,1]。
2 核极限学习机
若极限学习机(extreme learning machine,ELM)的隐含层神经元为L个,对于N个数据样本(txj,tyj)∈Rn×Rm,其激活函数为g(x)的单隐含层前馈神经网络的输出Yj数学表达式为:
(8)
式中:λi为连接输入层与隐含层的权值矩阵;bi为隐含层偏置;ρi为输入权重。
假设g(x)无限可微,那么ELM的输出可以零误差逼近输出的真实值,其数学表达式为:
(9)
式(9)可以简写为:
Hλ=T
(10)
其中:
H=
(11)
(12)
(13)
式中:H为隐含层输出矩阵;λ为输入层权值矩阵;T为输出层期望值矩阵。
此时λ的最小二乘解可以通过求解式(14)获得:
(14)
(15)
(16)
综上可得KELM模型输出Y(x)为:
(17)
式中:I为单位矩阵。
3 基于CMFA-KELM的投标人画像评价
3.1 目标函数
由于KELM的分类性能受其惩罚系数C和核函数参数g选择的影响,文中选择分类准确率fT为目标函数,运用CMFA算法对惩罚系数C和核函数参数g进行优化:
(18)
式中:total,right分别为样本总量和正确分类数量。
3.2 评价模型
采用CMFA-KELM的投标人画像评价模型流程图如图1所示,图中,Counter为当前迭代次数,Maxgen为最大迭代次数,K为K折交叉验证。首先,将采集的投标人画像评价数据10折交叉划分为训练数据和测试数据;其次,针对训练数据集运用CMFA优化KELM的参数组合(C,g),建立基于CMFA-KELM的投标人画像评价模型;最后,将CMFA寻优获取的最佳参数组合(C,g)代入KELM进行测试。
图1 基于CMFA-KELM的投标人画像评价流程图
4 实验与结果分析
4.1 数据来源
为了验证本文方法的有效性和可靠性,在南方电网供应商分类分级研究成果的基础上,全方面采集供应商外部数据,包括但不限于供应商登记信息、财务信息、社保信息、税务信息、票务信息、经营信息、企业关系信息、司法诉讼信用信息等,对投标人进行画像评价。运用层次分析法从资质信息、投标行为、技术实力、信用评价和履约表现等5个方面构建出投标人画像评价指标体系,包括投标企业的资质、企业规模、资质水平、企业信用信息、行政处罚信息、法律诉讼信息、投标活跃程度、中标业绩、投标项目偏好、企业关系信息和财务信息等11个二级指标。投标人画像评价指标数据和投标人画像水平由专家通过问卷调查法获取,专家组成员包括工程招投标专家21人、工程管理专家9人以及其他相关领域的专家20人,专家熟悉招投标理论、招投标评价模型以及工程造价和工程管理等相关领域内容,共回收有效问卷50份。
4.2 性能评估
为了评估CMFA-KELM进行投标人画像评价的效果,选择准确率ACC、检测率DR和误报率FAR3个参数作为评价指标。
(19)
(20)
(21)
式中:TP和TN分别为投标人画像评价等级被正确分类的样本数和被分成其他等级的样本数;FP和FN分别为投标人画像评价其他等级被错分的样本数和误报数量。
4.3 结果分析
为验证CMFA-KELM进行投标人画像评价的有效性,将CMFA-KELM与FA-KELM、PSO-KELM和GA-KELM进行对比。图2给出了收敛曲线对比结果。
图2 收敛曲线对比
本文采用10折交叉划分50个问卷样本数据,首先将11个投标人画像评价二级指标的得分数据作为KELM的输入向量,投标人画像评价等级(A、B、C、D和E)作为KELM的输出向量,建立投标人画像评价KELM模型,画像评价等级见表1,表中Score为评价得分;其次,运用CMFA优化KELM模型的惩罚系数C和核函数参数g,建立CMFA-KELM的投标人画像评价模型。图3为不同运行次数与ACC关系图,表2给出了不同算法评价指标对比结果。
表1 画像等级评价标准
图3 不同运行次数与ACC关系图
表2 ACC、DR和FAR对比结果
从图2可知,与FA-KELM、PSO-KELM、GA-KELM相比较,CMFA-KELM具有更快的收敛速度,且具有更低的适应度。从图3可以看出,独立运行10次,CMFA-KELM进行投标人画像的准确率整体明显优于FA-KELM、PSO-KELM、GA-KELM和KELM,其中KELM的准确率最低。从表3可以看出,CMFA-KELM的ACC为95.96%,较FA-KELM、PSO-KELM、GA-KELM和KELM分别提高4.35%、5.92%、5.23%和16.23%。CMFA-KELM的DR为95.38%,较FA-KELM、PSO-KELM、GA-KELM和KELM分别提高4.28%、5.26%、5.66%和15.52%。CMFA-KELM的FAR为4.15%,较FA-KELM、PSO-KELM、GA-KELM和KELM分别降低2.19%、2.87%、2.96%和5.01%。通过ACC、DR和FAR对比可知,CMFA-KELM进行投标人画像具有更高的准确率、检测率和更低的误报率。
5 结束语
本文研究的创新点在于将云模型理论引入标准萤火虫算法,提高了算法的性能,并将CMFA算法应用于KELM模型的参数寻优和投标人画像评价。与FA-KELM、PSO-KELM和GA-KELM相比,在3个性能评价指标ACC、DR和FAR上,CMFA-KELM模型的投标人画像评价效果最好,从而为投标人画像评价提供了新的方法。