APP下载

基于RS和SVM的建筑企业信用风险评估研究

2016-08-02帆,谈飞,崔

关键词:支持向量机粗糙集建筑企业

杨 帆,谈 飞,崔 祥

(河海大学 商学院,江苏 南京 211100)



基于RS和SVM的建筑企业信用风险评估研究

杨帆,谈飞,崔祥

(河海大学 商学院,江苏 南京 211100)

摘要:建筑企业的信用缺失给投资者和行业发展带来了巨大风险,企业信用风险评估模型的建立及其应用是防范信用风险的重要手段。利用粗糙集对数据进行处理,并结合支持向量机的数据分类作用,构造了基于粗糙集的支持向量机模型,将新的学习样本通过支持向量机模型完成对施工企业信用风险的分类训练和评估,通过实例验证了RS-SVM模型用于建筑企业信用风险评估具有良好的分类性能,有助于实现对我国建筑企业信用风险的预警,增强投资者信用风险防范能力,提高建筑行业信用水平;有助于丰富和完善企业信用风险评估理论和方法。

关键词:建筑企业;信用风险评估;指标体系;支持向量机;粗糙集

企业信用风险评估模型的建立及其应用是防范信用风险的重要手段。传统的评估方法有5C要素分析法、财务比率分析方法等[1];后来又出现了统计分析方法,典型的有Probit回归法、决策树等;计算机技术推动了企业信用风险量化评估模型的不断创新,如专家系统法、神经网络法等人工智能方法。目前国内信用评价研究较多的对象是商业银行[2-3],对于建筑企业的信用风险评估目前尚未有一个公认的可靠方法,因此,寻找一种可靠又易于操作的建筑企业信用评价方法是非常有必要的。

近年来,用粗糙集(rough sets,RS)或支持向量机理论(support vector machine,SVM)解决信用或风险评价问题的研究很多,如宋晓东等[4]构建了中小企业信用评价的双隶属模糊支持向量机模型,在改进支持向量机建模方法、最优指标组合遴选和信用评价分析视角拓宽方面均有所创新;李顺国等[5]针对投标过程中的不确定性和风险分析问题,运用粗糙集和支持向量机理论对投标风险进行约简分类,为决策者对工程项目的投标风险评估和决策提供依据;杜婷[6]、李文娟[7]采用粗糙集与支持向量机相结合的方法评估个人信用,并用小样本对个人信用评估模型分类预测,其效果和稳定性良好。

笔者利用了粗糙集对数据进行处理,并结合支持向量机的数据分类作用,构造了基于粗糙集的支持向量机模型,用以解决属性关系简单、非线性分类、回归或密度函数估计问题,将其应用于施工企业信用风险评估。

1粗糙集和支持向量机理论

1.1粗糙集理论

粗糙集理论是通过对数据归纳、不完整性整理及其结论表达式进行研究,实现对简约特征值的解释和数据的提取。属性约简是粗糙集理论的核心内容,一个粗糙集的决策表S=(U,C∪D),其中U={u1,u2,…,u|U|}为论域,C={a1,a2,…,al}中的属性为条件属性,D中的属性为决策属性。一般情况下,属性xi对C而言是必需的,若存在Ind(C)=Ind(C-xi),则属性xi可以省略。若属性集具有非独立性,则可能的最小属性子集、所有不可缺少的属性集(核)和相等数量的整个属性集的基本集(约简)都能被找到。

1.2支持向量机理论

支持向量机是一种以结构风险最小化为原则,利用不断求解极值来寻找全局最优解的数学方法[8],其在线性可分情况下寻求能将样本充分隔离且分离间距达到最大的最优超平面。在线性非分类的情况下,引入非负变量ξi(i=1,2,…,l)。设已知训练样本集T={(x1,y1),(x2,y2),…,(xi,yi)},其中xi∈X=RN(X为输入空间,是N维向量)为输入指标,yi∈{-1,1}或yi∈{1,2,…,k}为输出指标或决策属性。当yi∈{-1,1}时支持向量机为最简单的二类划分,当yi∈{1,2,…,k}时其为k类划分。求解最优超平面可表示为如下约束优化问题:

(1)

式中ω为权向量。上述二次规划问题存在唯一的极小点,用Lagrange乘子法化成其对偶形式:

(2)

式中:C为惩罚项系数;αi为Lagrange系数。如果αi>0,那么称相应的xi为支持向量,最优分类超平面的决策函数为:

(3)

支持向量机基于Mercer核,通过非线性映射φ将样本空间映射至一个更高维或无穷维的特征空间来解决非线性问题。Mercer核K(x,y)可以展开为一致收敛的函数项级数:

其中φi(x),λi分别为核K(x,y)的特征向量和特征值。最后得到最优分类超平面的决策函数为:

(4)

2RS-SVM施工企业信用风险评估建模

粗糙集的优点是在缺乏经验的基础上能够通过属性关系的简约分析信息之间存在的关系,缺点是分析对象仅局限于离散数据,容错能力和泛化能力不强,支持向量机恰能克服粗糙集在该方面的弱势。笔者将两者结合建立了基于RS-SVM的施工企业信用风险评估模型,如图1所示。对信用风险分类过程表述为:通过粗糙集在不影响分类效果的前提下对训练样本进行约简,找到最小评估属性集及对应的学习样本组成的新学习样本,然后将新学习样本通过支持向量机模型完成对施工企业信用风险的分类训练和评估。

图1 基于RS-SVM的信用风险评估模型

3RS-SVM施工企业信用风险评估应用

3.1指标和样本数据的选取

在进行变量选取时,结合国内外学者的相关研究[9-11]和建筑施工企业特点,对影响建筑施工企业信用因素进行分析整合,选择施工企业基本素质、管理体系、经营效益等方面的32个指标并分类,在定性与定量分析相结合的基础上对建筑施工企业的信用等级进行评价。

鉴于非财务指标量化困难、获取难度大的特点,笔者尽可能地选择可量化的定性指标共计18个对企业信用进行评价,还选取了对企业信用解释力度较大、表现能力强的14个财务指标进行专家打分,具体指标内容及分值分布如表1所示。

笔者选取8家上市建筑施工企业数据作为样本数据,信用分为AAA、AA、A、B这4个等级,数据和信用评级结果皆来源于可靠的财经网站。按照表1打分范围,采用专家打分法确定各评价指标值。决策属性用样本Y表示,评价集合为y={1,2,3,4},分别表示{“信用好”,“信用较好”,“信用一般”,“信用欠佳”}。表2所示为8个样本企业属性及其信用分类。

3.2指标数据处理

笔者根据数据值是否大于均值作为标准对数据进行离散化处理,即若数据值大于均值则赋值为1,否则赋值为0,再利用粗糙集对离散后的数据进行处理。采用Rosetta软件,按偏离度大于90%的原则进行评价指标的约简,具体约简属性集为{X1,X2,X5,X6,X7,X9,X10,X11,X14,X15,X16,X17,X18,X21,X22,X25,X26,X28,X29,X30,X31},其中X15,X16,X17,X18,X21,X22,X25,X26,X28,X29,X30,X31为整个决策表中的核属性。通过约简后发现,主要约简对象是与企业信用不相关的指标,留下的财务指标涵盖了盈利能力、偿债能力等方面,仍能正常反映公司的财务状况。

表1 定性指标内容及分值分布

3.3SVM的分类预测与结果分析

笔者对建筑施工企业的信用评级是将企业的上述各项指标得分作为分类属性,也就是输入数据;将企业的信用状况作为样本的分类标签,形成新的训练样本集T={(x1,y1),(x2,y2),…,(xi,yi)},xi∈X=R20,yi∈{1,2,3,4},其中SVM模型是通过LIBSVM 软件包实现的。在评估过程中,采用交叉验证法[12]进行最佳参数的选择。首先运用svmtrain 程序完成训练,设置支持向量机类型,选择核函数并设定其参数。通过运行,系统会给出一个包含模型参数信息和程序选择的支持向量模型文件[13];然后程序svmpredict在获得的模型基础上完成测试与预测工作。将A、C、D、E、F、H企业的数据作为训练数据来训练模型,再利用学习好的支持向量机对B、G企业信用分类进行预测。

表2 样本企业属性及其信用分类

(1)核函数的选择。笔者选择RBF函数作为核函数,原因在于该函数收敛域相对较宽,且样本维数高低和大小对RBF函数的适用性影响不大。RBF核可表示为:

(5)

式中,σ为函数的宽带参数。

(2)参数的确定。根据已有的研究成果可知,支持向量机性能的优劣在于核函数选择的参数和惩罚系数,而不是核函数类型。笔者选择RBF核函数作为支持向量机模型的核函数,这类支持向量机的性能主要是由参数C和σ决定,选取的参数值不同,得到的分类器也就不同。其中惩罚因子C的作用是实现回归误差与复杂性之间的折中。C过大或过小对机器的性能都会产生不利影响。径向基核函数带宽σ对模型的性能同样有较大影响,对于训练样本集,在σ选取适当的情况下,支持向量机一定可以对其进行正确分类。对参数(C,σ)不断赋值,共进行10次训练测试,找到一个最佳的参数组合,得到的分类器性能也就更好,泛化能力更强,准确率更高。综上,运用LIBSVM工具箱确定学习参数,得到最优学习参数为:目标函数的正则化参数C=75,损失函数中的ε=0.1,核函数中的σ=0.8。

(4)评估结果分析。SVM模型的具体判断结果显示:B企业信用属于AAA级,即信用好;G企业信用属于A级,信用一般,与实际信用等级符合,预测结果准确,验证了采用支持向量机对企业信用等级的分类是有效的。

4结论

研究发现粗糙集与支持向量机的结合可较好地用于施工企业信用风险评价,在保持支持向量机识别精度的前提下,通过使用粗糙集将数据进行预处理实现评价时间的缩短。施工企业信用风险评价具有复杂性的特点,任何评价方法都存在各自的优缺点,笔者的研究为施工企业信用风险评价提出了一种分析和解决问题的思路。

参考文献:

[1]柯孔林,周春喜.商业银行信用风险评估方法研究述评[J].商业经济与管理,2005(6):55-56.

[2]陈珊珊.基于粗糙集和支持向量机的商业银行信用风险评估模型[J].价值工程,2008,27(5):1-4.

[3]张晴.基于支持向量机的商业银行信用风险研究[D].杭州:浙江大学,2014.

[4]宋晓东,韩立岩.基于双隶属模糊支持向量机的中小企业信用评价[J].工业工程,2012,15(1):93-98.

[5]李顺国,卢新元.基于粗糙集和SVM的工程项目投标风险研究[J].计算机工程与应用,2008,44(17):224-227.

[6]杜婷.基于粗糙集支持向量机的个人信用评估模型[J].统计与决策,2012(1):94-96.

[7]李文娟.基于粗糙集-支持向量机的个人信用评估[D].重庆:重庆大学,2011.

[8]王巍.基于先验知识的支持向量机图像分割算法研究[D].西安:西安工业大学,2009.

[9]吴青.基于最优化理论的支持向量机学习算法研究[D].西安:西安电子科技大学,2009.

[10]任杰,刘振奎.施工企业信用评价体系分析[J].建筑管理现代化,2005(2):36-38.

[11]段婵.建筑业企业信用评价研究[D].武汉:武汉理工大学,2008.

[12]袁莉,李宏男,姜韶华.基于SVM的建筑企业信用评价研究[J].价值工程,2009,28(3):138-141.

[13]陈伟,王业球.基于支持向量机方法的中小企业信用评级优化研究[J].云南财贸学院学报(社会科学版),2011(6):83-84.

YANG Fan:Postgraduate; School of Business, Hohai University,Nanjing,211100,China.

[编辑:王志全]

文章编号:2095-3852(2016)01-0033-04

文献标志码:A

收稿日期:2015-06-09.

作者简介:杨帆(1991-),女,黑龙江哈尔滨人,河海大学商学院硕士研究生.

中图分类号:F270.5

DOI:10.3963/j.issn.2095-3852.2016.01.007

Research on Credit Risk of Construction Enterprise Evaluation Based on Rough Sets and Support Vector Machine

YANG Fan,TAN Fei,CUI Xiang

Abstract:Lack of credit of building companies has brought great risk to investors and industry development,and establishment and application of corporate credit risk assessment model is an important means to prevent credit risks.In order to alert construction enterprise's credit risk fully,this paper combines the data processing effect of rough sets and the data classification action of support vector machine method to make the RS-SVM model,uses the rough set to reduce the sample data and formats the new learning sample,and then the new learning sample is made to complete the construction of enterprise credit risk classification training and evaluation by SVM model.The examples demonstrate the SVM model for building corporate credit risk assessment has good classification performance and helps to introduce to the practice of construction enterprise credit risk assessment,enrich the corporate credit risk assessment theory and methods,and enhance investor credit risk prevention capacity and improve the construction industry credit level.

Key words:construction enterprises; credit risk evaluation; index system; support vector machine; rough sets

猜你喜欢

支持向量机粗糙集建筑企业
基于Pawlak粗糙集模型的集合运算关系
基于二进制链表的粗糙集属性约简
优势直觉模糊粗糙集决策方法及其应用
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
多粒化粗糙集性质的几个充分条件
浅谈“营改增”对建筑企业的影响及应对措施
建筑集团心理整合与思想政治教育研究
基于支持向量机的金融数据分析研究