BP神经网络模型在中小企业融资征信评估中的应用
2017-10-14张洪源李华
张洪源+李华
摘 要:在互联网金融环境中,金融机构希望能够收集和分析大量科技型中小企业日常交易行为的数据,判断其业务范畴、经营状况、信用狀况、企业定位、资金需求和行业发展趋势,在大数据移动互联时代的大背景下,征信数据的共享和获取方式正在发生着根本的变化。利用互联网手段进行业务运营和产品推广的科技型中小企业已占有较大比例。为使中小企业更加科学有效地得到融资以及融资机构选择合适的中小企业,在分析中小企业融资征信评估方法的基础上,结合BP神经网络的特点,通过建立科学的中小企业信用评价指标体系,构建了融资征信评估方法的BP神经网络模型。
关键词:中小企业;融资征信;BP神经网络
一、中小企业融资征信评估应用中BP模型分析
BP神经网络最主要是用来分类和预测,是一种以梯度下降法为学习规则、按误差逆传播算法训练的多层前馈网络,通过反向传播来调整神经元和网络层次之间的权值和临界值,最终达到误差平方和最小。BP神经网络的工作原理类似于人类的神经元,单个神经元并不复杂而且功能有限,当大量神经元构成一个强大的网络系统时,才能实现现实生活中的各种行为。它的拓扑结构包括输入层、隐含层和输出层,隐含层可单可多,是决定整个我那个落复杂性的层次,就像人类的成长一样,神经网络需要大量的学习和训练,对神经元进行刺激,对事物做出正确的判断。
1.BP神经网络的基本原理
BP神经网络(back propagation)是由Rumelhart和Mccelland于1986年提出的,它是一种多层网络的“逆推”学习算法,是目前应用最为广泛和成功的神经网络之一。其基本思想是:学习过程由信号的正向传播与误差的反向传播两个过程组成,正向传播时,输入样本从输入层输入,经隐层逐层处理后传向输出层,若输出层的实际输出与期望值不符,则转向误差的反向传播阶段,误差的反向传播是将误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而或得各层单元的误差信号,此误差信号即作为修正各单元权值的依据。
2.BP神经网络的具体结构及学习过程
BP神经网络是一种单向传播的多层前向网络,具有3层及以上的神经网络,包括输入层、隐含层和输出层,上下层之间实现全连接,每一层神经元之间无连接。输入层和隐含层神经元的传递函数(激活函数)在实际应用中一般采用S型函数(Logsig): ,输出层的传递函数是线性函数,一般用pureline表示。BP神经网络学习过程大体包括八个步骤,一是选取并输入研究样本,二是对其数据进行处理,三是根据研究目的创建网络模型,四是设定各种参数初始值,五是对建好的网络进行多次训练,六是模拟输出结果,七是调整参数值,八是仿真预测。此处仅做简单介绍,具体结构及学习原理的参考资料很多,读者可自行查阅杨德平等的《经济预测方法及MATLAB实现》一书。
3.中小企业融资征信指标体系建立
本文利用因子分析法对反应企业信用状况的指标进行整理分析,选取方差贡献率达到85%以上并且特征根大于1的变量指标作为公因子,最终选取了15个财务指标综合反映中小企业的信用状况,包括资产负债率、流动和速动比率、销售毛利率、资产报酬率、净资产收益率、应收账款与存货周转率、流动资产与总资产周转率、营业收入与营业利润增长率、净利润增长率、总资产和净资产增长率。采用如下公式对指标进行归一化处理: 其中,Xj为原始数据的均值; 为原始数据的标准差, 。
二、中小企业融资征信评估的BP模型构建
1.BP神经网络输出层、隐含层及输出层的设计
根据BP神经网络的设计网络,一般预测问题都可以通过3层网络来实现,其中,输入和输出神经元数目是根据输入向量和研究目标确定。本文选择了15个财务指标作为输入,因此输入层神经元数为15,输出层神经元的数量由信用评价结果的模式确定,输出“1”表示中小企业信用正常,用输出“0”表示中小企业信用较差,因此可以设定输出层神经元的数量为1。隐层神经元数可以按照经验公式来确定:
其中,L表示最小隐层神经元数目,N表示最大隐层神经元数目μ代表输入层神经元个数,η代表输出层神经元个数,α一般取1。因此,可以估计最佳隐层的神经元数目在5-31之间。
2.BP神经网络创建、训练及结构确定
本文在进行样本设计时,随机选取我国2016年50家上市公司为样本,采用上述指标体系作为输入元素,信用评价结果为目标函数,建立BP神经网络仿真模拟。其中,学习样本为前40家企业,最后10家企业为检验样本。输入函数用minmax(P)表示,隐层与输出层传递函数上文已作说明。对于训练函数的采用,本文利用5-31之间的不同神经元数就traingdx函数、traingd函数和trainglm函数进行了训练,训练的误差结果如下表所示,由此可知,采用trainglm训练函数时平均误差最小,并且由训练速度图像(此处省略)可以看出,trainglm训练函数的收敛速度也是最快的。
在采用敛速度最快的trainglm训练函数时我们发现,当隐层的神经元个数为17时,BP神经网络误差是最小的,如下表所示,这表明此时对函数的逼近效果最好,而且经过5次训练就已经达到了目标误差。因此,选隐层神经元的个数为17。
最后,由原始数据与预测值的拟合图可以看出,相对误差都很小,说明采用trainlm训练函数和隐层神经元数为17的BP神经网络经过训练后的预测效果良好,可用作中小企业信用评价模型。
3.BP神经网络模型的实证分析
由于篇幅有限,此处实证分析结果的图表已省略,只进行文字性的统计描述。根据已经训练优良的BP神经网络模型,对2016年我国50家中小企业进行信用评价,由前40家中小企业信用评价结果可知,各中小企业信用评价仿真值中数值最高的是第7家,接近“1”;数值最低是第35家,几乎为“0”,在最后10家企业的信用仿真值中(如下表)也可看出各中小企业之间的信用评价结果差异很大,并且接近其实际信誉度。
三、结论
本文建立了我国中小企业信用评价财务指标体系,据此构建的BP神经网络模型,以2016年40家上市公司为学习训练样本,并对剩下的10家公司进行仿真,对我国上市的50家中小企业进行了信用评价,经试验后比较发现,利用trainlm函数对数据进行训练时模型达到的效果最好,因为其收敛速度是最快并且误差是最小的。根据最后的模型输出结果可知,不同中小企业间的信用评价结果不同,并且经过BP神经网络模型对中小企业进行信用评价的预测结果与其真实信用评价相近,由此可知,利用BP神经网络对中小企业进行信用评价是可行且较为准确的。因此,中小企业可利用BP神经网络对自身的信用进行定期的监测,以保持企业自身良好的信誉度。同时,商业银行等金融机构也可利用BP神经网络对中小企业的信用作出客观实际的真实评价,甄选出信誉度良好的中小企业从而有效控制融资风险,减少不良贷款事件的发生。
参考文献:
[1]蒋逸帆.我国PPP项目风险评价综合指数的测度与分析[D].河北大学硕士论文,2016(06).
[2]杨德平,等.经济预测方法及MATLAB实现[M].机械工业出版社,2012(02).
[3]黄震.基于BP神经网络模型的中国P2P借款人信用风险评估研究[D].北京交通大学硕士论文,2015(06).
[4]刘祥东,等.基我国商业银行信用风险识别的多模型比较研究[J].经济经纬Vol.32,No.6,2015(11).
[5]秦秀秀.基于BP神经网络的创业板上市公司财务预警研究[D].安徽理工大学硕士论文,2015(06).
作者简介:张洪源(1992- ),男,汉族,四川渠县人,在读硕士,经济学硕士,河北大学经济学院统计学专业,研究方向:宏观经济;李华(1992- ),男,汉族,河北定州人,在读硕士,人口、资源与环境经济学,河北大学人口研究所,研究方向:人口与经济endprint