基于RNN循环神经网络的金融风险预警研究
——以安徽省为例
2021-11-30夏佳佳
夏佳佳,姜 涛
(安徽商贸职业技术学院 财务金融系,安徽 芜湖 241002)
2020年是我国经济遭受新冠疫情严重冲击的一年,也是三大攻坚战收官之年,我国总体金融风险呈现收敛趋势. 截止年底,全年处置银行不良资产达到3.02万亿元,P2P机构数量减至零,系统性金融风险基本得到有效控制[1]. 但是,在受新冠疫情影响的经济新常态下,我国金融发展仍然面临巨大的挑战,存量风险和新增风险不容忽视. 此外,随着金融科技的发展及人工智能技术的广泛应用,新兴领域风险增大,监管难度递增[2],面对经济新常态市场的波动,金融风险不确定性增加. 因此,如何构建合理的风险预警指标,预测和防范新常态下的金融风险,对我国金融和经济稳定有着举足轻重的作用.
1 文献综述
如何有效应对金融风险对于任何国家来说都很重要,国内外学者对该领域研究络绎不绝,总体来说主要集中在模型的选择以及指标体系建立两个方面.
1.1 国外研究现状
Nag和Mirtra[3]建立BP神经网络模型研究货币危机预警系统,提出了非线性回归方法,打破传统线性拟合方法,利用黑盒子捕捉高维影响因素,实验证明此模型更具效力. Dieter Gramlinch[4]利用金融风险动态预警模型分析全球金融危机发生原因,研究表明金融体系的脆弱性是最终导致危机最重要的影响因素;Sevim等[5]建立ANN、决策树和Logistic模型回归分析土耳其货币危机,通过回归比较分析各回归模型的利弊. Kumar、Moorthy和Perraudin[6]创新提出金融风险的产生应当包括出口下降、国际储备及虚弱的实体经济几个重要变量,丰富了金融风险预警体系.
1.2 国内研究现状
张安军[7]构建我国省域金融风险动态预警指标体系和金融风险压力指数,结合TAR门限自回归模型和Ologit概率模型对浙江省金融风险状况进行实证分析,结果显示通货膨胀率与出口增长对金融风险水平呈负相关,动态Ologit预警模型预测能力及模型拟合能力都要优于静态预警模型. 游悦[8]建立神经网络深度学习算法与分位数回归相结合模型,预测我国金融风险运行状况,结果显示运用深度神经网络更为有效,2018年第三季度和2019年第一季度金融风险处于高风险状态,2019年第二季度和第三季度金融风险处于危险边缘. 杨晓叶[9]建立绿色供应链金融风险评价指标体系,比较分析Logit模型与BP神经网络模型进行评估绿色供应链金融风险,结果表明Logit模型相对于BP神经网络模型更有效,所建立的绿色供应链金融风险评价指标体系可以较为准确地评估风险状况. 王玲玲[10]从房地产金融角度考察金融风险,利用BP神经网络评估分析房地产市场金融风险,结果表明所建立预警风险模型可以较好地拟合和预测,且对2017年度房地产金融风险进行了预测.
由于金融风险受到地域性影响,因此需要选择某一特定地区进行具体实证分析. 近年来,安徽省作为长三角地区成员之一,利用其自身地理优势承接长三角地区部分产业转移,随着经济飞速发展,金融服务实体经济的需求也日趋旺盛,随之而来的金融风险也不断增加. 因此,本文以安徽省金融市场作为研究对象,以便更好地构建金融风险预警模型.
2 安徽省金融风险现状
2.1 经济复苏态势向好,信用风险尚存
在新常态形势下,安徽省实现了经济稳定发展. 2020年国民生产总值总量为38 680亿元,名义增长率为4.98%,超过全国经济增长平均水平,经济实力得到大幅提升[11]. 与此同时,由疫情因素带来的影响仍然存在. 在疫情冲击下,部分中小企业无法按期偿还金融机构贷款,金融机构采取增加授信额度及进行授信展期等方法以缓解金融风险,扶持中小企业[12]. 这些举措虽然缓释了目前风险,但部分金融风险存在后期爆发的可能,即金融风险滞后性,金融机构不良贷款率在未来一段时间内存在一定上升压力.
2.2 宏观杠杆率保持稳定,房地产监管持续强化
为抵抗疫情的影响,安徽省2020年上半年出台了房地产扶持政策,让市场快速恢复. 下半年房地产调控政策不再将其作为短期刺激经济手段,行业监管持续强化,对房价上涨较快的城市升级调控政策,保持杠杆率的基本稳定. 房产企业加大营销力度,加速回款速度,销售业绩持续提升,市场回归理性[13].
2.3 数字金融创新持续发展,影子银行等领域风险不容忽视
安徽省为长三角地区的成员之一,长三角一体化的红利为其特别是合肥市带来了更多科技发展机会. 以科大讯飞、新东方等为代表的高科技企业飞速发展,各类国家实验室、国家级大科学装置相继落户为安徽省金融科技的发展提供充分支持. 2020年安徽省区域合作五个“区块链接”,已筹备成立安徽省区块链技术产业应用协会,力图推动“区块链+数字经济”深度融合发展[13]. 影子银行、P2P网贷虽然得到控制,但是随着金融科技的发展,重塑的金融业业态将带来市场垄断、数据权属不清等问题,一些新兴领域的风险隐患将逐步显现,一些新兴领域的风险隐患将逐步显现[14].
2.4 金融服务实体经济效果较好,保险机构对金融机构风险缓释效应不明显
农业银行安徽省分行、徽商银行中国银行安徽省分行、光大银行合肥分行、工商银行安徽省分行、交通银行安徽省分行、国元信托、华安证券、国元证券、省股权托管交易中心等26家金融机构服务实体经济发展评价为“优秀”,中信银行合肥分行、民生银行合肥分行、新安银行、浙商银行合肥分行、建设银行安徽省分行、省农业信贷融资担保公司、省信用担保集团等16家金融机构服务地方实体经济发展评价为“良好”[15]. 但是在金融机构支持实体过程中出现了对抵押物过度依赖的现象,这将增加区域内金融机构信用风险,保险机构对商业银行信贷服务过程中提供的保险服务比重仍然较低,无法实现风险缓释功能[16].
3 RNN循环神经网络模型
RNN即循环神经网络,与传统BP神经网络及CNN神经网络有所区别,主要对具有时间序列特性的数据预测效率较高,可以挖掘数据中的时序信息. 因此,目前多被应用于语言模型、机器翻译及时序分析等问题. 结构如图1所示,包括输入层、输出层及隐藏层. 其中输入层记为{x0,x1,…xt,xt+1,…},输出层记为{o0,o1,…ot,ot+1,…},隐藏层记为{s0,s1,…st,st+1,…}.U表示输出层到隐藏层权重矩阵,V表示隐藏层到输出层的权重矩阵,W表示隐藏层之间的权重矩阵. 在t时刻,由st-1和当前的xt作为输入,得到计算结果ot为输出且传递给t+1时刻. 由此得到RNN网络具备较强的记忆性,利用相连接的隐藏层,将前一时刻的状态传至下一时刻[17]. 在金融风险预警模型中,将2006—2019年时间序列数据作为输入,可将预测日某一时刻信息传至下一时刻,体现了预测数据间的时间相关性. 因此,较于传统神经网络,RNN神经网络可以降低预测误差.
4 基于RNN循环神经网络的安徽省金融风险预警模型构建
金融风险受到主观、微观等多方面因素影响,具有动态性、复杂性及非线性等特征,难以找到某个确定的线性函数进行刻画,因此神经网络可以较好地将各因素映射预测. 此外,金融风险影响因素具备时序特征,前一年风险发展对后一年金融风险状况有一定影响,传统神经网络忽略了风险发展过程中的时序性,而RNN神经网络具有较好的记忆能力,能够自动刻画某一时刻对于后续时刻的影响,特别适用于处理需要考虑时间相关因素的问题,且具备非线性、记忆性、适应性等特点. 因此,本文选择RNN循环神经网络模型研究金融风险[18].
4.1 指标及样本选择
本文借鉴前辈学者研究成果,以系统性、完整性及数据可得性为依据,构建安徽省金融风险预警体系,共有11个指标构成[19]. 指标数据主要来自银保监会、安徽省统计局、安徽省证监局、中国人民银行、国民经济和社会发展统计公报及EPS数据库.
GDP增长率 该指标反映某地区经济增长情况. 当经济增长迅速,企业投资动力充足,金融机构放贷意愿增强,企业融资渠道通畅,社会信用处于宽松状态,信用违约概率降低,金融风险相对减弱.
固定资产投资增长率 该指标反映社会固定资产更新、改建、扩建、新建等活动. 固定资产投资增长迅速,表示社会处于生产扩张状态,社会投资意愿明显,投融资环境优良,有利于降低金融风险.
居民消费价格指数增长率 该指标反映居民购买消费商品变动情况,在一定程度上反映了通货膨胀或紧缩程度. 通过对国民经济核算的调控,从而影响金融风险.
房地产供需比 该指标由商品房竣工面积与商品房销售面积的比率表示,反映了房地产供求关系. 比率越大表示供大于求,反之求大于供,促进房价上升. 房价的大幅上涨或下跌都将影响我国金融风险状况,如房价上涨过快导致居民借贷买房信贷投放增加,银行体系受房地产泡沫破灭的潜在损失增加,居民债务负担加重提供了房价下跌时抵押贷款违约可能性.
公共财政预算收入增速 该指标可以体现某一地区经济活力和质量的好坏,税收收入体现了该地区企业发展质量. 预算收入增速越快表明该地区企业发展质量良好,发生信用违约风险的可能性降低.
信贷增速适度率 该指标用各项贷款增速与GDP增速比值来表示,反映信贷规模扩张与经济增长匹配程度. 比率过大表明贷款增速超过了适度程度,为金融体系带来风险.
不良贷款率 该指标表明金融机构资产质量. 不良贷款率越大表明金融机构资产质量较差,发生风险概率较大,不良贷款率越小则表明金融机构资产质量较好,信用违约概率较小.
拨备覆盖率 该指标反映银行贷款可能发生坏账准备金使用比率. 拨备覆盖率越高说明银行抵抗风险能力越强,是衡量银行财务是否稳健的重要指标.
证券交易额占GDP比率 该指标用证券公司代理买卖证券交易成交金额与GDP比率来表示,反映资本市场活跃程度与经济发展的匹配程度. 比率越大表示该地区资本市场越活跃,直接融资需求越大,该指标过高或过低都将造成金融风险的增加.
保险深度 该指标用保费收入与GDP比率表示,反应保险在经济中的贡献程度. 比率越高说明保险投入比率越大,对于风险缓冲能力越强.
影子银行贷款比率 该指标用小额贷款公司发放贷款余额与银行业各项贷款余额的比率表示,反映影子银行发达程度. 影子银行过度发展将带来较大的金融风险,因此需要对其实施严格的监管.
由于本文涉及数据较多,变量维数较为复杂,变量之间也可能存在一定的联系,包含的信息可能存在部分重复. 在RNN循环神经网络中,如果变量过多会降低网络模型训练效率,因此需要利用主成分分析减少指标维数,提升训练效率,本文对上述11个指标进行主成分分析[20]. 但是由于各指标数据存在量纲不统一的问题,需要进行标准化处理,然后利用Python 3.8进行数据分析处理.
首先,进行KMO分析. KMO统计量数值为0.362,即数据间具备相关性,满足主成分分析条件. 经过变量主成分分析,指标贡献结果见表1.
表1 指标贡献率
然后,经过主成分计算得到因子载荷矩阵. 载荷矩阵代表原始变量与公共因子之间的关系. 由载荷矩阵可以得到每个主成分的方差贡献率,代表相应主成分在多大程度上反映原来所有信息. 如表1所示,前4个指标特征值累计贡献率达到85.8%,符合累计贡献率大于85%的原则,因此可以作为指标. 此外,原始变量上的载荷值无法由某些公共因子代表变量解释得到,因此需要进行因子旋转,本文采用最大方差法进行因子旋转(如表2所示).
表2 旋转成分
最后,由表2可以得到,成分1主要荷载了金融机构经营状况的3个指标,成分2主要荷载了社会融资状况的2个指标,成分3主要荷载了社会供求表现的3个指标,成分4主要荷载了区域风险表现的3个指标,利用这4个成分构造金融风险预警模型,再通过荷载矩阵求得代表安徽省金融风险14年的四个因子,安徽省金融风险得分见表3.
表3 因子得分
4.2 阈值划分
对于预警阈值的划分,本文参考已有文献采用3δ检验法. 通过点估计计算预警中心值,再设定偏离1δ区间为正常状态,偏离均值1δ到2δ低风险状态,偏离均值2δ以上为高风险状态,由此形成金融风险预警的5个区间(如表4所示).
表4 金融风险预警状态表
再由因子得分矩阵计算得到各成分均值与标准差,结合3δ法计算各成分预警值划分,结果见表5.
表5 预警状态判断表
4.3 RNN循环神经网络模型训练及评价
本文使用的RNN网络结构如图1所示. 所使用的循环神经网络为GRU(门控循环单元),该网络可以更好地提取序列中相隔较远变量间的关系[21]. 网络输入为2006—2019年样本数据,输出会被反馈回输入如此循环,使用的激活函数为relu,模型使用一层GRU网络,该层RNN有6个输出,最后输出的大小为18*1,输出数据即进入了混合模块,模型训练结果见图2. 通过RNN循环神经网络的建立,利用仿真计算,将输出样本即预测结果与实际样本即实际值进行比较,可以得到该网络的预测效果.
图2 仿真训练图
由图2可以看出,在仿真训练结果中预测值与真实值几乎重合为一条线,表明该模型拟合能力较好,预测能力较强,结果见表6反映模型训练情况.
表6 RNN神经网络训练结果
由表6可以从数值角度反映了数值的预测结果,与实际结果相差较小,结合金融风险预警状态表可以得到,2019年安徽省金融风险总体处于正常状态,由所得实际值及预测值可以看出,F1、F2均处于正常状态,F3处于高风险状态,F4处于低风险状态.
金融机构经营状况(F1) 2018年为0.472,大于2019的0.3,说明金融机构经营状况风险趋于减弱,这可能是由于安徽省2019年继续深化防范化解金融风险举措,实施全面清退网贷,查处影子银行,打击金融犯罪等一系列强有力措施,优化了金融机构经营环境,维护了省域范围内的金融稳定.
社会融资状况(F2) 2018年为2.77,远大于2019年的0.464,表明社会融资状况由高风险转向正常,信贷增速放缓,社会融资趋于合理. 究其原因,主要可能是2019年安徽省地方政府债务置换导致信贷增速放缓,加大对实体经济支持力度,且直接融资占比有所提高,社会融资风险逐步减小.
社会供求表现(F3) 2018年为0.168,远小于2019年的2.67,说明社会供求由正常状态转入高风险,可能是由于2019年国家降杠杆维护金融政策稳定的环境下,安徽省不良贷款率有所下降,居民消费指数上升,企业个人投资热度较高. 但过热的投资需求可能会提升融资杠杆率,导致金融风险的上升.
区域风险(F4) 2018年为-0.278,小于2019年的1.18. 表明安徽省区域风险由正常状态转入低风险,可能是由于安徽省积极承接产业转移,2019年发布多项人才政策,全省多地特别是合肥人口净流入明显. 但人口的回流可间接导致房产供需比的倾斜,存在房价快速上升等因素所导致的区域风险上升.
4.4 RNN与BP神经网络训练结果对比
为了进一步说明RNN神经网络对金融风险预警的适用性,本文将BP神经网络模型与RNN循环神经网络模型以2019年数据集训练结果进行对比,结果见表7.
表7 RNN与BP神经网络训练结果对比
可以看出,在RNN网络模型回归结果中均方误差、均方根误差及平均绝对误差均远小于BP神经网络回归结果,因此RNN循环神经网络具有更好地预测效果,预测准确度更高.
5 结语
金融风险预警体系中,指标呈现时序特征,因此预警体系的建立应当充分考虑到时间影响因素. 区别于传统的BP神经网络模型,RNN循环网络模型更具时序特性,从而可应用于实际金融风险预警. 本文首先对数据集进行主成分分析,提取具代表性因子;再对数据进行预处理,以符合实验操作需要,结合RNN循环神经网络建立更科学的金融系统风险预警模型;最后以安徽省具体数据为样本,实验结果证明该方法具有较高的准确率,通过实际值和预测值以及RNN与BP神经网络训练误差的对比,验证了该网络具有较高的预测精度,为金融风险预警体系建立提供了新思路.