基于大数据的信贷风险分析研究
2021-12-08田浩
摘要:随着经济环境的变化和近两年来疫情的影响,金融机構之间竞争愈发激烈。大多数商业银行都认识到贷后管理工作的重要性,但是银行客户经理在贷后风险信息识别上缺乏专业知识和工具,导致贷后管理一直银行信贷工作中最薄弱的环节。将大数据技术应用于贷后风险评估防控,能够有效的识别出贷后管理过程中存在的风险信息并及时采取措施,提高金融机构的贷后管理水平。
1.概述
近几年来我国市场经济多元化发展水平的不断提升,企业信用风险成为银行业面临的主要问题。贷后管理是商业银行在企业贷款过程中关键的一个环节,而贷后风险防控是贷后管理中的一项重要工作内容。但在银行信贷管理中普遍存在着“重贷轻管”的现象,对贷后管理内容认识不够全面。因此加强贷后风险防控不仅能够提高贷后管理工作质量,而且还能保证银行信贷业务稳健发展。在网络技术和大数据技术的发展背景下,为社会各个领域带来了新的优化和发展方向。将大数据技术应用于银行贷后风险防控,一方面可以提高信贷管理工作的科学性和有效性,另一方面能够及时预防不良贷款的形成。利用神经网络技术来建立贷后风险评价模型,从模型结果发现企业经营过程中可能存在的风险信息。总而言之,大数据分析技术可作为贷后管理工作中一个重要的工具。
2.BP神经网络基本原理
目前BP神经网络是信贷风险分析中最为广泛的神经网络模型。BP神经网络算法具有强大的并行处理机制,高度自学习、自适应能力,能够随环境的变化而不断学习。在进行信贷风险评估与预测时,企业信息和财务数据等指标之间存在复杂的非线性关系。而人工神经网络是一种自然的非线性建模过程,具有很好的逼近分线性映射能力,无需区分各个指标之间的非线性关系。
BP神经网络的模型结构包括输入层、隐藏层和输出层。其计算过程包括前向过程:输入信号从输入层通过激活函数向隐藏层和输出层传播。如果输出结果得不到期望的输出,则将误差信号通过反向过程,向输入层反推,直至样本的输出结果与期望值之间的误差小于给定值。此时可以得到较为稳定的预测结果。
3.BP神经网络建模及计算结果
本文采用的数据来自于某银行2020年度的有贷企业客户数据,包括5000个训练样本,350个测试样本。根据训练样本进行BP神经网络建模,得到稳定的预测模型后,将测试数据输入至模型中得到客户风险信息。
3.1客户数据描述
数据集包括企业客户基本信息数据、财务指标数据、贷款数据以及企业水电费数据。其中客户基本信息包括客户id、注册资本、注册地址、股权比例。财务指标有资产负债率、利润率、流动资产、短期投资、固定资产、无形资产、资产总计、营业收入、营业利润、净利润、经营活动产生的现金流量、投资活动产生的现金流量、筹资活动产生的现金流量等字段。贷款信息包括:贷款额度、授信额度、信用余额、还款期次、结算账户等数据。对5000个训练样本进行数据预处理,剔除财务指标数据缺失的客户。增加一个是否逾期字段,设置两个默认值:“1”(未逾期)和“0”(已逾期)。
3.2模型建立
本文采用matlab神经网络工具箱进行建模,其中激活函数为Sigmoid()函数。首先对样本数据进行归一化处理,设定网络隐藏层和输出层激励函数分别为tansig和logsig函数。网络训练函数为traingdx,性能函数为mse。网络迭代次数为5000次,期望误差为0.0001%,学习速率为0.01,设定好参数后开始训练网络。
3.3模型结果评价
根据上述训练好的模型,将预测数据输入至模型中。利用输出结果计算模型的总体分类正确率、逾期正确率、未逾期正确率、误报率等指标。其中逾期正确性为样本中违约的样本数与违约总数的比值;未逾期正确率为未逾期样本数与未逾期总数的比值。误报率为逾期样本中为未逾期样本的数量与逾期总数的比值,如表1所示
从表中可以看出,对于350个测试样本的逾期正确率为91.35%,而误报率为10.72%。因此BP神经网络模型对信贷风险预警的正确率较高,而误报率很低。从这两个指标可以看出本模型具有较好的性能。
4.总结
在大数据和机器学习的数据分析背景下,本文采用大数据分析技术对商业银行的企业客户进行了科学和有效的贷后风险评价。利用BP神经网络模型预测了客户逾期风险的概率,从结果可以看出该模型具有较高的评估效率和准确性。虽然本模型在贷后风险预警具有较好的性能,但在基础数据选择和预处理方面还存在欠缺。因此接下来的研究需要在大量样本的基础上,综合考虑企业运营的各个指标因素进行风险分析。从而提高商业银行的信贷管理水平和有效降低不良贷款发生率。
作者简介:
田浩,1994.12,男,汉族,河北省石家庄人,中国农业银行河北省分行科技与产品管理部,科员,从事系统开发和数据处理类工作。