APP下载

基于大数据的信用风控在化工行业的应用研究

2019-03-02解旭东虞立戎吴在华梅新芝

云南化工 2019年12期
关键词:化工行业信用风险信用

解旭东,虞立戎,吴在华,黄 玲,梅新芝,陈 森

(1. 中化国际(控股)股份有限公司, 上海 200126;2. 上海说以科技有限公司, 上海 200120)

大数据风控是风险管控和互联网大数据技术的结合,是一种新型风控管理模式,近几年大数据在各个领域得到了快速发展,但由于中国征信体系的不完善,给企业特别是化工行业的赊销体系带来了较大的风险,因此建立一个有效的新型风控体系是十分必要的。化工企业是基础性工业企业中十分重要的一种,其交易对象包括多种细分行业。化工行业因其实体制造业的特点,导致信用风控相对金融等行业比较传统。随着经济和社会信用交易的发展,化工行业的信用交易越来越多。由于化工交易自身的单次交易额比较大、上下游供应链企业参与较多,从而导致信用风险逐渐提升。因此对信用风险进行防控已成为现代化工企业正常运营与发展的重点关注问题。

1 相关概念和研究现状

为了实现对信用风险定义的精准界定,需要对信用含义进行深入了解。信用是指受信人与授信人之间建立契约关系,确保自身的本金能够满足回流和增值的要求。信用风险包括个人信用风险、商业信用风险、投资信用风险、银行信用风险以及国家信用风险几种类型[1]。企业的信用风险传导主要是指借助于相应载体,对企业内外部环境中所蕴含的风险进行释放,将其传递至企业各类业务流程中,导致企业的经营发展偏离预先设定的目标,进而对企业的运营效率造成损伤[2]。基于外部层面进行审视,企业信用风险的传导过程实际上也是风险源的释放过程。大数据是指在划定的时间和空间范围内把大量的、多样的、复杂的、混乱的、有价值的数据使用新工具和方法高效的对这些数据进行搜集、整理、分类、提取和分析,从而生成企业需要的信息。目前国内化工行业还没有建立起统一适用并且完整的征信体系,而行业的信用赊销比例较高,所以建立一个完善的信用风险体系至关重要。关于信用风险的研究主要是采用信用评分卡模型进行评估。评分卡模型具体是指首先利用已经收集的数据,评估出客户的信用、营业额、净利润率、赊销额、支付能力等指标,对指标进行划分,说明各个等级的重要性程度,然后计算各个等级的权重,最后根据权重计算我们需要的客户信息等级[4]。

BillFair 与EarlIsaac 在1956 年创立了第一个商业化信用评分系统FICO,之后,Myers 等[5]采用判别分析和回归分析法,将评分系统运用到消费者信用领域;OrglerSrinivasan 等利用模型对信用风控进一步研究。随着技术发展,机器学习被引入信用管理系统,最早的是Angelini 等[6]运用人工神经网络设计信用风险模型,Bequé 等[7]运用最近提出的人工神经网络的极限学习算法(ELM),被证实非常方便且预测精准度高,在信用风险建模领域有很高价值。过去的信用风险方法在分布、线性等方面有严格的假设条件,使该方法在互联网快速发展的时代难以适用。

2 大数据风控在化工行业的应用类别

2.1 风险识别

风险识别是风控的基础,在充分了解对方的基础上才有科学准确的风控。风险识别包括交易的全过程,目前使用比较多的是评分卡模型[8],我们使用模型可以汇总各部门业务和数据,并与业务专家一起确定通用模型的输入指标和权重,确定通用模型的数据源,制定个体公司的综合评分模型,为交易对象画制一个360°画像。

2.2 风险体系构建

信息挖掘是信用风险监管过程中,借助大数据的作用有效实施的最重要环节。通过构建信用风险评价模型确定评价指标如财务指标、交易数据、信号数据、公司信息、宏观经济、负面信息等,力争综合全面的挖掘出交易对象的具体信息,可帮助公司决策者科学地识别和判断风险与机遇,最终做出最合适的决策[9]。具体分为3 个模块,第一、客户基本信息模块:个体客户信息是区别于其他客户的基础。通过公开渠道、第三方渠道、行业协会、管理机构等收集客户的个人信息,借用财务系统收集客户的商业信息、借还款信息,利用政府数据网络收集公信信息等对客户的信用风险进行分析。第二、信用风险评估:可细分为风险评估、破产违约、交易价值、业务员评价四部分,在交易前可以运用已经收集好的数据,进行基础风险和破产违约的评估,初步判断风险,在交易过程中根据交易价值进行事中风险评估,在事后统筹之前的评估并结合业务员的评价进行全面的风险评估。第三、风险预警模块:通过对交易对象的相关风险数据的监测和结合企业自身情况,设定风险触发信号与阀值,继而利用数据自定义配置风险监控指标,接受到风险后,决策者根据实际情况进行决策并记录下风险处置措施。

2.3 风险决策

在大数据指标构建完整的基础上,建构相应的自动化决策模型与风险监控预警模型,核算风险层次,为决策者提供适当的信用信息。通过对客户的信息进行整理和评估,以生成的评估资信报告为基础,根据事先设置好的模型,对客户的信用风险进行实时监控,从而及时准确的衡量客户的风险等级。

3 大数据风控在化工行业的存在问题

3.1 数据质量直接影响模型效果

数据的真实性和数据的完整程度会影响模型生成不同的评估结果。我们在评估工作中使用的信用风险评估模型,只是纯理性的结果,故如果要不断提高信用风险评估模型的准确度,必须要求公司尽可能的收集到模型所需要的全部数据,并对其真实性进行去伪存真,从大量数据中提取到有效的数据特征。

3.2 传统评分卡模型具有一定的局限性

虽然评分卡模型已经应用到很多领域,但该模型内含有很多维度,导致在应用过程中可能会过于复杂。我们完全可以根据化工行业自身的特点和个体公司的需求,挑选出有效的部分变量,然后将需要的数据转化成标准的信用评分。

3.3 借鉴新方法建立一种更直观的风控体系

与传统评分卡模型相比,机器学习方法不仅对信用风险评估的准确度更高、更全面,而且对信用风险评估的统计假设条件也较宽松。如最新的XGBoost 算法,预测结果比传统评分卡模型表现更为出色,使得信用风险评估具有更好的可解释性和可操作性。

4 提升大数据风控能力的几点建议

4.1 完善初始数据的真实性和准确性

数据质量主要体现在完整性、一致性、准确性、及时性等方面[10]。真实数据可以直接影响到信用评估的结构是否可行。一方面,构建以政府为支柱、辅助以社会各方的力量,共建大数据库。我们知道,政府在中国是社会公信力的代表,必须要求政府完善监管标准和监管方法,提供最广泛和最有公信力的数据。另一方面,随着互联网技术的发展,应加强各地区、各部门与社会各方力量的信息实时互通,因为社会各方力量涉及各个领域信息。故构建完善的基础征信体系,就必须得从源头提高合作公司信息的真实性和准确性。

4.2 实现内部数据标准的一致性和完整性

对于内部数据,第一步要做的就是改变之前区块分割、部门分开的风险管理体系,使用统一标准,链接交易前、中、后的数据。对收集到的外部数据,鉴于数据链条繁多和差异较大,就需要一起协商,共同推进数据标准制定。从交易开始到交易完成,由于各种可能情况的出现,导致信息变更,这就需要在统一标准下,对数据进行实时更新,尽量减少因数据分歧和遗漏所造成的误差。

4.3 加强安全监管和安全使用数据

在信用评估和风险预测中,很多信息涉及顾客隐私,如果不加强监管就会导致数据泄露。对于各种内外部数据,要严格注意合规使用,涉及客户隐私的数据要先脱敏再以产品或服务的形式进行使用或输出,既不丢失数据分析价值,又不会触犯国家法律。最后,加强数据安全管控包括建立客户信息保护机制和防范内部人员操作风险,也包括加强技术安全体系建设,防范外部非法窃取风险,加强对日常管理及系统运行进行密切监控,有潜在漏洞时及时修复,加强物理硬件的安全,保证在数据的收集、整理、分类、处理、存储等环节都没有失误。

猜你喜欢

化工行业信用风险信用
抗疫情,石油和化工行业勇做贡献
卡博特公司高管柯尚恩和朱戟共同表示采取共同行动推动化工行业可持续发展
信用收缩是否结束
化工行业的挑战:如何同时实现可持续发展和盈利
信用中国网
信用中国网
信用消费有多爽?
京东商城电子商务信用风险防范策略
个人信用风险评分的指标选择研究
上市公司信用风险测度的不确定性DE-KMV模型