一种基于k-means的客户信用内部分级评分模型
2023-04-29常宏伟
常宏伟
摘要:在金融行业不断创新发展的背景下,伴随着量化工具的快速发展,宏观经济环境和金融市场急剧变化,银行业面临的风险出现复杂化和多样化的特点,客户信用风险这一银行主要风险也在深刻剧烈变化,运用客户信用内部评分可以显著加强银行风险控制,基于k-means方式提出一种客户信用内部分级评分模型,能够动态、有效控制风险。
关键词:客户信用;内部分级评分模型;k-means;控制风险
一、前言
随着世界经济的快速发展,物流、资金流、信息流快速完成全球流动,金融作为一种重要的工具有效促进了经济全球化的快速发展,金融国际化是经济全球化的重要组成部分,主要表现为金融市场国际化、金融交易国际化、金融机构国际化和金融监管国际化。金融国际化推动了经济全球化的发展。金融国际化是指一国的金融活动超越本国国界,脱离本国政府金融管制,在全球范围展开经营、寻求融合、求得发展的过程。金融国际化是经济全球化的重要内容。但是我们也应该看到,目前世界发展的不稳定因素增多,经济增长乏力,霸权主义、极端主义等深刻影响世界的发展,逆全球化发展的可能性在增加,宏观经济环境和金融市场急剧变化,各个国家长期财政赤字,且规模越来越大。由于经济不振,银行系统长期采取货币宽松政策。从二级市场看,以量化为代表的算法和工具加剧了二级金融市场波动,银行业面临的风险出现复杂化和多样化的特点。银行主要以高杠杆的存贷款业务为主要盈利手段,提高风险控制能力至关重要,客户信用内部分级评分模式是提高风险控制能力的重要方法之一。
二、商业银行业务
(一)商业银行负债业务
即商业银行资金管理和吸收市场资金业务,其中活期存款最多。
(二)商业银行的资产业务
指将吸收来的资金进行贷款和投资业务。
(三)商业银行中间业务
即银行作为代销商或中间商合作开展业务,并收取代销基金业务等费用。
这是商业银行的三大基本业务,其中资产业务和中间业务主要由银行的业务能力和专业能力决定,不在本文的讨论范围之内,而贷款业务则是银行最重要的业务,也是银行的主要盈利来源。
三、商业银行贷款业务
信贷业务又称为贷款业务[1],是指发放给借款主体为具有完全民事行为能力的自然人或持有工商行政管理机关核发的非法人营业执照的个体工商户、个人独资企业、个人合伙企业业主的所有贷款,包括贷款本金和利息。这是商业银行主要的资产业务,通过放款收回本息,获得利润,信贷是主要赢利手段。由于贷款后款项不由银行掌握,因此存在无法收回本息的风险,所以应在遵守人民银行、银保监会建立的严格的贷款制度上,建立贷款的审核流程和客户分级评分体系[2][3]。擅长甄别优质企业的银行,从达不到债券市场门槛的企业中,去挑选出信誉好的企业,并获取较高的贷款收益率。这个收益率扣除了信息生产成本之后,依然会有超额。这部分超额回报,称为贷款业务的特许价值。因为如果没有银行的甄别能力,这些企业因为达不到在债券市场融资的条件将很难融资。这种特许价值是对银行甄别能力的回报。如果银行没选择去做这些甄别工作,而只选择去为那一群最安全的企业放贷,那么它们的贷款利率只能在债券市场的收益率附近,甚至是无风险利率附近。
四、商业银行贷款业务风险
(一)宏观经济环境
地缘政治冲突放大了经济周期波动[4],并且对全球整体经济活动产生长期负面影响,对美国、中国贸易,工业生产以及就业市场的影响将持续很长时间。同时地缘政治动荡也将显著冲击全球主要资本市场,这次俄乌冲突反应明显,全球各大主要股市都出现不同下跌。另外,地缘政治动荡将推升了全球的大宗商品价格,导致通胀的上升,在经济不景气的情况下致使各国央行陷入了政策矛盾中。
(二)金融市场环境
随着经济的快速发展和金融衍生品的开发[5],金融市场得以快速发展,但是在快速发展的同时,我们也应该看到一些问题。金融的创新首先考虑风险问题,但是很多金融产品的推出更多以盈利为目的,忽视了金融的复杂性,尤其是这些年来非标产品、P2P、互联网金融、打着信托旗帜的通道产品和业务,复杂的金融衍生品等严重冲击了有序的金融市场。这些产品和服务隐藏很多风险在其中,一旦其中一个暴雷,基于金融的关联性会来带系统性的风险,其潜在隐藏的风险不容忽视。
(三)商业银行主体
近些年来,随着经济增速放缓,银行增量市场减小,存量竞争激烈,经营压力增大。随着我国名义GDP增速放缓[6],银行业总资产增速中枢明显下移,近几年银行总资产增速基本在个位数水平。而在增量放缓的情况下,存量竞争日益激烈,银行面临净息差收窄、信用风险持续暴露等经营压力,净利润增速也处于低位,因此银行抵御宏观风险的能力有所下降,体现在银行的资产质量下降,不良贷款率上升、拔备覆盖率下降、坏账增加等方面。近年来,监管部门不断要求银行加强风险管理、压实资产质量,银行业整体风险可控。虽然当前银行业不良贷款率仍然处于高位,但考虑到确认力度增强,以及关注类贷款占比下降,当前银行资产质量风险比2015年前后的峰值水平已经降低,当前银行业整体风险可控。此外,目前银行业拨备覆盖率为197%,整体而言仍然有一定缓冲空间。
商业银行贷款业务的宏观风险和金融市场风险是由市场决定的,并不是银行本身能够控制相关风险,因此不做讨论。本文主要讨论银行主体控制的风险的能力,主要体现在授信操作业务流程和客户信用内部分级评分模型。通过授信操作业务流程规范操作步骤,通过客户信用内部分级评分更好的对客户进行画像,进行客户偿债能力分级评分,进而刻画客户信用内部分级评分,基于分级评分进行贷款额度的审批和发放。
五、商业银行贷款业务风险控制模型
(一)商业银行授信客户和授信业务评级业务的操作
客户经理对授信对象进行调研[7];对授信对象的政治、经济、法律、社会等环境进行分析;支行行长负责对客户经理授信对象风险评级、业务风险进行审批;授信调查员对上报的授信对象风险评级、授信业务进行审查;授信处高经负责对经审查员审查后的授信对象风险评级、授信业务风险评级进行审查;贷审会对经高经审查后的授信对象风险、授信业务风险进行审查;最终行长根据贷审会意见签署意见。
(二)商业银行客户内部信用分级评分分类
为了尽量减少违约事件(贷款无法收回成为坏账)的发生,商业银行需要对客户进行信用评价,对客户贷款的全生命周期进行管理。在这样的需求背景下,信用评级应运而生。商业银行利用客户的属性、交易行为、资产和负债数据,以及可获取的合法的第三方数据(例如中国人民银行征信中心)进行分析,探索客户特征与违约行为之间的关系,并将其发展成为信用分级评分模型,用于对新客户未来的信用表现做出预测。信用评级不仅在银行业得到广泛应用。
一般而言,信用评级分为内部评级和外部评级两种方式。外部信用评级是指第三方机构提供的客户分级评分;另一种是银行自行开发的信用评级体系。外部信用评级一般借用第三方信用数据进行评级。每家信用评级机构都有信用评价体系,而这种体系的形成与完善离不开数据的支撑,因此数据资源是信用评估机构最重要的生产物料。内部信用评级一般由银行利用自有数据和可获取的第三方数据资源建立模型,进行贷前审批、贷款定价以及贷中和贷后管理等银行客户信用内部管理领域中,实现了信用风险的量化管理,提高审批额度准确度和控制风险。信用评价的主要衡量指标就是客户的违约概率,评级方式一般有两种:其一,基于历史数据进行评价,一般应用于客户的准入和贷前审批;其二,基于客户当前行为进行评价,用于反映客户的实时信用状况,多用于贷中和贷后管理。
Lehmann认为内部信用评级作为信用风险管理[8-9]的重要手段之一,在进行信息的收集、分析及评价的基础上,银行在此基础上根据自己的模型进行客户分级评分,JPMORGAN开发了creditmetrics模型,kmv模型等指标。在商业银行内部,我国王学永指出银行内部存在评级方法存在落后问题,部分专家也提出吸收西方的先进经验,积累内部数据,优化权重,强化贷款五级分类问题等内部分级评分评级[10]方法。
六、商业银行信用评级分类
(一)商业银行贷款五级分类
根据《中国银监会关于印发<贷款风险分类指引>的通知》(银监发〔2007〕54号),商业银行至少应将贷款划分为正常、关注、次级、可疑、损失五类,后三类合称为不良贷款。这五级分类贷款是银保监会对贷款进行的一种分类方法,是一种通用分类方法,这种方法侧重于事后跟踪贷款情况。
(二)商业银行内部信用评级分类现状
银保监会的贷款五级分类主要服务于事后跟踪,但是在贷前的分级评分分类模型则由各个银行自己设定,从西方发达国家商业银行运用分级评分经验看,其将不同的类型潜在的信用风险进行整合和识别,运用标准化的模型进行量化,有利于商业银行信用风险管理的标准化和标准化。
从公开资料可查询到部分商业银行的分级评分方法。例如JN农商银行按照9级分类对客户进行分级评分,从高到低依次为AAA、AA、A、BBB、BB、B、CCC、CC、C,其将客户分为四大类,针对不同类型的客户,依据不同的评级结果进行分类,如表1所示。
例如某农信社提出的CRM经营模式,也是依据收集的客户信息对客户进行分类,针对性的提供差异化产品服务。客户信用评级分为三级指标,一级指标是客户的最终分级评分,二级指标是影响一级的重要因素,结合了客户的基本信息、家庭信息、资产信息等,三级指标又是二级的重要影响因素,主要是本人与家庭成员的负债情况,担保情况,违法情况等。在运用了层次分析法和德尔菲法[11],基于系统现有数据,形成定量为主、定性为辅的信用评价体系。
这些客户信用内部分级评分模型从基于金融理论为基础,从银行角度对客户信用[12]进行分级评分逐渐转变为基于金融理论结合行为学为基础,基于系统现有的客户多维数据进行客户画像,在此基础上对客户信用进行分级评分。但是这些分级评分模型存在一些不足:1.缺乏从客户信用角度思考进行分级评分;2.数据维度不足或者有效性有待提升。在此基础上提出了一种基于k-means的客户信用内部分级评分模型。
七、一种基于k-means的客户信用内部分级评分模型
基于人类行为学理论,实际上所有人的行为都是具有相似性的,因此基于数据挖掘模型k-means聚类模型可以反映出客户的真实行为,利用多维有效数据对客户信用进行内部分级评分。
(一)分级评分数据
结合系统存储的数据和有效数据分析,某大型银行S省分行采用了多维数据模型。1.客户基本信息(年龄,职业);2.交易流水(交易频次,交易金额);3.资产信息(存款、理财等);4.征信信息;5.资产负债比信息(资产、信贷、信用卡)。
1.客户基本信息Z1(年龄,收入)
年龄N信息按照分段评级,满分为1,根据风险承担能力服从类似正态分布,根据经验分为18岁以下(0.4),18—35(0.8),35—55(1),55以上(0.2)。收入信息W按照分段评级,满分为1,根据风险承担能力服从对数分布,根据经验分为6万元以下(0.2),10万元以下(0.4),20万元以下(0.5),20-50万元(0.7),50万元以上(0.8),100万元以上(1)。
客户基本信息评分值:J=α×N+β×W(1)
2.交易流水Z2(交易频次P,交易金额E)
从交易行为学角度看,交易流水频次和交易流水是判断客户行为进而对客户信用内部分级评分非常重要的一种信息,重点观察过去4个季度交易频次、交易金额的均值与极大值的关系。
根据数据库计算出过去4个季度的流水频次均值P;过去四个季度的流水金额均值E;过去一个季度流水频次P1,过去一个季度流水金额E1。
交易流水信息评分值:L=P1/P+E1/E(2)
3.资产信息Z3(存款、理财等)
资产信息即是一种时点信息,可以知晓客户的时点资产信息;也是一种动态趋势信息,可以通过资产趋势判断客户的资金实际使用情况。从交易行为学角度看,重点观察过去4个季度资产信息的均值与极大值的关系。
根据数据库计算出过去4个季度的资产均值?;过去一个季度资产均值Z。
交易流水信息评分值:Z3=Z/?(3)
4.征信信息Z4
征信信息是主要查询人行征信数据库返回的个人征信数据,根据人行返回的个人征信信息分为AAA、AA、A、BBB、BB、B、CCC、CC、C三等九级,评分依次对应评分为1、0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2九个评分。
5.资产负债比信息Z5(资产、信贷、信用卡)
资产负债比是判断客户风险能力很重要的一个指标,依据本行信贷条线的客户季度负债信息,包括信贷和信用卡的负债信息F、客户季度资产信息Z。通过这个比值,判断客户出现信用风险时商业银行可化解风险的能力。
资产负债比信息评分值:Z5=F/Z(4)
(二)聚类模型
聚类算法是数据挖掘中的一项重要技术,其目的是使聚类后同一类的数据尽可能聚集在一起,不同的数据尽可能分离。聚类模型既有有监督的场景又有无监督的场景。经过一定的改造,还可以适用于半监督的场景。聚类算法主要有k-means聚类算法,这种算法最为熟悉的聚类算法。它在许多的工业级数据科学和机器学习课程中都有被讲解。Mean-shift聚类是一个基于滑窗的算法,尝试找到数据点密集的区域。它是一个基于质心的算法,也就是说他的目标是通过更新中心点候选者定位每个组或类的中心点,将中心点候选者更新为滑窗内点的均值。这些候选滑窗之后会在后处理阶段被过滤,来减少邻近的重复点,最后形成了中心点的集合和他们对应的组。高斯混合模型(GMMs)具有更好的灵活性比k-means。使用GMMs,我们需要假设数据点是高斯分布,相对于环形的数据而言,这个假设的严格程度与均值相比弱很多。这样的话,我们有两个参数来描述簇的形状:均值和标准差。以二维为例,意味簇可以是任何一种椭圆形(因为我们有两个标准差在x和y方向)。因此,每个高斯分布会被分配到单一的聚类簇。这些算法都在不同的应用场景中有所应用。随着数据量的迅速增加如何对大规模数据进行有效的聚类成为挑战性的研究课题,面向大数据的聚类算法对传统金融行业的股票投资分析、互联网金融行业中的客户细分等金融应用领域具有重要价值,本文使用k-means模型对银行客户信用内部分级评分。
1.k-means模型
k-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心在发生变化,误差平方和局部最小。基于k-means算法进行客户信用内部分级评分其核心是使用模型算法对对象进行聚类分析,这种聚类分析是基于客观数据对对象分类,而不是根据人的主观意愿对对象进行分类,能够客观反映相似对象的关联性。
(三)客户信用内部分级评分模型
1.对每一个对象Z建立一个点向量Zi(ZZ1、ZZ2、ZZ3、ZZ4、ZZ5)。
2.根据本行内部客户信用分级情况,定义客户信用内部k个分级,初始选择k个点向量ZK(ZK1、ZK2、ZK3、ZK4、ZK5)作为初始的分级中心点,计算每个点向量到分级中心点的距离。
根据距离分级中心的距离,将不同点向量划分到不同分级簇。对于每一个簇找到其所有关联点的中心点,方法是取每一个点坐标的平均值,根据各分级簇的点向量计算新的分级中心点,重新计算点向量到分级中心点的距离,重新划分分级簇。这样循环计算,直到最近两次计算的分级中心结果相同停止。
八、展望
通过数据验证,运用k-means算法建立客户信用内部分级评分模型,该模型从客观的客户数据出发,能够较精确对客户信用内部进行分级评分。但是也需要看到,建模依赖的数据维度还是不足,模型还有待于优化,客户信用内部分级评分精确度还有待于提高。
参考文献
[1]周云强.我国商业银行内部信用评级问题研究[D].天津:天津财经大学,2013.
[2]马龙,刘凯旋.金融科技在商业银行服务企业客户领域的应用研究[J].经济管理文摘,2021(18):73-74.
[3]王学永.宁夏银行内部评级体系的构建研究[D].银川:宁夏大学,2013.
[4]刘军,胡莉娜,张艳.后疫情时代金融科技在商业银行中的应用研究[J].内蒙古科技与经济,2021(12):61-62.
[5]陈媛.金融科技应用的研究热点及发展趋势:基于Scopus数据库的可视化计量分析[J].福建金融,2021(9):59-65.
[6]李慧明.商业银行金融科技应用及风险监管分析[J].河北金融,2021(8):11-14.
[7]田欣.商业银行法人客户信用评级体系改进研究[D].济南:山东大学,2020.
[8]张喆.C银行客户内部评级研究[D].咸阳:西北农林科技大学,2020.
[9]崔凯.大数据背景下商业银行信用风险评价体系研究[D].邯郸:河北工程大学,2019.
[10]单翠.基于内部评级法的县域农村商业银行信用风险度量研究[J].时代金融,2019(26):149-150.
[11]智扬贺.C银行客户信用风险评级体系改进研究[D].沈阳:东北大学,2015.
[12]李景丽.我国商业银行内部评级法应用研究[D].天津:天津财经大学,2015.
作者单位:太原旅游职业学院信息管理系