基于Matlab的个人信用评估线性规划模型
2014-06-19黄炎
【摘要】信用卡产业虽然在我国发展时间不久,但已经成为各个银行激烈争夺的市场,对信用卡的信用风险进行有效管理已经成为当务之急。本文在参考各种文献的基础上,简要介绍个人信用评分及其常用的方法,重点介绍了利用线性规划模型解决个人信用评级的理论,并给出利用Matlab软件进行计算分析的详细过程。
【关键词】信用卡 个人信用评估 线性规划模型 Matlab
一、背景介绍
随着我国经济的快速发展,信用消费已逐步浮出水面,信用卡个人消费贷款的规模正在迅速扩大,各商业银行均把发展信用卡业务作为未来发展战略的重要组成部分。由于目前国内商业银行对信用卡业务的风险管理水平较低,管理方法比较落后,缺乏一套行之有效的个人信用评分方法也阻碍着信用卡业务的进一步发展。
二、个人信用评分及其常用方法
银行对个人信用评分的本质上是一种分类问题,对于信用卡的申请者,银行可以通过对申请者的相关资料进行审查把他们分为两类:一类是好客户,其风险较低,银行批准其信用卡申请;另一类是坏客户,其风险较高,银行将拒绝他们的信用卡申请。目前越来越多的计量方法被运用到信用评分领域,其中统计学方法主要包括线性回归、Logistic回归和分类树等;运筹学方法则主要是一些线性规划方法。大部分的信用评分模型都使用其中的一种方法,或者将几种方法结合起来使用。这里我们主要介绍线性规划方法。
三、线性规划模型建立
线性规划模型的原理如下:假设有一个样本库,其中含有nB个坏客户(标记为i=1,2….nB),nG个坏客户(将其标记为i=nB+1,nB+2,….nB+nG);以及从申请表资料中得出的m个预测变量,因此第i个申请者所有资料元素所构成的向量是(xi1,xi2,....xim).
一个最理想的信用卡得分评估是找到一组权重值wj(j=1,2,….m),在给定的临界值c的条件下,使得所有的好客户的得分都在该临界值以上,而所有坏客户的得分都在该临界值以下。但这种划分不可能在所有情况下都发生,因此需要引入一个非负变量ai允许可能发生的误差,为了得出使误差ai之和最小的权重值,可以用下面的线性规划:
目标函数:Minimize a1+a2+…..+anG+nB
约束条件:w1*xi1+w2*xi2+…..+wm*xim≤c+ai 1≤i≤nB
w1*xi1+w2*xi2+…..+wm*xim≥c+ai nB+1≤i≤nB+nG(ai≥0 i=1,2,…..,nG+nB)
在这个公式中,临界值c是预先确定的,我们可以通过改变c的值,得到不同的权重wi,从而可以得出不同的误差值来验证模型的精确度。
四、利用Matlab进行计算和分析
(一)筛选预测变量,并转化为数值变量
在进行个人信用评估模型的建立时,预测变量的选择和确定很大程度上决定了模型结果的优劣。在银行已有历史数据的基础上,借鉴国外学者总结出来的指标,可以预先确定9项指标变量为最初的输入指标,分别为年龄x1、性别x2、受教育程度x3、月均收入x4、单位性质x5、婚姻状况x6、资产金额x7、贷款金额x8、月均支出x9。我们可以根据线性规划模型得出的权重wi来判断对各指标的取舍,如果指标xj的权重wj远小于其他指标的权重,则可以考虑剔除这个指标,并重新进行模型的计算。
可以看出,有些指标并非定量指标,必须先量化,才能对其进行数学处理。本文建议量化的方法是对不同的级别进行打分,比如指标受教育程度x3,一般来说受教育程度与还信用卡的能力成正比,因此可以设定博士及以上为50分,硕士40分,本科30分,专科20分,高中及以下为10分。通过对得出结果计算误差值,我们可以判别此打分的合理性,如果按照这种打分得出的结果判别误差较大,就应该考虑换一种打分的方法,即增大或者缩小打分的分差。
下一步是将数据进行标准化,其主要功能就是消除变量间的量纲关系,从而使数据具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1。
(二)模型与matlab计算
在本文案例中,选择9个预测变量,300个坏客户和300个好客户经过一些简单的数学变形,可以得到:
目标函数:Min a1+a2+…..+a600
约束条件:w1*xi1+w2*xi2+…..+w9*xi9-ai≤c 1≤i≤300
w1*(-xi1)+w2*(-xi2)+…..+w9*(-xi9)+ai≤-c 301≤i≤600 (ai≥0 i=1,2,…..,600)
这里,我们将使用MATLAB 2012a的优化工具箱来进行计算,主要调用的函数是linprog,先假定分界点c=0.
矩阵C=[x11,x12,……x1,9;………………;x300,1,x300,2,….x300,9; -x301,1,-x301,2,…-.x301,9;………………;-x601,1,-x601,2,…-.x601,9;],行数是600,列数是9;向量b=[c,c,…….c,-c,-c,……-c],其元素为300个c,和300个-c;
在command window中输入如下:
>>f=[zeros(1,9),ones(1,600)];C;b;B=[1*eye(300),zeros(300,300);zeros(300,300),eye(300)];
>>A=[C,B];LB=[;;;;;;;;;;zeros(1,600)];[X,fval,]=linprog(f,A,b,[],[],LB);Y =X(1:9)
在不等式A*X<=b中,含有600个不等式,609个未知数,我们只需要前9个未知数即可,也就是权重w1、w2、…、w9。
五、结语
本文通过对线性规划方法及个人信用有关理论的研究,建立了商业银行信用卡的个人信用评分线性规划模型,并着重利用Matlab软件进行计算分析。线性规划模型理论简单,不需要假设条件,与实际经济环境相符。另外,在大量样本数据的基础上,可以应用Matlab反复计算和试验,对得出的结果进行误差的验证,并根据得出的权重和误差值进行预测变量及其量化的调整,最终得出较优的结果。
参考文献
[1]Freed,N and Glover,F.(1981a).A linear programming appproach to the diacriminant problems.Decision Sciences,12,68-74.
[2]石庆焱,靳云汇.个人信用评分的主要模型与方法综述.统计研究,2003,(8).
[3]迟国泰,许文,孙秀峰.个人信用卡信用风险评价体系与模型研究[J].同济大学学报(自然科学版),2006,34(4):557-563.
作者簡介:黄炎(1989-),女,汉族,江苏徐州人,香港城市大学在读,研究方向:金融与精算。