试论贝叶斯网络在用户信用评估中的应用
2018-12-21张洁琳
张洁琳
试论贝叶斯网络在用户信用评估中的应用
张洁琳
(中年民族大学计算机科学学院,湖北 武汉 430070)
近年来随着我国经济的不断进步与发展,越来越多的人开始使用信用消费,住房贷款、购车贷款等等一系列个人消费贷款行为都需要由个人信用当担保。当前我国已经将个人信用制度列入到国家信用体系当中,为个人信用消费打造了良好的平台。当前个人信用评估是个人信用制度的重要组成部分,实际应用过程中最主要的目的就是对有可能出现的信用风险进行定性方面的分析,同时进行科学严谨的计算,将消费者的违约概率计算出来,为授信方的决策提供相应的依据。基于概率估计的贝叶斯以及相应的贝叶斯网络分析模型在实际工作的过程中有着其他数据挖掘工具所不具备的优势。通过对贝叶斯网络进行分析,以最小风险决策准则作为基本原则,在对用户进行信用评估时建立了一种全新的用户信用评估模型。在对数据进行采集的过程中,通过交叉验证的方式对数据进行了验证,最终检测结果表明,在对用户进行信用评估的过程中基于最小风险准则的贝叶斯以及贝叶斯网络分类模式可以有效的降低信用评估的风险。
数据挖掘;贝叶斯网络;用户信用评估;分析;研究
0 引言
在贝叶斯公式的实际应用过程中,为了不断提高朴素贝叶斯分类其实际的工作性能,相应的科学技术人员不断提出相应的技术与方法。在实际研究过程中有人提出了具有树状结构的分类器,这类结构使得朴素贝叶斯中的独立假设性条件进行了有效的拓展,将整个朴素贝叶斯结构进行了显著的扩展,可以让每个属性结点可以依赖一个非类节点。此结构具备良好的综合性能,可以在学习效率与非类精度之间进行合理的调节。但是此种算法在实际应用的过程中首先需要构造一个以条件信息为权的完全无向图,然后构造最大权最终生成一种树状结构,得到一个TAN模型。通过实验对此类算法进行验证,在实际应用过程中若是选取的根节点不同最终分类性能会存在着极大的差别。因此,此类模型结构方法在实际应用过程中不能很好的反映各个属性之间的依赖关系。相应的科学技术人员在研究过程中通过依赖关系设定相应的方向,并且还将有向树算法引入到TAN分类器的构造当中,最终研究出一种新的TAN模型构造方法法。
1 在用户信用评估当中应用贝叶斯的意义以及具体应用方法
在实际进行个人信用评估工作时,不仅需要对消费者信贷的分类最大限度的作出正确的判断,还需要明确若是判断失误会带来什么样的后果。若是在对用户进行信用评估时把信用良好的用户误判为信用差的用户,这种判断失误最多是让银行失去一个客户,可若是将信用不好的用户错误的判断为信用良好的用户,造成银行的错误授信,进而给银行带来一定的的损失,我们通过分析可以了解到显然后者出现失误时对银行的损失更大[1]。
由于信用评估这项工作十分复杂,并且实际的应用性十分高,因此当前在对个人信用进行评估时逐渐开始采用贝叶斯网络对用户信用进行评估,此种技术的应用极大程度的降低了在信用评估过程中出现错误的概率。在实际进行分类分类决策的过程中,尽可能的降低出现错误的概率是十分必要的。但是在实际应用过程中还有比错误概率更加广泛的概念,那就是风险。在银行对用户进行信用评估时,可以将用户“违约”类的样本错误的定义为“不违约”给银行带来的直接损失与“不违约”类样本错度的定义为“违约”样本存在着很大的差别。因此当前以朴素贝叶斯分类模型以及贝叶斯网络分类模型为基础,引入了最小决策风险分类准则,并且在实际的应用过程中对相应的数据集进行了科学合理的测试。在当前对用户进行信用评估的过程中将决策风险分类准则进行合理的应用之后,TAN结果算法实际应用性能最好。
想要在实际应用过程中不断降低出现错误判定的概率,需要在实际应用过程中对于损失函数进行充分的考量。损失函数可以将每个具体的算法步骤进行充分的考量,并且将概率转换为一种判定手段。在实际应用过程中由一定的数集表示可能采取的行为集,相应的损失函数可以用来描述某一特定行为出现风险的几率。通过决策理论当中术语对其进行表述,一个预期到的损失情况可以可以当做一种风险,可以将其称为条件风险。在设定公式的过程中x为随机向量的观察值,在面对不同的观察值时采用不同的决策替代值[2]。
2 贝叶斯网络的理论基础分析
在实际应用过程中,降低的实际应用过程中的错误率,其实正是贝叶斯网络的实际应用核心目标。但在贝叶斯网络的理论基础建设过程中,其主要考虑的不单单是错误率的高与低,更为重要的是,考虑比错误率更为广泛的一个概念体系风险。尤其是将贝叶斯网络理论基础以及实践应用技能应用到个人的信用评估过程中,在对消费者贷款进行分类时不仅要尽可能地对消费者自身信用评估作出正确判断,还要考虑到当作出错误判断后如何进行解决。同样还要考虑到做出错误判断后所产生的后果,以及机构所要承担的额外风险。简单举个例子,如果将信用好的人评定为信用差的人。那么会对结果造成一定量的损失,但是后果是可以进行后期处理,甚至是能够减轻风险归零,但如果将信用差的人评定为信用好的人,那么所产生的后果以及危害将会大大影响到评定机构自身的效益。同样是错误,却会产生不同的影响结果。贝叶斯网络在进行使用过程中,不单单是属于对个人信用评定的一种方式与技能,更为重要的是在评定信用过程中避免风险的产生。要想使误判函数得到有效控制,就要考虑该种运算模式。在运算过程中对系统参数的把控[3]。
3 构建贝叶斯网络用户信用评估模型的相关介绍
3.1 个人信用评估指标集选择的五大原则介绍
从个人信用体系以及评估体系建立以来,我国的信用评估机构以及信用评估系统一直都依据着五 大选择原则对个人的信用进行综合评估。第一,个人品质,品质原则在信用评估过程中,其主要表现为借贷人按期还款以及自身诚实守信的程度,或者是按照借款时所签定合同归属内容之内,准时还清贷款的意向。而该种的评估原则也是个人信用体系在进行评估过程中最重要的一项评估原则,对消费者主要从三方面来进行其个人品质的鉴定,稳定性,信贷历史,职业以及个人声望。第二,选择原则就是对消费者的个人能力进行评估,在对个人信用评估过程中,一定要考虑到消费者自身是否拥有能够还清贷款的能力,或者其自身能否进行管理更为庞大的贷款业务,在进行考察过程中这些都是消费者自身的业务能力所体现出来的。第三,评估原则就是对消费者自身的资本进行详细审核,消费者自身的资本能够很好的体现出消费者是否具有良好的贷款能力以及还款能力,通过对消费者的资本进行审核与鉴定,可以更好地展现出消费者自身的综合信用水平,不仅能够通过消费者自身的资本总价值进行衡量,同时也能够通过对资本总价值的衡量,展现出消费者自身的能力是否足够支撑消费者自身的信贷业务的。在我国,像吴京的个人资本审核过程中,其中有一个问题是针对个人资本现金情况进行详细设定的,这个问题就是当借贷人以及消费者自身由于某些原因导致自身的收入产生大幅度变化,借贷人自身是否还拥有其他手段来偿还相应贷款,而在此次个人信用评估过程中对资本评估最主要的体现,就是在个人的财务报表上。第四,原则担保品,在进行对个人信用评估过程中一定要考虑到个人的总体资本是否符合信贷标准,而担保品也属于个人所有资产的一种[4]。对个人担保品审核过程中,审核内容主要有担保品种类,担保品自身还有价值,自身价值的上升空间,担保品的市场效益。第五个原则也就是个人条件,个人条件在个人信用评估过程中,其主要指的就是外在环境以及在外的因素对个人偿还贷款能力的影响条件。以上提到的五种原则其组成部分不仅有发散性属性指标同时也包括离散型属性指标,而在贝叶斯网络用户信用评估模型的建立过程中,一定要考虑到上述五个选择原则对模型的影响,在对模拟对象选择过程中也一定要根据上述五个原则来进行筛选[5]。
3.2 模型构造的相关分析
模型构造以及建设过程中一定要考虑两方面,第一,确定网络的结构,第4学习属性变量条件概率分布以及确定类先验概率。
首先,在该种方法的模型建设过程中,一定要选取两类不同样本,简称两类人。同时,两类人的总体人数比例要达到一比一持平的效果,然后对这两类人的整体生活评估整体信用评估以及对个人的整个消费情况进行仔细的掌握与了解,在进行分散性分裂过程中,要采取树状图形式将两类人进行区别分类,根据该种网络模型的运算方法,将每个人的信贷情况以及信贷变化参数设为未知量x,然后将其运用到建立系统的运算算法当中,通过信贷变化参数不同来计算出两类人,其自身的信贷服务区间,然后根据服务区的范围不同,将两类人分别进行仔细规划与分类,通过数据对比可以更好的观察出两类人之间所存在的信贷使用情况的变化范围。通过特殊算法与计算,可以将这类人的整体评估风险进行数据显示,通过该算法可以更好地将人们的评估信用。通过数字范围变化区间的方式展现到,自身的资本评估上,可以帮助评估机构更好地了解于掌握借贷人的自身整体信息,也可以更好地有效控制错误率[6]。
4 仿真实验
在进行模型建立之后,可以开展相应的仿真实验,进而采用不同的信用评估借贷方法,可以让人们真正的了解到自身的信用效果,同时也可以在开展过程中使评估机构选择更好的评估方法来真正和对人们的自身信贷信息,而同样通过此次的方面实验,大大展现出贝叶斯网络在用户信用评估中拥有更好的应用市场与应用前景,能够更加准确的分析出用户自身的综合信用,保证系统在进行信用评估以及信用分类,使更加准确减少失误率[7]。贝叶斯网络必须通过相应的模型建立,然后经过后期的仿真实验才能够真正体现出该种运算方法以及信用评估方法,可以真正将人们的自身信用信息进行综合总结,更好地展现出人们的信贷结果,帮助我国相应的信贷机构以及银行更好的控制人们的银行信贷情况,在我国传统的信用评估过程中说采取的方法在很大程度上不能够准确地将人们自身信贷结果进行仔细分类与划分,大大影响相应工作机构的工作开展[8]。比如传统的银行再进行消费者信贷评估过程中对消费者自身的信用情况评估的并不是十分准确,导致很多负债累累的消费者依然可以通过银行进行贷款,对银行自身的效益产生不良影响。而将贝叶斯网络计算方法应用到人们的信用评估过程中可以更好更精确的对人们的信用情况进行仔细评估,保证人们通过贝叶斯网络评估方法评估之后,可以更好的将自身的信用情况反应给银行,保证银行自身工作的工作效率,减少银行等其他机构的工作失误,维护社会信用体系正常发展[9-10]。
5 结论
贝叶斯网络在用户信用评估中的应用,不仅提高了用户信用评估的准确度同时也大大提高了银行以及等其他评估机构的自身工作效率,促进我国社会信用制度的稳定发展,保证了我国的人们信用评估机制得到有序的发展以及更好地完善,希望通过本文的仔细论述,可以起到抛砖引玉的作用,为我国的相应工作开展提供更好的帮助,同时也提高银行等其他机构对人们借贷情况或者是信用评定情况工作的精准度,保证我国金融行业以及信贷行业的稳定发展,使各行各业的发现能够有一个稳定性较高的金融后盾。
[1] 杨立洪, 叶成达. 贝叶斯网络在用户信用评估中的应用研究[J]. 软件导刊, 2018, 17(06): 146-149.
[2] 陆静, 王捷. 基于贝叶斯网络的商业银行全面风险预警系统[J]. 系统工程理论与实践, 2012, 32(02): 225-235.
[3] 王占孔, 王学丽. 基于贝叶斯网络的分层网络故障诊断[J]. 软件, 2011, 32(04): 87-90.
[4] 裘江南, 刘丽丽, 董磊磊. 基于贝叶斯网络的突发事件链建模方法与应用[J]. 系统工程学报, 2012, 27(06): 739-750.
[5] 余文辉, 王沾, 曾祥君, 等. 基于贝叶斯网络的多状态变压器可靠性跟踪分析[J]. 电力系统保护与控制, 2015, 43(06): 78-85.
[6] 陈骥群, 赵书强, 马燕峰, 等. 贝叶斯网络法与盲数相结合的配电网可靠性评估[J]. 电力自动化设备, 2015, 35(06): 112-116.
[7] 胡明礼, 张彩芬, 朱建军. 基于贝叶斯网络推理的双重不确定信息集结模型[J]. 中国管理科学, 2014, 22(02): 135- 141.
[8] 李旭升. 贝叶斯网络分类模型研究及其在信用评估中的应用[D]. 西南交通大学, 2007.
[9] 闫瑞姣. 基于社交网络的信用评估模型的研究与实现[D]. 中北大学, 2017.
[10] 何莉娟. 电子商务环境下的我国中小企业信用评估体系构建[D]. 西南财经大学, 2012.
Discussion on Application of Bayesian Network in User Credit Evaluation
ZHANG Jie-lin
(Computer Science School, Middle-aged University for Nationalities, Wuhan, Hubei 430070)
In recent years, with continuous progress and development of China's economy, more and more people begin to use credit consumption, a series of personal consumption loans,including and housing loans, car loans, need to be guaranteed by personal credit. At present, personal credit system has been included in the national credit system in our country, which has created a good platform for personal credit consumption. Personal credit evaluation is an important part of personal credit system, with main purpose of qualitative analysis of possible credit risks in practical application, and providing corresponding basis for decision-making of the creditor based on default probability of consumers through rigorous scientific calculation. Bayesian network analysis model based on probability estimation has advantages that other mapreduce tools can not compete in actual work process. Based on Bayesian network analysis and principle criterion of minimum risk decision, the article establishes a new user credit evaluation model when evaluating users'credit. During data collection process, result of data verification through cross-validation shows, Bayesian and Bayesian network classification model based on minimum risk criterion can reduce credit evaluation risks in credit evaluation process of users effectively.
Mapreduce; Bayesian network; User credit evaluation; Analysis; Research
P413
A
10.3969/j.issn.1003-6970.2018.12.044
张洁琳(1992-),女,研究生,研究方向:数据挖掘。
张洁琳. 试论贝叶斯网络在用户信用评估中的应用[J]. 软件,2018,39(12):194-197