基于Java的信用卡数据挖掘系统
2017-02-21矫世全
矫世全
辽宁锦州渤海大学信息科学与技术学院
基于Java的信用卡数据挖掘系统
矫世全
辽宁锦州渤海大学信息科学与技术学院
随着银行信用卡市场在全球普及,信用卡在消费中占主导地位,大多数银行信用卡业务都能为本行增加经济收益,银行尝试在信用卡业务上创新或者优化信用卡管理,银行信用卡原始数据量巨大,通过分析原始数据挖掘潜在的商机,本文基于决策树算法实现银行信用卡数据挖掘的功能,实现决策信用卡业务功能。信用卡的数据库中存在大量数据记录,通过数据挖掘建立信用卡客户、业务功能模型,统计分析信用卡的业务模型以降低银行信用卡的运营风险,该系统构建以业绩统计分析、银行收益分析、重点业务领域分析等综合性数据挖掘管理系统,促进银行信用卡业务良性发展。本系统因信用卡实现数据挖掘具有可行性,针对于信用卡的数据挖掘建立挖掘模型,信用卡数据挖掘分析系统的设计对银行经济收益具有实际应用意义。
Java 银行 信息卡 数据挖掘 决策树算法
1 引言
银行信用卡业务量不断增长,基于数据库统计分析、存储录入、业务办理等功能,由于信用卡数据量大,数据组织存储凌乱,根本无法预测或者挖掘数据之间关联,更不可能根据某种规则挖掘信用卡未来业务的发展趋势。信用卡管理缺乏基于原始数据挖掘数据之间的关联,银行信用卡业务为了夺得客户和市场,实现银行信用卡业务长远的发展。银行通过数据挖掘系统深入分析不同信用卡客户的实际需求,寻找潜在客户源,为其提供有针对性的信用卡业务服务,是银行提高市场占有率的关键,因此,基于数据挖掘方式实现客户关系挖掘、重点业务挖掘等便成为银行研究的重点问题。
信用卡成为现今普遍的支付方式,代表着信用凭证。信用卡业务集成了“存、贷、消”三种常用的功能,这是实现无纸无现钞时代,它促进社会经济发展和各类商品销售,拉动国内经济增长,对社会发展起到促进作用。
由于信用卡性质,需要实施基于数据挖掘手段整合信用卡业务需求。另外,银行信用卡业务种类繁多,可能存在信用卡种类与客户群不对称的现象,务必会影响到信用卡发展趋势,银行使用信用卡业务的风险和获取利润并存。因此,银行有必要对数据库中的原始数据进行整合,实施有效地数据组织操作,将数据挖掘后的原始数据进行分析和归类操作,可以帮助银行推行信用业务,同时能够准确地预测未来发展。
2 信用卡数据挖掘系统设计与实现
2.1 系统功能性需求分析
本系统划分为一级功能模块和二级功能子模块两种。其中一级功能模块账户管理、信用卡管理、数据挖掘管理、信用卡激活管理;二级功能模块申请开卡业务、账户管理、开户管理、信用卡管理、统计交易类型、统计交易金额、统计交易次数、统计客户分布、统计查询和激活功能。
①申请开卡:客户通过银行信用卡系统实现客户资料填写,完成信用卡开卡操作;
②账户管理:系统管理员实现对账户进行管理,修改信用卡状态、管理信用卡业务;
③信用卡管理:实现对信用卡类型、额度、状态等进行综合性管理操作;
④数据挖掘管理:统计交易类型,实现信用卡不同类型的统计操作;统计交易类型,统计信用卡交易类型;统计交易额度,统计某个用户一段时间内的交易额度;统计交易次数,统计银行信用卡用户表在一定时间内的交易次数;
⑤信用卡激活操作:系统的管理人员通过信用卡账户或者身份证号查询或者激活操作,当信用卡开通之后必须进行激活才能进行后期的使用,包括:“存、贷、消”三种常用的功能。
2.2 系统非功能性需求分析
本文研究的信用卡数据挖掘管理系统的非功能性需求:
2.2.1 界面要求
要求该系统的功能界面按照统一界面风格设计,追求系统界面中控件布局合理、风格一致。
2.2.2 功能扩展性要求
系统的新功能扩展要求采用远程服务器端进行功能扩展升级设计方案,其目的是当信用卡需求变更为新功能时,只在远程的服务器端更新即可实现异步更新,使得系统新功能扩展的需求。
2.2.3 安全性能要求
为了保障系统安全性,避免系统在运行过程中受黑客恶意攻击,当前的网络环境下传输数据并不安全,如果对传输数据进行安全性保障,需要对传输的数据进行加密和解密操作。
3 系统的功能结构设计
3.1 系统的总体设计目标
信用卡数据挖掘系统实现的设计目标:
①系统资源整合操作,整合信用卡中心的原始业务数据,实现原始数据实时共享。
②方便办理银行信用卡业务。
③信用卡数据挖掘系统并不是直接传输数据,而需要对原始数据进行加密和解密操作,数据保密性较好。
④系统的新务功能进行扩展操作,例如:网上自助查询与服务管理功能等。
⑤软件界面简单快捷,有利于客户和管理者在实际信用卡管理过程中投入使用。
3.2 基于决策树算法信用卡数据挖掘算法描述
本文基于决策树算法来实现对银行信用卡的原始数据进行数据挖掘操作,决策树一度是数据挖掘实现的经典算法。算法巧妙的通过对已知训练原始数据建立决策关系,再根据建好的决策树模型实现对原始数据分析和归类操作。建立决策过程可视为原始数据规则分类过程。
本文的基于决策树构建数据挖掘系统的模型步骤如下:
①选择经典的决策树算法将银行信用卡原始数据进行初步的分类与分析;
②经过预处理原始数据,由于银行领域的数据特殊性和系统中存在大量的原始信用卡数据,如果想要通过对原始数据进行挖掘和应用,根据决策数据模型发现潜在原始数据汇总的重要的价值信息;
③基于决策树算法训练信用卡原始数据样本,构建信用卡数据挖掘管理模型,而基于决策树算法训练获取决策树应用模型,更易于对数据挖掘的理解;
④根据应用模型获取的关于原始数据分类结果,在本文的系统中存在功能模块实现对原始数据的分类与评估操作,对信用卡的原始数据挖掘过程和挖掘结果进行排序,银行信用卡中心工作人员根据数据挖掘模型所获取关数数据集合;
⑤最后将数据挖掘得到的整合数据采用图或者表或者图标结合的方式展现给银行信用卡中心管理人员,以一种直观可视化的方法便于对现在的业务分析和对未来信用卡业务发展动向进行预测。
3.3 基于决策树算法信用卡数据挖掘算法实现
在设计数据挖掘过程中,决策树的决策路径表示信用卡原始分类的路径,对于给定的某个信用卡原始数据集合D而言,对于已经输入的变量I值,表示输入变量值表示要选择的数据挖掘算法序号值,如果在原始数据中要获取到N个数据分类路径,由于管理人员输入的变量存在不确定性,如果给定样本数据集合D存在多种分类结果时,当分类结果视为数据增长的决定性因素,根据决策树的路径实现的对给定的样本D进行数据分类,其评价值作为熵,为了下一步数据N的分类,定义分类函数F,其输入参数为给定样本数据集合D和表示数据挖掘算法序号I值,函数公式记作:F(Di,I),函数公式1表示为:
公式1中:i为n个数据样本的第i个数据集合,n为总的数据集合总数,I表示序号,D给定样本原始数据集合。
算法1 基于决策树算法的信用卡数据挖掘过程input: D,I; //输入D样本原始数据和I序号,存在系统中的数据挖掘分类算法序号output: G//输出对原始数据样本的数据挖掘分类关系图; 1:初始化 G←null,T←null; //初始化数据挖掘的分类图和空值决策树2:switch(I);//根据参数I值判断使用数据挖掘算法,本文定义I=1为决策树3:for i←0 to D.length;//根据循环预处理原始数据样本4: D←P(D);//根据预处理函数还原给原始样本数据5:end for; 6:T←decisionFunction(D,I);//构建一个以原始数据为准的决策树7:List list←select data node and path on decision tree; //从决策树的数据节点上选择路径作为本次挖掘数据结果8:for i←0 to list.size;//根据循环取出本次挖掘数据结果9: G←list.get(i)//获取数据节点,将此节点添加到数据挖掘分类图中10:end for 11:end switch 12:return G;//返回一个原始数据挖掘后的关系图
算法1关于决策树应用过程和算法伪代码实现设计,实现了从样本原始数据的构建信用卡决策分类数据,并将分类数据节点的路径以图或者表或者二者结合的形式表示,形成的数据关联图即直观观察,又便于信用卡中心对信用卡业务做出决策。
4 系统测试
4.1 系统测试目标与测试原则
针对数据挖掘系统,可使用相关测试工具完成系统的测试工作,预期目标如下:
4.1.1 整体测试目标
系统业务功能按照最终的需求分析设计,无严重缺陷即可,系统性能指标核系统响应时间在允许的范围内。
4.1.2 功能测试
功能基本实现,每个功能之间完整通畅。
4.1.3 性能测试
多用户、高并发、多任务访问服务器均能符合相关要求,并支持较大大数据并发量查询性能,性能测试在允许的范围内。
4.2 系统测试结论
4.2.1 系统优点
通过上面测试可以发现数据挖掘系统功能上符合前期需求,为信用卡中心提供了良好应用平台,一是能够实现信用卡数据挖掘管理,二是为信用卡业务提供科学决策依据。
4.2.2 系统不足
系统对外接口未实现预留,随着银行信用卡业务不断增多,信用卡数据挖掘会带来巨大方便,该系统某些实用性的功能还需进一步扩展,更好的为信用卡中心服务。
5 结论与展望
本文研究的主要工作:
①做出符合银行信用卡管理的需求分析。
②通过研究信用卡数据挖掘的成功案例,再加上前人论文的借鉴基础上,熟悉Java编程语言的开发工作,熟练掌握了关于面向对象编程基本思想。
③分析本文所开发系统涉及到的关键技术与软件设计思想,其中包括:编程技术和数据库技术。详细设计完成了系统的基本功能模块实现,并为未来的信用卡业务发展预留部分待功能扩展接口,方便该系统扩展升级操作。
信用卡数据挖掘的需求会随银行信用卡业务进行不断更新,有变更需求的系统软件功能也随着发生改变,信用卡功能内容也随着不断丰富。信用卡数据挖掘管仍然存在一些不足之处,这些待改进的地方有望在今后研究中加以着重改进和完善的方面。
[1]沈阿强,陈洁,秦娟.大客户关系管理流程与实务[M].北京:人民邮电出版社,2007
[2]杜丽英,赵秀菊.基于数据挖掘的银行客户关系管理系统的研究[J].计算机光盘软件与应用,2014,1:18-19