APP下载

探讨嵌入式数据挖掘模型在银行卡业务中的运用

2016-12-20张鸿雁

梧州学院学报 2016年3期
关键词:调用银行卡嵌入式

张鸿雁

(晋中学院 信息技术与工程学院,山西 晋中 030619)



探讨嵌入式数据挖掘模型在银行卡业务中的运用

张鸿雁

(晋中学院 信息技术与工程学院,山西 晋中 030619)

针对既有数据的挖掘系统算法运行效率比较低、结构松散揭合等问题,建立嵌入式的数据挖掘相关模型,以便完成算法组件化的管理,同时把整个数据的流程归入到数据库中,这样不仅可以对数据的挖掘过程进行简化,而且能够大幅度提高数据的挖掘效率。

嵌入式;数据挖掘模型;银行卡

数据挖掘主要从相关数据库中挖掘相关知识,其是在银行卡数据储存方式的基础上,采取有效分析研究工具与方法,从传统失误型的数据库中获取深层次信息。但是,在数据的挖掘技术逐渐发展的过程中,怎样充分结合数据仓库的挖掘系统以及数据库的系统,开始变成数据挖掘中的一个重要问题。

1数据挖掘任务

1.1关联分析

通过关联规则的挖掘,可以发现很多数据项集间存在相关关系或者是关联性,如果两个以及多个变量取值间存在规律,就可称作某一种关联,如两个以及多个数据项取值间重复率比较高,就会存在关联性[1]。

1.2分类分析

分类过程需要找出相关数据,同时对概念模型与数据进行区分,这样对于标记与预测对象类比较方便。通常数据的分类主要包含两步的过程,也就是建立模型、使用模型。而导出模型主要在训练数据分析基础上,应用多种模式对挖掘数据进行分析。

1.3聚类的分析。

聚类分析主要是把数据与对象分为不同的类,在同类中对象相似度比较高,但是在不同类中,对象之间存在较大差异,其相似度主要是按照对象属性描述值进行计算,现阶段常用度量方式主要是距离。通过对聚类进行分析可以加强对于客观知识的了解,同时成立宏观的概念。

1.4异常的检测

在数据库中,相关数据有诸多异常的情况,对数据进行分析时容易发现,该异常情况容易影响到数据挖掘的准确性,需要引起人们的重视。而异常包含很多较为有用的知识,例如分类中异常的反例。异常的检测目的主要是为了寻找结果和参照间存在的差异,了解观察域值情况[2]。

2嵌入式的数据挖掘模型

目前,嵌入式数据的挖掘模型一般是使用各类数据库的访问技术,在数据的挖掘系统之中嵌入算法。这个模型支持根据相关标准规范开发挖掘的算法,同时将算法发布,并嵌入到各种数据的仓库以及数据库中,把数据库的功能转化为众所周知的、可以进行二次开发,便于发挥灵活的、通用的数据库功能。该系统一般包含用户层、数据挖掘层以及算法嵌入层等,这个系统模型从图1中可以看出。

图1 嵌入式的数据挖掘模型

2.1用户层与数据层

数据层一般包含数据仓库或者是数据库中元数据以及大量的业务数据,其是数据挖掘中的一个重要部分。在此模型中,用户层主要包含数据的管理人员、算法的发布人员以及数据的分析人员,可以让数据挖掘涉及更多用户[3]。

2.2数据的挖掘层

2.2.1预处理的模块

数据的预处理主要在数据的仓库中进行,其实现途径包含两条,其一,直接应用数据库管理体系SQL加工处理数据库中的各种数据,然后对数据表实施加工与处理;其二,与挖掘算法抑制,通过高级语言来实现,再将其嵌入数据库中,使得用户可像一般储存过程那样,可以对预处理的手段进行调用,再对数据实行预处理。

2.2.2关于结果处理的模块

相关结果的处理流程跟算法的调用一般都是保持同步,而在EXE的应用DLL的计算方式,其产生结果经常会返回EXE的文件之中。这时,该文本的结果在经过处理以后,可以写回到数据的仓库中,以便展示给相关用户。

2.3算法的嵌入层

算法发布的过程主要将算法发布至特定数据仓库的系统中,给数据仓库的系统中数据挖掘体系执行打下基础;而算法的调用过程一般是数据的仓库系统中执行,通常是通过数据库中储存使用户及时了解银行卡参数,再调出上一步的发布计算方式,对银行卡用户所指定数据进行挖掘。

2.3.1计算方式发布

首先,算法发布的过程一般需要将算法封装为DLL类型的文件,再将调用计算方式接口编译为EXE的文件,将算法DLL的文件以及相关EXE的文件发布至相关数据库中,而在相关数据库之中,储存创建的过程,可以称之为SP,其流程从图2中可以看出。

图2 算法发布的过程

2.3.2算法的调用

在实际调用的过程中,因为各种数据仓库的系统储存过程功能与大小存在差异,各种数据仓库的系统对于EXE的文件以及DLL的文件调用方式存在巨大的差别,因此,在不同的数据库系统下具体实现细节同样存在巨大的区别。在这个模型之中,数据库终端的调用储存过程,即SP,主要是指将用户参数与算法参数传入系统进行储存的过程中,再让储存系统对EXE的文件进行调用,通常EXE文件是用来处理储存的过程中所传入参数,以便对DLL算法获得挖掘结果进行调用[4]。

3嵌入式的数据挖据具体应用

3.1在银行卡的业务中对于嵌入式的挖掘数据应用

现阶段,在银行卡的业务上对于数据挖掘的技术应用,尚存在以下三方面局限。第一,效率比较低。尤其在进行海量数据的挖掘时,经常达不到预期的效果;第二,专业化的程度比较低,无法针对相关银行卡的业务实施挖掘。而嵌入式数据能够将传统管理转变为算法组件化的管理,换句话说,主要是针对各种银行卡开发情况选用相关组件的计算对策,而且,进行银行卡数据挖掘,能够准确地对客户进行归类,可以及时发现一些较优质的客户,同时嵌入式的数据挖掘能开发出单独计算方式,其目的是为了满足客户的分类需要。此外,嵌入式的数据挖掘体系属于灵活性比较高的一种数据挖掘体系,并且客户可在系统中改进算法以及添加新算法,便于实施二次开发,大幅度节省大型系统二次开发成本[5]。

3.2实例应用研究

为对嵌入式的数据挖掘中相关模型自身有效性进行验证,和央行的某分行进行合作,通过信用卡的业务数据,对比分析了非嵌入式以及嵌入式的挖掘系统运行情况,主要在PC机,即在HY DDR512M RAM与P42.5GCPU上进行测试,选择Apriori以及CMP两种数据的挖掘计算方式。所选嵌入数据库是SQLServer 2005的实验数据,由10000条如实记录至160000条的记录,对以上两种计算方式进行测试,可充分了解不同计算方式在银行卡数据集上,使用非嵌入式以及嵌入式的数据挖掘时,其潜在性能方面的差异,其中,在银行卡的业务中对嵌入式的数据挖掘应用一般包含分类挖掘与关联规则的挖掘。

3.2.1分类挖掘

分类挖掘需要按照持卡人交易方式以及使用情况,将持卡人群分成各种类别,一般分成流失的客户、优质的客户、潜在流失的客户以及潜在的优质客户等,这种分类方式是现阶段较为常用的一种分类方式。在整个分类挖掘的过程中,通过关联规则之中Apriori的算法,可以有效挖掘实例中存在的数据,其算法时间从表一中可以看出,从表1中的数据对比中能够看出,在银行卡具体业务数据的挖掘中采取嵌入式的数据挖掘,两种不同算法的计算效率都有明显提高。无论是Apriori亦或是CMP,计算效率均提高了两三倍,从实际应用情况来看,伴随银行卡业务数据量的增加,使用嵌入式的数据挖掘方式可以大幅度节约时间。换句话说,嵌入式的数据挖掘系统效果比较好,将其应用在银行卡的业务数据挖掘中切实可行[6]。

表1 Apriori算法

算法数据量(条)嵌入式(s)非嵌入式(s)Apriori10000403970492000832114664000020133304768000043086454016000092162145476

3.2.2关联规则的挖掘

经过对持卡人基本情况与用卡行为进行综合分析,可以导出具可信度、支持度比较高的用卡习惯人群,构成关联的规则。此外,在选用计算方式过程中,主要选取wangH等人所提出的:高效新型决策的数算法,也就是CMP的计算方式。将这种计算方式应用在实例中,效果比较好,如果实例中数据呈现出倍数增长,数据的挖掘需要时间从表2中可以看出。

表2 CMP计算情况

算法数据量(条)嵌入式(s)非嵌入式(s)100005025785320001052616136CMP4000021556330198000042884671321600008711013606

总而言之,应用嵌入式的数据挖掘系统模型,可以使挖掘计算方式变得更加方便与简单,此模型即将向着第四代数据挖掘模型系统发展,同时是商业智能化平台以及数据仓库体系的关键性发展方向之一。将新嵌入式的数据挖掘模型应在银行卡的业务之中,不仅能够对嵌入式的数据挖掘模型优越性进行验证,而且能够给商务智能化应用技术软件的升级提供参考。

[1]仲蓁蓁.嵌入式移动信息终端在银行自助设备配送管理中的应用研究[J].机械设计与制造工程,2013(12):23-25.

[2]赵竹明.数据挖掘技术对村镇银行信用风险预测系统的嵌入研究[J].青岛职业技术学院学报,2015(3):123-125.

[3]吕志刚.大数据驱动下的银行应用分析平台整合模式——广发银行统一数据挖掘分析平台实践[J].中国金融电脑,2015(8):

[4]郭佳.数据挖掘技术在村镇银行信用风险预测中的应用研究[J].科技经济市场,2014(6):67-68.

[5]黄昶君,王林.大数据助推银行零售业务量化经营——大数据时代的零售数据挖掘和利用探索[J].海南金融,2014(1):34-36.

[6]卓丽娟.数据挖掘在企业财务核算中的运用——来自第三方支付公司的例子[J].城市建设理论研究:电子版,2015(10):12-14.

(责任编辑:高 坚)

2016-03-18

晋中学院教学改革创新项目(ZL2016jg06)

TP368.1

A

167-8535(2016)03-0014-04

张鸿雁(1979-),女,山西寿阳人,晋中学院信息技术与工程学院教师,硕士,研究方向:计算机应用、数据挖掘。

猜你喜欢

调用银行卡嵌入式
复杂背景下银行卡号识别方法研究
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
银行卡被同学擅自透支,欠款谁偿还?
核电项目物项调用管理的应用研究
TS系列红外传感器在嵌入式控制系统中的应用
谁划走了银行卡里的款
搭建基于Qt的嵌入式开发平台
基于系统调用的恶意软件检测技术研究
关于审稿专家及作者提供银行卡号的启事
倍福 CX8091嵌入式控制器