浅谈新时期数据挖掘的运用
2019-11-12潘主强
摘要:随着计算机技术在新时代的发展,数据挖掘运用也越来越多,除了在银行金融、生物医学、电子商务等商业科研领域。在新时期,数据挖掘在公共管理领域也得到了进一步的运用。
关键词:数据挖掘;新时期;运用
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2019)25-0001-02
1 数据挖掘概述
1.1 数据挖掘定义
数据挖掘(Data Mining,简称DM)是从不完整、大量有噪声的数据中提取出有意义的模式知识的过程[1],挖掘分析的对象主要有数据库或数据仓库内容以及其它多种数据源。主要涉及统计学、计算机科学、高性能计算等众多学科,而分析是一个包含多步骤知识发现的过程[2],主要如图1所示[3]。
1.2数据挖掘内涵
数据挖掘是提取隐藏在数据集中的知识和信息,这些知识和信息尚未完全探索,虽然事先未知,但具有许多有用的知识,通过挖掘分析将其表示成最终能被人容易理解知识[4]。它不但能够从大量随机、有噪声、不完全的数据中学习已有的知识,而且能够发现未知的信息,所得到的知识既能容易理解,又便于应用、存储,这些知识可以在管理信息、决策支持、预测趋势、过程控制等许多领域发挥作用[5]。
2 商业及科研领域
数据挖掘研究具有广泛的应用领域,主要在金融领域、生物医学、电子商务中具有广泛的运用。
2.1数据挖掘在金融领域中的应用
在数据挖掘技术发展的早期,它已经应用于金融市场。早期在金融市场的运用主要是分析特定对象的演变或发展趋势,进而采取相应预防措施,突出的应用在信用评估和防止欺诈。较早前,Robert Groth等运用Neural network对进行股票走势预测[6],辅助客户制定稳健的投资策略。但随着互联网、第三方支付的发展与冲击,非银行金融机构借助网络对银行传统业务大规模“蚕食”,对银行产生了较大冲击,网络信贷开始崭露头角,数据挖掘也开始在网络金融借贷方面。陈等[7]以Weka为工具,运用数据挖掘对P2P网络金融平台借贷历史挖掘分析,使用Weka已有的算法及数据模型,参考借出总金额、时间、总次数指标,以聚类结果为导向,將出款人分为8种类型。以类型判断出款人的潜在价值,为管理者提供参考导向。而对于传统银行业,也在积极运用数据挖掘来提升其在存、贷、汇等传统业务的优势地位,进一步巩固开拓市场。
2.2数据挖掘在生物医学中的应用
数据挖掘在生物医学领域也有着广泛的应用。Vysis 采用Neural network为药品开发进行蛋白质分析[6]。在之前的研究中,数据挖掘主要是分析生物序列,试图找出某种未知的规律。随着深度学习的发展,数据挖掘在生物医学上也出现了新的研究应用。可以通过对已有的疾病数据运用数据挖掘学习,实现对患者疾病分类,间接对医生辅助诊断。张[8]等针对已有疾病数据的不均衡、多标记等特点,进行了不均衡、多标记分类研究,提高了相应的分类预测指标。洪等[9]结合目前深度学习在生物医学数据的最新应用情况,运用循环神经网络、卷积神经网络等深度学习模型,数据预处理、模型构建等方面的解决方法的分析,指出了深度学习在生物医学数据的发展前景。
2.3电子商务领域的运用
电子商务领域数据挖掘也有着较多的运用。随着新时期大数据的发展,通过分析交易平台历史交易数据,可挖掘出购物者在商品类型的偏好,对其实现精准推荐。同时,它可以协助电商平台运营,调整平台的销售策略和商品,进一步为消费者提供个性化服务。李等[10]在Spark平台基础上,改进了协同过滤(Item-CF)算法商品推荐系统(此算法基于新物品),并将其应用在公开的MovieLens数据集上测试。结果表明,该系统提高了相应的推荐指标并且降低时间复杂度。沈等[11]基于随机森林,设计了一个关于帖子浏览的推荐系统。该系统在数据处理、特征选择和调整参数等前期基础上,将实际问题与分类模型结合,形成新的新的分类模型,对用户推荐感兴趣的帖子,而且还对用户浏览后是否会产生交互行为进行了预测。通过提高推荐精确度等相应技术指标,数据挖掘在电商得到进一步深入。
3公共管理领域的运用
数据挖掘除了在上述商业科研领域发挥着作用外,也开始在电子政务领域、政府决策领域、数字经济等公共管理领域开始发挥着重要作用。
3.1 电子政务领域
电子政务的核心建立在是以互联网为基础的将政府管理和服务,建设以群众满意为导向的政府服务体系[12]。虽然政府部门多年来积累了大量丰富的数据,但是数据利用的频率和效率都很低,而数据挖掘可以解决这个问题。利用数据挖掘分析,“挖掘”和“提炼”政府部门的数据,使政府能够有效地安排和指导政府服务。通过数据挖掘分析群众在办事过程中遇到的难点、赌点,有针对性地推出相应的政策,制定便民的服务流程、制度,让“沉睡”的数据发挥更大的作用。让政务服务更具有针对性、满足更加个性化需求,这就是新时期电子政务的发展方向[13]。
3.2 政府决策领域
政府决策是公共管理中非常重要的组成部分,要充分满足群众在社会各项公共服务需求,体现人性化色彩,必须全面地了解社会公共服务的各方面数据,深入地进行分析、汇总从而制定相应的决策。然而,社会服务涉及广泛的数据,并且相应的数据量很大。通过数据挖掘分析处理这些已有的社会服务数据,从中挖掘出决策者想要的信息,有利于决策者更加科学、合理、有针对性的决策。利用基于数据挖掘的决策咨询系统,使政府能够更加有效掌握经济和社会运行的具体情况,使决策更加科学。
孙等[14]采用5层架构,通过全面的数据采集、建立决策数据仓库、采用适合数据挖掘算法,并根据用户需要对数据进行主题分类,在结果上采用直观的、可视化和支持查询的显示呈现。给用户提供了更加方便、更加具有针对性的决策体验。杨等[15]以数据仓库为基础,运用联机分析处理(OLAP)和数据挖掘,建设了政府经济决策系统,实现了对政府经济决策实现了有效的支持。
3.3数据挖掘在数字经济中的应用
数字经济是以数字资源为基础,数字技术和信息技术是其重要的驱动力,通过信息网络的连接形成了生产和消费等经济活动的总和。当前,随着新技术的发展,通过智能手机不仅可以完成看病挂号、缴付水电费等一般事务,而且还可以参与举报违法、纠正不实消息,报告重大险情、交通事故等,数字经济越来越多地用于民生领域。数据挖掘是数字经济智能化“引擎”,为数字经济的下一步发展提供了重要支持。
4结语
数据挖掘计算机领域中热门的研究领域之一,同时也是一个随着时代发展而不断发展的学科,在未来的领域中,会有着更加广泛的运用。本文主要从应用方面总结和阐述了当前数据挖掘运用的主要方向。在新时期,随着大数据等技术发展,数据挖掘的运用领域也会越来越广。
参考文献:
[1]王光宏, 蒋平. 数据挖掘综述[J]. 同济大学学报, 2004, 32(2): 246-252.
[2]叶磊, 骆兴国, 李建喜. 数据挖掘的应用和发展趋势叶磊[J]. 电脑知识与技术, 2006(32): 26-27.
[3]Han J, Kamber M. Data Mining : Concepts and Technique[M]. 2005.
[4]Zaki M J, Yu J X, Ravindran B, et al. Advances in Knowledge Discovery and Data Mining[J], 2013, 5476(4): xviii.
[5]刘力扬. 数据挖掘与数据库知识发现[J]. 河南广播电视大学学报, 2000(3): 42-43.
[6]滕广青, 毛英爽. 国外数据挖掘应用研究与发展分析[J]. 统计研究, 2005, 22(12): 68-70.
[7]陈雪改, 王飞. 基于P2P互联网金融的数据挖掘技术研究[J]. 重庆理工大学学报, 2017, 31(7): 151-155.
[8]潘主强, 张林, 颜仕星, et al. 中医临床数据疾病分类机器学习方法研究[J]. 计算机工程与应用, 2017, 53(13): 146-154.
[9]洪浩, 伯晓晨, 医学信息学杂志 李 J. 深度学习在生物医学数据中的应用[J], 2018, 39(3): 2-9.
[10]李星, 李涛. 基于Spark的推荐系统的设计与实现[J]. 计算机技术与发展, 2018, 28(10): 201-205.
[11]沈晶磊, 虞慧群, 范貴生, et al. 基于随机森林算法的推荐系统的设计与实现[J]. 计算机科学, 2017, 44(11): 164-167.
[12]刘典文. 数据挖掘技术在公共管理领域的应用[J]. 行政论坛, 2010, 17(2): 42-46.
[13]周民, 贾一苇. 推进“互联网+政务服务”,创新政府服务与管理模式[J]. 电子政务, 2016(6): 73-79.
[14]孙道远. 基于数据挖掘技术的政府决策咨询系统的研究与设计[J]. 长春工程学院学报, 2017, 18(4).
[15]杨越. 数据挖掘在政府部门决策管理系统中的数据与应用[D]. 解放军信息工程大学, 2012.
【通联编辑:王力】