数据挖掘技术在经济统计中的应用探讨
2018-04-28孙海军
孙海军
【摘要】在当今社会中,我国的经济统计随着社会经济的发展而发展,而且,就目前情况来看,经济统计的数据量也越来越大,因此为了该项工作能够更加准确,对数据统计者有了更高的要求,需要其更具专业性,能够深入的挖掘数据,而且随着数据量的不断增加,数据类别也相应增多,基于此,需要根据环境需要对数据统计的方式进行更新,更加全面、准确的提高数据统计的质量与效率,本文主要分析了数据挖掘技术在经济统计中的应用情况。
【关键词】数据挖掘技术 经济统计 应用
经济统计学是在经济领域内揭示数据规律的一门具体的综合性科学,该学科主要利用整理、分析、建模等手段对所收集到的信息数据进行分析加工,同时结合数学、经济学、统计学的相关知识不断完善经济统计学,推动其不断稳定发展。在社会大环境中,统计与分析的应用是十分广泛的,对企业发展有促进作用,但是,统计学挖掘数据处在探索阶段,需要我们进行深入研究。
一、数据挖掘技术应用到经济统计中的优势
其一,数据挖掘技术具有很强的综合能力。在社会发展过程中,经济发展离不开数据统计,两者相辅相成,互相影响,为了推动经济发展,必须重视数据统计。众所周知,管理部门进行决策时往往会参考经济数据统计的结果。然而,由于部门的细化和管理形式的不同,使得各种数据统计需求、统计类型、数据形式各不相同,阻碍了工作的正常进行。为此,在经济数据统计过程中,可以使用数据挖掘技术,实现数据形式的自由转换,满足不同部门的各种需要,从而推动经济发展。
其二,具有较强的数据实际统计效果。在经济数据统计过程中,数据挖掘技术起到至关重要的作用,能够在庞大的数据库中对经济数据进行统计分析以及适当加工,使数据由无序变为有序,提高了数据的科学性和有效性。当然,数据挖掘技术还能够探索出数据库中的价值性信息,充分发挥了经济统计数据的作用,在一定程度上也提高了数据信息管理的效率,确保经济统计信息的有效性和真实性,从而推动经济数据统计活动的顺利开展。
其三,数据挖掘技术适用性明显,范围广泛。数据挖掘技术可以应用到经济数据统计的各个管理部门,实现数据信息的有效整合,满足统计需求,为经济活动提供准确的数据参考,便于经济活动的顺利开展。为此,可以大力推广数据挖掘技术,使其作用发挥到最大化。
二、数据挖掘在经济统计中的常用技术
(一)决策树方法
决策树方法能够发掘数据中隐藏的具有价值的信息,可以进行分类预测,预测类型主要有类别型或连续型变量,是归纳推理算法的基本形式之一。决策树方法为了便于理解和解释,通常会采用图形和规则作为其模型形式。决策树也可称作分类树,其基本操作过程是利用离散值逼近目标函数,形成相应的分类规则,充分发挥决策树的作用和优势,预测分析相关数据,充分展现有效处理庞大数据的优点。决策树可以形成流程图式结构,在根节点到叶子节点之间对相关实例进行排列,然后进一步分类预测,完成一系列分类操作。叶子节点技能用于表示分类结果,也能表示变量测试,位于决策树的末端位置,而决策树的分枝则代表了变量测试的相关结果的可能性,体现了不同的分类规则。应当充分发挥决策树方法的优势作用,很好的处理数据,寻找有效信息。
(二)决策树在水上乐园的救生员人数决策应用
我们以一家露天游泳馆进行举例,相关负责人员特别重视对于救生员人数的确定,因为雇佣人数的合理性与资金的支出和劳动资源的合理利用之间存在必然联系,通过优化雇佣方案,可以节省开支,达到开源节流的目的。同时,还能够有效防止因为顾客过多,而人力安排不够导致的对现场不能控制。所以,负责人应该根据天气变化调整雇佣救生员的数量,从而达到效益更高。我们选取了7月份人们两周游泳的情况作为研究数据,通过分析以及决策树模型的结果,在确保经济利益最大化的情况下,对救生员雇佣人数做出判断。根据实际情况得出结论:在阴天的时候人们通常会选择游泳,当然也存在部分游泳爱好者会选择在雨天时去游泳馆游泳。
通常情况下,为了更好的了解人们的游泳意愿,可以对晴天和雨天进行具体划分,顾客大多喜欢湿度小于等于70%的晴天游泳,雨天可以分为有风、无风两类,一般来说,顾客更倾向于在无风的雨天来游泳。
我们利用决策树方法对相关数据完成分类和整理分析工作,通过对相关参数要点的把控,可以对该游泳馆所需要的救生员数量进行确认,该游泳场的负责人最好的方案就是选择雇佣大批量的临时人员,特别是在天气出现异常的情况下,救生人员的数量也需要随之增多,在潮湿的晴天和有风的雨天应减少救生员的雇佣量。这样,该游泳馆的经济效益可以得到提高。
通过对上述案例的分析探究,我们能够清晰的看到决策树可以利用图形和规则分析数据,为企业的发展决策提供依据,有效提升经济效益和社会效益。
(三)数据集成
数据集成通常分成两种方式,第一种为模式集成法。面对现代化信息技术的发展壮大,很多科研领域进行数据挖掘都会应用到计算机技术,但是,在大数据的发展背景下,数据之间表现出来的关系也较为复杂,想要对同一文件内的内容进行有效识别和整理,就需要完成数据集成模式,便于对不同数据之间的关系进行把握控制。
第二,冗余问题。我们所说的冗余是对于数据之间存在的相关性进行有效判定,把存在一定联系的数据,运用数学代入法,运用到计算公式中,判断r的值和1以及0的关系,绝对值趋近于1的,表明数据之间存在的相关性越大,这种计算方法最常见于我们国家的购房价格和人们平均收入方面,可以以此判断出人们的购房能力。
三、结束语
综上所述,在经济统计管理中运用数据挖掘技术,能够发现并收集到所有有价值的数据,对这些数据进行汇总分析,不断提升统计数据的有效性和科学性。进行数据统计管理过程中,有效运用挖掘技术,不但可以有效节约经济数据统计效率,还能够保证数据统计的精准性,适合进行大范围推广应用。
参考文献
[1]劉西清.数据挖掘技术应用于经济统计中的研究[J].人力资源管理,2016(10).
[2]陈华彪,游新彩.关于数据挖掘技术在经济统计中的应用[J].经济视野,2017(5).
[3]李荣.关于数据挖掘技术在经济统计中的应用[J].中国商论,2015(2).
[4]许佳捷,郑凯,池明旻,等.轨迹大数据:数据、应用与技术现状[J].通信学报,2015(12).