APP下载

基于Excel下数据挖掘处理及应用的思考

2018-09-26全思皓

数字技术与应用 2018年5期
关键词:数据分析数据挖掘

全思皓

摘要:Excel软件是一种应用性与功能性较强的办公室应用软件,不同于Word这种文本工具,Excel是一种常用的数据处理工具,在数据挖掘与处理方面有读到的优势,本文基于这一前提,就Excel下数据挖掘与处理方法进行分析,并探讨Excel下数据挖掘与处理技术的实践应用,在大数据时代的今天,Excel软件的这一应用优势无疑是非常重要的。

关键词:Excel;数据挖掘;数据分析

中图分类号:TP317 文献标识码:A 文章编号:1007-9416(2018)05-0214-01

随着大数据时代的到来,各行各业都逐渐明确数据对于行业乃至企业发展的重要作用,数据挖掘技术也更多的应用于客户分析、精准营销、企业管理等各方面,并发挥出日益重要的作用。但就目前而言,除了少数专业人士之外,越来越多不具备专业知识的普通人也开始从事数据挖掘与分析的工作,相较于价格高昂、专业性强、应用难度大的公式与软件,Excel这种廉价高效的软件更加值得普通人尝试与应用。

1 Excel下数据挖掘处理方法

1.1 数据挖掘方法

在大数据时代,智能移动终端的逐渐普及使得各行各业与生产生活的各个环节都产生了大量的数据信息,这种情况下,要想从数据信息中发掘价值信息,仅仅依靠传统的手工计算方法是无法实现的,这种情况下,以计算机技术与信息技术为基础的数据挖掘技术应运而生。顾名思义,“数据挖掘”就是从数据信息中挖掘重要信息,在大数据时代下,各种数据挖掘技术与软件层出不穷,比如S-PLUS、SPSS等软件都在数据挖掘方面有着较好的应用效果。但同时,这些软件的应用也对使用者的专业性提出了较高的要求。Excel软件是一种表格软件,不仅能够制作表格、生成图表,还可以利用各种函数计算工具进行计算,同时兼具数据挖掘功能。比如,Excel软件中的数据透视表,就可以有效实现数据表的分层处理,而数据分层是数据挖掘的重要环节与重要内容;规划求解是数据挖掘中求取最优解的重要工具。

1.2 数据处理与分析

Excel软件的数据处理最为常见的方法是“筛选”“排序”等功能,以及常用的Excel软件函数功能对数据信息进行处理,以便于更加清晰明确地分析与处理数据。在对数据信息进行分析时,常用的方法是Excel軟件中的数据透视表、透视图、柱状图、散点图、描述性统计等功能,还可以运用其Z-test功能与回归模型进行数据信息的分析,以便于通过数据分析来对市场变动、消费者需求与商品采购等活动提供数据参考[1]。

2 Excel下数据挖掘的应用

2.1 规划求解的加载

为了更好地探讨与分析Excel软件在数据挖掘与数据处理方面的应用,本文以最优化问题为例进行分析与研究,以分析Excel软件在就最优化问题进行数据挖掘与处理方面的优势。一般来说,在安装Excel软件时,软件本身并不会直接反映与显示出来Excel规划求解功能,还需要进行重新加载处理,这个过程的操作顺序为:office按钮→Excel选项→加载项→转到…→规划求解加载项→确定。

2.2 最优化问题的提出

为了更好地分析Excel在规划求解方面的应用,更好地分析最优化问题,以某超市M为例,该超市为大型综合性超市,销售商品包括日用百货、衣服鞋帽、水果蔬菜、禽畜肉蛋等各种品类,在实际的运营过程中,就需要从全国各地批量购买大量百货商品乃至蔬果肉蛋。以M超市所销售的桃子为例,该超市采购的桃子主要来源于A、B、C三个城市,并且分别运输至BJ、XA、CS与LZ四个城市的分店,这四个城市分店分布于全国各地,桃子的运输路线及运输方式自然不同,这种情况下,平均每一箱桃子的运输费用与成本投入也就不同。假设该超市的四个分店所采买的桃子在A、B、C三个城市中并不品质与种类上的差别,那么出于经济最大化的考量,为了在最大程度上减少桃子运输成本的投入,则考虑到每个产地的生产能力与采购能力有限,在满足A、B、C三个城市市场需求的前提下,如何确定最佳的运输源头及消费区、最佳的运输路线与最佳的运输数量。

2.3 对数据信息的整理与归纳

为了更好地应对与处理这一问题,首先需要制作相应的工作表格并对相应数据信息进行整理与归纳。运用Excel软件对M超市商品采购成本最小化的确定过程中,需要基于相应的数据信息为基础,在实际的数据挖掘与处理过程中,所采用的函数为SUM与SUMPRODUCT两种,通过这两种函数来计算M超市在每个桃子产地的总采购量、运输量与运输总成本。

2.4 设置“规划求解参数”

并基于以上前提,对“规划求解”加载项进行运行,在相应的“规划求解参数”中进行相应参数的设置,并确定约束条件,在约束条件的限定费范围内进行数据挖掘与计算。本次计算包含三个约束条件,分别包括:(1)桃子在运输过程中的单位为箱,指定箱数为整数,没有零数;(2)桃子从产地向消费区的运输,要充分满足当地对于桃子的市场需求,因此供应量大于需求量;(3)从桃子产地运输的桃子总量,不能超过产地的供应能力与采购能力。同时考虑到这是一个实际应用问题,因此运输量决不能小于零,因此在规划求解参数设置中,必须设置“假定非负”这一项。

2.5 最优化问题的求解

在完成“规划求解参数”的设置之后,就可以单击规划求解中的“求解”这一按钮,就可以自动生成最优化运输量。经过计算,可以确定的是桃子产地A需要向CS分店运输桃子1200箱;桃子产地B需要向XA分店运输桃子800箱,性LZ分店运输桃子700箱;桃子产地C需要向BJ分店运输桃子1500箱。通过这种运输方式可以实现运输成本的最小化,为280000元[2]。

3 结语

为了更好地分析Excel中的数据挖掘处理功能的应用,以某超市为例提出了商品采购运输总成本最优化的分析。实际上,在大数据时代,充分熟练掌握Excel软件的应用技术与应用方法,可以有效实现对市场营销的优化,进一步提高企业运营质量与运营效率,减少运营成本的不必要消耗。另外,这种数据挖掘与处理方式,还可以应用于对产品性能的提升与研发领域。

参考文献

[1]崇美英,曲梦琪,黄宏博,王遵刚.基于Excel的数据挖掘处理及应用分析[J].北京信息科技大学学报(自然科学版),2016,31(01):90-93.

[2]彭娟.Excel在数据挖掘中的应用研究[J].电子技术与软件工程,2013,(14):142.

猜你喜欢

数据分析数据挖掘
基于并行计算的大数据挖掘在电网中的应用
浅析大数据时代对企业营销模式的影响
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究