APP下载

数据挖掘技术在农产品价格预测中的应用

2019-02-14杨柳青郝彦刘闯

农村经济与科技 2019年23期
关键词:主成分分析法数据挖掘

杨柳青 郝彦 刘闯

[摘要]近年来农业商品市场一直处于一种不稳定的状态,但是农产品是人们生活的必需品,针对市场这种动荡不安的情况应利用科学的手段进行专业的调整优化。在数据挖掘的指导思想下建立可靠的农产品价格预测模型,精准剖析市场需求,便于把握农产品的价格走向,稳定农产品市场。进行数据挖掘的第一步就是搜集数据,有足够数量的数据样本可以让实验结果更加准确,其次分析影响农产品价格的因素,利用主成分分析法在建立价格预测模型之前对其进行降维处理,最后根据各个价格预测模型的特性,搭建最合适的模型,提高预测结果的准确度。

[关键词]主成分分析法;价格预测;数据挖掘;农产品价格

[中图分类号]S-9 [文献标识码]A

1 研究的背景及意义

1.1 研究背景

随着世界一体化的发展进程越来越快,国内外市场关联密切,因此国内市场变得越来越复杂,市场的变幻莫测会给人们带来焦虑不安甚至会影响正常生活。而农业作为民生之根本,农产品市场的不稳定状态自然也是值得全球瞩目的热门话题。农产品所具有的特征是很特别的,在生产物流方面有不易于运输和存储,周期性很短,季节性区域性明显等特性;从消费者的角度来说农产品具有需求量大、安全性、新鲜度、产品的可替代性等特性;在物价方面具有动荡性及易受自然灾害影响较大的特性。

综上各种因素导致了农产品市场容易变换较为极端的性状。这种动荡不安的市场不仅会影响人们的日常生活甚至会产生恶性的蝴蝶效应。同时随着各种新兴技术的出现,迅速推动了农业现代化建设的进程。通过大数据采集、存储、分析和挖掘技术的研究和应用,充足运用好农产品市场领域中数目庞大、获取渠道宽泛、种类繁多的数据,逐步提高农产品市场取得和使用数据资源的能力,完成对农产品市场经济运行更确切的监管、剖析和预测是非常有意义的。

1.2 研究意义

目前我国的经济发展已经从高速发展转为高质量的发展,人们的生活品质逐渐提高,但是人民群众的生活日常始终离不开“衣食住行”,因此农产品的价格自始至终是人民最关注的事情。农产品的价格是市场物价的基础,正确的科学预测方法可以帮助供应商做出正确的决策,同时也能为人民群众的利益提供保障。信息时代的快速发展,我们生活中产生的数据种类繁多,数量巨大,人们已经不仅仅满足于得到简单、廉价的数据了,从这些复杂的数据中提取出对我们有效的信息就显得举足轻重。数据挖掘的应用领域十分广泛,将其与农业相结合,利用短期的预测数据可以对市场进行监控,稳定生产需求,保障人民安居乐业,维持市场秩序稳定。

2 数据挖掘概述

2.1 数据挖掘的概念

数据挖掘是指从海量而复杂的数据中利用算法找寻隐蔽于当中有效信息的过程并且数据挖掘是采用逐个剖析数据然后从大量的数据中寻找其规律的技术。根据数据挖掘的定义我们可以总结出以下几个要点:数据是真实、大量、有噪声的;发现的知识是可理解、有意义的;发现的知识是人们感兴趣的(这里的知识一般指的是规则、概念、规律以及模式等)。预料、可用和可适用三个表征应该是通过数据挖掘所得到的信息所具备的。

通常数据挖掘分为有指导的数据挖掘和无指导的数据挖掘两种。我们研究农产品的价格预测用到的就是有指导的数据挖掘方法,通过利用可用数据建立数学模型为生产者的决策提供有效依据。一个全面的数据挖掘过程主要会包含数据选择、数据预处理、挖掘算法以及知识的表达和解释。

2.2 数据挖掘的应用

当下,数据已然侵入到了社会的各大范畴,而数据挖掘技术也成为各个领域的热门话题。杨一鸣、潘嵘、潘嘉林等介绍主要的方法:时间序列方法中的基本方法 ARIMA,贝叶斯方法、人工神经网络、k均值聚类、决策树、关联规则等。这些方法已经广泛应用于股票市场预测、生物医药领域、房地产预测等方面,并且产生了不错的效果。如李冰岩对海量数据使用关联规则中的Apriori算法对这些数据进行合理分析,从中发现了隐藏的形式,提炼有意义的知识,辅助电子商务企业决策者及时制定市场策略,迎合市场需求,预测市场走向。从上述这些例子中可看出数据挖掘在这个信息爆炸时代的重要性。

3 数据挖掘技术在价格预测中的应用

3.1 研究方法

数据挖掘对于价格指数的预测方法大致可以分为两部分:定性分析法和定量分析法。定性分析法和定量分析法是相互成就的,它们彼此之间缺一不可。定性分析法在对事物进行判断时会带有个人主观意识,因此它只能得出大致的结论,结论并不一定客观。定量分析是在已有信息的基础上对数据进行进一步的客观分析,常用的定量分析有兩种:因素回归法和时间序列分析法。定性分析是定量分析的前提,定性分析为一系列的分析工作提供基础、确定方向,缺少定性分析那么接下来的定量分析将会毫无意义。

3.2主成分的提取

在预测农产品价格研究中我们需要进行数据建模,根据大量的不同维度的数据,利用数学函数将它们输入和输出之间的映射关系描述出来,而主成分的提取是为模型的建立奠定基础。

首先我们需要了解影响农产品价格的因素,通常农产品价格会受到很多自然因素和社会因素的影响,例如:农产品的进、出口量,国家的政策经济发展,天气及病虫害等,这些因素相互之间都具备着一定的关联性。因此在对其进行建模之前我们需要对数据进行预处理从而得到影响价格的主成分,利用主成分分析法可以对模型进行降维处理,避免过多复杂的数据会致使模型产生过拟合。

3.3 价格预测模型

在对数据进行预处理之后,需要选取适当的模型对其进行价格预测。价格预测理论模型大致分为以下三种:灰色预测模型、马尔科夫模型以及神经网络模型。

3.3.1 灰色预测模型。灰色预测模型是根据小规模的、残缺的信息,建立数学模型并做出战网的一种预测方法。灰色预测是对灰色系统做出的预测,它对时间序列短、信息不完全的系统进行建模分析,具有独特的功效。由于灰色预测模型所需要的样本数据小,演算便利,建模精准度高,因此它是小样本预测的高效工具。

3.3.2 马尔科夫模型。马尔科夫过程马尔科夫模型又称之为马尔科夫链,通常我们把时间和状态都是离散的马尔科夫过程定义为马尔科夫链。

3.3.3 神经网络模型。神经网络作为数据挖掘的一个重要组成部分,它的存在能便利的解决非线性和多变量的问题,这是利用一般数学模型很难解决的问题。并且在进行建模的时候只需要对其设置合理的参数,给予模型足够的训练样本,它就能通过强大的自学习能力找到输入和输出之间的关系,得到我们所需要的结果。

影响农产品价格的因素关联复杂,神经网络是最适合解决这种非线性问题的,同时为了提高预测结果的精准程度,可以使用多种神经网络方法对预测效果进行对比实验,得出最准确的结论。

4 结语

数据挖掘现在作为热门技术,已经渗透到了很多领域,而我国作为农业大国,农业的收入与国家的收入一脉相连,我们更加需要科学的方法来将农业可持续健康的发展下去。农产品价格的预测不仅能监测市场情况,维护市场健康有序的发展,同时也可以帮助生产者做出科学的决策。在科技强国的背景下,只有将农业与科技相结合,我国的农业才能欣欣向荣,人民才能安居乐业。

[参考文献]

[1] 陈金赛.基于神经网络的预测分析及其应用研究[D].杭州:浙江工商大学,2012.

[2] 许洋.前馈型神经网络算法优化分析[J].硅谷,2014,7(13):66.

[3] 解建强.基于BP神经网络的赣南脐橙价格预测研究[D].武汉:华中农业大学,2017.

[4] 靳占新,徐中一.大数据背景下物资价格预测方法[J].中国电力企业管理,2018(12):3-4.

猜你喜欢

主成分分析法数据挖掘
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
基于主成分分析的煤层气赋存影响因素分析
基于主成分分析法的高校财务风险评价指标体系构建
基于R的医学大数据挖掘系统研究
一本面向中高级读者的数据挖掘好书