APP下载

基于Apriori数据挖掘技术的粮情安全预测系统的研究与设计

2016-04-25郭小波胡坤伦

关键词:Apriori算法数据挖掘

郭小波,胡坤伦

(河南工程学院 计算机学院,河南 郑州 451191)



基于Apriori数据挖掘技术的粮情安全预测系统的研究与设计

郭小波,胡坤伦

(河南工程学院 计算机学院,河南 郑州 451191)

摘要:实现对粮情安全的预测、提高粮情检测的实时性,是降低粮食发霉变质等事故发生的重要保障.设计了一种基于Apriori数据挖掘算法的粮情安全预测系统,通过分析挖掘监控中心采集到的大量粮仓环境历史数据实现了精准预测,及早发现了粮仓的安全隐患,有效地防止了粮情检测不及时的问题.

关键词:Apriori算法;数据挖掘;粮情安全;粮情预测

粮食安全事关国计民生,保证粮食的安全储藏、降低储藏期的粮食损耗对保障国家的粮食安全具有重要意义.粮情安全预测系统是保证粮食安全存储的重要手段[1-2],是采用现代传感器技术和信息化技术构建的一个可以对粮仓实现全方位环境信息监测的现代化监控预测系统[3].

传统的粮食安全监控系统主要依靠单一的传感器对粮仓的温度、湿度、气体浓度等环境参数进行检测,进而判断粮食储藏是否发生了安全问题[4].文献[5]提出了一种基于数据融合的方法来实现对粮情检测系统收集到的温度和湿度信息进行融合处理,然后对粮情安全进行判断;文献[6]提出了一种基于ZigBee无线传感器网络数据融合的方法对传感器采集到的粮仓信息进行融合处理,可以直接将温度和湿度信息转换为粮食安全指标数据,实现了根据粮仓温度和湿度信息对粮情状态进行智能判断.但这些方法都只能判断当前情况,无法提前预测粮仓粮食的储藏状态,往往只能在已经发生了实质性安全事故之后才发现,造成了大量的粮食变质损坏[7-9].

在现有的粮情监控系统基础上,基于Apriori算法从粮情监控数据中挖掘潜在的粮情隐患信息,实现对粮仓粮情的安全预测和危险评估,提前预知该粮仓存在的问题,进而提前采取预防措施,有效避免了安全问题带来的粮食损坏[10].

1系统架构

1.1硬件

硬件系统主要包括主控计算机、主控机、智能控制柜和分布于粮仓的传感器、动作设备和大气监测设备.其中的动作设备主要对粮仓环境进行调节和控制,包括电动窗和通风设备等的控制[11];大气监测设备的功能是监控粮仓外部的环境信息,包括温度和湿度;智能控制柜运行控制程序,接收主控机的命令,实现对粮仓动作设备的控制,调节粮仓环境;主控机是整个系统的控制和存储中心,可将粮仓检测数据进行实时记录并保存到主控机的存储服务器上;主控计算机与主控机相连,主要运行粮情监控人机交互软件,实时显示粮仓信息,同时接收粮仓管理员的命令并对粮仓动作设备进行控制以调节粮仓环境[12].

1.2软件

图1 基于Apriori算法的粮情安全预测系统软件架构Fig.1 Apriori algorithm based food security situation prediction system software architecture

软件系统是本系统的核心,部署在Linux平台上,采用业界流行的Web三层架构模式进行设计,分为UI人机交互层、业务处理层和数据库存储访问层3个部分,整体的软件架构如图1所示.人机交互功能采用Jsp动态网页技术设计实现,将粮情状态信息和监控数据信息进行实时动态显示;业务处理层的主要任务是实现Apriori算法、基于Apriori算法的粮情安全预测及数据采集,采用服务的形式运行;服务器基于Boa开源嵌入式服务器进行搭建,为用户提供Web访问服务并将其运行于主控机上,采用开源数据库产品MySQL进行数据、日志等信息的存取.

2Apriori算法

本设计主要是通过Apriori算法来发掘粮情状态与历史数据的关联性.Apriori算法是一种常用的非常经典的数据挖掘算法,在目前大型的数据分析系统中常被使用.Apriori算法的核心是使用候选项集寻找频繁项集,它利用频繁项集性质的先验知识,使用一种被称为逐层搜索的迭代方法,可以利用k项集来搜索(k+1)项集.首先,遍历目标数据库, 计算每个项目的支持度, 记录每个项目或属性的出现次数,收集所有支持度不小于用户最小支持度的项目,它们构成频繁1-项集L1,之后用L1搜寻L2,用L2搜寻L3,如此进行下去,直至找不到频繁k项集时算法中止,整个过程可以分为连接和剪枝两步.

(1) 连接步.通过Lk-1与自身进行连接从而产生候选k项集的集合,标记为Ck.进而通过剪枝步得到Lk.

(2)剪枝步.Ck是Lk的超集,超集是指集合中的成员可能是频繁的也可能是不频繁的,但所有的频繁集都必须包含在Ck之中.通过对数据库进行扫描,首先确定Ck中每个候选集的相关数目,剪掉Ck中的非频繁项进而确定Lk.在该过程中Ck集合可能很大,容易导致系统运行处理花费时间过多而导致效率下降,可根据Apriori性质对其压缩.任何非频繁的(k-1)项集都不会是频繁k项集的子集,根据Apriori这一性质,如果一个候选k项集的(k-1)子集不在Lk-1中,该候选项集也不是频繁的,可以从Ck中删除.

3基于Apriori算法的粮仓情报数据挖掘系统设计

3.1收集信息的预处理

(1)项集的选择

并不是所有的关系数据库中的记录信息属性都可以进行数据挖掘,例如粮仓的名字、地址等,所以要先对无关的属性进行删除,将粮仓的信息参数如温度、湿度等可以参与数据挖掘的信息保留起来,作为后继数据挖掘的数据.同时,要把那些意义相同但是属性名字不同的信息进行归纳整理,使之变成利于使用和研究的数据.

(2)空缺值的处理

数据挖掘算法适合于无空缺值的事务数据库,可以用平均值法把空缺的值用平均值取代,即对粮仓的某项参数通过一段时间的测量,最后取其平均值放入空缺项中,或者把那些含有空缺值的记录行删除.

(3)字段中的连续属性值离散化

连续属性离散化的问题定义:若I是所有属性中的一个连续属性,I的值域为[a,b], [a,b]上的k个划分πk是由k个区间构成的集合.πk={[a0,a1],[ak-1,ak]},式中a0=a, ak=b.离散化过程就是在[a,b]上产生k个划分的过程,一次处理一个属性,就可以把这个字段的值映射成一系列连续的整数,把这些整数看作Apriori算法中的项.

3.2系统模型的设计

本系统通过Apriori算法对粮仓的历史温湿度信息进行状态评估和信息挖掘,以获取预测关联信息,从而为系统提供决策.通过配置文件实现Apriori算法的自动配置,生成模块配置文件,供执行体使用.Apriori执行体根据其服务的业务类型选取正确的配置文件并执行相应的算法,在系统中只要设计一个Apriori算法模块就可以供多个业务使用,极大地方便了整个系统的升级,算法的通用性和可维护性得到保证.基于Apriori数据挖掘算法的粮情安全预测系统模型如图2 所示.

图2 基于Apriori数据挖掘的粮情安全预测模型Fig.2 Food security situation prediction model based on data mining Apriori

由图2可以看出,整个系统数据由粮情基础数据库系统提供,包括外部环境数据、粮仓环境数据、历史安全事故数据、粮情状态数据4部分,通过Apriori算法执行数据信息挖掘找出粮情状态数据与外部环境数据、粮仓环境数据、历史安全事故数据及时间的关联性,进而发现粮仓当前潜在的安全风险,并对其进行置信度分析,如果置信度高即说明粮仓当前处于该粮情状态下的可能性高.

3.3数据挖掘系统操作平台界面

首先,通过Web界面选择挖掘数据并进行算法配置,运行效果见图3.文中采用的数据从黑龙江省肇源农场粮仓监控系统的数据库(数据从2010年1月1日至2015年3月1日,本数据时间长度对预测的实验结果无影响)中读取,包括温度、湿度、气压和降水量等信息.实验中选择的算法为Apriori算法,可以通过Web页面完成粮情预测前的系统配置.

Apriori算法相关挖掘参数的设置页面见图4,对温度、湿度、气压和降水量等监测数据按照设定的间隔进行设置并进行数据分段,同时设置好数据来源的粮仓和粮区编号.

图3 粮情安全预测系统数据和挖掘算法的配置Fig.3 Data food security situation and mining algorithms predict system configuration

图4 Apriori算法数据和相关挖掘参数的设置Fig.4 Apriori algorithm and associated data mining parameter settings

图5 挖掘结果Fig.5 Mining results

4实验与分析

经过以上信息配置,对相应编号的粮区和粮仓数据进行挖掘分析,挖掘结果和预测结果见图5.图5中的S表示安全事故等级,等级越高,表示发生安全事故的可能性越大.设置S0到S9共10个等级,T,A,B,P分别代表温度、湿度、降水量和气压,其中降水量分为10个等级,分别为B0~B9,其他参数均分为5个等级.挖掘结果显示,S8和T3,A3,B2的关联性较大,表明处于高温、高湿度和一般降雨情况下,粮食较容易发生安全事故,其置信度达到了18.3%.S9和T2,A4,B3,P2的关联性较强,置信度高达29.4%,表明温度处于室温时候,如果湿度、降水量、气压变化较大的时候,非常容易爆发高安全事故的粮食安全问题.使用本系统综合挖掘得到关联度联合时间变化的预测结果显示,最近一个月内该粮仓发生大于S6等级的安全事故的可能性高达56.1%,并且这些安全事故由温度和湿度过高引发的可能性较大.同时,还得到了近十天发生安全事故的等级为S3,其可能性为42.11%,该事故也是由温度和湿度引起的,所以管理员可以根据这些结果适当调整粮仓的温度和湿度,使温湿度处于合理的范围,防止粮仓发生安全事故.

综上所述,使用本系统可以很好地对近期的粮情安全事故进行预测,能够基于Apriori算法挖掘出可能导致该事故的原因,进而可以方便粮仓管理员做好预防工作.

5结语

在传统的粮情安全监控系统的基础上设计了基于Apriori数据挖掘技术的粮情安全预测系统,通过Apriori算法执行数据信息挖掘,找出粮情状态与外部环境数据、粮仓环境数据和历史安全事故数据及时间的关联性,发现粮仓当前潜在的风险,进而对粮仓安全问题进行预测,以便提前采取防范措施,防止粮食安全事故的发生,对提高粮食存储的安全性具有非常重要的意义.

参考文献:

[1]庞海锋,蒙艳玫,唐治宏,等.粮情智能测控系统中的数据融合技术研究[J].测控技术,2014(6):36-39.

[2]孔李军.基于信息融合的粮情测控系统智能决策技术应用研究[D].郑州:河南工业大学,2010.

[3]甘典文.基于ZigBee/GPRS的无线粮情远程数据传输终端的研究与实现[D].北京:北京邮电大学,2011.

[4]Chen S,Kozuch M,Strigkos T,et al.Flexible hardware acceleration for instruction-grain program monitoring[J].ACM SIGARCH Computer Architecture News,2012,36(3):377-388..

[5]钟志杰.基于“云外包”模式的粮情测控系统设计与实现[D].合肥:安徽大学,2014.

[6]SCOTT P M.Multi-year monitoring of Canadian grains and grain-based foods for trichothecenes and zearalenone[J].Food Additives & Contaminants,1997,14(4):333-339.

[7]甄彤,马志,张秋闻.多传感器信息融合技术在粮情测控中的应用[J].河南工业大学学报:自然科学版,2013(4):56-59.

[8]吴建军,张强,邹东尧.基于粒子群的神经网络改进算法在粮情测控中的研究[J].河南工业大学学报:自然科学版,2009(4):68-71.

[9]常青.物联网环境下的粮仓环境监测系统设计[D].西安:电子科技大学,2012.

[10]王婧.基于粒子群优化算法的粮情控制智能决策系统[D].郑州:河南工业大学,2011.

[11]张驰.基于无线传感网络的粮情在线监测系统关键技术研究与实现[D].北京:北京邮电大学,2012.

[12]徐鹏.粮情监控数据无线传输系统设计与开发[D].大连:大连海事大学,2010.

Research and design of food security situation prediction system based on Apriori data mining algorithm

GUO Xiaobo,HU Kunlun

(CollegeofComputer,HenanUniversityofEngineering,Zhengzhou451191,China)

Abstract:The achievement of food security situation and the prediction of grain situation to improve real-time detection are important safeguard to reduce moldy food and other accidents. To solve this problem, we proposed and designed a data mining system based on Apriori algorithm to predict food security situation, and analyzed a lot of historical data collected from the monitoring center of barn environment, then achieved food security situation for accurate prediction. The system can detect security risks of the grain in the barn, thus effectively avoid the problem of food situation cannot be detected timely.

Key words:Apriori algorithm; data mining; food security situation; grain situation prediction

中图分类号:S161.6

文献标志码:A

文章编号:1674-330X(2016)01-0074-04

作者简介:郭小波(1980-),男,河南新安人,讲师,硕士,主要研究方向为模式识别、人工智能与数据挖掘.

基金项目:河南省科技攻关计划项目(122102310441)

收稿日期:2015-10-15

猜你喜欢

Apriori算法数据挖掘
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
基于Hadoop平台的并行DHP数据分析方法
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
基于云平台MapReduce的Apriori算法研究
关联规则挖掘Apriori算法的一种改进
基于RFID的汽车零件销售策略支持模型
关联规则在高校评教系统中的应用
一种基于Hadoop的大数据挖掘云服务及应用