农业物联网中数据流挖掘技术的应用论述
2015-09-15王永青
王永青
摘 要 网络信息技术的普及和农业生产方式的转变,促进以“物联网”为基础的智能农业和精准农业的发展。现代农业生产应用物联网技术中的智能感知芯片、移动嵌入式系统,通过无线传感器网络实时监测作物或禽畜的生产信息数据,应用专家系统的技术措施,降低人力的消耗和对农田环境的影响,配置科学化的种植方式,实现农业的现代化发展。基于此,对物联网中数据挖掘技术进行分析,查看其在农业生产中的应用,为现代化农业提供技术保障。
关键词 物联网;数据挖掘技术;农业生产
中图分类号:TP311.13 文献标志码:B 文章编号:1673-890X(2015)24--02
农业物联网是有效结合网络技术、传感技术、信息处理技术、应用开发技术,应用射频识别装置、全球定位系统、红外感应器、激光扫描器等设备实现土壤温湿度、空气温湿度、光照强度、土壤元素含量、二氧化碳浓度等地理位置信息和环境信息数据的实时采集,按约定协议实现与上位机服务器的数据传输,并通过有效的数据分析,为用户展示直观图表或曲线,并结合实际生产需求和转接系统,对环境调控设施进行指令控制,实现最适宜家禽生产或农作物生产的环境调控,确保农业生产的数据化管理[1]。
1 物联网的关键应用技术
1.1 标签事物的射频识别
射频识别是非接触式的、可实现多目标的自动识别技术,具有数据储存量大、环境适应性好、读写距离远等特点,由电子标签(有源电子标签和无源电子标签)、天线、读写器3部分构成。该技术的工作原理是:电子标签进入读写器的工作区域后,无源电子标签接收到读写器发出的电磁波,产生感应电流获得能量,实现自身编码信息的发送,被读取器读取后解码后,发送至电脑主机进行相关处理。
1.2 传感网络技术
无线传感器网络是由布置紧密、分布随机的传感器组成的无线自组织网络,以协作地感知、采集和处理网络覆盖地理区域内感知对象的信息为目的,并将感知结果传输给观察者,实现农田操作的自动指挥和控制。
1.3 智能处理技术
智能处理技术是利用模糊识别、海计算、云计算等智能计算技术,分析和处理海量数据和信息,并对物体实施智能化控制和分析技术。云计算为农业物联网提供的处理控制功能,包含数据挖掘、模式识别、数据分析、搜索引擎、人工智能等技术。
2 数据流挖掘技术
数据流具有有序性、不可再现性、无限性、高速性、动态性、高维性等特点,需要具备联机、单遍扫描、多层多维等数据流处理功能的数据流处理技术实现数据流的有效处理[2]。
2.1 数据流分类算法
改进的Hoeffding决策树分类算法,使用恒定的时间和内存大小处理样本,解决内存、样本和时间对数据流挖掘的限制。改进的决策树分类算法保留传统决策树算法在精度和速度的优点,增加了对数据产生过程中变化趋势的检测和响应,实现算法对高速时变流数据分类的适应。
2.2 数据流频繁模式挖掘算法
针对数据流的频繁模式挖掘,提出了有效算法FP-Stream,采用倾斜时间窗口技术来维护频繁模式实现时间敏感问题的解决。FP-Stream结构由用来捕获频繁和准频繁项信息的频繁模式树和为每个频繁模式提供的倾斜时间窗口组成,实现了在数据流中可靠的估计频繁项集频率。
2.3 数据流聚类算法
数据流是随时间不断变化的无限过程,隐含的聚类随时间的动态变化导致聚类质量的降低,聚类算法需要完整储存数据,并能够根据原始数据实现聚类变化的追踪算法。要求聚类算法以简洁的增量式表达聚类,实现新数据的有效处理分析,对噪音和异常数据的处理按照要求保持稳健。
CluStream算法实现整个数据流在当前时间范围和任意时间范围内的聚类变化结果。该算法由在线和离线2部分构成。在线部分用Micro-cluster定时存储数据流的摘要信息,实现数据增量式的处理和更新;离线部分Macro-cluster通过对在线部分保留的中间结果再处理得到用户感兴趣的不同时间范围内的数据流聚类结果。
3 农业物联网的数据流挖掘技术的应用[3]
3.1 基本的统计和查询
通过数据库提供的统计和查询功能实现简单的数据挖掘需求,为用户提供有用的知识和信息。可以使用联机分析处理和数据仓库技术对农业物联网进行数据观察和建模,用于各种粒度的多位数据交互分析,实
(下转第页)
(上接第页)
现有效的数据挖掘和数据泛化。将质量信息与果蔬业务的多位数据看作数据立方体形式,建立数据立方体模型,通过联机分析处理的各种功能操作,实现每一粒度级别和在所有维的交互产生分层、聚集、汇总,达到统分分析、趋势分析、预测和查询的目的。
3.2 分类挖掘分析
分类挖掘分析,通过构建分类器实现采集数据中产品类别和产品品质的分类,预警某些类别产品可能导致的不良结果。
3.3 聚类挖掘分析
传感器数据的特点是偏向于原始数据的收集,需要应用数值离散化技术或概念分层技术简化和减少原始数据。通过泛化实现数据的意义和理解能力,有助于多层次数据流挖掘任务,便于挖掘结果的实际应用[4]。数据挖掘过程中,需要数据挖掘系统具备分布式挖掘的能力。无线传感器网络数据是大规模的数据集,分布式数据挖掘系统是在无线传感器网络中获得知识的最优工具。
利用聚类技术对数据进行类标签的确定,可以提取重要数据类或预测未来的数据趋势,获得更好的数据分类和预测,实现数据源组流对数据流的整合。进行数据流聚类,识别共同的行为特征,发现感兴趣的行为模式。
3.4 关联相关挖掘分析
农业物联网中环境检测传感器网络数据流涉及时间轴、温湿度、传感器电压电平、亮度、地理位置等,可以将不同地理位置的相同类型传感器急性分析,发现区域差异模式;用相同地理位置不同类型的传感器数据流发现交叉类型之间的相互关系等。通过无线传感器网络节点的地理位置和连通性对数据进行分析,发现关联模式,利用专家系统进行解析,探寻合适的经验借鉴,为农业生产提供技术支持和数据保障。
4 结语
依据对农业物联网的数据特点的分析,简要解析物联网关键应用技术和数据流挖掘技术,可以实现多维数据流的挖掘,结合先进的数据挖掘算法实现数据的有效关联和整合,提高最佳参数的准确率。通过专家系统的分析预测,为农业生产提供技术措施和服务,保障农业生产的合理健康发展[5]。
参考文献
[1]周泽学.农业物联网中数据流挖掘技术的应用[D].上海:复旦大学,2012.
[2]时雷.基于物联网的小麦生长环境数据采集与数据挖掘技术研究[D].郑州:河南农业大学,2013.
[3]刘艺.基于农业生产过程的农业物联网数据处理若干关键技术的研究[D].北京:北京邮电大学,2014.
[4]刘倩.面向农业物联网多环境信息融合的监测判别研究[D].上海:东华大学,2014.
[5]王磊.农业物联网中综合信息管理系统的设计[D].济南:山东大学,2012.
(责任编辑:刘昀)