云计算平台下物联网数据挖掘研究
2021-04-09山东华宇工学院高晓川
山东华宇工学院 高晓川
在新时期环境下,互联网技术在各个行业中得到了广泛使用,这也推动了物联网技术得到快速进步与发展。在物联网环境内,往往存在的数据呈现海量的特定,这些数据尽管数量和规模庞大,但其具备着很大的应用价值,因此各个行业逐渐对物联网数据挖掘十分重视。为了更好实现物联网数据的挖掘,云计算平台为其提供了便利,下面,文章就主要针对基于云计算平台的物联网数据挖掘进行研究,希望对相关工作的开展提供帮助。
物联网是现阶段社会发展的产物,它将互联网和各个行业实现密切联系,有效推动了行业的信息化和智能化发展,对促进我国行业的现代化发展至关重要。在物联网发展中,数据挖掘是重要的功能发挥途径,如何实现物联网内数据的有效挖掘是现阶段物联网发展中的重要内容,而云计算平台对其数据挖掘提供了良好的技术支持,基于云计算平台的物联网如何进行数据挖掘,就是文章主要研究的内容。
1 物联网和云计算
对于物联网来说,它主要是指借助各种信息的传感器、GPS系统、激光的扫描器、红外的感应器和射频识别的技术等各类装置和技术,对任何需要连接、监控和互动等物体或者过程内,声、光、电、热、力学、生物、化学和位置等所需信息进行采集,借助各类可能性的网络实施接入,从而实现物和物以及物和人泛在的联系,进而达到对物品智能感知、辨别与管理。在物联网中,整体可概括成三大特征,主要包括充分借助现有技术对信息感知,通过电子标签对基本信息进行了解;其对信息传递进行可靠性的提供,同时具备有线网络的信息输出和无限网络的信息传输手段,常见的有借助传感器的网络和其它通信等进行信息的获取和传递,且确保信息的传递具有良好可靠性;能够实现数据的智能化处理,借助模糊识别和信息处理等技术能够对海量、异构的数据实现高效地处理,促进信息整合有效性进行提升,确保数据的运用效率以及对物体的智能控制效果。
对于云计算来说,它是一种分布式的计算,主要是借助网络云把巨大数据计算的处理程序实施无数个数量小程序的分解,后借助多部的服务器所构建的系统对小程序获取的结果实施处理与分析,且向用户进行反馈(云计算的概念示意图如图1所示)。云计算作为一种分布式计算的平台,对大量的数据挖掘具有显著的效果,能够有效促进数据挖掘有效性的提升。通过分布式的数据处理法,能够从分布式的存储和并行计算的方面,有效实现对数据储存、计算和容错等要求的满足,确保数据具有良好的安全性以及高性能。基于此,谷歌提出分布式的文件系统化理论,且在行业内得到逐渐发展,且能够对数据的存储、搜索和分析等要求深层解决。在行业内,谷歌所研发开源系统在逐渐发展中形成了HDFS(Hadoop的分布式系统)、KFS(Kosmos文件系统),并组建成丰富化分布式的数据存储体系。在行业市场内,所流行开源的云计算相关平台有abiCloud和Hadoop平台等。
2 物联网的数据挖掘重要性
对于数据挖掘来说,主要是从大量数据内通过算法对隐藏于其内信息进行搜索的过程。此数据挖掘常和计算机的科学存在密切关系,并借助统计、检索、在线的分析和处理、机器智能学习、模式识别和专家系统等方法对上述目标有效实现。在数据挖掘中,包括诸多的步骤,主要有信息的收集、信息数据的集成、信息数据的规约、信息数据的清除、信息数据的转变、信息数据的价值挖掘等。
通过互联网技术的使用,对信息达到互联互通目的,它把现实世界内的物体借助传感器或者互联网等手段实现了联系,同时物联网和云计算存在密切关联,在物联网内存在海量的数据通过云存储方式而存在。在行业内对物联网的使用中,主要以云计算的手段对海量数据实施整合与储存,进而对数据价值实现挖掘,有效满足数据挖掘预测和决策的需求,且反向对此类传感网络实施管控,让其数据挖掘的结果对其物联网内客观事物呈现的运动规律以及发展进程等充分反应。在决策制定以及过程控制期间,数据挖掘至关重要,现阶段它已从传统模式的局限性内发生突破,且朝着物联网方向转变。
3 基于云计算平台的物联网数据挖掘平台
3.1 关键技术
在此平台内,想要实现数据挖掘的功能,需要借助诸多的技术,其中关键技术包括数据汇集的调度技术、服务调度与服务管理的技术、挖掘算法的并行技术等。
在数据汇集的调度技术方面,主要借助云计算各种类型的数据实现汇聚、调度,进而对不同类型数据达到连接与共享的效果,它也实现了多种数据的实时性和同步性连接。此技术在使用中主要对各类数据规约方面存在的问题实现解决,在对问题解决的方案设计时,要求其能够对各类数据格式都能够识别和衔接,从而对数据的充分分析与挖掘提供保障以及条件。
在服务调度与服务管理技术方面,是为了实现云计算对各类业务系统提供必要的服务,如服务调度以及管理功能等。其中在服务调度中,主要是基于对服务等级和资源匹配上,对优先级的服务实施调度,从而对服务间隔离和互斥等问题进行解决,确保云服务安全运行的空间满足要求。而服务管理主要是把服务注册和服务暴露的功能实现统一,对本地服务的能力可暴露性有效提升,对第三方的接入数据价值实现充分地挖掘。
在挖掘算法的并行技术方面,主要是云计算的平台内将挖掘算法的并行化当作有效基础能力的技术,包括选择并行性的算法、可行性的算法和并行性的策略等,数据挖掘的算法主要有决策树的算法和关联规则的算法等,此云计算的平台借助并行化的算法能够对数据实现充分挖掘和利用。
3.2 基于云计算平台的物联网数据挖掘实现
文章主要是以云计算当作服务技术的物联网平台,在此平台中将Hadoop当作基础,借助有效平台的搭建实现形影功能。根据实际运行的模块分子,主要包括感知层、传输层和数据层,且还包括数据挖掘的服务层,具体结构如图2所示。
3.2.1 平台的感知层
平台感知层其实是物联网内终端形态的体现,其结构主要有物联网的终端、移动通讯的控制终端、感知层接入的网关、终端的外设、感知层子网的节点以及卡识的读物等。其中物联网内存在两部分,分别是终端的中间件与应用部分,在其内嵌入有远距离的通信模块,其终端的中间件汇聚和封装着终端的能力,而终端的应用主要是在终端驻留的应用作用发挥。在终端的外设方面,主要包括GPS、传感器、摄像设备、条码的读写器和控制器等装置;在卡识的读物方面,主要包括条码、RFID的标签等;在感知层的接入网关方面,主要是把感知层的子网接入到运营商的网络内的一些网关类设备;在感知层的子网方面,主要有无线型传感器的网络、有线的局域网和WiFi类网络等;在子网节点方面,主要是接入至感知层接入的网关内感知层子网终端的设备,有节点的中间件、节点的应用等部分。
3.2.2 平台的传输层
平台的传输层作为一种高速和无缝等特点的数据传送网络,它具备诸多网络的形态,可以快速和灵活地把感知数据向云计算的数据中心内传输,达到全面性和有效性互通互联的目的,还可以把各类的监测设备实现联网数据的传输,使物联网内监测设备对数据实现网络化的高速传输效果。
3.2.3 平台的数据层
数据层是数据挖掘相关平台的核心和关键部分,此层根据功能需求主要分作两个部分,分别是数据源的转换模块与数据挖掘的部分。对于物联网的数据挖掘功能平台,数据层发挥着重要的作用,因为物联网内的数据呈现出海量性、无序性与异构性等特征,当数据层在对此类数据实施处理与储存中就需要能够对它们实现功能的可行性与有效性。此数据层内,涉及有两个模块,分别为数据源的转换模块以及分布式的存储模块。其中前者主要用在对平台内异构性的数据开展转换处理活动中,而后者和Hadoop的平台内所存在HDFS的文件系统实现结合,以分布式的方式对物联网内海量的数据存储。
结语:综上所述,物联网内数据挖掘对其数据价值的发挥具有着至关重要的作用,云计算在物联网的数据挖掘中发挥着重要的功能,文章从数据感知层、数据传输层、数据层和服务层等部分对基于云计算平台的物联网数据挖掘平台实施研究,对各部分组成和功能实现进行了分析,往对相关领域的研究具有参考价值。