APP下载

物联网海量异构数据存储与共享策略的思考

2018-09-13王瑾

无线互联科技 2018年10期
关键词:物联网

王瑾

摘要:研究物联网海量异构数据存储以及共享策略,能够有效提高数据存储以及数据共享的质量。基于此,文章首先简单介绍物联网信息服务系统的结构组成。其次,分析物联网海量异构数据存储的方法,其中主要包括知识密度的应用、预处理技术以及数据分布3方面内容。最后,研究物聯网海量异构数据共享策略,其中主要包括基于设计准则的数据共享策略、基于物联网标识平台的数据共享策略两方面内容。

关键词:物联网;异构数据;共享策略

随着时代的不断发展,我国物联网行业也得到了一定的发展,虽然目前该行业涉及的范围较广,但是整体上仍然处于发展的初期阶段,在此过程中需要重点解决物联网中信息存储发展的智能化问题。目前物联网在异构数据存储共享的过程中仍然存在较多需要完善的地方,为了保证物联网整体的发展质量,需要根据实际物联网在发展过程中存在的问题制定解决方案,这种方式能够保证物联网信息存储以及信息共享的质量。

1 物联网信息服务系统的结构组成

在实际运行中主要可以将物联网系统分为以下几方面内容,分别为感知层、网络层、数据层以及应用层。其中信息服务系统在数据层中,主要负责存储大量的异构数据,并将其应用在各种服务中,最终达到提供多样化服务的目的,同时也是物联网正常运行的前提条件。在信息服务系统中,物联网能够实现信息采样功能、智能追踪功能、监控功能以及管理功能几方面内容,由此可以看出新信息服务系统对物联网正常运行的重要性。物联网信息服务系统主要由安全控制系统、共享空间系统、数据接收系统以及数据存储系统构成,其中感知设备以及网络通过其中的数据接口进入到原始数据层中,原始数据、加工数据以及元数据共同组成系统中的共享空间。另外,本地应用、外部应用以及外部信息服务系统通过系统中的数据应用接口进入到持久数据存储系统中,将其中包含的数据进行存储。数据正是通过这种方式在信息服务系统中进行相互传输,不同系统板块中对应的系统功能也不同,因此,能够实现多样化的信息服务。

物联网在实际应用过程中具有多源异构、规模大、时空关联性强、冗余度高等特点,目前研究的重点在物联网信息服务系统中的时空关联以及事件查询等方面内容,已经取得了一定的研究成果。但是在海量异构存储方面,仍然存在存储性能低以及数据共享难度高等问题,不能达到物联网数据存储的要求,在实际应用过程中非常容易出现信息孤岛等现象,严重影响物联网的整体运行质量[1]。

2 物联网海量异构数据的存储方法

2.1 知识密度的应用

文件系统存储技术在实际应用过程中经常采用分布式文件系统存储的方式,在此过程中,需要在本地文件系统的基础之上建立物联网文件系统,这种建立方式能够将物

联网的存储点相互连接。也就是说,将系统中独立运行的节点相互组合,最终形成一个整体,并对其中的资源进行统一管理,这种方式能够在统一时间为多个用户提供数据文件,大大提高了数据传输的效率,同时还能够有效控制物联网中的空间动态拓展问题。但是为了保证数据的存储质量,还需要对其中的知识密度展开分析,知识密度指的是完整表达特定信息的过程中,需要的数据量和原始数据量之间的比值,通常情况下用小数的形式表示。物联网中知识密度的大小通常由知识对象决定。以网络中的音频传输为例,要想得到不同时间段音频的大小,则需要确定音频中的声音序列。假如音频的大小为1 kB,共占14个字节,则其中的知识密度就是0.0137。

2.2 数据预处理技术

数据预处理技术主要包括以下几方面内容。

2.2.1 数据的分类处理

在此过程中的分类对象为系统中的原始采样数据,主要被分为两类,其中第一类为轻量级的数据,主要包括数据的数值型和字符型,这类数据在实际使用中的特点就是传输成本低、使用的空间小。另一类是多媒体数据,主要包括视频数据、图像数据、音频数据以及信号数据等,这种类型的数据在实际应用过程中主要具有需要的存储空间大等特点,在数据预处理的过程中,针对不同种类型的数据,需要采用不同的数据处理方式。

2.2.2 增加知识密度

这种方式是提高存储质量的主要方式,该种手段经常使用在多媒体数据中,由于多媒体数据在存储的过程中需要大量的空间,其中的知识密度较低,因此为了在保证存储质量的同时,缩小存储空间,必须对其实施量化处理,将其中有价值的部分提取出来,对其中的关键词和关键信息进行处理,这种方式能够大大提高数据的使用效率。

在此过程中需要将多媒体数据分为两类,其中第一类为兴趣值,该类数据指的用户在一定范围内最关心的数据值,例如在交通系统中,所对应的数据值为车辆的违规数量以及车牌号等,缩小有效数据的范围。第二类为摘要值,这种类型的数据指的是多媒体数据的简略描述,这种数据中的知识密度为0,通常情况下起到辅助作用。在实际生活中,要想判断两个图片的相似程度,可以通过数据中的摘要值进行判断。

2.3 数据分布

数据分布主要包括以下几方面内容。

2.3.1 数据类型的划分

数据存储类型可以分为高集能存储以及分离存储,其中分离存储需要设置一个主集群和一个副集群,这两个集群在实际运行中具有较强的独立性,各自包含一个数据库。在此过程中,需要将多媒体数据存在其中的副集群中,采用这种存储方式的主要原因是外界用户对副集群的感知程度较低,在此过程中,这两个集群可以实施数据传输。多媒体数据与轻量化数据表面上存在于两个集群之中,但是在逻辑中仍然属于一个集群。

2.3.2 数据库

系统中采用的存储方式主要为分布式,在此过程中存储的数据达到一定数量时,必须实施数据分片,将其中的数据分布到不同的机器中,在这种方式中,集群的独立运行能力较强,可以不依靠服务器进行数据存储。另外,采用数据分片的方式能够提升自身的数据存储能力以及系统应用性能,但是在此过程中需要注意,需要根据实际情况制定科学的应用方案,否则会出现降低系统使用性能的现象。如果数据的规模较小,则不需要数据分片处理,避免出现时间浪费的现象[2]。

3 物联网海量异构数据共享策略

3.1 基于设计准则的数据共享策略

在该种设计准则中,所有能够被命名的数据都可以叫作抽象資源,其中主要包括网络中的数据信息、连接信息、计算信息以及存储信息、物联网中的网关以及感知网络等,涉及的范围较广。为了提高资源管理的质量,需要采用层次化管理的方式,其中主要包括实体级、应用级以及系统级3方面内容,实体级指的是其中的资源都是独立的实体资源,其中主要包括对象资源、索引资源以及知识资源等。应用级指的是一些资源的结合体,在此过程中存在多个感知对象,其中一个集合体中的资源等级也相同。系统级主要指的是物联网系统层中的数据资源。

在这种数据共享策略中,主要包括资源层级关系和资源类型关系两种,资源层级关系中主要包括系统级、应用级以及实体级,其中信息服务系统数据属于系统级,各个应用系统属于应用级,各个数据实体属于实体级。资源类型管关系中主要包括索引资源、对象资源、知识资源等,其中索引资源将数据信息共享到对象资源中,对象资源再将数据信息分别传输给感知数据以及知识资源,再由知识资源生成最终的数据。除了这种数据生成方式之外,索引资源可以直接将数据信息共享到知识资源中,由知识资源直接生成数据,以上两种方式都能够实现数据生成。

3.2 基于物联网标识平台的数据共享策略

利用这种方式能对物联网中大量的数据资源进行标识管理,首先需要发现资源和定位资源,在此过程中需要确定系统中数据存在的位置,找出该资源生命周期中存在的所有资源,从而建立一个独立的信息服务系统。在商品生命周期生产以及物流销售环节中可以利用这种方式。利用物联网中的异构标识,能够对数据进行编码,主要组成结构为标准码加上物品码,标准码主要负责编码格式的识别。其次,协调工作流程,在此过程中,主要的工作流程包括注册信息、映射处理以及资源检索,其中注册信息主要包括资源得标识信息、物品中的标准码以及数据的描述信息等。映射处理指的是在资源收集完成之后,采用统一资源标识符(Uniform Resource Identifier, URI)的方式对数据进行映射处理,保证信息注册的完整度。最终,资源检索指的是利用检索系统对系统中的资源进行检索,保证最终数据共享的质量。由此可以看出,在制定数据共享策略的过程中,需要根据实际情况制定不同的数据共享方案,采用这种方式制定的数据共享策略具有较强的针对性以及应用价值。除此之外,还要充分考虑其中的影响因素,降低其对系统正常运行的影响[3]。

4 结语

随着人们对物联网的关注程度越来越局,如何提高物联网中数据存储以及数据共享的质量,成为有关人员关注的重点问题。本文通过研究物联网海量异构数据存储以及共享策略发现,对其进行研究,不仅能够提高物联信息存储的质量,同时还能够实现实时信息共享。由此可以看出,研究物联网海量异构数据存储以及共享策略,能够为今后物联网异构数据存储以及数据共享的发展奠定基础。

[参考文献]

[1]赵立波,李凌霞,王旭.物联网海量异构传感器采样数据存储与查询处理[J].软件导刊,2017(12):182-183, 187.

[2]王顺.面向农业物联网的异构数据存储方法研究[D].郑州:河南农业大学,2016.

[3]何凤成.Hestus:—种海量异构物联网数据存储模型及其实现[C].合肥:第29届中国数据库学术会议,2012.

猜你喜欢

物联网
基于无线组网的智慧公交站点信息系统研究与实践
基于LABVIEW的温室管理系统的研究与设计
论智能油田的发展趋势及必要性
中国或成“物联网”领军者