用电信息采集系统非结构化数据管理设计
2017-09-11林耀
林耀
摘 要:本文通过两部分对用电信息采集的非结构化数据的管理工作进行了详细的说明,首先对非结构化数据进行了概述;之后重点介绍了其系统结构的内容。
关键词:用电信息采集系统 非结构化数据 结构化数据
一、用电信息采集系统非结构化数据的概述
全覆盖与全采集的用电信息采集系统广泛运用于国家电网中,在一定程度上提升了国网公司的电力营销服务能力,同时提升了国家电网的企业形象。然而,当前所采集的信息与数据,呈现数据分散以及利用效率较低等特点。而且,电力营销服务工作,不但要求拥有结构化的数据,同时也要求以文本与视频等非结构化数据作为支撑。因此,相关的工作人员需要重点管理用电信息采集系统非结构化数据。
用电信息采集系统主要由三部分构成:主站、通信信道以及采集设备。用电信息系统能够对用户信息进行及时的采集与处理,从而准确地了解用户的用电状况,及时发现是否存在异常状况。电子信息技术的进步,在一定程度上推动了电网信息化程度,使得用电信息采集系统需要采集传统结构化数据以及非结构化数据。当前,电力领域的研究人员开始研究基于大数据信息技术的用电信息采集系统的应用问题。只是运用结构化数据对用户的用电特点进行分析,则无法满足电力营销服务的高级应用内容。因此,必须做好电力用户的非结构数据的采集以及管理工作,从而更好地满足电力营销服务。研究人员将用户类型分为A-E五个分类,这些用户的非结构数据是电力营销服务的重要支撑数据。同时,根据数据对用电预测状况以及故障预判趋势的重要程度,分为基础类、普通类、专用类以及特殊类。具体分类以及介绍如图1所示。
但是,国内的非结构化数据的研究进度比较慢,同时其专业信息技术还有待完善。与此同时,存储物理设备的容量以及兼容性等问题。所以,必须对用电信息采集系统的非结构化数据进行科学合理的管理和设计。
二、用电信息采集系统的系统架构
非结构化数据的用户拥有不同的类型,同时数据分类和大小也有所差异,从而无法从数据分析中提炼有价值的研究内容。然而,这些非结构化数据拥有大数据的主要特征,所以拥有较大的研究作用。运用非结构化数据对电力用户的用电信息进行分析与预测,能够在很大程度上拓展电力营销业务的范围。
通过数据采集、存储以及挖掘三方面对非结构化数据进行管理。首先,数据采集主要感知和采集前端的相关数据;而数据存储主要是将非结构化数据实施结构化存储;最后数据挖掘主要是运用这些非结构化数据的过程。具体的非结构化数据管理过程如图2所示。
1.非结构化数据管理的数据采集。电力用户的数据信息经过采集之后,将信息传送到数据中心。其中,将这些非结构化数据进行分类,根据来源的不同主要分为采集终端、系统平台以及用户侧三类。采集终端能够采集结构化与非结构化数据,能够实时采集与上传信息。系统平台是用电营销业务工作过程中,所建立的客服以及收费等功能系统。用户侧主要是用户为了满足自我信息查询与追踪所运用的信息渠道。
2.非结构化数据管理的数据存储。多样化的非结构化数据,使得数据的存储与挖掘存在一些不方便。比如:非结构化数据的保存格式不同,使得存储的空间范围以及内存划分尺度不同;同时尽管数据格式相同,然而不同的用户数据的容量与属性也不相同。所以,需要运用Hadoop的分布式架构,实施主从式的虚拟化;之后实施数据的预处理工作;最终运用Hadoop信息技术实施数据的存储管理。
Hadoop信息技术主要由三部分组成:Hadoop Common、HDFS以及MapReduce。其中HDFS属于Hadoop的重要内容之一。同时,HDFS主要是针对大数据实施存储以及管理的文件系统,该系统能够较好地实施非结构化数据的管理工作。HDFS的主要组件以及功能介绍如表1所示。
MapReduce也属于Hadoop的重要内容之一,同时该数据库主要针对大规模的PB级别的数据实施计算管理。MapReduce区别于传统关系型的数据库来说,拥有很多优点,比如:MapReduce可以处理的数据规模较大,同时数据更新速度也比较快。MapReduce与传统关系型数据对比来说,其具体的特点说明如表2所示。
3.非结构化数据管理的数据挖掘。非结构化数据的类型较多,同时这些数据之间拥有较大的差异,所以运用不同的数据挖掘方法。对于文本数据来说,可以根据文本的分类或者抽取特征項的方式,对数据进行挖掘。同时,对视频数据可以运用对象识别以及模型库比对等方式进行数据挖掘;而音频数据的挖掘,一半运用相关性分组以及可视化等技术进行数据挖掘。
总 结
用电信息系统采集的非结构化数据拥有一定的隐私性,同时也拥有较强的实用性。因此,对这些非结构化数据进行管理设计,成为了相关研究人员的重点研究课题。运用相应的专业技术,对非结构数据进行采集、存储以及挖掘,同时根据所挖掘的信息与数据更好地管理电力工作。
参考文献:
[1] 祝恩国,刘宣,葛磊蛟.用电信息采集系统非结构化数据管理设计[J].电力系统及其自动化学报,2016,(10).