解析电力调度自动化系统挖掘技术的应用
2019-01-14苟吉伟
苟吉伟,敖 榜
(深圳供电局有限公司,广东 深圳 518000)
0 引 言
目前,我国各个生产制造类企业中都涉及数据挖掘技术。数据挖掘技术是互联网技术下衍生的一种大数据技术,能有效对庞大数据群体进行管理、分析、分类及汇总,并结合互联网管理技术对有用数据进行筛选和罗列[1]。电力调度自动化系统中运用大数据挖掘技术,将会对电力事业产生深远影响。目前,我国正处于经济转型过渡期,很多传统企业急需要改变产业结构,深化内部控制。电力企业应用数据挖掘技术,将进一步推动企业向现代化生产过渡,提升企业竞争优势。相关数据挖掘技术也将结合企业发展特性做出相关调整与改进,以加快我国经济建设。
1 挖掘技术相关概述
1.1 基于大数据下的数据挖掘技术概述
进入21世纪后,世界进入高速互联网时代,信息技术得到空前发展,而基于互联网下的大数据技术也成为了当下发展的焦点。目前,全世界的数据库已达到了一个庞大规模,各类信息汇聚在互联网下,给人们提供了丰富的信息资源。但是这些数据庞大且种类繁多,很难进一步找到需要的内容,由此出现了大数据挖掘技术。大数据挖掘技术的出现就是对庞大的数据群体进行合理过滤、筛选,然后从中找到有利的信息资源。这种数据挖掘技术是指利用有效的手段或者搜集渠道,对现有大数据信息进行信息资源与模型的匹配区分。利用这种匹配区分将这类具有价值的信息资源搜集,并作为企业决策的重要依据[2]。随着互联网技术的不断发展,数据挖掘技术已形成了一定特点。近年来,出现了很多不同类型的挖掘技术,将庞大的数据群体做了进一步细分。
1.2 数据挖掘的特点分析
电力系统下的挖掘技术也指数据开挖技术。数据开挖技术具有如下特点。
(1)实用性。面对现有信息互联网下庞大的数据信息群体,挖掘技术也在不断创新和完善。现在的挖掘技术迎合了时代发展,对相关数据的收集变得越来越快,相关反馈效果也更加及时、有效,给企业或者团体提供了重要信息参考依据。
(2)数据量庞大。基于互联网资源下的数据,正在高速增长,随着5G等通信网络的布置,信息数据量还会进一步高速增长。
(3)应用性。数据挖掘技术的出现主要是源于人们对信息资源庞大的需求,而数据挖掘也就成了人们的实际应用需求。该技术将对数据进行相关挖掘筛选,再过滤,然后应用于现实生活中,完成实际项目的决策[3]。
(4)动态性。大数据下的信息资源并不是稳定不变的,而是随着时代发展不断增加、改变。因此,数据挖掘结果具有时间属性。随着时间的推移,数据挖掘结果涉及的相关数据将发生改变,需及时更新数据。
(5)集合性。目前,对于数据挖掘的算法以及相关建模的手段有很多,如专家系统、人工智能以及分析统计等。它们在对数据做相关收集时,并不是通过单一数据进行相关检索,而是通过多种集合方式实现功能化的应用。
(6)具有价值意义。对大数据信息的挖掘是具有价值意义的。为促进企业发展,需合理挖掘信息数据。
2 电力调度自动化化系统数据挖掘方法分析
为使电力调度自动化化系统实现数据挖掘技术对生产带来效益,需对挖掘技术进行相关分析。结合数据对电力系统的作用,做好相关必要性措施。目前,从挖掘技术实际应用特点来对挖掘技术分析方法进行分析。
2.1 关联分析法
庞大的数据信息虽然种类繁多、复杂,甚至很多没有任何参考意义,但是数据信息存在于互联网下必然会与相关事物存在密不可分的联系。当某一些事件一旦发生,相联系的事件也必将出现一定反应。这种反应也就是信息数据间存在的关联属性。基于此,对于数据挖掘需求,关联分析就是通过对事物与事物间存在的某种依赖或者关联信息来找寻事物本身存在的联系规矩,从而又利用这种规矩来对信息数据进行相关挖掘[4]。目前,关联分析法在数据挖掘中具有重要应用价值,能快速找到相关信息数据。
2.2 聚类分析法
聚类分析法指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析法是利用相似方法来对信息数据进行相关收集活动,以找到有价值的数据信息。此外,还要进行划分和提取,以满足不同类别人群的实际需求。聚类分析常常涉及心理学、医学及市场销售等[5]。
2.3 分类和预测法
问题预测的两种表现形式可分为分类与数值预测两种。分类就是预测分类,可利用连续值函数模型表现现有已知训练数据集合的特征,以实现各类别描述的内容,并由此找到用户需要的信息资源。预测分类法也是监督学习的一个过程,它能依据训练数据来精准表达和划分有价值的信息数据。
2.4 人工神经网络法
人工神经网络法依赖于计算机网络系统。人工神经网络法普遍应用于计算机以及计算机网络环境中,处理的数据群体都比较庞大,且处理速度比较快。它可将大批量相关数据进行提取过滤,并筛选出有价值的数据。由于人工神经网络法的技术层面高,所以具有的价值也更大。人工神经网络法通过建立有效的数学模型,将对关联信息资源或者数据引入到数据建模中,从而进行相关数据分析[6]。目前,常用的人工神经网络有RBF神经网络和BP神经网络。
3 在电力调幅自动化系统中数据挖掘技术的具体应用
整个过程都建立了科学性参考,并以此来提升研究价值。整个研究将围绕周期性关联规则挖掘算法,从而创立基于周期性关联规则的数据挖掘分析系统。整个系统的创建过程具体如下。
(1)选择开发平台。开发平台的选择需结合相关电力调度系统功能属性。可选择微软旗下的NET平台作为整个系统的大平台。这是因为它能很好地适应电力系统的工作环境,具备强大的数据库访问能力。此外,它具有丰富的扩展接口,可满足整个系统的需求。
(2)数据桥下的数据集成模块设计。目前,我国电力企业内部环境比较杂乱,很多相关标准并不统一,所以综合考虑各方原因决定采用数据集成方法。同时,将采用数据清洗策略,以完成不完整数据、重复数据以及错误数据的清洗工作。数据内容清洗中,除重复数据不需要清洗外,其余相关数据都需要利用修补值跟默认值的方式来清洗。例如,如果数据出现不完整,就采用补“0”或者“补null”默认值的方法来清洗。此外,无类型文件数据集成、数据库相关数据集成以及异构数据集成也是重要过程。
(3)数据管理模块设计。该设计根据实际要求出发,可采用SQLSERVER数据库系统,并将数据库管理分类为层次建模、数据表管理及数据表导出。数据表管理中含有数据管理、结构管理以及删除等功能,导出过程涉及access文件与excel文件等。
(4)数据分析功能模块设计。整个模块将由周期数据分析、数据预警分析关联分析以及数据周期性分析四个功能构成。主要涉及内容为同期数据分析模块设计。此模块的组成由负荷数据、网损失数据及有功总数据组成。相关分析流程可表示为:输入所有对比条件、合法、根据条件生成SQL语录、显示查询结果及打印对比图像等。
4 结 论
随着时代的发展与进步,我国各个领域都在积极创新。很多企业应用了大数据挖掘技术,以提升企业竞争力。电力调度自动化系统中应用挖掘技术必将推动我国电力企业不断发展。