基于数据挖掘的大用户用电特征分类方法研究
2021-07-30陆惠惠王炼
陆惠惠,王炼
(国网上海市电力公司松江供电公司,上海 201699)
数据挖掘是从数据资源中搜索实用信息的处理过程,各执行法则的制定都必须依靠隐藏于信息中的数据限定关系。在人工智能及数据库理论的支持下,数据挖掘算法可揭示出信息之间的隐含应用关系,从而确保所有潜在信息都得到妥善地处理[1-2]。简单来说,数据挖掘算法的应用主要面对机器学习、人工智能、模式识别等多个领域,可通过实践规律探索的方式,确定信息数据之间的实际作用关系。
随着底层大用户应用耗电总量的增加,核心电力资源很难在既定执行周期内,得到妥善地按需分配处理。为避免上述情况的发生,BP 神经型电量分类手段在识别大用户对象节点处电子信息的同时,计算相邻电量数据之间的连接步长值。但此方法很难改变大用户对象的平均耗电周期时长,易导致电压升值的过度提升。为解决此问题,引入数据挖掘算法,搭建一种新型的大用户用电特征分类方法,通过划分用户行为的方式,提取大量的用电行为模式特征值,实现对电力资源的按需分配与调度。
1 基于数据挖掘的大用户用电行为分析
1.1 集中用电量计算
集中用电量是指底层大用户在单位时间内的电子消耗总量。在用电数据收集、存储及电子信号交互处理的过程中,大用户对象都扮演着极为重要的角色。简单来说,集中用电可体现大用户流通电子在电网终端中的传输情况,随着电表计量能力的增强,已消耗电子量得到明确记录,未消耗电子也可在多次转存记录下,生成独立的样本空间数据,以供下级用电设备的直接调取与应用[3-4]。设 |T|代表应用电子的既定高频振动时长,I′代表大用户消耗电流的最大特征迁移量,U′代表大用户消耗电压的最大特征量,联立上述物理量,可将集中用电量表达式定义为:
式中,T0代表高频振动时长的最小表现实值,T1代表高频振动时长的最大表现实值,U0代表大用户消耗电压的最小特征量,I0代表大用户消耗电流的最小特征迁移量,代表大用户节点处的电阻均值,λ代表特征电量的既定输入系数。
1.2 用户行为划分
用户行为划分是在数据挖掘原理基础上,对特殊用户对象节点进行的具体化描述,包含应用电流等级划分、应用电压等级划分、实用电子量计算3 个实际操作步骤[5-6]。简单来说,随着大用户用电特征的改变,电流、电压、电子量等指标的实际消耗情况都会出现一定的物理变化,且这种变化的实际作用趋势通常是不固定的。一般情况下,可总结为随大用户用电特征的凸显,底层电流、电压的实际传输量逐渐增加,而电子量属于二次计算参量,其具体变化规律,受到实值电流、实值电压之间限制关系的影响[7-8]。设代表用户行为中的电压累积量,代表用户行为中的电流累积量,联立式(1),可将的实值计算过程描述为:
式中,r代表大用户节点所负载实值电阻的最小阻值,μ0、μ1分别代表两个不同的干扰压降差,μ代表μ0、μ1之间的平均数值,χ0、χ1分别代表两个不同的干扰流降差,χ代表χ0、χ1之间的平均数值,yˉ代表大用户节点处的电阻定值消耗参量。
规定在整个数据挖掘算法的执行周期内,大用户节点处的用电特征始终不会发生明显改变,设ξ代表传输电压利用率,σ代表传输电流利用率,联立式(2),可将电网环境中的用户行为划分表达式定义为:
式中,p代表传输电子的固定迭代系数,l代表标准用电特征向量,α代表电压与电流之间的消耗限定参数。
1.3 耗电周期确定
耗电周期是与大用户用电特征直接相关的参量指标,可随电量数据挖掘深度的改变而出现变化,受到大用户节点所属行为划分等级的直接影响。在电子信息挖掘条件保持不变的前提下,耗电周期受到电子输出总量、电子回执总量两项物理系数的直接影响[9-10]。电子输出总量也叫定向电子累积量,常表示为;电子回执总量也叫反向电子累积量,常表示为。随大用户节点中电量消耗时间的延长,累计在数据挖掘层中的应用电子快速反馈回核心控制主机,直至电网环境中不再出现明显的电量波动行为。在上述物理量的支持下,联立式(3),可将大用户节点处的耗电周期计算式定义为:
式中,β代表特征电子的传输消耗频度数值,代表传输电子的输入均值量,代表传输电子的输出均值量。
2 大用户用电特征的分类方法
在数据挖掘原理的支持下,按照用电用户分类、高维负荷数据降维、用电行为模式特征提取的处理流程,完成新型大用户用电特征分类方法的搭建。
2.1 用电用户分类
用户分类是确定电网耗电总量的必要处理环节,通常情况下,满足大用户用电需求节点所处的层次等级相对较高,可在保留原有电子传输属性的同时,对可能接触到的传输电子进行定向分类处理,从而使整个电网传输环境始终趋于稳定。规定可直接进行电量传输的用电用户可分为三类,其中只有电子应用等级最高的节点组织满足大用户用电特征的判别需求[11-12]。随着电子流量水平的提升,大用户节点所承担的电流传输量也逐渐增加,由于电网应用能力的特殊性,电子量很难在核心控制元件中大量堆积,故大用户用电特征的分类必须以电子传输应用量作为唯一判别条件。具体分类原理如表1所示。
表1 用电用户分类判别原理
2.2 高维负荷数据降维
高维负荷数据具有大用户用电特征的全部实用特点,如电子传输速率快、电子容量大、电子多样性强等,从实践性方面来看,大用户用电数据所处的维度水平越高,与之相关的电量时序性也就越强,即大用户用电特征实际表现形式始终受到负荷数据维度水平的影响[13-14]。设θ代表大用户用电特征的原始维度条件,在既定输送周期内,该项物理量始终具备较强的应用稳定性。代表大用户节点处的用电量均值,与其他实用消耗信息相比,该项物理量可与数据挖掘算法的应用权限保持相同的变化趋势。联立θ与,可将大用户用电特征的高维负荷数据降维表达式定义为:
式中,代表传输电子量的实际消耗定频系数,f代表传输电子的分类权限参量。
2.3 用电行为模式特征提取
用电行为模式特征提取是基于数据挖掘大用户用电特征分类方法搭建的末尾处理环节,在高维负荷数据降维定义式的支持下,可按照电子流的实际分类需求,对已存储电量进行集中化处理,从而缓解电网环境中的电子量寄存压力[15-16]。假设在一个电子输出周期内,已寄存电量只能保持由起始端到终止端的传输行为,而在此过程中所有与大用户用电节点相关的消耗特征,都可被定义为直流型电子应用量。设vmax代表电子量特征的最大寄存量,vmin代表电子量特征的最小寄存量,联立式(5),可将大用户用电行为模式的特征提取表达式定义为:
式中,代表大用户节点处用电特征量的平均数值,b代表定频提取系数,x代表用电特征的分类基向量。至此,完成各项应用指标的实值计算与处理,在数据挖掘应用理论的支持下,实现新型大用户用电特征分类方法的顺利应用。
3 实用性研究
为检验基于数据挖掘大用户用电特征分类方法的实际应用能力,设计如下对比实验组。利用人工方式将电网执行主机与电子传输线路相连,将所有记录数据反馈至中心控制主机中,在相同实验环境下,分析既定节点处耗电周期及电压升值的实际变化情况。
实验组控制主机搭载新型大用户用电特征分类方法,对照组主机搭载传统BP 神经型电量分类手段。截取各项应用指标在单位时间内的特征参量值,分析相关系数的实际变化趋势。
大用户对象的平均耗电周期可描述电力资源的按需分配能力,通常情况下,前者的数值水平越低,后者的实际分配能力也就越强,反之则越弱。表2反映了实验组、对照组大用户对象平均耗电周期的具体变化情况。
分析表2 可知,随传输电子总量的提升,实验组大用户对象的平均耗电周期始终保持不断延长的变化趋势,全局最大值仅能达到6.48 min,与最小起始值6.01 min 相比,上升了0.47 min;实验前期,对照组大用户对象的平均耗电周期不断上升,在达到最大数值水平后,开始趋于稳定,全局最大值达到8.38 min,与实验组极值相比,上升了1.90 min。
表2 平均耗电周期对比表
大用户节点处的电压升值也能反映电力资源的按需分配能力,通常情况下,前者的数值量越小,后者的实际分配能力也就越强,反之则越弱。表3 反映了实验组、对照组电压升值的实际数值水平。
表3 大用户节点处的电压升值
分析表3 可知,随着实验时间的延长,实验组大用户节点处的电压升值始终保持先上升、再稳定、最后下降的变化趋势,全局最大值仅达到56.7 V;对照组大用户节点处的电压升值在实验前期始终保持稳定,从实验中期开始,一直不断上升,全局最大值达到67.0 V,与实验组极值相比,上升了10.3 V。
4 结束语
在传统BP 神经型电量分类手段的支持下,新型大用户用电特征分类方法借助数据挖掘原理,可在计算节点处集中用电量数值的同时,实现对用电行为模式特征的定向提取,能够同时满足对大用户对象耗电行为的记录与对电力资源的按需分配,具备较强的实际应用价值。