基于OIV算法的风电机数据预处理方法探究
2017-11-30易灵芝
黄 昊,易灵芝,詹 俊
(1.湘潭大学,湖南 湘潭 411105;2.湖南优利泰克自动化系统有限公司,湖南 长沙 410205)
基于OIV算法的风电机数据预处理方法探究
黄 昊1,2,易灵芝1,詹 俊2
(1.湘潭大学,湖南 湘潭 411105;2.湖南优利泰克自动化系统有限公司,湖南 长沙 410205)
针对风电机组各部件性能分析过程繁琐低效、预测精度不高以及经济效益不足的异常风电机组状态问题,文章提出一种用于后期预测的数据预处理方法,结合基本的网络工具进行实验,提高了风电机组中发电机定子温度预测的准确性。
数据清洗;OIV算法;建模预测
考虑到数据采集装置系统实际采集到的数据复杂化的特点,传统数据预处理的清洗方法普遍缺乏通用性,大部分用于数据预处理的清洗方法效果不会很好[1-4]。例如:在风力发电企业中存在很多粗略报警,单月多次上风机进行盲目维护,此类问题在短期内不会导致机组停机或者部件损坏,这种方式必然会影响机组组件的正常运转,而传统方法几乎无法对其加以准确的检测识别。目前,在国内外风电领域的大小企业中,普遍存在有数据但无法将数据处理得很好的情况,导致后期用作预测及诊断的误差甚大。针对这类事例,为了提高对风电机组分部件的针对性可靠分析,建立精度较高的模型,需一种高效且通用性强的数据预处理清洗方法。
1 算法的提出与验证
1.1 最优组内方差算法
已知定子温度曲线样本集合U,设V={Vn,V1}为目标集合,其中Vn表示该集合中定子温度正常的数据集,V1表示定子温度偏高或偏低的数据集(定义为异常),且V满足Vn∩V1=∅,Vn∪V1=U。最优组内方差(Optimal Interclass Variance,OIV)算法要解决的问题就是如何快速、准确地对数据集U进行清洗,识别出放电机定子温度正常和异常的数据集,再进一步保留正常、剔除异常为空,这实际上就是个数据预处理方法。
定义1:已知样本集合U={(x1,y1),(x2,y2),…,(xn,yn)},且满足yi>yi-1,i∈(2,n),x表示输入参数,y表示定子温度,n为数据点总数。有方差φ公式:
OIV算法公式为:
1.2 算法分析
为形象说明OIV算法的思想和求解特点,下面以一台风电机组中发电机定子的实测温度曲线数据集U为例来进一步说明。
已知U(10)={(x1,y1),(x2,y2),…,(x167,y167)}中共有167个定子温度曲线散点。首先,按照定子温度由小到大升序排列,使其满足yi>yi-1,i∈(2,167)的必要条件;然后,依次计算前i个坐标点中定子温度的方差值,将计算结果形象地称作滑差值,所得到的数据集称为滑差集;最后,通过与初始阈值S比较分析,从而实现数据清洗的功能。另外,为了缩小数据值范围,本文中计算均用标准方差代替方差值。
根据式(2)计算小于阈值S的最大γ,通过S定义的公式得到10号区间的阈值S为13.850 4,即计算小于13.850 4的最大γ=84,对应S为13.885 86,从而由此得到以(84,13.885 86)为临界点,可划分两个数据集。如图1所示,由5号、10号、20号区间分别通过这种方法共同绘制的散点图,可以清晰地看到两种数据集的划分。
为了验证本文所提到的数据清洗方法OIV算法的精确度,从风电场数据采集装置系统中下载了2016年5月1日00:00:00至5月31日23:59:59的数据进行实验验证,其中包含了发电机电流、环境温度、发电机定子温度1、发电机定子温度2、发电机定子温度3、发电机定子温度4、发电机定子温度5、发电机定子温度6。
由于数据量过于庞大,在使用前先进行了每10分钟平均化。其中,数据中具有6个发电机的定子温度,6个发电机的定子温度在无故障的情况下两两关系保持一致,因此,本文后面将只对发电机定子温度1与发电机电流和环境温度进行讨论与实验。
1.3 找出输入参数进行实验
根据数据采集装置系统所采集的数据,发电机电流是最能影响发电机定子温度的参数,在未进行数据清洗的情况下,输入参数只有发电机电流所测试的均方误差(Mean Square Error,MSE)结果为21.634 1,这时考虑到发电机外界因素环境温度的影响,进行一次输入参数为发电机电流和环境温度所测试的MSE结果为12.550 6,相比单输入参数,数据集在精度上得到了明显的提升。
实验结果如表1所示,可以看出,上下限幅值不宜过高,按照原定的100%为最优上下限幅值。
由表1得知方差阈值的最佳上限值,经过数据预处理的清洗工作如图2所示。
图2 S<δ时候数据集的划分
在经过OIV算法之后的数据集中融入发电机定子温度1的每个数列对应前一秒时间的温度数值,通过矩阵实验室(Matrix Laboratory,MATLAB)的反向传播(Back Propagation,BP)工具箱,进行完整的发电机定子模型建立。并且通过实验MSE结果和表1可以看出,该方法下得到的数据集所建立的模型预测精度高且过程可行。
2 得出结论
为突出该方法的数据处理功能,利用数据采集装置系统采集相关数据,结合发电机相关理论,本文提出了一种用于后期预测的数据预处理方法,并通过实验得到了证明。
3 结语
总之,对于现有的风电场的条件,结合数据采集装置系统采集的数据,本文所提到的OIV算法,计算过程简单易懂,通用性强。很好地解决了对于庞大的数据采集装置数据去差取优困难的问题,加快了整个数据预处理的过程,结合BP工具箱的功能,先建立模型,为之后的预测工作提供了一个很好的思路。
表1 方差阈值S上下限幅值MSE实验结果
[1]FENG Y,QIU Y,CRABTREE C J,et al.Monitoring wind tuibine gearboses[J].Wind Energy,2013(5):728-740.
[2]GRAY C S,WATSON S J.Physics of Failure approach to wind turbine condition based maintenance[J].Wind Energy,2010(5):395-405.
[3]苏勋文,米增强,陈盈今,等.基于运行数据的风电机组建模方法[J].电力系统保护与控制,2010(9):50-54.
[4]ZHENG H,KUSIAK A.Prediction of [J].Journal of Solar Energy Engineering,2009(3):376-385.
Research on preprocessing method of wind turbine based on OIV algorithm
Huang Hao1,2, Yi Lingzhi1, Zhan Jun2
(1.Xiangtan University, Xiangtan 411105, China; 2.Hunan Youlitaike Automation System Co.,Ltd., Changsha 410205, China)
Aiming at the problem that the performance analysis process of wind turbine unit is cumbersome and inefficient, the prediction accuracy is not high and the economic efficiency is not enough, this paper puts forward the data preprocessing method for post-prediction combining with the basic network tool, which improves the accuracy of generator stator temperature prediction in wind turbine.
data cleaning; OIV algorithm; modeling prediction
黄昊(1991— ),男,江苏宜兴人,硕士研究生;研究方向:新能源技术与系统。