风电大数据生产调度平台建设中的关键技术研究
2018-08-27白道华
白道华
(大唐先一科技有限公司,长沙 410007)
风能是一种重要的清洁能源,近年来,世界风电产业得到迅速发展。风电场具有距离分散、地理位置偏远、不易统一管理等特点,随着风电场开发和管理的深入,近几年电网及各发电集团均开始推广 “无人值班,少人值守”风电场和集控中心的建设,多个大型风电集控中心也陆续建成投入使用。
本文结合某大型新能源公司风电大数据生产调度平台,对平台涉及的关键技术进行研究和总结。
1 风电生产调度平台建设中的主要问题
风电生产调度平台主要存在以下问题。
(1)传感器等设备可信度低。部分仪器仪表精确度不高、数据误差较大:部分仪器仪表安装时精度不满足要求,并且缺乏后续的修正、检查及校准等维护造成数据误差较大,影响了平台数据来源的可靠性、全面性、准确性以及可比性。
(2) 数据采集指标数量不满足大数据分析要求。风电发展初期,GE、维斯塔斯、歌美飒等风电机组占有量较大,这些机组均使用自主研发的主控系统;随后,国产风电机组开始占有市场,但核心的主控技术都从国外引进,受技术封锁、吸收能力等因素影响,未能完全理解消化;近几年,金风、华锐、远景等厂家相继开发了自己的主控系统。这些监控系统各有各的通信规约、设计思路、控制策略和数据类型,互不兼容。这些风电机组厂家受产权保护、技术封锁和利益影响,不与风电企业共享数据,只是有偿部分开放。这些数据远远不能满足风电企业的大数据分析需求。输变电设备数据不足:风电场在设计、施工阶段,信息化标准不高,在获取输变电设备数据时,监测点和可靠性普遍不满足需求。
(3) 数据存储和计算无法满足大数据分析要求。生产调度平台数据对实时性要求较高,并且需要同时兼顾平台的应用查询功能需求,通常采用商用实时/历史数据库+关系数据库的方式构建数据中心。此架构在一定程度上解决了海量数据存储和计算的问题,但由于商用实时/历史数据库开放程度较低,受本身读写性能以及数据库总容量的严重制约,对平台软硬件架构以及数据集成方式的要求极高,并且配套的数据分析工具匮乏,无法满足大数据分析和计算的要求。
(4) 风电管理基础相对薄弱,数据分析标准匮乏。我国风电一直处于迅速建设扩张期,对管理和运维的重视尚未提高到应有高度,风电场主要设备的管理和运维效率较低。
2 平台的关键技术分析
本平台分为数据采集、数据中心、综合应用中心三个层次(见图1)。
图1 系统总体架构图
数据采集层主要完成风电场数据的汇集及预处理;数据中心是平台的核心部分,数据的存储、风机状态判断、数据的计算分析均由数据中心完成;综合应用中心用于实现数据分析结果的展示,用户自定义分析等。
下面按三个层次介绍平台涉及到的关键技术点。
2.1 数据采集
风电数据采集平台的数据采集涉及50多种风机机型,涵盖了国内外几乎所有主流机型。为保障平台科学有效,需要建立统一、标准的通信规范体系,并合理选择数据源。
(1)采集指标规范体系的建立。平台充分调研和分析涉及到的所有风机机型指标,特别是各机型故障码和状态码,根据大数据分析的业务需求,整理出一套大数据分析采集指标规范体系。指标按照风机类型(直驱、双馈)区分,涉及到风机SCADA系统、能量管理平台、AGC、AVC、测风塔、升压站等所有指标。
(2)数据源的选择。与风场侧通信的数据源,需要根据各子系统安装和集成情况具体选择,满足“数据全面、传输可靠”的要求。风机SCADA系统作为风电场实时运行和控制数据的主要来源,鉴于风机厂家存在技术封锁,在技术封锁较严重的风电场采取直接采集的方式。限功率指令和停机指令等电网调度指令直接从能量管理平台采集;风速、风向等气象数据从测风塔传感器采集。
(3)数据通信标准规约的确立。大型能源公司通常下属风场众多,风机厂家及主控系统也多种多样,确立一种统一、科学、高效的数据通信标准规约对生产调度平台数据采集的数据完整性有着至关重要的作用。规约须具备的功能有:网络资源最优化利用、所有数据完整有效并需具备可扩展性、具备断电续传功能,并且续传后实时数据更新无延迟。
该平台制定了风电场与生产调度中心统一的通信标准,采用TCP/IP的通信方式结合Msmq消息队列技术,保障数据的稳定实时传输,并配备断电续传功能保障数据的完整性。
2.2 大数据中心
平台采用成熟的商业Hadoop软件加私有云的架构方式[1-4],搭建新能源风电大数据中心和综合应用中心,主要用于数据的存储、计算分析和可视化展示。
(1)数据中心的搭建。平台基于Hadoop大数据平台和Oracle数据库,开发数据中心功能,数据中心提供分布式实时数据库、服务总线、高速数据总线、任务调度与监控、数据同步等公共服务。在此基础上实现模型数据、实时数据、历史运行数据的存储管理、高效统计计算处理与快速访问,为上层的应用提供数据访问与计算服务。平台搭建大规模的大数据平台群集,大数据平台群具有扩展性强、分布式存储、资源自动优化和负载均衡等特点,可最大程度上满足新能源公司增量风场数据的接入。为了满足实时监控的数据实时性要求,系统提供分布式实时库,以分布式内存库的方式,在进程内存中缓存所有量测数据的当前值。
(2)企业服务总线。平台采用Java技术,通过建立异构系统底层的消息通信机制,构建连接异构系统的ESB,以服务总线为交互基础,以标准接口对外提供模型和数据,构建一个开放的、规范的大数据中心,满足系统与其他应用之间的交互需要。
2.3 综合应用中心
平台提供开放式的开发平台,由数据、基础框架、业务服务、界面框架、安全控制体系和辅助开发工具六块组成。在此基础上,根据生产调度中心的管理需要,利用数据中心的数据实现各种上层应用,主要包括实时监视、告警监视、经济运行、设备管控、能效管理、故障诊断、数据挖掘分析等。
平台提供应用商店式的开发框架,新的应用功能可以在平台开发框架内即插即用,可实现应用系统的开放式开发管理。
3 结语与建议
通过建立集团级别的风电大数据生产调度平台,一方面按照当前大数据分析业务的要求,将所有现地数采设备和传感器的运行状况全面集中地反映在统一数据平台上,结合监测系统自身告警监测功能,可以由上至下及时开展监测设备的维护和检查,避免设备进入可信度低又无人监管维护的恶性循环中;第二,开发了模块化的数据采集软件,可以支持从风机直接采集所需数据,有利于下一步风机厂家技术壁垒消化工作的开展;第三,以Hadoop大数据软件为依托,采用虚拟化云平台技术,搭建了风电大数据平台,有利于下一步大数据挖掘分析工作的扩展,并可以为建设企业级跨部门的大数据平台打下基础;第四,建设开放的大数据平台和开发框架,并运用服务总线技术,为未来大数据时代数据的开放、共享提供技术储备。但风电大数据生产调度平台的后续完善以及对海量数据的挖掘,仍是亟需开展的课题,具体内容如下。
(1)生产调度平台的后续完善和维护。从现地数采设备到生产调度平台中心侧,涉及到大量的软硬件产品和物理网络连接,需要必要的人力物力长期保持对相关设备的完善和维护,如软硬件运行状态的监护、网络环境的监测,底层传感器和数采设备的定时校对和更换。虽然部分工作能够通过软件报警和通知功能完成,但这些功能的需求设计、开发和使用,仍是需要人员参与的长期过程。
(2)风机厂家技术壁垒的消化。本平台虽然消化了部分风机厂家数据采集的技术壁垒,但风机机型众多、涉及各厂商利益。要实现大数据时代的开放、共享还需要各方共同努力。
(3)大数据挖掘工作的扩展。大数据中心的建立,为后续的数据分析应用打下基础,如:气象大数据分析功能的扩展、风机故障预警功能的扩展[4]、大数据挖掘在风电选址方面功能的扩展、风电机组运行状态监测等,仍需各方向的专业人员协同工作、共同进行相关深度数据挖掘的业务需求梳理、挖掘算法验证及结果分析验证等工作。