基于电力大数据的经济景气指数解析
2022-01-17国网新疆电力有限公司信息通信公司王天军王巧莉胡新苗
国网新疆电力有限公司信息通信公司 王天军 王巧莉 胡新苗 刘 昆 苟 亮
在我国社会经济持续发展的背景下,为电力行业提供了新的发展机遇。但电力行业景气处于不断波动的状态,如波动范围过大会使电力供需和经济发展的矛盾更加突出,进而影响国家经济发展和居民生产生产水平。基于电力大数据能更加全面地把控电力行业景气波动和宏观经济波动间的联系,更好地把控行业态势,为电力行业的发展和规划设计提供更加科学合理的依据。
1 电力企业大数据概述电力行业发展现状
电力企业大数据指的是将大数据技术和理论知识应用到智能电网中来,把用户用电习惯、电力经营、电力系统维护检修、电力工程规划设计等各方面的信息和数据,通过互联网传递到电力企业的信息中心进行集中分析和处理,从而为电力事业的发展提供更加真实的依据。电力企业大数据是电力行业技术改革的主要产物,并不仅体现在技术进步上,更多涉及到电力系统的发展理念、规划设计模式、技术路径等方面的革新。这是因为大数据是以个性化商业未来作为核心价值,可促进电力企业能够重新审视自身价值。且电力大数据还能借助优化生产运行的方法提升节能降耗水平,逐步向绿色产业的方向发展。
其所具有的特点主有:数量体量非常大,不仅包括设备状态数据,也包括资源使用、用户信息等各个方面的数据;数据类型较多,包括流程记录数据、测电量数据等结构化数据,以及视频、图表、音频等非结构化数据;处理速度非常快,数据的采集、汇总、分析、处理、存储及使用效率更加快、更准;价值密度较低,有数据量非常庞大,因此就无法保证数据质量,在特定时间内有价值的数据密度相对较低。
电力行业是维系其他行业健康发展的关键,我国电力行业始终保持良好的发展速度,从2015年到2020年全国发电量都在持续增加。据中国电力企业联合会统计,2020年全国全口径发电量为7.62万亿千瓦时,同比增长4.05%。2020年全国第一产业用电量859亿千瓦时,占比1.14%;第二产业用电量5.12万亿千瓦时,占比68.19%;第三产业用电量1.21万亿千瓦时,占比16.09%;城乡居民生活用电量1.09万亿千瓦时,占比14.58%。2016~2020年全国第一产业和第二产业用电占比呈下降趋势,第三产业和城乡居民生活用电占比不断提高,近年来信息传输、软件和信息技术服务业用电量持续高速增长。
此外,近年来我国电力行业稳健发展,但受到环境保护的影响,清洁能源将成为未来我国电力行业发展的主要方向,煤电灵活性改造和清洁能源将会成为未来我国电力行业发展的主要趋势。
电力大数据对经济景气指数模型的改进:虽然目前我国电力行业的发展势头比较强劲,但日常经济指数模型构建和分析中,判断经济周期和经济走势依然存在很多短板,其中最显著的短板是判断规则的把控和积极指标的滞后性。而电力大数据和经济数据相比具有更高的先行性,可利用电力大数据来构建经济景气指数模型,以便更加科学的支撑电力行业发展经济形势的把控,保证发展决策和战略方针的制定具有一定的前瞻性[1]。为最大限度上发挥出电力大数据先行性的优势,可采用等权重加权的方法来改进电力经济景气指数模型,选择那些周期性较强的行业来构建基于电力大数据的经济景气指数。具体而言,可引入经济学中关于经济周期理论的繁荣、衰退、萧条、复苏四个阶段构建起周期性的变换模型。
2 基于X13-ARIMA 的经济景气指数模型构建
2.1 模型构建
为更加深入地分析和研究电力经济景气指数,需结合电力行业相关经济指标、利用X13-ARIMA算法来构建经济景气指数模型。对采集到的电力大数据进行预处理,计算机算出行业的月度电量、业扩月度报装容量同比增长率等,并对预处理后数据的完整性进行全面检查,如存在缺失情况要及时填补。如:在2019年电力景气指数模型构建中,需对2019年前后细分行业分类不一致的数据再按照新旧行业对应关系表进行全方位整理,然后再采取时差交叉相关系数法来详验证行业月度电量、业扩月度报装容量同比增长率等电量行业经济指标先行、一致以及滞后的关系。如将基准指标设定为y={y1,y2,y3……},而被选中的指标则设定为x={x1,x2,x3……xn},设定r 为时差相关系统,则有:
式中l=1,±1,±2…±L。l 表示的是电力行业超前或者滞后的期数,如为负值表示滞后、正值则表示超前,L 表示最大的延迟数,而nl表示数据对齐后的数据个数[2]。
最大时差相关系数反映了被选指标和基准指标的时差相关关系,而延迟系数则可反映出超前或是滞后的期数。在进行电力行业电量、业扩报装容量增长率序列调整中,可采用X13-ARIMA 算法进行有针对性的调整,可准确获得周期循环趋势项。但为保证调整的准确性,需假定时间序列,包括趋势周期、季节、日期效应、不规则序列等,这些内容普遍具有很强的随机性和不可测性,需使用信号提取技术从观测的时间序列中进行准确的识别和估计。
2.2 调整程序
电力在不同季节存在较大的变化幅度,通常夏季用电量最大,为用户用电的需求,在利用X13-ARIMA 算法构建电力行业经济景气指数模型时,需对相关程序进行季节性调整、先进行预调整,选择出ARIMA 误差最能描述原始序列特征的回归模型,用于调整序列的确定性影响,同时扩展时间序列分解中使用的具有回溯性和预测性的序列[3]。然后将预先调整的序列分解成未观察的组件,主要包括趋势周期、季节性、不规则性。将预调整确定的因数逐步分配到各自的成分,最后将原始序列完全分解成最终的周期、季节、日历、不规则成分等。其中季节性调整序列通常可通过没有季节和日历效应的序列来获得。
在绝大数情况下,调整程序需经过至少两个步骤,即预先调整和序列分解,在具体调整中两个步骤是分开处理的,但为保证调整程序的科学性和有效性,需全部纳入任何季节性调整程序中来。如:在预先调整时,选择的条件不同则最后的分解结果也不相同,且实际序列分解结构可能会指向预调整阶段的变化。两个阶段最终的结果都需详细分析,以保证季节性调整结果的质量。
2.3 应用验证
为验证基于X13-ARIMA 算法构建经济景气指数模型的应用效果,需结合实际情况对电力经济景气指数进行验证分析,选择的用电量指标选取情况如下:公共管理和社会组织领先周期为6个月、相关系数为0.74;金属冶炼和加工业不存在领先周期,但存在相关系数为0.73;工艺品和其他制造业的领先周期为3个月,相关系数为0.70;房地产行业领先周期达到7个月,相关系数为0.76;燃气生产和供应行业的领先周期为6个月,相关系数为0.59;住宿和餐饮业的领先周期为9个月,相关系数为0.51[4]。先行指标相关系数在0.65以上的行业领先周期在5~6个月之间。
经季节性调整后,基于X13-ARIMA 算法构建的经济景气指数模型经济景气指标时间序列被拆分为趋势周期部分、季节部分、日期历程部分、不规则部分。通过进一步分析计算可知,先行指数和一致性指数的计算结果及合成指数趋势良好,电力经济景气指数表现出良好的趋势一致性[5]。此外,为更好地反映电力经济指数和实际经济指数的一致性,对比分析了电力经济景气指数和工业增加值,发现二者的趋势保持一致,表明基于X13-ARIMA 算法构建的电力经济景气指数模型具有很好的应用和推广价值。
综上,采用理论结合实践的方法分析了基于电力大数据的经济景气指数的解析,分析结果表明,将经济学领域中经常用到的景气指数模型应用到电力经济景气指数中,具有良好的一致性和先进性。在电力大数据的背景下,采用X13-ARIMA 算法构建的电力经济景气指数模型能真实反映出电力经济景气指标。而通过实例验证表明此种方法能够真实、有效、科学合理的反映出电力大数据背景下电力行业经济景气指标的发展趋势,契合目前我国电力行业的发展现状,值得大范围推广应用。