APP下载

基于电力大数据城市造影分析

2021-09-17伍润泽王莉

大众投资指南 2021年2期
关键词:造影因素模型

伍润泽 王莉

(国网四川省电力公司德阳供电公司,四川 德阳 618000)

移动互联网、物联网、云计算等新一代信息技术的快速发展和5G技术的应用推广,标志着人类社会正式进入大数据时代,数据成为重要的战略资源。通过深入探索电力数据与社会数据、互联网数据的融合创新,促进大数据的流通集成和深度挖掘,创造大数据在智慧城市、人工智能发展应用中的良性生态环境。

电力是国家能源,电力行业的发展是国民生计大事。随着大数据的时代的到来,智能电网和信息化建设,电力行业积累了海量数据,这些数据在数据量、多样性、速度和价值方面具有大数据的特征。

研究城市的未来发展、城市的合理布局和综合安排城市各项工程建设的综合部署,是一定时期内城市发展的蓝图,是城市建设和管理的依据。城市规划是以发展眼光、科学论证、专家决策为前提,对城市经济结构、空间结构、社会结构发展进行规划。通过优化城市规划,发挥指导和规范城市建设的重要作用,进行城市造影构建根据城市发展与运行状况不断修订城市规划,持续改进和完善进行连续决策。

一、模型框架

以电力数据为核心,构建多维城市发展历史状态比对模型,并在此基础之上形成电力数据城市造影信息分析,通过海量电力数据为基础,利用降维分析、系统聚类分析、主成分分析等方法,构建城市发展状态的多维模型,另一方面结合外部城市经济环境数据与电力数据指标,通过动态时间规整、支持向量机等算法对目标城市与全国范围内所有城市进行比对,实现全视角、多空间、多城市的发展状态比对。

动态时间规整DTW对各样本的综合得分时间序列数据进行相似性测度,得到各样本的初始距离阵。采用计算样本综合得分时间序列(面板数据转时间序列),对时间序列编码符号化,引入趋势距离得出两条时间序列的原始数据距离及其发展趋势的相似程度,再用根据样本距离矩阵用ward聚类。

电力数据造影模型本质是以应用为中心的开源SaaS服务平台,其整体架构由多源数据管理、计算资源管理、应用场景管理三个资源层与应用层构成,以满足多用户,多场景定制分析应用的需求:

电力造影模型Saas服务使用SOA技术架构进行开发,SOA提供逻辑与物理层面的松散耦合,因此可以根据造影平台需要对不同数据服务场景使用不同的API暴露方案,具有可重用的服务和可重组服务以及标准化的服务接口。并且具有服务独立性和平台中性,可以满足扩展性不受到平台、语言以及应用框架的约束,最大限度满足造影平台分析场景及应用环境的多样性。基于SOA框架,具体使用Docker、Kubernetes等容器技术开展研发,可作为公有云环境下的应用交付平台、DevOps平台、自动化运维平台和行业云平台,或作为企业级的混合云多云管理工具、kubernetes容器管理工具或Service Mesh微服务架构治理工具。

二、算法说明

时间序列数据存在多种相似或距离函数,其中最突出的是动态时间规整[1](Dynamic Time Warping)。动态时间规整未知量伸长或缩短(压扩),直到与参考模板的长度一致,在这一过程中,未知单词的时间轴会产生扭曲或弯折,以便其特征量与标准模式对应。给定两个时间序列Q和C,Q=[q1,q2,…qn],C=[c1,c2,…cm],若n=m,可直接计算两个序列的距离;若n≠m,则需要线性缩放到一样的长度再进行比较。为对齐这两个序列,构造一个n x m的矩阵网格,矩阵(i,j)处的元素为为qi和和cj两两个点的距离d(qi,cj)(即序列Q的每一个点和C的每一个点之间的相似度,距离越小相似度越高)。寻找一条通过该矩阵网格若干格点的路径,路径通过的格点即为两个序列进行计算的对齐的点。该路径定义为warping path规整路径,用W表示。W=w1,w2……wk其中=中wk=(i,j)k。W需满足边界条件、单调性和连续性。满足这些约束条件的路径可以有指数个,然后需要使得下面的规整代价最小的路径,该路径可通过动态规划算法得到。

ARIMA属于时间序列分析法[2],其在电力数据预测中的应用也比较多,其具体的处理步骤为:首先通过ARIMA模型对原始数据进行检验,检验其是否为非平稳时间序列, 如果不是非平稳时间序列,则需要对其进行处理;多次处理后检验为平稳的时间序列,再根据识别阶数,建立ARIMA(p,q)模型。

时间序列数据变化的影响因素归结为四类: 长期趋势(Trend)、季节变动因素(Seasonal variation)、循环变动因素(Cyclic variation)以及非规律性变化因素 (Irregular variation)。其中,长期趋势与季节变动因素属于基本决定因素,循环变动因素属于规律性因素,而非规律性因素则是偶然不规则因素。然而,在特定时间段内,三类因素并不是同时显著影响时间序列的变化,每一类因素对数据影响是否显著、显著程度需要通过计算分解获得。 因此通常在传统 ARIMA 模型基础上,加入季节调整算法,及考虑季节变动、非规律因素对数据的影响,并通过趋势分解,分别预测不同的因素对时间序列的影响。

三、数据采集

电力城市造影分析主要包含电力数据、政务数据、企业数据、公开数据四部分:

电力数据:电力数据是城市造影分析的数据基础,因为电力数据具有精确性、实时性、广泛性等独特优势,可以在不同程度上,从多角度衡量社会发展的各个方面。

政务数据:政务数据是模型服务政府治理的关键,通过政务数据与电力数据的钩稽融合,可以更好地服务政府基础治理,协助政府建立实时监测场景。

企业数据:企业数据是模型服务企业客户的核心,主要包含企业用户在使用本平台接入的共享数据、可能包含授权脱敏的企业基础数据、生产经营数据、供应商数据等。

公开数据:外部多源公开数据是模型进行服务优化的重要补充,主要包含外部天气、地理、文化、舆情、行业、经济等数据,构建的分析场景状态中,需要大量外部数据用于绘图辅助、分析参照等功能。

四、功能实现

综合运用LASSO法、PCA分析法等统计方法,将高维的繁多的电力数据、经济数据输入,基于城市各指标的发展状态时间序列,运用X-12Arima调整、DTW规划等方法进行特征工程,结合聚类、xgboost、svm等机器学习算法,构建多维城市历史状态比对分析。实现面板数据中、时空视角下城市的各维度发展趋势的相似性程度分析,以分类算法解决与目标城市特定年份最相似城市的匹配实现。开发城市发展造影模型。结合logit、BP神经网络等预测算法,利用电力数据关联产业结构,透视城市产业群结构状态,预测电力区域流向,达成产业协同最优方案。

五、结束语

通过开展城市造影分析,构建电力数据为核心的城市整体运行状态数据监测指标体系,形成全视角、多空间的城市画像,为城市治理、规划、投资、城市群协调发展提供实证数据支撑。深度挖掘电力数据的社会、经济与商业价值,为政府、行业、用户提供更好的服务。为政府对了解自身城市发展定位提供参考,实现电力服务政府治理与价值拓展。为规划城市发展提供参考路径,提高投资效率和规划效率,优化社会资源配置,提升群众生活水平。

猜你喜欢

造影因素模型
超声造影在周围型肺肿块穿刺活检中作用
输卵管造影疼不疼
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
解石三大因素
输卵管造影疼不疼
3D打印中的模型分割与打包
短道速滑运动员非智力因素的培养
FLUKA几何模型到CAD几何模型转换方法初步研究
超声造影在妇科疾病中的应用