APP下载

电网数字化战略中风险的结构性递展分析:基于多站融合项目运营

2022-10-08张晨孙轶恺崔维维刘平阔

智能电网 2022年5期
关键词:决策树问卷指标

张晨,孙轶恺,崔维维,刘平阔*

(1.国网能源研究院有限公司,北京市 昌平区 102209;2.国网浙江省电力有限公司经济技术研究院,浙江省 杭州市 310020;3.上海电力大学经济与管理学院,上海市 杨浦区 200090)

0 引言

电网数字化转型成为当前发展的一种新业态,是将数字化、智能化、互联网化应用于传统电网,以增强电网的灵活性、开放性、交互性、经济性、共享性的过程,因此,传统单一变电站的资源价值已不能满足电网数字化转型过程中用户的需求[1]。充分发挥变电站站址富余资源价值,探索对外提供公共服务的新业态,培养新的业务增长点,进行多站融合项目的建设将成为必然趋势。多站融合项目是以变电站资源为核心,实现多类需求交叉融合发展,优化能源类业务、发展信息类业务、开拓租赁类业务,将各类资源优化整合,实现能源和信息的互联互通、平等共享、供需平衡、优化互动,以优化电网运行和业务能力水平为目标,优化能源配置,提升综合服务水平,最终构建包括物理形态、数字形态和产业形态的共享平台[2]。在此背景下,建设实现资源优化分配、增强信息共享、保障运作可靠、实现运营和运维管理、提高经济和社会效益的多站融合服务至关重要。多站融合充分应用了“大-云-物-移-智-链”等技术,以实现多站融合项目所涉及的各环节互联互通,提高了数据采集、应用的能力。然而,随着云计算、SDN(sofeware defind network, 软件定义网络)、NFV(network functions virtualization, 网络功能虚拟化)、5G等新技术的引入对传统的单个站运营安全造成了巨大的冲击,存在传统风险、新增风险等多方面风险隐患[3]。因此,有必要就电网数字化风险评估开展研究,其中多站融合成为了数字化过程的“排头兵”项目。通过对多站融合运营风险源以及风险指标的分析,确定在不同场景业务下各类风险指标的重要程度,明确进行风险规避时决策侧重点[4],从而保证多站融合系统的安全、高效、可靠运行,为在多站融合的经济运行和价值最大化打下基础。

诸多学者对多站融合项目的建成与运营进行了深入探讨,其整合现有的通信、电力等资源,实现资源利用最大化,相对于单站运营,多站运营更具有优越性[5-6],能够实现“电力资源、电力业务、通信数据”三者合一。多站融合等形式的综合能源服务已成为当前国家能源战略和能源企业发展的新焦点[7-9]。多站融合系统的复杂性和各种不确定性的相互作用,使得维持系统正常运行变得困难[10-13],即多站融合系统的复杂性和智能化的快速发展导致了潜在运营风险增加[14-19]。确保多站融合的优势以及效益最大化的前提是保证多站融合安全稳定运行,那么,风险与安全研究以反映风险波动在操作阶段避免重大事故就至关重要[20-21]。进行多站融合风险管理评估就是控制多站融合运营过程中可能出现的风险,用尽可能低的成本降低多站运营风险[22-23]。

在进行风险管理之前要明确风险的衍生源与风险指标为风险的量化评估打下基础[24]。关于变电站类风险分析中,变电站在项目建设阶段多存在项目的安全、质量、进度风险,以及自然风险等。在变电站运行维护阶段多存在技术、人员、外力等方面因素引发的风险[25-28]。

本文就基于变电站基础的多站融合项目运营中可能出现的风险衍生源进行分析,定义存在的风险指标,以及对定义的风险指标进行结构性分析。为此,利用卡方自动交互检测法(chi-squared automatic interaction detector, CHAID)的决策树分类原理,聚焦多站融合项目风险的结构性递展过程,着力分析三方面问题:①在多站融合的项目安全运营过程中风险指标及体系的建立;②分析风险指标体系,研究其风险递展进程;③明确在多业务场景下风险指标的重要程度,并提出决策侧重点。本文旨在从理论上建立完善的多站融合风险指标体系,在应用上为多站融合风险管控提供较为全面的风险状况参考。

1 研究方法

1.1 风险指标体系构建

风险指标体系的建立以多站融合项目的经济增加值[29](economic value add,EVA)作为多站融合运营风险评估的起点,对其进行价值型绩效分解,如图1 (a)所示分解出三大类价值驱动因素[30]:运营利润率、资产利用率、运营性现金流。将风险因子与三类价值驱动因素结合,分析出九大绩效杠杆[31-32],如图1 (b)所示。

进而,在原有变电站风险源分析的基础上,根据多站融合的实际运营情况和指标确定标准,并结合多站运营、电力市场、5G相关运营管理者的意见,得到其风险管理涉及充换电站、5G基站、分布式能源站、数据中心站、储能电站、北斗基站等融合运营中各环节协调发展的风险衍生源[33-34]。从定性角度对十大风险源进行分析将风险指标定性分为11个指标,如图1 (c)所示:R1信息传递风险、R2技术可靠性风险、R3区位选址风险、R4绩效偏差风险、R5财务风险、R6部门文化差异风险、R7经济周期风险、R8制度规范风险、R9需求风险、R10政策风险、R11意外灾难。关于风险指标定义的具体解释,详见附录A。

根据多站融合项目的投资建设期、项目运营期以及收益期等不同时期的不同特点,从3个维度对11个风险指标进行分类:政策风险、市场风险、运营风险。其中运营风险包括 R1、R2、R3、R4和R5,政策风险包括 R8、R10,市场风险包括R6、R7、R9、R11。从内生和外源两个层次对11个风险指标进行分类:内生风险(R1、R2、R3、R4、R5、R6和R7)和外源风险(R8、R9、R10和R11)。

1.2 风险递展

多站融合的物理形态呈现出“变电站→能源站→多业务站”的技术协同与功能延展过程;在综合能源站、光伏发电站、储能站(充换电站)的基础上,科学整合数据中心站、5G基站、北斗地基增强系统站等优势资源与“新基建”设施,形成多领域、多业务的逻辑融合、结构集成、优势互补、数据贯通,成为实现电网数字化与电网高质量发展的前沿领域和关键一环。

多站融合运营项目呈现“多方位、多层级、多环节”的特点,其运营环节的各个方面相互依存,任何一个环节出现风险都会波及其他环节,因此需要进行风险递展分析。本文进行的风险递展分析主要是针对各个环节之间、各个风险因素之间对多站融合运营项目的影响,在运营管理中根据多站融合运营的特点对其运营风险的重要程度进行优先排序,以供决策者做出最优决策。本文采用数据挖掘(data mining,DM)方法对风险结构性递展过程进行分析。

数据挖掘模型的功能优势在于通过预测未来趋势及行为,做出前摄的、基于知识的决策。基于多站融合运营阶段的大量数据,本文通过数据挖掘模型对其进行处理,分析预测出未来的风险趋势以及风险侧重点,为风险管控与决策提供理论依据[35-37]。

数据分析中的分类和预测是两种不同的形式,是指对现有数据处理显示未来趋势的模型。当输出具有离散性,则为分类;当输出具有某种连续性,则为预测[38]。本文中11类风险指标属于离散变量,因此本文研究的问题为分类。

数据分类问题通常采用统计、距离、决策树或者神经网络等方法解决,由于本文所分析问题中风险类别较多、所要求的风险状况分析较为复杂,因此本文采用易于分析且结果表达直观的决策树算法[39-40]。

1.2.1 CHAID算法

本文采用卡方自动交互检测(CHAID)方法对风险结构性递展过程进行分析。CHAID算法是一种用于数据集分类的灵敏且直观的决策树技术,它细分属性变量和因变量之间的关系。本文使用CHAID算法,能够确保风险变量分类的准确性高,可以清晰地显示哪些字段比较重要,即生成清晰的规则[41]。模型运行结果为一个树状图,顶端是所有样本观测值的合集,接着分成两个或两个以上的子集,即能从多个风险变量中自动搜索出产生最大差异的风险变量,从而达到对风险指标分类的作用。

1.2.2 CHAID算法步骤

1)定类/定距变量属性的判定。

①若本文处理变量属性为定类,则需找到在多个分类的标准级别下合并影响不明显的变量。

②若本文处理变量属性为定距,则根据输出变量的种类不同,采用不同的检验方法,即分类变量采用卡方检验,数值变量采用F检验。

2)已判定分支变量的确定和分隔值的选择。

①按照步骤1)中计算出各个变量的卡方检测统计量和P值。根据P值的大小来确定变量的关联程度,选择与目标变量关系最为密切的作为最佳分支变量,其他变量作为其子分支节点。

②重复上述操作,直至满足收敛。

1.2.3 CHAID算法公式

拟合优度检验,即检验模型对样本观测值的拟合程度。在检验过程中,实际观测数与理论观测数关系为

fe越大,即fe≥5,说明检验结果越好,拟合程度越高。

当样本容量较小时,利用似然比检验对数据的分类处理更为通用和稳健,因此,本文中考虑使用似然比检验。似然比的计算公式为

式中:RLR为似然比;L1为复杂模型中的最大似然估计值;L2为简单模型中的最大似然估计值。

样本的联合分布函数为似然函数

式中:θ为待估参数;x1、x2、…、xn均为来自总体样本x的观察值。

提升度用以反映CHAID模型中的收益 (%);提升度越高,说明模型的 “收益”越好。提升度的计算公式为

式中:Llift为提升度;为模型特定样本空间输出值是t类的概率;为所有样本空间内输出值是t类的概率。

2 数据及分析

2.1 实验数据处理

2.1.1 数据采集

第一,将各个指标的含义进行简洁的定义与解释。

第二,将第一步中定义的研究变量与多站融合项目的工作人员、运营管理方面学者以及风险评估方面的专家等进行沟通讨论,对问卷中变量以及对变量的解释进行修改和完善。

第三,组织部分专业人士进行预问卷调查,修正部分内容。

第四,以各种不同的形式正式发布调查问卷。

第五,定期回收,检查质量,对已回收问卷进行处理。

问卷将政府部门、教育及科研机构、电力企业、多站相关企业等的相关工作人员设为答卷人的选择范围。

问卷分为五部分:调查目的说明、问卷说明、答卷人背景的信息调查、对多站融合运营风险指标的解释、答谢语。其中,问卷主体内容包含两部分:第一部分即答卷人背景信息的调查;第二部分是针对影响多站融合运营项目的风险指标进行调查(即将指标影响程度分为一般重要、稍微重要、比较重要、非常重要、极其重要五个层次进行打分)。

2.1.2 统计性描述

本次问卷调查回收周期为3个月 (2020年8月至2020年11月),实际共发放问卷500份(为了保证问卷的分析结果准确,样本容量应在300份以上[27-28]),实际收回问卷416份,其中有效率为82.45%。对问卷数据进行分析、处理如表1和表2所示。

表1 信度分析Table 1 Trust level analysis

表2 效度分析Table 2 Validity analysis

信度分析用于研究数据的回答可靠准确性。

第一,分析表1中的α系数,若α≥0.8,即说明该问卷属于高信度;若0.7 ≤α< 0.8,则说明该问卷属于较高信度;若P=0.000<0.05,则说明该问卷属于低信度;若KMO值小于0.6,则说明该问卷属于低信度。

第二,若CITC值小于0.3,可考虑将该项进行删除;

第三,若“ 项已删除的α系数”的值明显高于α的值时,说明可以将该项删除后对其他各项重新进行分析。

第四,对分析进行总结。

如表1所示α=0.833>0.8,因此,可以说明该问卷调查中的研究数据的信度好。且删除任意项的“项已删除的α系数”,结果不会有显著的提高,因此,说明问卷中的各项不需要做删除处理。

上述各项中的CITC的值均满足大于0.4的条件,因此,说明各项间相关性良好,也可说明该问卷的信度高,可用于进一步分析。

效度研究用于分析研究项是否合理有效。

第一,分析表2中的KMO值,若KMO值不小于0.8,说明该问卷效性高;若KMO取值[0.7, 0.8),说明该问卷效性较高;若KMO取值[0.6, 0.7),说明该问卷效性一般;若KMO值小于0.6,说明该问卷效性较低。

第二,效度分析要求需要通过Bartlett检验(对应p值需小于0.05)。

第三,若仅两个分析项,则KMO值均为0.5。

从表2中得KMO值为0.893,大于0.8,即该问卷效度高。

调查对象情况如表3所示。

表3 调查对象个人信息表N=343Table 3 Personal information form N=343

续表

2.2 数据分析

2.2.1 数据预处理

卡方检验统计结果如表4所示。

表4 卡方检验统计Table 4 Card side inspection statistics

若总例数不少于40,最小理论频数大于5,则满足卡方检验条件,选择卡方值(pearson chi-square)和对应的P值(即Sig)。若P≤0.05,即说明差异具有统计学意义;反之,P>0.05,即说明差异无统计学意义。

从表4可以看出:P=0.000<0.05,差异有统计学意义。

2.2.2 CHAID决策树构建

1)模型建立与执行结果。

本文采用Clementine软件完成分类建模过程。

①将数据导入数据流,选择“分类”节点对其进行预处理。由于本文采用的是主观数据,考虑到数据的主观影响以及分类的清晰度,仅将风险分为不存在“0”以及存在“1”,即调查问卷中指标影响程度中一般重要、稍微重要两个层次归为不存在类别,比较重要、非常重要、极其重要三个层次归为存在类别。

②选择“CHAID”模型节点,进行建模。

③模型的“专家”选项中,卡方用于类别目标选择“似然比”,其他“字段”、“成本”、“注释”保持原始设置不变。

④形成完整的数据流,输出模型,生成决策树。

CHAID决策树结果如图2所示。

由图2可得,多站融合运营风险的决策树结构呈多分支走向,图2和表5用不同的方式展现了多站融合运营的风险诊断。其中,各个分支节点P≤0.025,即具有较强的相关性。由图2的分支走向可得,当多站融合项目运营过程中不存在“部门文化差异风险”时,决策者应优先考虑运营风险体系中的“信息传递风险”,该指标数n=70,占样本总数的20.408%(P=0.000); 当多站融合项目运营过程中存在“部门文化差异风险”时,项目决策者应优先考虑运营风险体系中的“意外灾难”,该指标数n=273,占样本总数的79.592%(P=0.000)。其他的风险递增决策过程以此类推。

由图2可知,根据多站融合运营决策树分支的去向和发展以及CHAID模型分析层次,可得到决策树14个分支去向,即多站融合运营项目的主要风险状况分为14种,进一步分析可得如下结论。

首先,决策树的起始风险为“部门文化差异风险”,即说明“部门文化差异风险”的存在与否对风险状况的走向影响最为深远,因此“部门文化差异风险”成为融合的最大不确定性因素;

其次,“信息传递风险”和“意外灾难风险”位于风险决策树的第二层级,在分析“部门文化差异风险”后需要根据概率权衡“信息传递风险”和“意外灾难风险”以进一步分析风险状况;

最后,在风险决策树低端的“财务风险”、“经济周期风险”、“政策风险”和“制度规范风险”,相对于而言对风险状况的影响较小、易于管控。

将图2中的14种分支去向用表格的形式来表示,见表5。通过表5对风险状况的展示,可清楚的看出CHAID模型将定义的11个风险指标进一步筛选出10个较重要的影响多站融合运营风险管理的风险指标。表5中的14种风险状况为具体多站融合项目的风险识别提供参考,使运营项目有目标有侧重点地进行风险管控,以降低项目存在的风险隐患,提高其运营可靠性。

表5 多站融合的风险状况Table 5 Risk conditions for multi-station fusion

2)模型收益评价。

表6和表7中,给出模型的收益评价数据。其中,各个主要节点的收益评价用“指数(%)”的值来表示,“指数(%)”的数值越大,则说明上述CHAID模型的收益越好。

表6 训练样本各节点的收益数据Table 6 Train the revenue data for each node of the sample

表7 训练样本累积的收益数据Table 7 Revenue data accumulated from the training sample

最后,由clementine软件CHAID模型预测结果可得,其多站融合运营决策树的错误率为0.335,标准误差为0.072,错误率及标准误差都在可接受范围内,因此分析过程合理。

3 结论及建议

3.1 研究结论

第一,为针对性研究电网数字化的风险管控问题,本文以多站融合运营项目为例,建立了多站运营的风险指标体系,为分析确定风险源及风险指标的递展关系提供理论框架;进而,为多站融合在各场景下的风险指标属性进行分类,由运营风险决策树的分支去向可得,“部门文化差异风险”、“信息传递风险”和“意外灾难风险”属于表象风险,“绩效偏差风险”和“区位选址风险”属于潜在风险,为进一步风险规避提供了决策侧重点。

第二,本文将多站融合的运营风险递展通过过程性维度进行递展分析可得,在项目导入期,“部门文化差异风险”成为融合的最大不确定性因素,其次需要根据概率权衡“信息传递风险”和“意外灾难风险”,而常规意义的“财务风险”、“经济周期风险”、“政策风险”和“制度规范风险”等风险处于可控范围。

第三,本文得出的14类风险状况可用于多站融合导入期、建设期、运维期的风险识别,在未来的研究中,以本文所建立的风险指标体系以及风险状况为指导,可对多站融合项目进行风险管控,提高项目运营可靠性;随着多站融合试点的不断扩大建设,可根据实际出现的安全隐患对本文的风险指标及风险状况进行修正,以更好地应用于实践。

3.2 政策建议

当前,作为中国能源战略和能源企业发展的新焦点的多站融合项目的兴起,迫切需要解决多站融合运营的安全稳定运行问题。因此,本文总结以下政策建议。

首先,稳步建设多站融合试点运营、推进电网数字化转型,完善相关电力政策法规。从而,从源头解决部分风险衍生源,在多站融合项目启动、投运或经营之前,在选址、建设方面规避致命性风险因素,在多站联动、站址规模、投资成本等方面实现多站融合项目运营安全。

其次,推进具有区域地方特色的多站融合运营风险理论体系研究,尤其是涉及针对各个不同的多站融合项目的运营场景下的风险递展途径进行明确,从而改进相关政策制度、指定应对风险有效策略以及加强风险监管的机制等关键问题的研究,使之成为多站融合风险管控的有力支持和有效机制。

最后,稳步推进技术革新,充分利用电力企业在多站融合运营项目中的牵头、引导作用,从而形成规范、稳定、安全运营环境和行之有效的政策支持框架,促进多站融合的发展。

附录A 多站融合项目运营风险指标的重要性评价

多站融合风险指标 风险对于多站融合项目运营的重要程度指标的名称及其说明 一般 稍微 比较 非常 极其R1信息传递风险 1 2 3 4 5说明:对多站融合中的实时监测与反馈的要求更高,各环节传递信息发生信息错误的机会增多。R2技术可靠性风险 1 2 3 4 5说明:多站融合运营后技术本身的先进性、可靠性、实用性、可得性与预期方案发生较大变化,达不到预期的效果,而导致损失的风险。R3区位选址风险 1 2 3 4 5说明:部分站选址局限性问题突出,区域因素影响的不确定性。R4绩效偏差风险 1 2 3 4 5说明:多站融合运营过程中项目绩效总收益较原站绩效收益总和有下降的风险,从而造成损失的风险。R5财务风险 1 2 3 4 5说明:数据中心等需要统一运营的业务需要重点防范分散运营而失去合力的情况,从而造成品牌不强、市场能力薄弱、运营成本过高的情况。R6部门文化差异风险 1 2 3 4 5说明:多站原有的运营方式、运营理念、制度等在融合过程中存在冲突的可能性增大。

多站融合风险指标 风险对于多站融合项目运营的重要程度指标的名称及其说明 一般 稍微 比较 非常 极其R7经济周期风险 1 2 3 4 5说明:外部市场竞争激烈,在整体服务体系、营销管理上要具备外部竞争的能力,需要关注投资与收益不匹配的问题。R8制度规范风险 1 2 3 4 5说明:数据中心类指南或规范,现行内容不适用多站融合,与多站融合场景存在一定冲突。R9需求风险 1 2 3 4 5说明:多站融合业务的多样化同原站单一业务比较需求的不确定性增大,使损失的风险加大。R10政策风险 1 2 3 4 5说明:国家的制度、法律在逐渐完善的过程中,规制、制度、法律法规的调整、修订的不确定性。R11意外灾难 1 2 3 4 5说明:地震、火灾、公共卫生安全、政治的动荡、意外的战争、气候变化、环境恶化等指标补充及重要度1 2 3 4 5

猜你喜欢

决策树问卷指标
主要宏观经济指标及债券指标统计表
主要宏观经济指标及债券指标统计表
简述一种基于C4.5的随机决策树集成分类算法设计
莫让指标改变初衷
主要宏观经济指标及债券指标统计表
决策树学习的剪枝方法
问卷大调查
问卷你做主
决策树在施工项目管理中的应用