基于生命周期理论和正态分布拟合技术的电网项目关键节点预警分析
2020-06-09车佳辰
文 凡,王 薇,成 飞,车佳辰
(1.国网浙江省电力有限公司经济技术研究院,杭州 310008;2.浙江华云信息科技有限公司,杭州 310008)
0 引言
项目管理是电网公司重要的经济管理活动,直接影响公司的生产经营发展,新电改机制下电网公司项目管理的外部环境和内部要求发生了深刻的变化,为落实“三集五大”管理要求,统筹协调电网公司各部门项目管理资源,提高项目管理的精益化水平,有必要进一步理顺电网公司项目管理现状和改进方向,构建科学合理的项目全过程监控指标体系,建立项目关键节点预警模型,支撑新电改机制下电网公司综合计划优化提升工作,实现与“加快建设与‘三集五大’”机制相适应的项目管理工作体系[1]。
1 项目全过程监控指标体系
基于项目生命周期理论,以项目管理流程为主要维度,从项目的关键节点中求同存异,梳理出项目执行全过程监控指标体系,实现各个项目的可比性。通过具体监测指标获得项目的整体运行情况以及所处的状态,对后续的项目进展及效益有充分的了解和预测。
1.1 项目生命周期理论的适用性
项目生命周期是一个项目从概念到完成所经过的所有阶段,一般项目都由4 个主要阶段构成: 规划阶段(提出需求和概念)、计划阶段(设计思路和方案)、实施阶段(执行项目方案的过程)、完成阶段(试运行或结束)[2-4]。对于电网企业而言,其投资项目呈现以电网基建为主体、衍生外围项目、全方面覆盖、服务于电网发展的总体特征,且由于电网项目门类繁多,建设周期较长,建设资金庞大,涉及的部门、资源、时间等因素过多,必须要对项目从规划到完结的全过程进行细化分析。项目生命周期理论的本质在于从不同阶段抽取项目所具有的共同属性,对项目进行全方位分析,尤其适用于大型复杂电网项目的监控和预警[5-8]。
1.2 项目全过程监控维度梳理
基于项目生命周期理论,考虑到电网企业的独特性与项目的复杂性,可以将电网项目基本流程进度划分为项目计划、项目执行、项目收尾3个阶段。然后全面考虑项目资源使用调度,如投资控制规模、资金使用、物资使用等,以及关系项目落实情况的建设进度,从时间节点、投资事件、建设事件、资金事件这4 个维度构建项目全过程监控体系。在具体的指标体系建立过程中,则应当不违背项目执行的整个流程,以保持相关监控指标体系的合理可行。项目全过程监控流程如图1 所示。
图1 项目全过程监控流程
1.3 项目全过程监控指标体系构建
基于项目生命周期理论,全面分析电网发展投入项目的执行全过程,即在流程控制层面,应当按照项目计划、项目执行、项目收尾这3 个不同阶段对项目运行的不同时期进行基本区分,从而实现项目的闭环管理。然后参考电网项目管理办法,进一步细分每个不同的项目阶段: 在项目计划阶段存在计划、初设、预算等不同项目阶段;在项目执行过程中包含招标、开工、建设等实际执行阶段;在项目收尾时需要进行竣工结算、项目投产、财务决算、项目关闭处理等。同时电网项目执行流程具有共性特征,即4 个监控维度: 时间节点、建设事件、投资事件、资金事件。最后在足够细分的监控范畴内,可以针对各类项目的具体情况进行分析,有针对性地提出相关指标。考虑到电网项目以电网基建项目为主体,其余的衍生项目服务于电网基建项目,因此,构建以电网基建项目为核心的项目监控指标体系如表1 所示。
表1 电网基建项目全过程监控指标体系
2 项目全过程监控预警模型
项目全过程预警模型是基于上述构建的项目全过程监控指标体系,选取关键节点的核心指标,量化指标分析项目运行风险状况并以此为基准确定风险强弱等级[9]。
2.1 正态分布理论的适用性
正态分布又名高斯分布,是一种概率分布。正态分布是具有两个参数μ 和σ2的连续型随机变量的分布,参数μ 是遵从正态分布的随机变量的均值,参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)[10-12]。当μ=0,σ2=1 时,称为标准正态分布,记为N(0,1)。
考虑到电网项目均经过严格的立项评审,具有严谨的项目管理规范,历史同类项目的执行流程具有可聚类性和可对比性,因此,假定电网项目服从正态分布,与正态分布的差异即为偏差,需要进行预警分析。构建基于正态分布理论的项目全过程监控预警模型,对各类项目的关键节点进行正态分布分析,同时考虑到电网项目专业性较强,难以直接使用正态分布的常规特性,因此对正态分布理论进行必要的修正:
(1)时间数据二次量化。项目全过程时间流程数据难以直接进行比较,必须将时间数据二次量化,实现不同项目数据之间的分布比较分析[13-15]。
(2)引入多维判断标准。单纯依赖均值和方差分析难以深入挖掘出电网项目的特性,因此增加中位数、众数、偏度、峰度等分布特征值,多维度分析项目关键节点的合理性区间和偏差[16-17]。
2.2 时间节点二次量化
全过程监控预警需要逐个分析项目推进过程中各个事件的计划时间节点,对每个时间节点进行偏差分析[18]。由于所有项目的执行时间尺度不同,难以进行横向比较,因此对于实际项目的数据需要进行标准化处理,将所有项目统一在相同的时间尺度上,从而使其具有可比性。选取所有项目都具备的两个时间节点作为基准: 定义项目开工时间为0,项目关闭时间为1,其余的时间节点数据以项目执行时间作相应的线性变换。变换方程为:
以表2 的时间节点数据为例。根据上述标准化过程,项目开工计划时间2018-01-01 定义为时间0,项目计划执行时间为2018-01-01—2018-06-01 共151 天,换算后的标准化时间节点数据见表3。
表2 原始时间节点数据
表3 换算后的标准化时间节点数据
对时间数据进行标准化处理的意义在于以下几个方面:
(1)将所有可能的项目计划节点按照各自项目执行时间的比例进行缩放,最终的标准化时间节点在形象进度上与原始数据等同。
(2)项目开工后经过100%的时间完成项目并达成项目关闭条件,与项目逻辑、形象进度相符。
(3)对于在项目开工后将要发生的事件,可以确定为在项目形象进度推进到a%的时候发生。
(4)对于在项目开工前会发生的事件,以项目计划开工执行时间为标准尺度对比后在项目开工前-b%时发生,此时虽与形象进度不符,但可以通过推广形象进度的概念使之具有类似意义[19-23]。
2.3 多维数据模拟分析
在实践中,样本数据受到多种因素的影响,多表现为偏态分布。在对偏态分布的统计分析中,除样本均值μ 和样本方差σ2之外,更为重要的数据在于样本众数(mode)、样本中位数(median)、样本偏度(Skewness)和样本峰度(Kurtosis)[24]。其中,样本众数定义为统计样本中出现最多的样本点,样本中位数定义为统计样本排序后处于中心的样本点,样本偏度系数定义为样本数据的三阶矩。
式中: γ1为样本偏度系数;Skew(X)为样本偏态系数的计算函数;X 为样本值;E[(·)3]为三阶中心矩。
针对样本数据可修正为:
式中: n 为样本量;xi为第i 个样本值;为样本均值。
若样本偏度系数γ1=0,则表示样本数据分布在统计均值两侧无偏向;若γ1>0,则表示样本数据更倾向滞后于统计均值出现;若γ1<0,则表示样本数据更倾向超前于统计均值出现。
样本数据的四阶矩表示为:
式中:Kurt(X)为样本峰态系数的计算函数;E[(·)4]为四阶中心矩。
通常为了使正态分布的峰度为0,定义超值峰度为:
针对样本数据样本峰度可以修正为:
若样本峰度系数γ2=0,则表示样本数据分布密度正常;若γ2>0,则表示样本数据分布密度更加集中;若γ2<0,则表示样本数据分布密度更加分散。
2.4 项目预警区间设置
在量化和归一化项目关键节点计划时间和实际时间后,通过比较分析差异,设置预警区间进行预警分析。对于某个监测数据的预警模型,可以通过历史数据分布设定不同的阈值来确定各自的预警区间。在实践中,随着样本偏离中心程度的扩大,预警的必要性不断增强,可以设定30%,20%,10%的分级预警区间,如图2 所示,其中抛物线的中心表示样本均值。10%预警区间是指以均值为中心的样本分布,偏离均值最大的10%的样本需要预警;20%预警区间是指以均值为中心的样本分布,偏离均值最大的20%的样本需要预警(此时包含10%预警区间);30%预警区间是指以均值为中心的样本分布,偏离均值最大的30%的样本需要预警(此时包含20%预警区间)。简单来说,偏离均值最大的样本必须预警,随着样本与均值的离散程度减小,预警的必要性相对减弱。从图2 可以看出,随着预警区间的扩大,样本距离均值中心的偏离程度越来越小,预警的必要性不断下降,因此30%的预警区间称为三级预警区间,20%的预警区间称为二级预警区间,10%的预警区间称为一级预警区间。
图2 预警区间设置
考虑到主网项目的实施过程有明显流程,且基于“互联网+发展”平台的数据资源,因此重点分析主网项目的全过程关键节点预警区间。主网项目全过程主要包括5 个关键节点: 物资招标、项目开工、物资领料、项目投产、项目关闭。设定项目时间尺度为0-1,即项目开工时间为0,项目关闭时间为1,进行项目各个时间进度的分布图分析。
(1)物资招标时间。图3 为主网项目物资招标时间的正态分布拟合图,表4 为主网项目物资招标时间正态分布特征值。
图3 主网项目物资招标时间的正态分布拟合图
表4 主网项目物资招标时间正态分布特征值
设定主网项目物资招标计划时间小于0,即在项目开工前完成物资招标计划,但考虑到主网项目类型多而复杂,在开工时间一定范围内的偏差皆为合理,即以物资招标计划时间为基准,物资招标实际时间与计划时间的偏差则需要进行预警。如表4 所示,如果物资招标比计划提早整个项目周期的0.06 以上,或者推迟0.86 以上,则进入三级预警状态(30%的物资招标时间异常);如果开工时间比计划提早0.27 以上,或者推迟1.01 以上,则进入二级预警状态(20%的物资招标时间异常);如果开工时间比计划提早2.34 以上,或者推迟3.09 以上,则进入一级预警状态(10%的物资招标时间异常)。
(2)项目实际开工时间。图4 为主网项目开工实际时间的正态分布拟合图,表5 为主网项目开工实际时间正态分布特征值。
图4 主网项目开工实际时间的正态分布拟合图
表5 主网项目开工实际时间正态分布特征值
设定主网项目计划开工时间为0,项目实际开工时间越接近0,项目实际开工情况越合理。如表5 所示,如果开工时间比计划提早整个项目周期的0.78 以上,或者推迟0.98 以上,则进入三级预警状态(30%的项目开工时间异常);如果开工时间比计划提早0.97 以上,或者推迟1.12以上,则进入二级预警状态(20%的项目开工时间异常);如果开工时间比计划提早2.50 以上,或者推迟2.10 以上,则进入一级预警状态(10%的项目开工时间异常)。
(3)物资领料时间。图5 为主网项目物资领料时间的正态分布拟合图,表6 为主网项目物资领料时间正态分布特征值。
图5 主网项目物资领料时间的正态分布拟合图
表6 主网项目物资领料时间正态分布特征值
由上述图表可以看出,物资领料计划时间和物资领料实际时间相对较为提前,考虑到物资领料贯穿项目开工和关闭全过程,因此处于项目建设周期0-1 时间段皆认为合理,物资领料预警主要考虑实际领料时间与计划领料时间的偏差。如表6 所示,如果物资领料时间比计划提早整个项目周期的1.03 以上,或者推迟0.56 以上,则进入三级预警状态(30%的物资领料时间异常);如果物资领料时间比计划提早3.52 以上,或者推迟2.32 以上,则进入二级预警状态(20%的物资领料时间异常);如果物资领料时间比计划提早4.17以上,或者推迟2.65 以上,则进入一级预警状态(10%的物资领料时间异常)。
(4)项目投产实际时间。图6 为主网项目投产实际时间的正态分布拟合图,表7 为主网项目投产实际时间正态分布特征值。
由于样本数据的项目投产计划时间与项目关闭计划时间一致,默认设置为1,因此这里只分析项目投产实际时间。考虑到项目投产在项目开工之后、项目关闭之前的时间段,因此处于项目建设周期0-1 之内皆认为合理。如表7 所示,如果投产时间推迟1.30 以上,则进入一级预警状态(10%的项目投产时间异常),其余主网项目投产实际时间皆为合理。
图6 主网项目投产实际时间的正态分布拟合图
表7 主网项目投产实际时间正态分布特征值
(5)项目关闭实际时间。图7 为主网项目关闭实际时间的正态分布拟合图,表8 为主网项目关闭实际时间正态分布特征值。
图7 主网项目关闭实际时间的正态分布拟合图
表8 主网项目关闭实际时间正态分布特征值
设定主网项目计划关闭时间为1,且考虑到项目建设周期差异性,认为项目实际关闭时间在0-1 范围内皆合理,超过建设周期1 则需要进行预警。如表8 所示,如果关闭时间比计划推迟整个项目周期的0.66 以上,则进入二级预警状态(20%的项目关闭时间异常)。
主网项目关键节点均值分析见表9。由表9可知,项目实际周期为89%(即实际项目关闭时间-物资招标时间),项目计划周期为133%(计划项目关闭时间-物资招标时间)。进一步对主网项目的重要监控节点进行均值分析,项目计划均值数据除物资领料时间外,其余节点均符合项目规范要求。物资领料由于贯穿于项目实施整个过程中,难以确定一个准确时间点,因此认为在项目实施过程中发生的物资领料皆为合理,不需要预警。主网项目实际均值中,物资领料时间早于物资招标时间,项目关闭早于项目投产,不符合项目管理规范要求,因此剔除物资领料时间和项目关闭时间,用计划时间替代。其余关键节点基本符合项目实际执行流程。
表9 主网项目关键节点均值分析
3 项目监控预警实证分析
基于主网项目预警区间,进行单体项目预警的实证分析。对于主网项目,选取如下单体项目A,并量化其流程数据见表10。
表10 A 项目的量化流程数据
从预警模型的点预警角度分析: A 项目物资招标实际时间(-0.31)处于物资招标计划时间(-0.28)和物资招标合理时间(-0.33)之间,表明A 项目的物资招标实际时间较自身计划提前,但晚于历史水平;A 项目物资领料实际时间(0.40)处于物资领料计划时间(0.48)和物资领料合理时间(-0.13)之间,表明该项目的物资领料实际时间较自身计划提前,但晚于历史水平。
预警模型的点预警能直观判断单体项目执行流程是否存在偏差,但偏差是否需要预警以及预警的界限,需要进一步通过历史数据模拟的预警区间进行判断,主网预警区间见表11。
表11 主网预警区间
从预警模型的区间预警角度分析: 对于物资招标时间,A 项目数据(-0.31)处于物资招标计划时间均值(-0.33)和中位数(-0.23)之间,即超前于多数项目的计划时间,且A 项目处于30%预警区间之内,即A 项目在该指标上基本符合历史数据的执行情况,不需要预警;对于物资领料时间,A 项目(0.40)处在物资领料计划时间均值(-0.13)和中位数(-0.01)右侧,即滞后于多数项目的计划时间,且A 项目物资领料时间处于10%预警区间之外(0.40>0.11),需要执行一级预警。
4 结语
本文围绕实现项目全过程监控优化提升目标,基于项目生命周期理论,建立项目全过程监控指标体系,采用正态分布拟合,通过时间节点量化、多维数据拟合、预警区间设置,构建用于电网基建项目关键节点管控和偏差分析的项目预警模型,支撑新电改机制下电网公司综合计划优化提升工作,实现与“加快建设与‘三集五大’”机制相适应的项目管理工作体系。