基于大数据的电网运检项目资金完成率路径分析模型
2018-01-28沈润夏谢元弟张云平黄宗祥
沈润夏+谢元弟+张云平+黄宗祥
摘要
根据项目共有的项目类型、计划年度、专业细分等字段特性,运用SPSS软件强大的数据挖掘、统计分析能力,搭建以资金完成率为最终因变量的线性回归路径分析模型。经过SPSS路径分析,完成路径图、路後系数表和变量相关性表,用量化的路径系数直观地显示与资金完成率水平相关的项目类型等变量间的直接、间接结构关系。
【关键词】大数据 资金完成率 路径分析
生产技改、大修、城市配网、固定资产零购等运检生产类项目作为电网企业进行资产配套完善、建筑修缮、设备更新的重要途径,是保障电网安全稳定运行的技术管理手段。而计划资金完成率一直是运检项目管理所涉及的重点考核指标。
1分析思路
本文旨在全面剖析某地市供电公司历年运检项目资金完成率大数据,运用统计学方法建立路径分析数学模型,从理论上得出影响资金完成率的主要影响因子及其直接、间接作用;并对今后项目预算管理提出改进方向,扭转长期以来预算管理混乱的不利局面。分析步骤见图1。
1.1取数
从PMS系统中查询历年运检项目,并将所有项目的基本信息导出Excel表,再在ERP系统中通过项目编码批量查询项目资金完成情况并导出Excel表。
1.2数据清洗
将PMS、ERP中导出的表格以项目编码为识别字段合并成一张Excel表,在Excel表中实现数据清洗,删除重复、错误、异常数据,通过综合计划文件等资料补全项目基本信息。
1.3变量转换
将Excel数据表导入SPSS软件,通过项目类型、计划年度、专业细分、电压等级、投资性质等文本型自变量对于因变量资金完成率的箱线图,识别每一类自变量中各种数据与因变量之间的线性关系,并根据该线性关系将对应的文本类型变量转换为虚拟数值变量,用于后续分析。
1.4路径分析
通过对运检项目专业的数据特征,先绘制基本路径模型图,然后利用SPSS软件中的线性回归命令,逐条路径计算变量间的相关系数,绘制出运检项目资金完成率相关数据的路径图。
1.5总结分析
根据路径图,总结对资金完成率影响最大的关键因素及变量之间的相互影响关系,分析路径图对于今后项目计划、实施的指导意义。
2路径分析法概述
路径分析通过构建路径图,直观地显示变量间的内部结构关系,在多元线性回归的基础上计算变量间各条路径的相关系数,即路径系数。路径系数分为直接路径系数(某一变量对因变量的直接作用)和间接路径系数(该变量通过其他自变量对因变量的间接作用)。在一个构造合适的路径图中,任何两个变量间的相关系数就是连接这两点之间的所有复合链上的路径系数的乘积之和。具体分析流程如图2所示。
广义的路径模型有两种基本类型:递归模型和非递归模型。本文分析内容采用递归模型,即模型中各变量间因果关系结构全部为单向链条关系,无对应反馈作用。因此,各内生变量与其原因变量的误差之间或任意两个内生变量的误差之间相互独立,根据该方法,可搭建项目各共有属性变量与最终因变量资金完成率之间的路径分析模型。
3建模及算法实现
3.1数据挖掘
该阶段经过系统取数、数据整合、数据清洗后,共得到全口径项目1026条,变量数据10000多条,如果有足够多的数据来源,还可再扩展分析的数据量,且数据量越大分析越准确。大数据挖掘后,按照线性原则将文本变量转换成数值变量。如根据SPSS描述性分析,结合箱线图的直观显示(见图3),整体资金完成率方面,城网<技改<零购<大修,因此,变量赋值为:城网=1,技改=2,零购=3,大修=4,从而实现变量转换,便于后续路径回归计算。
3.2搭建模型
完成项目类型、计划年度、专业细分、电压等级、投资性质等字段的变量转换后,加上项目总投资、实际成本等信息,形成新的数据表。将新数据表所有数据作为SPSS路径分析的数据源,根据各属性变量间的逻辑关系,结合运检项目特点、项目管理实施经验,绘制出基本路径模型图(见图5)。
使用SPSS软件逐条路径计算回归系数。如以离散量资金完成率水平W为因变量,自变量有项目类型L、年度N、专业Z、电压等级D、项目性质X、计划投资J。路径回归计算后得到的方差表、回归系数表、标准化残差图分别如表1、表2、图4所示。
方差表中方差分析结果F=73.888,P=0.000,说明回归更显著,回归模型更具有统计学意义。残差直方图中正态分布明显,回归分析算法正确。
依次对逐条路径进行回归计算后,将系数填入路径模型图,形成最终路径图(见图5)。
4结论及成效
根据资金完成率路径模型,可以得出以下结论:
(1)路径分析得到的数据结果比起可观测数据值更能真实反映项目各因素对资金完成率水平的综合影响效果。如项目性质X与资金完成率水平W的直接影响系数(即可观测影响值)为-0.093,但加上间接影响路径之后,其综合影响系数达到-0.2808,挖掘出潜在影响效果,避免因素影响力的误判,因此,采用路径分析法获得的项目影响因素评价更为科学。
(2)可以从量化数据中得到对资金完成率水平W影响最大的因素为专业Z、项目类型L。
(3)可以从路径分析中找到存在强相关关系的因素组合为项目性质X与电压等级D,项目类型L与计划投资J。
(4)该路径分析结果可用于对年度投资重点宏观上的定性指导。
路径分析的主要成效为:通过路径分析模型解析运检项目资金完成率与项目各共同字段之间的内在联系,最终形成科学的预算管控联动机制。经过大数据挖掘和SPSS路径线性回归运算,完成历年运检项目资金完成率水平路径图、路径系数分解表和变量相关性表,建立以资金完成率为最终因变量的完整路径分析模型。SPSS软件具有计算功能强大、无需单独编程等优势,因此该算法对于其他专业项目也具有适用性,只需修改路径模型,其系数计算方式不变。
参考文献
[1]胡水星.大数据及其关键技术的教育应用实证分析[J].远程教育杂志,2015(05):46-53.
[2]田萌.基于數据挖掘的复杂仿真数据分析方法研究[D].哈尔滨工业大学,2010.
[3]武松,潘发明.SPSS统计分析大全[M].清华大学出版社,2014.
[4]郑奇.电力工程中的技改大修工程管理[J].科技与创新,2014(04):68-69.
[5]李金昌.大数据与统计新思维[J].统计研究,2014,31(01):10-17.endprint