基于组合预测的能源优化

2018-06-01方梓涵张焕明朱家明

赤峰学院学报·自然科学版 2018年5期

方梓涵，张焕明，朱家明

（安徽财经大学统计与应用数学学院，安徽蚌埠 233000）

随着第三次能源革命的兴起，清洁能源的大规模开发利用已成为世界能源发展的主流，能源技术创新进入高度活跃阶段.同时，美国制定了西部州际能源协议，试图在加利福尼亚州(CA)、亚利桑那州(AZ)、新墨西哥州(NM)和得克萨斯州(TX)形成一个现实的新能源合同，重点是增加清洁和可再生能源的使用.因此，基于实际数据分析和建模的重要性，为州际能源合同设定一组目标对该计划的实施有重要的指导意义.

1 数据来源与模型假设

本文数据来源于2018美国大学生数学建模竞赛C题.为了便于解决问题，提出以下假设：⑴除了主要指标的选择外，不会有突发事件或次要因素影响预测结果的波动；⑵假设可再生能源增长率与其他选定指标之间存在线性关系；⑶2008年亚利桑那州缺失的风电数据可被2008年其他三个州的数据所取代，以计算2009年风电增长率；⑷长期数据可以通过单调的线性模型进行预测.

2 基于多元线性回归模型的预测体系

2.1 研究思路

本题需要研究的是建立一个模型来描述1960年到2009年四个州是如何通过综合可能影响相似性和差异性的因素（如地理、工业、人口和气候）来解决四个州的能源状况.针对此问题，我们分为三个小问题来研究，第一，构建一个模型，描述1960-2009年能源概况的演变过程，并阐述四个州对清洁可再生能源的使用情况.第二，确定使用更清洁、可再生能源的最佳概况，并解释选择标准.第三，预测2025年和2050年每个州的能源状况，并给出可再生能源使用目标.

2.2 指标设计

根据相关文献，人口增长率、行业能耗增长率、能源生产和消费总量的比例作为解释变量，可再生能源消费增长率作为解释变量，综合运用EXCEL，MATLAB，EVIEWS相关软件对数据进行组织和计算，并根据初始建模结果的状态，对模型进行不同修改得到最终状态的多元线性回归模型.

为了专注于每个州的能源状况以及清洁能源和可再生能源的使用，我们设计了以下变量，见表1.

表1 使用清洁和可再生能源

为了解清洁能源、可再生能源增长与各种内生因素之间的关系，建立了如下多元回归方程：

其中，C是一个常数，被视为模型中的其他随机因素（如地理因素，气候因素等）.

2.3 评价指标体系结果分析

通过MATLAB导入时间表中的相关数据，综合运用EVIWES对回归方程进行拟合，分别得出近年来四个州清洁能源和可再生能源的使用现状和历史趋势.AZ状态下的初始建模结果如图1所示.参数根据p值变量逐一调整，最后X1，X2，X3，X4，X6，X7，C 被消除，以改进整体模型参数显著性，在85%置信度模型的置信水平下，拟合效果如图2所示.

图1 亚利桑那州模型结果

图2 亚利桑那州的拟合图

AZ州清洁能源，可再生能源增长率模型是：

X1，X5可以满足交通运输业和住宅部门能源消费总量的增长速度.从中可以看出，交通运输行业资源消耗每增加1%，清洁能源使用量的增加就减少了1.064%，而住宅部门每增加1%的资源消耗，清洁能源增长率为1.022%.

3 基于主成分分析法的评价系统

3.1 研究思路

为确定2009年四个州中哪些州似乎具有最佳使用清洁可再生能源的概况.首先，我们选取有关清洁和可再生能源的相关指标.然后，建立PCA模型以分析综合评分.

3.2 基于主成分分析法的预测模型

我们对罕见原始数据进行预处理和标准化.其中，亚利桑那州在2009年之前未使用风电，因此2008年之前的数据被其他三个州的平均值所替代.

原始指标数据的标准化收集.P维随机向量X=(X1，X2，…，Xp)T，样品 Xi=(Xi1,Xi2,…,Xip)Ti=1,2,…n 和 n＞p，样本数组被构造并且样本元素被标准化变形，如下所示：

确定m的价值，使信息利用率达到85%以上.对于每个方程λj(j=1,2,…,m)，求解方程组以获得单位特征向量bj.

综合评价.对主成分进行加权求和，得到最终评价值，各主成分的权重为方差贡献率.

无偏灰色马尔可夫预测模型.(i)使用最小二乘法来估计样本矩阵，(ii)求解无偏GM（1,1）模型参数，(iii)建立状态转移矩阵M，p是从Q1到Q2的m步转换的概率.

随着时间的推移，在灰色系统的开发过程中会有一些随机干扰进入当前系统，这将影响系统的开发.对于无偏灰色马尔可夫预测模型，原始数据之后只有很少的数据比较准确.因此，我们必须不断考虑相继进入系统的扰动因子，稀释历史数据，随时向系统中添加新的信息，以提高中长期预测的准确性.

3.3 实证分析

主成分分析模型的前三个主要组成部分如下：

相应的贡献率分别为52.4865%，34.2103%，13.3033%，这是前三位累计贡献率99%，最终计算的PCA综合得分如表2所示.

表2 四种状态的综合评分

因此，根据PCA模型，加州具有最佳的清洁能源使用概况.

使用1960-2009年的能源消耗得分来预测2025到2050年的未来能源消耗状况.使用无偏灰色马尔可夫预测模型，我们得到了每个州的结果如图3和表3所示.

表3 2025年和2050年未来能源消耗情况

4 基于能源使用状况的复合预测模型

4.1 研究思路

首先利用二次移动平均模型和BP神经网络模型拟合预测目标时间序列的指标值，然后运用加权算术平均组合拟合模型得到两种可再生能源预测值，最终运用LINGO寻求模型的最小残差从而获得最佳解决方案.

4.2 数据处理

①设定每个元素的实际值为Xit(i=1,2,…,n；t=1,2,…,N)，用二次移动平均模型和神经网络模型拟合每个指标fit(i=1,2,…,n；t=1,2,…,N)的值.定义模型的残差，其中：

②目标函数是：

③为找到最优的LINGO解决方案，我们对最优组合模型使用了复合预测：

4.3 结果分析

利用加权算术平均组合预测模型，得到2025-2050年两种预测模式下各种能源的预测值，最终得到两种可再生能源预测值，如下表.

表4 可再生能源的预测值

表5 可再生能源消费总量

本文对1960-2009年期间四个州的能源使用情况进行概述，做出了预测并确定了有关清洁能源使用的“最佳状态”标准.首先，为研究各种经济现象对可再生能源利用的影响，我们用七个经济指标建立多元回归方程.在亚利桑那州交通部门消费每增加1%，清洁能源的使用就会减少1.064%.当住宅部门消费额增加1%时，增长率清洁能源将达到1.022%.各要素在不同国家的影响力各不相同，其他随机因素对清洁能源增长率有正向或负向影响.加利福尼亚州（CA），亚利桑那州（AZ），新墨西哥州（NM）和得克萨斯州（TX）的综合得分分别为1.3587,0.1499，-0.3315和-1.1771.因此，2009年加利福尼亚州似乎具有“最好”的清洁可再生能源利用状况.接下来，使用包括第二移动平均模型和BP神经网络模型在内的组合预测模型来确定2025年的可再生能源目标到2050年.最后，我们认为四个州在使用可再生能源方面出现明显差异：能源效率政策的实施在AZ中得到了更好的回应，NM成为可再生能源使用的示范代表.由于工业建设范围广，资源节约意识薄弱，加州可再生能源消费总量为负值.可以看出，四州能源紧缩的目标是减少使用不可再生的能源，如煤和石油，同时增加使用可再生能源，如天然气.

本文分析为了形成以增加清洁能源使用为重点的新能源契约，国家应采取以下行动：以优势为基础制定战略规划，国内外广泛合作，再生资源合理有序开发，重视建设的辅助设施.

为进一步提高预测精度，本文运用灰色关联预测模型对原有模型进行改进，恰当地对模型进行了评价.

5 总结

本文运用流程图，将建模思路完整清晰地展现出来；考虑到地理和行业等不同因素，我们建立了多元回归模型来研究清洁能源因素的变化，可应用于因素分析.基于组合预测模型，我们建立二次移动平均模型来预测长期趋势，同时建立BP神经网络模型来提高预测精度.该模型可应用于宏观经济的决策问题，适用于对宏观经济的频繁波动进行非常紧密的现实拟合并对其变动的原因做出稳定一致的解释.具有减少预测的系统误差、显著改进预测效果的特点.

〔1〕刘增佩，高明峰，宗容荣，王嘉伟，庄志林，陈杰，陈玉燕，谢立昌.生物电阻抗分析在人体下肢神经网络数学预测模型中的应用[J].国际老年学杂志，2012,6（1）.

〔2〕 Robert R.Andrawis，Amir F.Atiya，Hisham El-Shishiny.将长期和短期预测相结合，用于旅游需求预测[J]. 国际预报期刊，2010,27（3）.

〔3〕 Feng Guo,Jun Diao,Qiuhong Zhao,Dexin Wang,Qiang Sun.A double-level combination approach for demand forecasting of repairable airplane spare parts based on turnover data[J].Computers&Industrial Engineering,2017,110.