直接离散GM(1,1)模型参数估计的最小一乘法
2016-12-10周德强
周德强
(长江大学 信息与数学学院,湖北 荆州 434023)
直接离散GM(1,1)模型参数估计的最小一乘法
周德强
(长江大学 信息与数学学院,湖北 荆州 434023)
研究表明直接离散GM(1,1)模型对严格服从非齐次指数规律的原始数据进行建模,所得到的模型具有完全相同的指数规律,而当数据为近似非齐次指数规律时,直接离散GM(1,1)模型拟合效果较差。主要原因是直接离散GM(1,1)模型采用最小二乘法估计参数,稳健性不好造成的。针对这一情况,文章提出利用最小一乘法估计直接离散GM(1,1)模型参数改进上述不足。对比实验表明,采用最小一乘法估计参数得到的直接离散GM(1,1)模型具有很好的精度和稳健性,使得直接离散GM(1,1)模型的适用范围得到进一步扩大。
直接离散GM(1,1)模型;参数估计;最小一乘法;最小二乘法;线性规划
0 引言
GM(1,1)模型是灰色系统预测模型及拓展模型中的基础和核心方法[1,2],应用它的前提是要求原始数据序列符合或基本符合指数规律变化[3]。但许多文献[4,5]研究表明当利用GM(1,1)模型对纯指数序列进行拟合时,在预测精度上有时仍不能取得满意的拟合效果,对于传统GM(1,1)中存在预测精度上的缺陷[6,7],文献[2]分析了传统灰色GM(1, 1)模型本身结构上存在的问题,从离散到离散的观点,提出了DGM(1,1)模型,对GM(1,1)模型做出了实质性的改进,用DGM(1,1)对纯指数增长序列进行预测模拟,结果完全符合增长规律。
但是实际生活中完全具有纯齐次指数特征的数据是极少的,相对而言,更多的原始序列是更符合近似非齐次指数规律的序列[8,9]。针对齐次或者近似非齐次灰色指数序列的灰色建模,众多学者做了相应研究,其中文献[8]提出的DGM(1,1)模型的直接建模法(直接离散GM(1, 1),针对小样本下具有近似非齐次指数特点的序列,构建了一种简单的预测模型,能较好模拟原始序列的非齐次指数特征。
在利用灰色模型进行预测时,通常模型中参数估计的好坏会直接影响到模型的预测精度[10,11]。和传统的GM(1, 1)模型类似,DDGM(1,1)模型仍采用的是最小二乘法进行参数估计,尽管最小二乘方法参数估计存在许多优点,但是其稳健性较差,在模型求解中往往会造成严重的病态问题[12]。实验表明当原始数据严格服从非齐次指数规律,DDGM(1, 1)建模法所得到的模型具有完全相同的指数规律,然而当非齐次指数规律的数据含有奇异数据,褪变为近似非齐次指数规律时,DDGM(1,1)模型拟合效果较差,这与DDGM (1,1)模型利用最小二乘法进行参数估计的方法有很大关系。
因此,利用DDGM(1,1)模型对含有异常的数据进行建模和参数估计时,应该尽量选择较为稳健的准则以减少奇异数据对模型预测的影响[13]。最小一乘准则受异常点的影响较小,稳健性比最小二乘准则的稳健性好[14-17]。其次,最小二乘准则需要假定数据分布服从正态分布,并且该方法基于残差平方和最小寻优,很容易陷入局部最小,对于非线性较强的序列,应用最小二乘法得到的结果会产生很大的偏差[18]。而最小一乘准则对数据分布没有严格要求,理论证明:对于误差不服从正态性的问题中,最小一乘估计的统计性能优于最小二乘估计[14]。
在对实际生活中符合近似非齐次指数规律的具有贫信息的序列进行建模时,由于所用数据不多,数据总体特征不够明显,往往还会含有异常数据,针对传统的DDGM( 1,1)模型参数估计方法上的缺陷,同时鉴于最小一乘法优越的统计性能,本文将用最小一乘准则对DGM(1,1)模型参数进行估计,求解模型时,通过函数变换将优化问题转化为一个线性规划问题[19],以克服最小二乘法容易陷入局部最小的问题。最后,用数据模拟仿真,通过对比分析证实了该方法的有效性。
1 DDGM(1,1)建模法及其缺陷
1.1DDGM(1,1)建模法[8]
定义1:设 X(0)=(x(0)(1),x(0)(2),···,x(0)(n))为一单调递增序列,若对于:
①k=1,2…,n-1,x(0)(k)=ceak,c,a≠0,
则称 X(0)为齐次指数序列。
②k=1,2…,n-1,x(0)(k)=ceak+b,c,a,b≠0,则称X(0)为非齐次指数序列。
定义2:设序列X(0)=(x(0)(1),x(0)(2),···,x(0)(n)),称:
为直接DGM(1,1),简称DDGM(1,1)模型。
则灰色微分方程(1)中参数的最小二乘估计为:
令:
则:
文献[8]的研究表明,利用DDGM(1,1)建模法,对于原始数据序列严格服从非齐次指数规律时,所得到的模型具有完全相同的指数规律。
1.2DDGM(1,1)建模法参数估计缺陷分析
DDGM(1,1)模型本质上是用自回归模型方法建立修正指数模型[8],由式(3)知该自回归模型采用的是基于大样本数据的最小二乘法估计参数,即:
当原始数据存在奇异数据时,平方会放大奇异值对可信度的影响,导致DDGM(1,1)模型的预测效果不好[11]。虽然DDGM(1,1)建模法对严格服从非齐次指数规律的数据能够完全拟合,但是,实际生活中完全具有纯齐次指数特征的数据是极少的。同时,DDGM(1,1)模型是针对小样本建模的方法,当收集的数据较少,并且数据中夹杂有异常点时,用最小二乘准则所得的结果就令人难以接受,在此情况下应用所得到的回归方程或模型进行预测、拟合等,则预测或拟合的精度相当低,甚至根本不能使用[15-17]。因此针对此种情况,利用DDGM(1,1)模型进行预测时,不宜用最小二乘法估计模型参数。
2 估计DDGM(1,1)模型的最小一乘法
相对于传统DDGM(1,1)模型,优化问题(6)的目标函数含有绝对值,因此引入变换[19]:
其中
uk≥0,vk≥0,代入式(7)得:
从而,估计DDGM(1,1)模型的参数归结为如下线性规划问题:
可利用单纯形法求解上述线性规划问题,得到基于最小一乘法准则的最优参数β1,β2。
3 模型建模效果比较
为了验证基于最小一乘法估计DDGM(1,1)模型的可行性和有效性,以下模拟近似非齐次指数序列进行验证。取两组数据[20]:
上述数据为完全的非齐次指数序列。
将第一组数据的第三和第四个数据交换位置得到第二组数据:
第二组数据相对第一组数据为有异常的近似非齐次指数序列。
首先验证两种准则下,DDGM(1,1)模型对完全的非齐次指数序列的拟合和预测情况。以前6个数据建模,最后一个数据作为预测值,利用DDGM(1,1)模型建模,分别采用最小二乘准则和最小一乘准则对模型参数进行估计。对第一组数据有:
(1)最小二乘准则
(2)最小一乘准则
由于上述数据不存在异常,所以两种准则下估计的参数较为接近。根据两个准则得到模拟和预测结果见表1,表中结果表明,对于原始数据严格服从非齐次指数规律,建立DDGM(1,1)模型,使用两种准则估计参数,排除计算误差,所得到的模型均具有完全相同的指数规律。
表1 不同准则下模拟计算结果比较
用第二组数据进行最小一乘稳健性的测试。仍然以前6个数据建模,最后一个数据作为预测值,利用DDGM (1,1)模型建模,分别采用最小二乘准则和最小一乘准则对模型参数进行估计。
(1)最小二乘准则
(2)最小一乘准则
由以上结果可以看出,当原始数据有异常时,对于DDGM(1,1)模型,应用最小二乘准则所得到的参数系数与无异常点时差异甚大,而对最小一乘准则,异常点的有无对求得的参数影响很小。根据两个准则得到模拟和预测的结果见表2,从表中数据可见,用最小二乘准则所得的DDGM(1,1)模型进行拟合和预测精度相当差,模型已根本不能使用。而用最小一乘准则所得的DDGM(1,1)模型进行拟合和预测,精度仍然很高,进一步说明了最小一乘准则能够克服数据较少且存在异常点时最小二乘准则出现的病态问题,稳健性较好。
表2 不同准则下模拟计算结果比较(含异常数据)
图1不同准则下模拟结果
图1显示了对第二组数据利用DDGM(1,1)模型进行建模,分别基于最小二乘法和最小一乘法估计DDGM(1,1)模型的参数得到的模型拟合和预测值。由图像拟合情况可见,对于含有异常点的近似非齐次指数序列,基于最小一乘法估计DDGM(1,1)模型的参数,效果远远好于最小二乘法。
两组数据的实验结果充分表明,基于最小一乘法估计DDGM(1,1)模型的参数具有可行性和有效性。
4 结论
最小二乘法具有良好的解析性,易于求解,使得该方法在DDGM(1,1)模型中成为普遍采用的参数估计方法。本文从分析最小二乘法对DDGM(1,1)模型参数估计容易造成的缺陷入手,提出基于最小一乘法估计DDGM(1,1)模型的参数,理论上可以克服最小二乘法估计模型参数的缺陷,利用给出的线性规划法使得基于最小一乘法估计DDGM(1,1)模型的参数在应用中成为可能,实例表明基于最小一乘准则估计DDGM(1,1)模型的参数,DDGM(1,1)模型能更好地拟合近似非齐次指数规律的数据,有效扩充了DDGM(1,1)模型的适用范围。
[1]邓聚龙.灰色系统理论教程[M].武汉:华中理工大学出版社,1990.
[2]谢乃明,刘思峰.离散GM(1,1)模型与灰色预测模型建模机理[J].系统工程理论与实践,2005,(1).
[3]穆勇.无偏灰色GM(1,1)模型的直接建模法[J].系统工程与电子技术,2003,25(9).
[4]罗党,刘思峰,党耀国.灰色模型GM(1,1)优化[J].中国工程科学, 2003,5(8).
[5]刘斌,刘思峰,翟振杰,党耀国等.GM(1,1)模型时间响应函数的最优化[J].中国管理科学,2003,11(4).
[6]何文章,宋国乡.基于遗传算法估计灰色模型中的参数[J].系统工程学报,2005,20(4).
[7]张大海,汪世芳,史开泉.灰色预测公式的理论缺陷及改进[J].系统工程理论与实践,2002,22(8).
[8]曾波.近似非齐次指数序列的DGM(1,1)直接建模法[J].系统工程理论与实践,2011,31(2).
[9]崔杰,党耀国,刘思峰.一种新的灰色预测模型及其建模机理[J].控制与决策,2009,24(11).
[10]郑照宁,刘德顺.基于遗传算法的改进GM(1,1)模型IGM(1,1)直接建模[J].系统工程理论与实践,2003,23(5).
[11]何霞,刘卫锋.灰色GM(1,1)模型中参数估计的几种方法比较[J].统计与决策,2011,(20).
[12]郑照宁,武玉英,程小辉,包涵龄.灰色模型的病态性问题[J].系统工程理论方法应用,2001,10(2).
[13]董建,谢开贵.基于最小一乘准则的非线性回归模型研究[J].重庆师范学院学报(自然科学版),2001,18(4).
[14]BATES D M.非线性回归分析及其应用[M].韦博成译.北京:中国统计出版社,1997.
[15]谢开贵,何斌,杨万年.组合预测权重系数的确定[J].预测,1998,7 (7).
[16]董祺.“残差绝对值和最小”准则的松驰算法[J].预测,1990,9(2).
[17]袁修贵.“残差绝对值和最小”准则的目标规划法[J].预测,1994, 13(1).
[18]安德洪,韩文秀,岳毅宏.组合预测法的改进及其在负荷预测中的应用[J].系统工程与电子技术,2006,26(6).
[19]杨桂元.残差绝对值之和最小准则下回归方程的求解[J].运筹与管理,2001,10(1).
[20]战立青,施化吉.近似非齐次指数数据的灰色建模方法与模型[J].系统工程理论与实践,2013,33(3).
(责任编辑/易永生)
O21
A
1002-6487(2016)22-0015-03
湖北省自然科学基金资助项目(2013CFA053);长江大学基础学科研究发展基金资助项目(2014JCY002)
周德强(1974—),男,湖北襄阳人,硕士,副教授,研究方向:机器学习、模式识别、系统建模。