经济分析与预测模型中信息矩阵的病态问题分析
2014-06-13罗娟
罗娟
摘要: 对常用的经济分析与预测模型中的线性回归、时间序列及灰色系统信息矩阵的病态问题进行了讨论。通过对统计资料附加干扰,基于最小二乘原理,得出每个模型中的每一参数与噪声的数值关系。指出在经济分析与预测模型的使用过程中,使用这类模型进行分析时必须考虑矩阵的病态问题,采取有效方法减轻或者消除信息矩阵的病态程度后方可使用这三种模型。
Abstract: The paper discusses theoretical and simulates in numerical of the economic analysis and forecasting model's ill-posed problem in linear regression analysis, time series analysis model and gray system model. Imposed interference noise on deformation observational data, it come out the numerical expression relation between every three model parameters and the noise interference using the least squares principle. The paper points out if one use any of the three models for modeling analysis to explain the deformation and deformation forecast, one must be required to inspect the information matrix A=XTX whether or not was ill-posed, and take effective method to reduce the ill-condition of the information matrix before using these three models.
关键词: 经济分析;病态;线性回归分析;时间序列;灰色模型
Key words: economic analysis;ill-posed;linear regression analysis;time series;gray model
中图分类号:F224 文献标识码:A 文章编号:1006-4311(2014)16-0019-03
0 引言
经济分析与预测模型中[1],线性回归分析法、时间序列分析模型、灰色系统分析模型等都可能会产生矩阵病态问题。文献[1]对计量经济分析于预测模型中的灰色模型的病态问题进行了研究与探讨。经济分析与预测就是通过大量的经济统计数据,利用统计方法,建立经济指标或经济指标影响因素之间的数学模型,并进行经济预测,或者依据经济发展随时间空间变化特征及变化建立模型。前者有多元回归分析模型、逐步回归分析模型和岭回归分析模型等,后者有趋势分析法,时间序列分析法、模糊聚类分析模型,动态响应分析等方法等。线性方程组Ax=b中,系数矩阵A或常数项b的极小变化,会引起解x的巨大变化,称这样的方程组为病态方程组,A称为病态矩阵[2,3]。现对方程组Ax=b进行摄动分析。令A为固定非奇异矩阵,b摄动值为δb,解x则为x+δx,即:A(x+δx)=b+δb得δx=A-1δb,由范数的定义得:||δx||?燮||A-1||·||δb||,||b||?燮||A||·||x||,则:
■?燮||A-1||·||A||·■ (1)
从式(1)可以看出,常数项b的微小变化δb在解x中可放大||A-1||·||A||倍。令b固定,A摄动一个δA,解x变为x+δx,即:(A+δA)(x+δx)=b。如果δA不受限制,A+δA可能奇异,令:(A+δA)=A(I+A-1δA)当||A-1δA||?燮1时,(I+A-1δA)-1存在,得:δx=-(I+A-1δA)-1A-1(δA)x,||δx||?燮■。若||A-1δA||?燮1,有:
■?燮■ (2)
从(1),(2)式可以看出,||A-1|| ||A||愈大,A,b摄动时,解x的变化就越大,||A-1|| ||A||则是解相对于原始数据变化的灵敏度,是反映方程组病态的指标,称cond(A)=||A-1|| ||A||为矩阵的条件数。常用的条件数是谱条件数:cond(A)2=||A-1||2||A||2=■。当A 是实对称矩阵时,cond(A)2=■,λ■,λ■分别为A的按模最大和最小特征值。
信息矩阵的病态影响了经济分析与预测模型的解释和预测的精度和准确性。本文对回归分析模型、时间序列模型和灰色GM模型中的病态问题进行了讨论与分析。对经济统计资料施加噪声,基于最小二乘原理,给出上述模型每一个参数与噪声的关系表达式。
1 回归分析模型中的病态问题
考虑如下多元线性回归分析[4]:
y■=b■+b■x■+…+b■x■+e■ …y■=b■+b■x■+…+b■x■+e■ (3)
其中yi,xij分别为经济统计数据的因变量和自变量,bi为回归系数,ei为观测误差,假设ei服从独立同分布的N(0,σ2),k为回归方程的阶数,N为经济统计数据样本长度。式(3)用矩阵形式可以写成
Y=Xb+e (4)
其中Y=y■,y■,…,y■■,b=b■,b■,…,b■■,
e=e■,e■,…,e■■
X=1 x■ … x■1 x■ … x■… … … …1 x■ … x■
令A=XTX,C=XTY,则式(4)的正规方程为Ab=C (5)
则b的最小二乘(LS)估计为
b=(XTX)-1XTY=?准TY=A-1C (6)
其中?准T=(XTX)-1XT称为广义逆矩阵或伪逆矩阵。
有表1的经济统计数据,现采用二元回归模型y=b0+b1x1N+b2x2N进行回归分析。
从而X=1 2.0 16.01 2.1 16.11 6.9 49.01 7.0 48.91 7.6 52.01 7.7 52.6,Y=18.720.537.239.336.537.6,
从而,A=X■X=6 33.3 234.633.3 222.07 1546.43234.6 1546.43 10778.18
由于det(A)=449.0196≠0,信息矩阵A非奇异。cond(A)=281612.7484,矩阵A严重病态。即x1N和x2N两列数据存在高度依赖性。根据b=(XTX)-1XTY=A-1XTY求出的b=[8.3571,-7.6957,1.6877],从而可以得到二元回归模型
y=8.3571-7.6957x1N+1.6877x2N (7)
为观察信息矩阵A的病态性对对二元回归模型系数的影响,现把Y值得后一项y6=37.6依序增加0.1,可得到b值随其变化的趋势,见图1(图中b(2)对应于b2,b(3)对应于b3,Y6对应于y6)。考虑到y6的微小增量对表1中经济统计数据的规律无较大影响,但回归系数变化很大,可认为式(4)的回归分析模型不可靠。
2 时间序列分析模型中的病态问题
AR(n)模型中[5],有
xt=φ1xt-1+φ2xt-2+…+φnxt-n+at (8)
若共有x1,x2,…xN等N个采样数据,则有
Y=Xφ+a (9)
式中:
X=x■ x■ … x■x■ x■ … x■… … … …x■ x■ … x■,φ=φ■φ■…φ■,
Y=x■x■…x■,a=a■a■…a■
则φ的最小二乘(LS)估计为φ=(XTX)-1XTY (10)
信息矩阵XTX的元素是由数值接近的数据累加而成,数值互相很接近,X的列存在复共线性,式(10)为病态方程组,φ的数值解将不稳定。
某序列经济统计数据共8个(单位:千万),采用AR(4)模型进行统计数据的时间序列分析。(表2)
则可知:
X=6.01 7.02 7.98 9.017.02 7.98 9.01 10.007.98 9.01 10.00 10.999.01 10.00 10.99 12.01,Y=10.0010.9912.0113.02,则
A=XTX=230.261 260.2096 290.2096 320.2604260.2096 294.1409 327.9194 362.1701290.0299 327.9194 365.6406 403.8897320.2604 362.1701 430.8897 446.2003,XTX为对称正定矩阵。det(A)=0.000398≠0,信息矩阵A非奇异,cond(A)=1909061.3249。根据式(10)可求得φ=[-0.5093,
0.1897,0.2187,1.1081]。把Y值后一项13.02依序增加0.001,则求得φ值的变化趋势产生很大改变,是因为信息矩阵XTX是严重病态的。见图2(图中b(1)对应于φ1,b(2)对应于φ2,b(3)对应于φ3,b(4)对应于φ4,x(8)对应于x18,x18初值为13.020)。
3 灰色系统分析模型中的病态问题
灰色系统分析模型的病态问题一直有文献进行了研究[6-8]。设有如表3某经济统计资料。
现采用GM(2,1)模型对表3中的数据进行分析。从文献[6]知,b=[(A■B)T(A■B)]-1(A■B)TY (11)
b为GM(2,1)的模型参数。从而得:(A■B)=-5.2448 -7.2208 1-5.2912 -12.4888 1-5.4240 -17.8464 1-5.8864 -23.5016 1,Y=0.64640.04640.13280.4624,从而可以得到(A■B)T(A■B)=119.5742 339.0911 -21.8464339.0911 1078.9293 -61.0576-21.8464 -61.0576 4,继而利用matlab求矩阵逆函数inv命令可得((A■B)T(A■B))-1=23.2464 -0.8890 113.3921-0.8890 0.0408 -4.2327113.3921 -4.2327 554.9427,最后,根据式(11)求得b=[-2.054487,0.086579,-9.577209]。
矩阵[(A■B)T(A■B)],det((A■B)T(A■B))=25.2807≠0,矩阵A非奇异,可其条件数为688123.87035。这么大的条件数对于一个三阶矩阵是不正常的。令x■■(5)从5.8864以0.01步长递增,可发现b的值改变的幅度远比x■■(1)的幅度大。见图3(图中b(1)对应于b1,b(3)对应于b3,x1(5)对应于x■■(5))。
4 结语
本文对经济分析与预测模型中的线性回归分析法、时间序列分析、灰色系统等模型中的病态问题进行了讨论与分析。研究结果表明:在经济分析与预测中,使用类似模型时,应考虑信息矩阵的病态问题,采取适当的措施来减轻病态矩阵的影响才能用于实际。
参考文献:
[1]郑照宁,武玉英等.GM 模型的病态性问题[J].中国管理科学,2001,9 (5) :38-44.
[2]Horn,Roger.A.Johnson.Charles.A. Matrix Analysis[M].First Edition. New York:Cambridge University Press,1985:336-389.
[3]方保,李医民.矩阵论基础(第二版)[M].南京:河海大学出版社,1999:210-240.
[4]陈希孺,王松桂.近代回归分析[M].合肥:安徽教育出版社,1987.
[5]徐东,刘志阳,徐奉臻.我国证券投资基金羊群行为的实证分析(1999~2004)——基于LSV和时间序列的研究[J].哈尔滨工业大学学报,2006,38(12) :2132-2138.
[6]邓聚龙,灰色控制系统(第一版)[M].武汉:华中工学院出版社,1985:293-360.
[7]唐利民,朱建军,戴水财等.变形分析与预测模型中病态问题分析[J].测绘科学,2008(06):47-49.
[8]唐利民,唐平英.公路路基沉降分析与预测模型病态问题研究[J].中外公路,2008(02):75-79.
令A=XTX,C=XTY,则式(4)的正规方程为Ab=C (5)
则b的最小二乘(LS)估计为
b=(XTX)-1XTY=?准TY=A-1C (6)
其中?准T=(XTX)-1XT称为广义逆矩阵或伪逆矩阵。
有表1的经济统计数据,现采用二元回归模型y=b0+b1x1N+b2x2N进行回归分析。
从而X=1 2.0 16.01 2.1 16.11 6.9 49.01 7.0 48.91 7.6 52.01 7.7 52.6,Y=18.720.537.239.336.537.6,
从而,A=X■X=6 33.3 234.633.3 222.07 1546.43234.6 1546.43 10778.18
由于det(A)=449.0196≠0,信息矩阵A非奇异。cond(A)=281612.7484,矩阵A严重病态。即x1N和x2N两列数据存在高度依赖性。根据b=(XTX)-1XTY=A-1XTY求出的b=[8.3571,-7.6957,1.6877],从而可以得到二元回归模型
y=8.3571-7.6957x1N+1.6877x2N (7)
为观察信息矩阵A的病态性对对二元回归模型系数的影响,现把Y值得后一项y6=37.6依序增加0.1,可得到b值随其变化的趋势,见图1(图中b(2)对应于b2,b(3)对应于b3,Y6对应于y6)。考虑到y6的微小增量对表1中经济统计数据的规律无较大影响,但回归系数变化很大,可认为式(4)的回归分析模型不可靠。
2 时间序列分析模型中的病态问题
AR(n)模型中[5],有
xt=φ1xt-1+φ2xt-2+…+φnxt-n+at (8)
若共有x1,x2,…xN等N个采样数据,则有
Y=Xφ+a (9)
式中:
X=x■ x■ … x■x■ x■ … x■… … … …x■ x■ … x■,φ=φ■φ■…φ■,
Y=x■x■…x■,a=a■a■…a■
则φ的最小二乘(LS)估计为φ=(XTX)-1XTY (10)
信息矩阵XTX的元素是由数值接近的数据累加而成,数值互相很接近,X的列存在复共线性,式(10)为病态方程组,φ的数值解将不稳定。
某序列经济统计数据共8个(单位:千万),采用AR(4)模型进行统计数据的时间序列分析。(表2)
则可知:
X=6.01 7.02 7.98 9.017.02 7.98 9.01 10.007.98 9.01 10.00 10.999.01 10.00 10.99 12.01,Y=10.0010.9912.0113.02,则
A=XTX=230.261 260.2096 290.2096 320.2604260.2096 294.1409 327.9194 362.1701290.0299 327.9194 365.6406 403.8897320.2604 362.1701 430.8897 446.2003,XTX为对称正定矩阵。det(A)=0.000398≠0,信息矩阵A非奇异,cond(A)=1909061.3249。根据式(10)可求得φ=[-0.5093,
0.1897,0.2187,1.1081]。把Y值后一项13.02依序增加0.001,则求得φ值的变化趋势产生很大改变,是因为信息矩阵XTX是严重病态的。见图2(图中b(1)对应于φ1,b(2)对应于φ2,b(3)对应于φ3,b(4)对应于φ4,x(8)对应于x18,x18初值为13.020)。
3 灰色系统分析模型中的病态问题
灰色系统分析模型的病态问题一直有文献进行了研究[6-8]。设有如表3某经济统计资料。
现采用GM(2,1)模型对表3中的数据进行分析。从文献[6]知,b=[(A■B)T(A■B)]-1(A■B)TY (11)
b为GM(2,1)的模型参数。从而得:(A■B)=-5.2448 -7.2208 1-5.2912 -12.4888 1-5.4240 -17.8464 1-5.8864 -23.5016 1,Y=0.64640.04640.13280.4624,从而可以得到(A■B)T(A■B)=119.5742 339.0911 -21.8464339.0911 1078.9293 -61.0576-21.8464 -61.0576 4,继而利用matlab求矩阵逆函数inv命令可得((A■B)T(A■B))-1=23.2464 -0.8890 113.3921-0.8890 0.0408 -4.2327113.3921 -4.2327 554.9427,最后,根据式(11)求得b=[-2.054487,0.086579,-9.577209]。
矩阵[(A■B)T(A■B)],det((A■B)T(A■B))=25.2807≠0,矩阵A非奇异,可其条件数为688123.87035。这么大的条件数对于一个三阶矩阵是不正常的。令x■■(5)从5.8864以0.01步长递增,可发现b的值改变的幅度远比x■■(1)的幅度大。见图3(图中b(1)对应于b1,b(3)对应于b3,x1(5)对应于x■■(5))。
4 结语
本文对经济分析与预测模型中的线性回归分析法、时间序列分析、灰色系统等模型中的病态问题进行了讨论与分析。研究结果表明:在经济分析与预测中,使用类似模型时,应考虑信息矩阵的病态问题,采取适当的措施来减轻病态矩阵的影响才能用于实际。
参考文献:
[1]郑照宁,武玉英等.GM 模型的病态性问题[J].中国管理科学,2001,9 (5) :38-44.
[2]Horn,Roger.A.Johnson.Charles.A. Matrix Analysis[M].First Edition. New York:Cambridge University Press,1985:336-389.
[3]方保,李医民.矩阵论基础(第二版)[M].南京:河海大学出版社,1999:210-240.
[4]陈希孺,王松桂.近代回归分析[M].合肥:安徽教育出版社,1987.
[5]徐东,刘志阳,徐奉臻.我国证券投资基金羊群行为的实证分析(1999~2004)——基于LSV和时间序列的研究[J].哈尔滨工业大学学报,2006,38(12) :2132-2138.
[6]邓聚龙,灰色控制系统(第一版)[M].武汉:华中工学院出版社,1985:293-360.
[7]唐利民,朱建军,戴水财等.变形分析与预测模型中病态问题分析[J].测绘科学,2008(06):47-49.
[8]唐利民,唐平英.公路路基沉降分析与预测模型病态问题研究[J].中外公路,2008(02):75-79.
令A=XTX,C=XTY,则式(4)的正规方程为Ab=C (5)
则b的最小二乘(LS)估计为
b=(XTX)-1XTY=?准TY=A-1C (6)
其中?准T=(XTX)-1XT称为广义逆矩阵或伪逆矩阵。
有表1的经济统计数据,现采用二元回归模型y=b0+b1x1N+b2x2N进行回归分析。
从而X=1 2.0 16.01 2.1 16.11 6.9 49.01 7.0 48.91 7.6 52.01 7.7 52.6,Y=18.720.537.239.336.537.6,
从而,A=X■X=6 33.3 234.633.3 222.07 1546.43234.6 1546.43 10778.18
由于det(A)=449.0196≠0,信息矩阵A非奇异。cond(A)=281612.7484,矩阵A严重病态。即x1N和x2N两列数据存在高度依赖性。根据b=(XTX)-1XTY=A-1XTY求出的b=[8.3571,-7.6957,1.6877],从而可以得到二元回归模型
y=8.3571-7.6957x1N+1.6877x2N (7)
为观察信息矩阵A的病态性对对二元回归模型系数的影响,现把Y值得后一项y6=37.6依序增加0.1,可得到b值随其变化的趋势,见图1(图中b(2)对应于b2,b(3)对应于b3,Y6对应于y6)。考虑到y6的微小增量对表1中经济统计数据的规律无较大影响,但回归系数变化很大,可认为式(4)的回归分析模型不可靠。
2 时间序列分析模型中的病态问题
AR(n)模型中[5],有
xt=φ1xt-1+φ2xt-2+…+φnxt-n+at (8)
若共有x1,x2,…xN等N个采样数据,则有
Y=Xφ+a (9)
式中:
X=x■ x■ … x■x■ x■ … x■… … … …x■ x■ … x■,φ=φ■φ■…φ■,
Y=x■x■…x■,a=a■a■…a■
则φ的最小二乘(LS)估计为φ=(XTX)-1XTY (10)
信息矩阵XTX的元素是由数值接近的数据累加而成,数值互相很接近,X的列存在复共线性,式(10)为病态方程组,φ的数值解将不稳定。
某序列经济统计数据共8个(单位:千万),采用AR(4)模型进行统计数据的时间序列分析。(表2)
则可知:
X=6.01 7.02 7.98 9.017.02 7.98 9.01 10.007.98 9.01 10.00 10.999.01 10.00 10.99 12.01,Y=10.0010.9912.0113.02,则
A=XTX=230.261 260.2096 290.2096 320.2604260.2096 294.1409 327.9194 362.1701290.0299 327.9194 365.6406 403.8897320.2604 362.1701 430.8897 446.2003,XTX为对称正定矩阵。det(A)=0.000398≠0,信息矩阵A非奇异,cond(A)=1909061.3249。根据式(10)可求得φ=[-0.5093,
0.1897,0.2187,1.1081]。把Y值后一项13.02依序增加0.001,则求得φ值的变化趋势产生很大改变,是因为信息矩阵XTX是严重病态的。见图2(图中b(1)对应于φ1,b(2)对应于φ2,b(3)对应于φ3,b(4)对应于φ4,x(8)对应于x18,x18初值为13.020)。
3 灰色系统分析模型中的病态问题
灰色系统分析模型的病态问题一直有文献进行了研究[6-8]。设有如表3某经济统计资料。
现采用GM(2,1)模型对表3中的数据进行分析。从文献[6]知,b=[(A■B)T(A■B)]-1(A■B)TY (11)
b为GM(2,1)的模型参数。从而得:(A■B)=-5.2448 -7.2208 1-5.2912 -12.4888 1-5.4240 -17.8464 1-5.8864 -23.5016 1,Y=0.64640.04640.13280.4624,从而可以得到(A■B)T(A■B)=119.5742 339.0911 -21.8464339.0911 1078.9293 -61.0576-21.8464 -61.0576 4,继而利用matlab求矩阵逆函数inv命令可得((A■B)T(A■B))-1=23.2464 -0.8890 113.3921-0.8890 0.0408 -4.2327113.3921 -4.2327 554.9427,最后,根据式(11)求得b=[-2.054487,0.086579,-9.577209]。
矩阵[(A■B)T(A■B)],det((A■B)T(A■B))=25.2807≠0,矩阵A非奇异,可其条件数为688123.87035。这么大的条件数对于一个三阶矩阵是不正常的。令x■■(5)从5.8864以0.01步长递增,可发现b的值改变的幅度远比x■■(1)的幅度大。见图3(图中b(1)对应于b1,b(3)对应于b3,x1(5)对应于x■■(5))。
4 结语
本文对经济分析与预测模型中的线性回归分析法、时间序列分析、灰色系统等模型中的病态问题进行了讨论与分析。研究结果表明:在经济分析与预测中,使用类似模型时,应考虑信息矩阵的病态问题,采取适当的措施来减轻病态矩阵的影响才能用于实际。
参考文献:
[1]郑照宁,武玉英等.GM 模型的病态性问题[J].中国管理科学,2001,9 (5) :38-44.
[2]Horn,Roger.A.Johnson.Charles.A. Matrix Analysis[M].First Edition. New York:Cambridge University Press,1985:336-389.
[3]方保,李医民.矩阵论基础(第二版)[M].南京:河海大学出版社,1999:210-240.
[4]陈希孺,王松桂.近代回归分析[M].合肥:安徽教育出版社,1987.
[5]徐东,刘志阳,徐奉臻.我国证券投资基金羊群行为的实证分析(1999~2004)——基于LSV和时间序列的研究[J].哈尔滨工业大学学报,2006,38(12) :2132-2138.
[6]邓聚龙,灰色控制系统(第一版)[M].武汉:华中工学院出版社,1985:293-360.
[7]唐利民,朱建军,戴水财等.变形分析与预测模型中病态问题分析[J].测绘科学,2008(06):47-49.
[8]唐利民,唐平英.公路路基沉降分析与预测模型病态问题研究[J].中外公路,2008(02):75-79.