条件期望在最优预测中的应用
2010-03-22魏艳华徐长伟王丙参
魏艳华,徐长伟,王丙参
(1.天水师范学院 数学与统计学院,甘肃 天水 741001;2.中原工学院 理学院,河南 郑州450007)
近年来,随着人们对随机现象的不断观察和研究,条件数学期望已经被广泛的利用到日常生活中.随着研究的深入,条件数学期望在计算科学、生物、统计、物理、工程、运筹、经济管理和金融领域中得到广泛应用,并取得了很好的效果,尤其值得注意的是条件期望在最优预测中的应用[1-3].现代概率论总是从讲述条件期望开始,这是因为以测度论为基础的条件期望是鞅论的基础,也是严格陈述现代概率论必不可少的基本概念[4].鉴于此,本文研究了条件期望性质及与Radon-Nikodym定理的关系,举例分析了它在预测实际问题中的应用.
1 条件期望
设(Ω,F,P)为完备的概率空间,A,B∈F称为事件,如果P(B)>0,则称P(A|B)=P(AB)P(B)为在事件B发生条件下的条件概率,条件概率P(·|B)也是可测空间(Ω,F)上的概率测度[5].我们称E(ξ|B)=∫ΩξdP(ω|B)为ξ关于条件概率P(·|B)的条件期望,易证:E(ξ|B)=1P(B)∫BξdP.
当σ代数G=σ(Bn,n≥1)其中{Bn∶n≥}是Ω的一个可测分割,则
E(ξ|G)=∑∞n=11P(Bn)∫BnξdP·IBn(ω).
进一步推广就是下面条件期望的定义.
定义1[1]设(Ω,F,P)为概率空间,G是F的子σ代数,ξ为数学期望存在的随机变量,一个G可测随机变量η如果满足∶∀A∈G,∫AηdP∫AξdP,则称η为ξ关于G的数学期望,当ξ=IA(ω),A∈F则称E(ξ|G)为A关于G的条件概率,记为P(A|G).
Radon-Nikodym定理保证了上述条件期望的存在.事实上:∀A∈G,v(A)≜∫AξdP是G上的符号测度,且关于P绝对连续.由Radon-Nikodym定理可知存在Radon-Nikodym导数η=dvdP,于是,
∀A∈G,∫AηdP=v(A)=∫AξdP.
条件期望E(ξ|G)实际上是随机变量ξ在G的每个可测子集上按概率测度的平均,特别当G=σ(η),η为随机变量,记E(ξ|G)=E(ξ|η).若取G=σ({A}),A∈F则E(ξ|G)=aIA+bIAc,其中a,b分别为ξ在A和Ac上的均值,这表明E(ξ|G)是对ξ的某种局部修平,修平的效果随G的增大而减弱.若G={Ω,Ø},则E(ξ|G)=Eξ,ξ被彻底修平;若增大G⊃σ(ξ),则E(ξ|G)=ξ,此时修平作用消失.显然易见,条件期望是几乎处处确定的,因此有关条件期望的性质也是a.s成立的.注意在概率空间情形,a.s收敛总蕴含依概率收敛.当P[E(ξ+|G)]=∞,E[(ξ-|G)=∞]=0时,称E[ξ|G]=E[ξ+|G]-E[ξ-|G]为ξ关于G的广义条件期望,约定∞-∞=0.显然当Eξ存在时,广义条件期望就是条件期望.
定理1[4]条件期望具有下面的性质:
(1)E(aξ+bη|G)=aE(ξ|G)+bE(η|G),其中a,b∈R,且假定E(aξ+bη|G)存在;
(2)E[E(ξ|G)]=E(ξ);
(3)如果ξ为G可测,则E(ξ|G)=ξ;
(4)如果ξ与σ代数G独立,则E(ξ|G)=E(ξ);
(5)如果G1是σ代数G的子σ代数,则E[(E(ξ|G))|G1]=E(ξ|G1);
(6)(Jensen不等式)如果f是R上的下凸函数,则f(E(ξ|G))=E(f(ξ)|G);
2 条件期望在预测中的应用
定理2 设Y是(Ω,F,P)上的任一r.v,EY2<∞,D是F的一个子σ代数,则对每个D上可测函数Z(EZ2)<∞有
E[(Y-Z)2]≥E[(Y-E(Y|D))2]
(1)
式中等号当且仅当Z=E(Y|D),a.s时成立.
证明 因为E|(Z-E(Y|D)|<∞,是D可测的,故有
E[(Z-E(Y|D))(Y-E(Y|D))|D]=
(Z-E(Y|D))E[Y-E(Y|D)|D]=0,a.s
E(Y-Z)2=E[(Y-E(Y|D))2]+
E[(Z-E(Y|D))2]-
2E[(Z-E(Y|D))(Y-E(Y|D))]=
E[(Y-E(Y|D))2]+E[(Z-E(Y|D))2].
这就证明了(1)式成立的充分必要条件是E[(Z-E(Y|D))2]=0即Z=E(Y|D),a.s
推论1 若EY2<∞,则VarY≥Var[E(Y|D)],等号当且仅当Y=E(Y|D),a.s时成立.
如果Z=g(X),D=σ(X),则(1)式变为E[(Y-g(X))2]≥E[(Y-E(Y|X))2],等号成立的充分必要条件为Y=E(Y|X),a.s.
条件均值E[Y|X]的危险性小于Y,这一结论是Rao-Blackwell定理的理论基础,意思是如果Y是某个参数的无偏估计,则E[Y|X]是一个更好的无偏估计,这里假定E[Y|X]是一个统计量,即不含未知参数[4].在事件X=x上的,Y的条件分布的概率质量堆积于条件均值E[Y|X=x]附近,使得发散程度变低,因而是一个更好的估计量.
在最小二乘(均方)意义下,已知D的条件下,E(Y|D),a.s是Y的最佳预测.通常当观察到D={X=x}时,E(Y|x)是一切对Y的估计值中均方误差最小的一个,则称之为Y关于X的回归.特别当X=(X1,…,Xn),D=σ(X)则在Rn→R的一切可测函数g中,在最小二乘意义下,E(Y|X1,…,Xn)是Y的最佳预测[6].
例1 设X=(X1,X2)服从n元正态分布N(a,B),这里X1,X2是一个子向量,EX1=a1,EX2=a2,B=(B11B12
B21B22),B11,B22分别是X1,X2的协方差矩阵,B12则是X1与X2的相应分量构成的协方差矩阵.我们做线性变化
(Y1,Y2)=(X1,X2)(I-B-111B12
0I)
EY1=EX1=a,VarY1=VarX1=B11
EY2=a2-a1B-111B12VarY2=
E(Y2-EY2)′(Y2-EY2)=B22-B21B-111B12
又因为E(Y1-EY1)′(Y2-EY2)=0,即Y1,Y2相互独立,变换的Jacobi行列式为1,所以fX(x1,x2)=fY(Y1,Y2)=fY1(y1)fY2(y2),这里,y1=x1,y2=-x1B-111B12+x2,显然fX1(x1)=fY1(y1),因此在X1=x1条件下,X2的条件密度
f(x2|x1)=fX(x1,x2)fX1(x1)=fY1(y1)fY2(y2)fY1(y1)=
fY2(y2)=fY2(-x1B-111B12+x2).
因为Y2~N(a2-a1B-111B12,B22-B21B-111B12),所以在X1=x1条件下,X2的条件分布是N(a2+(x1-a1)B-111B12,B22-B21B-111B12),E(X2|X1=x1)=a2+(x1-a1)B-111B12称为X2关于X1的回归.显然它是x1的线性函数,所以在正态分布场合最佳预测是线性预测.
例2 设到达某车站的顾客数为参数是λ的泊松流,求在时间间隔(0,t]中,所有到达顾客等待的时间和的平均值.如果每分钟有5个顾客到达该车站,每10分钟有一列车通过该车站,求一天(24小时)在该车站由于等待乘车而浪费的平均时间和.设X(t)表示在(0,t]内到达车站的顾客数,则{X(t),t≥0}为参数为λ的泊松过程.Wj是第j个顾客到达的时刻,ηj是第j个顾客的等待时间,则
ηj=t-Wj.
E[∑X(t)j=1(t-Wj)]=
∑∞n=1E[∑X(t)j=1(t-Wj)|X(t)=n]P(X(t)=n)=
∑∞n=1[nt-E(∑X(t)j=1Wj)]P(X(t)=n)=
[t-t2]E[X(t)]=λt22
因为λ=5人/分钟,所以一天(24小时)顾客由于等车而浪费的平均时间和为:5×1022×6010×24=36000(分钟).由上可知,如果增加车次,顾客浪费的时间少,但是车次增加,费用必然增加,满载率将减少,也会造成浪费.而如何确定车次,使时间、金钱的浪费最小,这是运筹学所要研究的优化问题.通过“均方误差最小”可以解决一系列的预测问题,在当前的社会,经济发展是重要问题.通过条件期望可以预测小至一个公司的日常运作,大至世界经济的发展方向,并且可以根据它所做出的预测做出相应的决策.所以,条件数学期望的经济应用将会越来越为人们所关注.
参考文献:
[1]金治明.数学金融学基础[M].北京:,2006.
[2]张梅.利用条件期望解决最优预测问题举例[J].陕西教育学院学报,2006,22(2):83-84.
[3]张慧.条件g期望与相关风险测度[J].山东大学学报:理学版,2005,40(3):34-40.
[4]严加安.测度论讲义[M].北京:科学出版社,2004.
[5]刘嘉锟,王公恕,等.应用随机过程[M].北京:科学出版社,2004.
[6]史及民.离散鞅及其应用[M].北京:科学出版社,1999.