M/G/c排队系统中顾客队长排队长的置信区间的Bootstrap估计
2011-01-25杨巧君张渊娴周灿灿马新生
杨巧君,汪 琴,章 玲,张渊娴,周灿灿,马新生
(浙江外国语学院理工学院,浙江杭州310012)
1 引 言
等候服务的顾客数(即排队长)及系统中的顾客数(即队长)是排队论中衡量系统优劣的二项重要指标.目前,求解排队系统队长、排队长的方法主要是针对顾客到达数的分布均服从Poisson分布的情形[1]44[2-5],求解M/G/c系统的队长、排队长的方法有随机模拟法、正态分布近似法和非参数统计方法[6,7],但这些方法主要适用于求解队长、排队长的点估计,而不能很好的计算其置信区间.
统计学家Efron教授在1979年提出了一种基于计算机技术的Bootstrap重抽样方法[8].该方法是一种非参数统计方法,它的显著特点是不必对未知分布做任何假设,而是通过计算机对原始数据进行再抽样来模拟未知分布,然后对未知参数进行估计.由于计算机性能和软件技术的日益提高,Bootstrap方法已成为应用统计学中非常常用和有效的非参数估计方法之一,而参数的区间估计又是Bootstrap方法的最经典的应用[8,9][10]81.基于此,Chu和Ke[11]于2006年首次利用Bootstrap原理,从非参数估计的角度讨论了M/G/1系统顾客逗留时间的Bootstrap区间估计,随后,Ke,Ko和Sheu[12]于2008年讨论了可控M/G/1系统忙期的Bootstrap区间估计,并以置信区间长度的标准,比较了不同区间估计的优劣.为此,本文将利用Bootstrap理论,并在我们研究团队前期研究成果[6,7]的基础上,给出一种求解M/G/c系统的队长、排队长区间估计的方法.
2 队长、排队长的点估计
队长,指系统中的顾客数,它的期望值记作Ls,排队长(队列长),指系统中排队等候服务的顾客数,它的期望值记作Lq,它们满足关系
一般情形Ls(或Lq)越大,说明服务率越低,排队成龙,是顾客最讨厌的.
M/G/c//排队系统[1]2是这样一类排队系统:顾客流为Poisson流,有c个并列的服务台(c≥2),每个服务台对一个顾客的服务时间相互独立且均服从一般分布,服务时间与到达时间相互独立,顾客源和系统容量是无限的,先到先服务.
ls1,ls2,…,lsn的矩估计作为顾客数ls的点估计,即
依据大样本理论和中心极限定理,我们知道不论排队长和队长服从何种分无偏、一致和渐进正态估计[10]93.
3 Bootstrap区间估计
目前,尚未有对M/G/c//系统指标作区间估计的文献报道.为此,本文提出了一种基于观测数据和Bootstrap重抽样技术的队长和排队长的区间估计方法.
3.1 Bootstrap方法的基本提法[10]81
3.2 Bootstrap方法的基本步骤
注1:从非参数统计的观点看,Fn是F的非参数极大似然估计,它为一离散分布,X*~的可能
注2:若已知F为一连续分布,为了适当考虑F的连续性,可作
,i=1,2,
注4:在再抽样时,Bootstrap子样X*的容量可以不为n.
3.3 Bootstrap置信区间
Efron[8],Efron和Tibshirani[9],以及沃塞曼[10]83给出了3种构建Bootstrap置信区间的方法,介绍如下.记α为显著性水平.
方法1 正态区间法
最简单的方法是正态置信区间
方法2 枢轴量法置信区间
于是得到
因此,1-α的Bootstrap枢轴置信区间为
可以证明[10]84,当满足一定条件时有,
其中,Cn由(4)给出.
方法3 百分位区间法
Bootstrap百分位数区间定义为
4 实际计算
文献[13]给出了一个某医院眼科门诊的实际M/G/c//排队系统,并给出了每天进入系统和离开系统的各类病人的详细数据.该医院眼科门诊每天开放,住院部共有病床79张,手术主要分为:白内障、视网膜疾病、青光眼和急诊(外伤).该住院部非急诊病人按照FCFS(First come,First serve)规则安排住院.我们以该排队问题中的队长和排队长的计算为例,来检验我们以上给出的置信区间的合理性.
首先,利用[13]中提供的实际数据,可得每天系统中的排队长、队长,如图1所示.
图1 排队系统中的排队长、队长
观察图1可知,该医院眼科门诊服务系统的排队长在10天后(即从7月22日开始)进入稳态,队长在20天后(即从8月3日开始)进入稳态.因为我们考虑的是稳态后的系统状态,故以下的计算中只采用稳态后的数据.
利用矩估计计算公式(1)和(2),可估计得稳态后队长为168.3902人,排队长为89.2941人.
采用本文第3部分给出的区间估计方法,利用Matlab软件进行计算,在95%、90%、85%和75%四种置信度下,分别计算得到队长、排队长的三种置信区间.计算中,队长和排队长的实际样本数分别为n1=41,n2=51,重抽样的样本数B仿文献[11]和[12]中的方法,取为B=1000.实际计算过程中,我们发现,由于重抽样的随机性,每次运行得到的结果是不同的.为此,我们采用随机模拟的思想,对重抽样过程再重复计算N=1000次,取N次结果的平均值,作为置信区间的估计值.结果分别如表1和表2所示.
表1 全部非急诊病人队长的置信区间
表2 全部非急诊病人排队长的置信区间
利用表1和表2的结果,可得不同求解方法和不同置信水平下,队长、排队长的置信区间长度的变化情况,如图2所示.
图2 队长、排队长置信区间的长度变化
由以上排队系统中排队长、队长的点估计和区间估计的结果可知:
(1)在95%、90%、85%和75%不同的置信度下,三种bootstrap区间估计的置信区间均包含了点估计所得的结果(进入稳态后排队长的平均值为89人,队长的平均值为168人).
(2)在不同的置信水平下,每一种方法所得的置信区间是不相同的,且置信区间长度随着置信度的降低而减小.
(3)置信度为95%时,队长和排队长的置信区间长度分别为4.8416和3.5805,都显著小于数据的标准差7.9934和6.5888,说明本文给出的方法是有效的.
(4)根据区间估计理论,置信区间的长度越短,区间估计的效果越好[10].以置信区间的长度为评价标准,本文计算结果表明,正态区间法与百分位法相当,略优于枢轴量法.
[1]孙荣恒,李建平.排队论基础[M].北京:科学出版社,2002.
[2]张淑媛,卢献利.M/G/C/排队系统在呼叫中心中间件的应用[J].内蒙古科技与经济,2010,2(204):69-72.
[3]刘晓燕,孙玺菁,刘孝磊,刘丹.一类N-策略M/G/1排队系统队长分布[J].海军航空工程学院学报,2010,25(3):357-360.
[4]唐应辉,刘燕.N-策略M/G/1/排队系统的队长分布表达式[J].运筹与管理,2006,15(3):40-46.
[5]周永卫,杨晓侠,范贺花.M/M/1排队系统队长瞬时分布的新算法[J].华东交通大学学报,2006,23(1):158-160.
[6]汪琴,岑璐局,张渊娴,等.基于排队论的眼科病床合理安排的数学模型[J].浙江教育学院学报,2010,1(1):79-88.
[7]陈静,杨巧君,周灿灿,等.一类随机服务系统的非参数统计分析与预测[J].浙江教育学院学报,2010,1(1):89-94.
[8]Efron B.Bootstrap methods:Another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[9]Efron B R,Tibshirani J.An Introduction to the Bootstrap[M].New York:Chapman&Hall,1998:178-199.
[10]L沃塞曼.统计学完全教程[M].张波,刘中华,魏秋萍,等,译.北京:科学出版社,2008.
[11]Ke J C,Chu Y K.Nonparametric and s imulated analysisof intensity for a queueing system[J].Applied Mathematics and Computation,2006,183(2):1280-1291.
[12]Ke J C,KoMY,Sheu S H.Estimation comparison on busy period for a controllable M/G/1 system with bicriterion policy[J].Simulation Modelling Practice and Theory,2008,16(6):645-655.
[13]全国大学生数学建模竞赛组委会.2009高教社杯全国大学生数学建模竞赛B题[EB/OL].[2009-10-10].http://mcm.edu.cn/mcm09/Problems2009c.asp.