APP下载

分位数回归理论及其应用*

2014-09-06郭月玲李春波

关键词:工学院胸围位数

郭月玲,李春波

(1.湖南工学院数理部,湖南 衡阳 421002;2.湖南工学院体育部,湖南 衡阳 421002)

分位数回归理论及其应用*

郭月玲1,李春波2

(1.湖南工学院数理部,湖南 衡阳 421002;2.湖南工学院体育部,湖南 衡阳 421002)

介绍了分位数回归的概念、拟合优度、置信区间,并将分位数回归方法应用到肺活量的研究中.结果表明,体重在肺活量分布上的变化趋势是递减的,呼吸差在肺活量分布上的变化趋势是递增的,而在肺活量分布的中端,胸围的影响较强.

分位数回归;参数估计;肺活量

在进行定量分析时,通常采用最小二乘法(OLS).但是运用最小二乘法的条件比较高,如线性回归模型要求满足同方差性、随机误差间两两不相关等条件,在实际中,完全满足这些条件的情况并不多见,那么在应用时就难以得到无偏的、有效的参数估计量.针对上述问题,Koenker R等[1]于1978年提出分位数回归模型.相对于OLS模型,分位数回归具有以下几个优势:首先,它对模型中的误差项不需做任何分布的假定,表现出很强的稳健性;其次,对条件分布的刻画更加细致,尤其能有效地分析数据分布中极端值的影响;还有,分位数回归通过使加权误差绝对值之和最小得到参数的估计具有大样本理论下的渐进优良性.因此,目前该方法被广泛应用.笔者利用该方法探索大学生体重、肺活量、呼吸差、胸围四者之间的相互关系,对大学生肺活量的影响因素进行分析.

1 分位数回归的概念

(1)

(1)式中,yi代表因变量的向量,xi代表自变量的向量,τ是要估计的分位数值,β是一个系数向量.这个模型的特点是β将随着τ的变化而有所不同.τ可以取0~1之间的任何值,然后依靠(1)式的线性规划估算出Y的相应分位数的回归系数.实际上,最小绝对偏差法估计的值就是回归分位数在τ=0.5时的一个特例.

2 分位数回归的拟合优度

假设待估计的模型为

(2)

其中β1:(p-q)×1,β2:q×1.

3 分位数回归的置信区间

伪R2定义为

参数的可信区间[4]可近似用t分布原理方法.

4 实证研究

为了解影响肺活量的因素,收集湖南工学院2012年电气系、机械系共1 800名学生的健康体质测试成绩数据,利用分位数回归方法对数据进行分析.考虑肺活量对体重、胸围、呼吸差的分位数回归,选择分位点0.05,0.25,0.5,0.75,0.9,利用统计软件STATA计算,输出结果见表1.

表1 多分位点的分位数回归

从表1可以看出,各解释变量在各分位点都具有显著意义.对于变量x1(体重),各分位数回归系数依次递减,说明体重在各分位数的分布是不同的,对于具有不同肺活量的学生而言,处于条件分布低端的学生,体重的影响要高于平均水平,而处于条件分布高端的学生,体重的影响相对较低.对于变量x2(胸围),除了在5%和90%分位数回归上系数分别为20.502 5和24.181 8外,在25%,50%,75%的分位数回归上系数都较高,其系数分别为32.683 2,36.898 1,40.355 9,这说明对于不同肺活量的学生而言,胸围处于中端的学生,其边际贡献较大.对于变量x3(呼吸差),各分位数回归系数依次递增,且回归系数为正,表明呼吸差与肺活量之间具有显著正相关,且处于条件分布低端的学生的呼吸差影响要低于平均水平.

5 结语

将分位数回归应用到肺活量的研究中,分析结果表明,在影响肺活量的诸因素中,体重、胸围、呼吸差对肺活量不同分位点的影响是不同的,但均为正向效应.其中,体重因素的作用随着分位点的升高而降低,呼吸差因素的作用随着分位点的升高而升高,胸围因素则表现在中端影响效应最强.当然,该结论也受到数据抽样代表性不足的限制,比如涵盖院系较少、个别学生无成绩等,这可能在一定程度上对结论存在影响.

[1] KOENKER R,BASSETT G.The Asymptotic Distribution of the Least Absolute Error Estimator[J].Journal of the American Statistical Association,1978,73:618-622.

[2] 李育安.分位数回归及应用简介[J].统计与信息论坛,2006,5(3):35-38.

[3] 朱平芳,朱先智.企业创新人力投入强度规模效应的分位点回归研究[J].数量经济技术经济研究,2007,24(3):69-80.

[4] 季 莘,陈 峰.百分位数回归及其应用[J].中国卫生统计,1998,15(6):9-11.

(责任编辑 向阳洁)

IntroductiontoQuantileRegressionandItsApplication

GUO Yueling1,LI Chunbo2

(1.Department of Mathematics,Hunan Institute of Technology,Hengyang 421002,Hunan China;2.Department of Physical Education,Hunan Institute of Technology,Hengyang 421002,Hunan China)

The concepts of quantile regression,the goodness of fit,and the confidence interval are introduced.The method of quantile regression is applied to the research on lung capacity.It is concluded that the weight distribution in lung capacity has the tendency to decrease,the breathing difference distribution in lung capacity has tendency to increase,and the chest circumference has strong impact in the middle part of lung capacity distribution.

quantile regression;parameter estimation;lung capacity

1007-2985(2014)05-0026-03

2014-03-20

湖南省教育厅科学研究项目(12C0665)

郭月玲(1983—),女,山东菏泽人,湖南工学院数理部讲师,硕士研究生,主要从事经济数学研究.

O212

A

10.3969/j.issn.1007-2985.2014.05.007

猜你喜欢

工学院胸围位数
探讨假体凸度对假体隆乳患者术后胸围及罩杯的影响
五次完全幂的少位数三进制展开
《盐城工学院学报(自然科学版)》征稿简则
《盐城工学院学报(自然科学版)》征稿简则
《盐城工学院学报(自然科学版)》征稿简则
《盐城工学院学报(自然科学版)》征稿简则
胸围革命
幸而今天买了胸衣
遥感卫星CCD相机量化位数的选择
“判断整数的位数”的算法分析