小样本数据潜变量建模:贝叶斯估计的应用
2018-12-13毛志雄李玉磊
晏 宁,毛志雄,李 英,李玉磊,郭 璐
小样本数据潜变量建模:贝叶斯估计的应用
晏 宁1,2,毛志雄1,李 英3,李玉磊1,郭 璐1
1. 北京体育大学 心理学院, 北京 100084; 2. 北京联合大学 心理素质教育中心, 北京 100101; 3. 北京中法实验学校, 北京 100095
旨在通过一项基于计划行为理论的锻炼行为实证研究案例,说明贝叶斯结构方程模型如何应对小样本数据。贝叶斯方法之所以适用于小样本数据主要因为:贝叶斯方法不依赖大样本理论且允许估计测量模型中所有可能的残差协方差,经典统计方法中这些均无法实现;借助贝叶斯定理,采用信息先验的贝叶斯估计允许将先前研究的结果与当前研究进行整合,从而使假设获得检验的机会,这也是经典统计方法无法实现的。与最大似然估计相比,贝叶斯估计有助于降低对样本量的要求、避免不适当解、更好地反映研究者的理论构想和先验信念、促进科学知识的积累。然而,贝叶斯估计并非万能,必须确保合理、透明地使用先验信息。
贝叶斯方法;结构方程模型;最大似然估计;残差相关;先验分布
1 问题的提出
众所周知,样本量越大,<0.05的可能性越大。然而研究实践过程中,研究者并非总有机会获得大样本数据。运动与锻炼心理学领域的研究也不例外。纵向追踪研究中的样本流失、研究对象的总体数量极为有限、严格的研究参与者筛选标准、研究经费的限制以及道德约束等因素均有可能使研究者获得大样本的期望难以、甚至根本无法实现。而小样本数据带来的一个直接后果是统计检验力降低,由此造成的不显著的值,使得研究结果在零假设检验框架下无法获得有意义的解释[7,26,33]。此时,研究者常需面对两难的选择,坚持还是放弃自己感兴趣的研究问题。
究竟多大样本量才能满足当前研究所需,是每个学者在研究开始之前必须要回答的问题。借助模型中参数个数来粗略估计研究所需样本量是常用的策略之一。如:Lee等(2004)[26]的研究显示,采用最大似然估计(maximum likelihood estimation)进行结构方程模型分析时,至少需要自由参数5倍以上的样本量,才能获得参数的无偏估计,这个标准已经比实践中常用的经验法则要宽松得多。模型复杂程度和测量模型特征也是确定样本量时经常需要考虑的因素,如:Hair等(2014)[15]基于模型复杂程度和基本测量模型的特征给出一套更为精细的确定样本量的经验法则:当模型中包含5个及以下构念,每个构念有3个以上观测条目且平均方差萃取量在0.6及以上时,最小样本量为100;当模型包含7个及以下构念,每个构念有3个以上观测条目且平均方差萃取量在0.5左右时,最小样本量为150;模型包含7个及以下构念,平均方差萃取量低于0.45,且(或)存在观测条目不足3个的构念,最小样本量为300;模型包含7个以上构念,其中部分构念平均方差萃取量低于0.45,且(或)单一构念的观测条目不足3个,最小样本量为500。除上述法则外,Muthén(2002)[32]甚至认为,确定样本量唯一有效的途径是进行模拟研究。如果模拟研究显示5倍于自由参数个数的样本量可以提供足够的统计检验力,则实际研究中的样本量至少要5倍于自由参数个数。
然而,如果基于上述策略确定的样本量无法达到,会出现什么情况?考虑一下这个研究问题:采用前瞻设计,考察计划行为理论(the theory of planned behavior,TPB)[4]相关构念对有锻炼意向和少量锻炼行为、但未达到推荐锻炼标准的视障大学生群体的锻炼行为的预测效果。这个问题中,研究者感兴趣的群体有两个限制条件。1)视障大学生。因为元分析结果显示,计划行为理论对锻炼行为的预测效果存在群体差异[28],因而有必要单独考察计划行为理论相关构念对视障大学生锻炼行为的预测效果。2)满足“有锻炼意向和少量锻炼行为、但未达到推荐锻炼标准”的筛选条件。因为符合这一条件的研究参与者,是未来最有可能通过心理社会变量的干预促进其锻炼行为的群体。通常,此类研究问题需要使用结构方程模型来回答,如前所述,使用最大似然估计需在大样本量条件下才能获得参数的无偏估计。但是,该研究在实际数据采集过程中,至少面临5个挑战。1)视障大学生总人数相对有限,且分散于众多高校,研究者期望获得一个大样本数据,其难度可想而知。即便有些高校开设的特殊教育类专业存在一定数量的视障大学生,由于这些专业在校生的规模有限,想要获得大样本数据也并非易事。如2016年全国仅有1 941名残疾人(含视障)进入高等特殊教育学院学习[2],而北京地区规模最大的特殊教育学院目前在校视障大学生也仅有160人左右。2)“有锻炼意向和少量锻炼行为、但未达到推荐锻炼标准”这一筛选条件的限制进一步加剧了获得大样本的难度。3)样本流失是前瞻设计无法回避的现实。4)从伦理层面讲,需征得本人的同意,才能邀请其参加研究项目进而获得数据。5)重度视障大学生无法独自完成纸笔测验,需要安排调查员协助进行,造成时间成本和经费投入的增加。在上述5个挑战面前,研究者获得根据经验法则确定的样本量,难度倍增。那么,对于这一研究问题,除了等待若干年,以积累足够的样本量之外,是否只有放弃一途?
2 贝叶斯估计应对小样本数据的原理
与最大似然估计相比,贝叶斯估计(Bayesian estimation)不一定需要大样本量[30]。在分析小样本数据时,贝叶斯估计可以同时兼顾估计精度和统计检验力[26]。这主要归因于贝叶斯估计可以将参数的先验信息纳入分析过程[36]。
贝叶斯估计的核心思想是将收集观测数据前已掌握的关于参数的知识(先验)与观测数据信息(似然函数)相结合,进而获得更新的参数知识(后验)[24]。确定先验分布的依据是研究者在采集观测数据前,确信已经掌握的关于模型参数背景知识的多少,以及对这些信息的确信程度。当参数值及其精度的先验信息可以获得并加以利用时,可设定信息先验分布(informative prior distribution)。先验知识可从前人的研究(如:元分析或类似的研究)中获得,其优点是便于他人核实这些先验信息的来源。当然也可从本领域理论或实务方面的专家处获得[41]。当没有任何可资利用的先验知识,或者未使用先验知识时,可选择无信息先验(non-informative prior distribution),即假定我们对于模型参数一无所知,观测数据中的参数估计值出现在负无穷到正无穷任一点上的概率均等,也就是模型参数服从一个从负无穷到正无穷的均匀分布(uniform distribution)。从贝叶斯的观点来看,先验信息的缺乏同样值得考虑,也有必要将其纳入后续统计分析。换句话说,量化未知与量化已知同等重要[22]。有些情况下,设定参数取值范围从负无穷到正无穷没有实际意义,因此可以在设定先验分布时,增加参数取值范围的设定,如:先验均值的取值范围可以不包含超出量表刻度以外的数值。更多关于贝叶斯方法的介绍可参考van de Schoot等(2014)、Depaoli等(2017)文献。
一般来说,先验信息精度越高,所携带的信息量越大,对估计结果的影响越大[37]。当使用无信息先验时,先验分布不会对最终模型参数估计产生任何影响,因而,采用无信息先验分布所得结果与最大似然法一致[30]。当使用低精度的信息先验,尤其是样本量较大时,结果几乎不会受到先验信息的影响。不管样本量大小,精度较高的信息先验不仅可以将先前研究的结果纳入当前的分析过程,更可由此获得更加精确的可信区间(credibility interval)或者后验预测区间(posterior predictive interval)估计值。换句话说,先验分布的精度越高,后验分布所携带的信息就越多,即:统计检验力就越高,或者说,统计推断错误不太可能发生[38]。此外,将先验信息纳入分析过程可避免不可接受的估计值以及贝叶斯估计中的收敛问题。而多项模拟研究[18,29]结果显示,经典统计方法中常用的最大似然估计则经常遭遇违犯估计和收敛问题。总之,采用信息先验的贝叶斯估计在小样本量条件下,也可以获得有意义的结果。但是,我们仍强烈建议,如果有可能,获取大样本数据仍应作为研究者的首选。
3 研究案例
本文数据来源于一项锻炼行为促进领域的实证研究。该研究旨在考察计划行为理论相关构念对有锻炼意向和少量锻炼行为、但未达到推荐锻炼标准的视障大学生锻炼行为的预测效果。
计划行为理论是身体活动促进领域应用最广泛的理论之一。该理论认为,行为态度、主观规范和主观控制感透过行为意向影响行为[4]。如果将主观行为控制感视为自己是否对从事该行为有足够选择权的评价,则主观行为控制感可对行为的产生有直接预测作用[3]。目前已有多项元分析和叙事性综述为计划行为理论解释和预测不同人群各种形式的身体活动行为提供了支持性证据,且研究结果具有较高的一致性[6,10,11,14,17,21,23,34]。如:近期一篇元分析[28]结果显示,行为态度与行为意向、主观行为控制感与行为意向、主观行为控制感与身体活动、行为意向与身体活动的相关系数(标准差)分别为:0.60(0.14)、0.55(0.20)、0.34(0.15)、0.48(0.18)。鉴于元分析结果具有易量化、可查证、可提供变量关系的强证据等特点,研究案例将以此作为先验信息的来源,并将其纳入后续的数据分析过程。
为降低读者的认知负荷,研究案例仅将计划行为理论框架中的行为意向和主观控制感作为锻炼行为的预测因素纳入假设模型。根据计划行为理论,可以假设,锻炼意向和主观控制感对锻炼行为均有显著正向预测作用,且主观控制感可同时对锻炼意向有显著正向预测作用。
下文将借助真实数据分析过程演示说明如何应用贝叶斯估计分析小样本数据,同时对比最大似然估计和贝叶斯估计在小样本条件下模型拟合和参数估计的差异。至于两种估计方法对比的结果,可以预期,在小样本量条件下,当最大似然估计无法对模型参数作出有效估计时,采用允许纳入先验信息的贝叶斯估计,可使研究假设获得重新检验的机会。
特别说明,因该数据仅用作演示说明的目的,且假设模型仅选用了部分计划行为理论构念,相关结果不构成计划行为理论对视障大学生锻炼行为预测效果的研究证据。
3.1 方法
采用前瞻设计。研究参与者来源于某高校特殊教育学院的在校大学生,第1次测量完成锻炼行为以及锻炼意向和主观控制感的测量。4周后,完成第2次锻炼行为测量。共有81人完成两次测量。两次测量中,达到ACSM推荐锻炼标准[16],即每周参与中等强度锻炼5次以上或者大强度锻炼3次以上者,以及每周参与中等以上强度锻炼低于1次者予以剔除。最终获得52份有效数据。
锻炼意向和主观控制感的测量各3个条目,采用6级李克特量表计分[1]。锻炼行为采用【休闲时间锻炼问卷】(the Godin Leisure-Time Exercise Questionnaire,GLTEQ)[13],要求参与者报告过去4周中,每周锻炼时间在30 min以上的次数[35]。
采用Mplus 7.4[31]进行潜变量建模。首先,使用最大似然法对模型进行估计,此时,不使用任何先验信息。模型拟合采用传统的2/CFI、TLI、RMSEA、SRMR等指标进行评估。一般来说,2/小于3,CFI、TLI大于0.9,RMSEA、SRMR小于0.05代表模型拟合良好[15]。
使用信息先验进行贝叶斯估计时,需进行敏感度分析(sensitivity analysis),以考查先验信息选择的合理性。所谓敏感度分析即通过考查不同先验信息条件下模型参数估计结果的差异,检验先验分布的选择对后验分布的影响程度。如不同先验信息条件下模型参数估计结果相差不大,则表明先验分布的选择对后验分布的影响较小,可以一定程度上支持先验信息选择的合理性[12]。根据Zondervan-Zwijnenburg等(2017)[40]的推荐,本研究选用无信息先验和信息先验两种先验信息进行敏感度分析,并详细报告先验信息的来源及设定方法,以确保先验信息使用的透明度。具体来说,无信息先验模型估计采用Mplus的默认设置。如:测量条目均值、锻炼行为截距项、因子载荷和路径系数的默认先验分布为N(0,1010),代表模型中这些参数服从先验均值为0,先验方差为1010的正态分布,以此近似代表先验均值为0,先验方差无限大的均匀分布。测量条目和锻炼行为的残差方差以及锻炼意向、主观控制感两个潜变量方差的先验分布为IG(-1,0),即服从先验均值和先验方差无限大的逆伽马分布(inverse gamma distribution)。信息先验模型是在上述模型的基础上,首先对所有观测变量进行标准化转换,然后通过model prior命令增加参数先验分布的设定。本研究依据近期一篇元分析[28]所提供的锻炼意向与锻炼行为、主观控制感与锻炼行为、主观控制感与锻炼意向关系的相关系数及其标准差确定相应路径系数的先验分布为N(0.48, 0.032 4)、N(0.34, 0.022 5)、N(0.55, 0.04)。根据Hair等(2014)[15]关于标准化因子载荷的推荐标准,确定因子载荷的先验均值为0.7,根据Asparouhov等(2010)[5]的建议,选择0.01作为因子载荷的先验方差,即标准化因子载荷的先验分布为N(0.7, 0.01),代表因子载荷很可能介于0.5~0.9之间(0.7±0.2)。根据Muthén等(2012)[30]的建议,采用近似零的残差相关替代零残差相关,理由将在下文讨论。测量条目残差相关的先验分布设为IW(0, 12)①,即服从先验均值为0,先验方差为0.011的逆威沙特分布(inverse Wishart distribution);残差方差的先验分布设为IW(1, 12),即服从先验均值为0.2,先验方差为0.027的逆威沙特分布。
由于对残差相关设定了小方差信息先验,收敛的难度增大,因而需要设定较大的迭代次数。根据Muthén等(2012)[30]的建议,固定贝叶斯迭代100000次。行为意向和主观控制感是计划行为理论中两个独立的构念,因此这里不考虑设置交叉载荷。其余使用Mplus的默认设定。以PSR指标小于1.1,且轨迹图呈现快速上下变动,但没有长期趋向或任意漂移的情形时,可认为达到收敛[12]。模型拟合采用后验预测值和卡方差异值95%可信区间来判断。后验预测值在0.5附近,且卡方差异值95%可信区间以零为中心基本对称,代表模型拟合良好。模型比较选用DIC指标,DIC值越小代表模型拟合越好[12]。
3.2 结果
最大似然法模型估计结果见表1。锻炼意向和主观控制感所有条目的标准化因子载荷均在0.7以上;主观控制感到锻炼意向的标准化路径系数为0.758,主观控制感解释锻炼意向方差的57.4%;模型拟合指标除RMSEA之外,均比较理想。然而,锻炼意向和主观控制感到锻炼行为的路径系数以及对锻炼行为方差解释率均未达显著,提示仅部分研究假设获得支持。此外,最大似然估计结果报告中,有一个主观控制感测量条目的残差方差未达显著,意味着该参数估计值非常接近负值,超出统计分析所能接受的范围,为不适当解。
表1 最大似然估计结果
注:DV-结果变量;IV-预测变量;Std. FL-标准化因子载荷;unstd.-非标准化路径系数;std.-标准化路径系数;INT-行为意向;PBC-主观控制感;PE-锻炼行为;***<0.001,下同。
贝叶斯模型估计结果见表2。两个模型PSR指标在迭代100 000次后,均小于等于1.002。检视所有参数轨迹图,也均提示迭代过程已收敛。敏感度分析结果显示,选用两种不同的先验信息(即无信息先验和信息先验),所得模型参数(标准化路径系数和标准化因子载荷)结果差异不大,表明先验信息的纳入并未对模型参数的估计造成重大影响,这一定程度上支持了先验信息选择的合理性[37]。从模型拟合指标来看,信息先验模型后验预测值为0.564,95%可信区间以零为中心基本对称,且DIC指标数值较小,提示信息先验模型拟合度优于无信息先验模型。从模型参数估计和推断的结果来看,无信息先验模型中的标准化路径系数、标准化因子载荷等参数的后验估计值均与最大似然估计的结果相近,这是因为无信息先验分布不会对最终模型参数估计产生任何影响[30];其中,主观控制感到锻炼意向的标准化路径系数为0.753,主观控制感解释锻炼意向方差的56.8%;而锻炼意向和主观控制感到锻炼行为两条路径系数的95%PPI包含0,提示仅部分研究假设得到支持,与最大似然估计结果一致。信息先验模型中所有路径系数的95%PPI均不包含0,提示全部研究假设得到支持。锻炼意向和主观控制感共同解释了锻炼行为方差的19.7%,与计划行为理论对身体锻炼行为预测效果相关元分析的结果接近[28]。此外,信息先验模型和无信息先验模型中所有残差方差后验估计值的95%PPI均不包含0,提示未出现违犯估计现象。
表2 贝叶斯估计结果
注:coeff.-标准化路径系数;*95%PPI不包含0。
3.3 分析
当样本量较小时,贝叶斯估计通过纳入先验知识,以更新先验知识的方式,使研究假设全部获得数据支持;而最大似然估计结果仅支持了部分研究假设。
样本量较小是导致上述案例中最大似然估计结果未能支持全部研究假设的重要原因。1)根据计划行为理论及现有元分析[28,34]证据判断,行为意向和主观控制感应可有效预测锻炼行为。而该研究中最大似然估计结果提示模型拟合指标良好,且3条路径系数所反映的变量关系方向与计划行为理论所预测的一致,唯独模型中锻炼意向到锻炼行为以及主观控制感到锻炼行为两条路径系数未达显著,由此可以排除模型建构本身的问题。2)众所周知,采用最大似然估计进行结构方程模型分析,需要的样本量较大。如:根据Hair等(2014)[15]的推荐标准,包含5个及以下构念、每个构念包含3个以上测量条目、且平均方差萃取量在0.6及以上的模型,最少需要100个样本。3)结构方程模型要求误差方差为正,且显著[15]。最大似然估计结果中存在误差方差不显著的情形,为不适当解。而贝叶斯方法估计的误差方差全部为正,且95%可信区间均未包含0,提示未出现不适当解。根据Hair等(2014)[15]的准则,样本量在300以上,且满足每个构念至少3个条目的原则,才可能不出现上述违犯估计的情况。即便是采用相对比较宽松的准则,在每个构念包含3个及以上条目时,若要最大似然估计能够收敛并获得适当解,样本量至少也要在150以上[20]。而该研究仅有52笔有效数据。综合以上3点,不难判断,最大似然估计结果未能支持全部研究假设,很有可能是样本量小所致。鉴于该研究数据采集过程中的种种挑战,增加样本的难度和成本较高,因此需要一种替代估计方法来对研究假设进行检验。
贝叶斯方法不依赖大样本理论,可将先前研究的结果与当前研究进行整合,从而使假设获得检验的机会,且允许估计测量模型中所有可能的残差协方差,而这些在经典统计方法中均无法实现[26,30,36,40]。这些特征决定了贝叶斯估计可以在小样本量条件下作为最大似然估计的替代方案。本研究结果表明,在相对较小的样本量条件下,贝叶斯估计利用从元分析获得的变量关系方向、强度的先验信息,借助Gibbs采样算法,依然获得了模型参数的无偏估计,进而使研究假设全部获得支持。同时,贝叶斯估计通过纳入误差方差的先验信息(先验均值为正),也有效避免了不适当解的情形[37]。此外,该研究根据Muthén等(2012)[30]的建议,对残差相关设定小方差信息先验,替代零残差相关。因为主观控制感和锻炼意向两个量表题目具有相似的结构、内容和措辞以及相同反应形式,由此造成的方法偏误必然会包含在每个测量条目的残差中,因此,模型中一定会存在微小但不为零的残差相关。最大似然估计的残差独立原则假定所有测量条目的残差相关为0,仅仅是出于模型简约性的考虑,而不能使模型更加符合现实情况[30]。因而允许对残差相关设定小方差信息先验,或许是信息先验贝叶斯估计能够在小样本条件下对研究假设做出有效检验的另一个重要原因。
最后,有必要强调的是,采用最大似然估计进行结构方程模型分析时,经常遇到研究假设无法获得数据支持(如:因统计检验力降低致使>0.05)、违犯估计(如:残差方差为负或不显著)等问题。此时需要具体问题具体分析,明确引发这些问题的确切原因,采取针对性的应对措施。切勿一味强行使用信息先验贝叶斯估计,获取自己感兴趣的研究结果。
4 讨论
本文首先简要分析了小样本数据的成因,并介绍了贝叶斯方法分析小样本数据的基本原理。样本量是每个研究者在开始一项研究前都关心的一个议题。最大似然估计是结构方程模型最常用的估计方法,通常需要较大的样本量。然而由于种种原因,研究者却往往难以、甚至无法获得借助经验法则或模拟研究确定的最小样本量。样本量不足会直接导致统计检验力下降,进而使研究结果在零假设检验框架下无法获得有意义的解释。贝叶斯估计可以作为小样本量条件下,结构方程模型的备选估计方法。其主要原因在于贝叶斯估计可将先验信息纳入分析过程,结合观测数据信息,获得参数的后验分布,而这个过程并不受样本量大小的限制。对一笔小样本数据而言,模型参数的先验分布精度越高,其后验分布的精度就越高,统计检验力也越高。
然后借助一项运动与锻炼心理学研究领域实证研究的数据分析过程,说明利用贝叶斯方法分析小样本数据的具体方法。通过与最大似然估计的对比,可见贝叶斯估计在实务上的4个独特优势。1)同等条件下,贝叶斯方法对样本量的要求较低。正如Lee等(2004)[26]的模拟研究表明,采用最大似然估计的结构方程模型,其最小样本量为待估计参数的4~5倍,而采用贝叶斯方法仅需待估计参数的2~3倍。不仅如此,Hox等(2012)[19]的研究表明,采用稳健最大似然估计(MLR)进行多层次模型分析时,至少需要50组样本,而采用贝叶斯估计则仅需20组。2)贝叶斯方法可以避免不适当解。最大似然估计有时会产生不恰当解,如残差方差不显著或者小于0、标准化回归系数大于1。通过残差方差、协方差先验分布的设定,这些不适当解的情况不会出现[37]。但需要注意:由于模型设定错误导致的不适当解,贝叶斯方法没办法解决。3)贝叶斯估计允许将残差方差和残差相关的先验信息纳入分析过程,从而使得假设模型能更好地反映研究者的理论构想和先验信念[30]。4)贝叶斯估计可以将前人研究成果以先验分布的形式纳入当前的研究中,体现研究的继承性。具体来说,贝叶斯估计可将来源于元分析、先前相同主题研究、预研究或者领域专家的变量关系的方向和强度先验信息,与当前观测数据相结合,构建参数的可信区间,从而更新先验知识[37]。除上述4个优势之外,文献[8,9,25,30,36,37,39]表明贝叶斯估计还有其他特点和优势。
当然,贝叶斯方法也受到诸多质疑,尤其是在先验的选择问题上[27]。批评者认为先验的选择完全基于研究者的主观决策,并警告称应警惕因错误选择先验而造成的严重后果。支持者为此做了诸多努力,并给出具体建议。如:van de Schoot等(2014)[37]的研究结果显示,对误设先验信息所造成的后果可不必过于担心,但是,研究者有义务确保先验选择的透明度。如:清晰、准确的描述所使用的先验信息,并陈述理由及其来源;如果使用了不同先验分布,还需用表格呈现敏感度分析的信息。通过这种方式,读者可以自行决定他们是否信服。近来,Zondervan-Zwijnenburg等(2017)[40]介绍了一份先验信息的获取和使用指南,并通过实际研究案例示范了如何获取先验信息。这些学者的工作均有助于推动先验信息使用的规范化。需要指出的是,应用贝叶斯方法的学者也有义务在确保先验信息设定的透明度和合理性的前提下,规范、合理地使用先验信息。比如使用先验信息的一个常见错误做法是反复尝试各种不同的先验信息,然后选择对自己有利的结果进行报告。这种做法与捏造数据同属违反学术道德行为[40]。其实,选择使用信息先验的理由不应该是为了获得统计上显著的结果,而应该是纳入可资利用的先验信息后,有助于回答那些悬而未决的研究问题。只要恰当的应用信息先验,不管结果如何,都不会掩盖该项研究自身的价值。
5 结论
贝叶斯估计可帮助研究者有效应对小样本数据造成的困扰。总体而言,信息先验贝叶斯估计通过将参数的先验信息纳入分析过程,同时兼顾了小样本量条件下模型参数估计精度和统计检验力。具体而言,信息先验贝叶斯估计将先前研究结果以先验信息的方式纳入分析过程,结合当前观测数据,使研究假设在小样本量条件下获得检验的机会;通过纳入残差方差的先验信息,避免小样本量条件下最大似然估计常见的违犯估计问题;通过纳入残差相关的先验信息,真实反映模型中必然存在的微小但不为零的残差相关,有助于改善模型拟合程度。
应用信息先验贝叶斯估计需要注意以下几点。1)虽然信息先验贝叶斯估计可以帮助研究者在小样本量条件下获得有意义的结果。但研究者在面对小样本数据时,首要考虑的问题仍应该是有没有可能增加样本量,其次才是先验信息的选择问题。2)清晰、准确的描述所使用的先验信息,并陈述理由及其来源,确保先验信息选择的透明度。3)信息先验贝叶斯估计需进行敏感度分析,以考查不同先验信息对后验估计的影响。进行敏感度分析至少也要报告使用统计分析工具软件中的默认先验信息和研究者经过检索、论证确定的先验信息的模型参数估计结果,并用表格呈现。4)解释使用不同先验信息所造成的分析结果的差异。5)方法是服务于研究问题的,贝叶斯方法也不例外。选择使用信息先验贝叶斯估计的最重要原因应是有助于特定(领域)研究问题的解决。先验信息的检索和选择可能是一项高度精细化且费时费力的任务,但有助于明晰当前研究与前人研究的区别。恰当的先验信息提供了对该领域研究现状的深刻见解,将其纳入当前研究,有助于该领域科学知识的更新。而所有已发表的研究也都应为未来同类研究提供先验信息,进而有助于该领域科学知识的积累。
[1] 胡艳, 毛志雄. 计划和障碍自我效能对锻炼意向与行为过程关系的影响[J]. Int J Sport Exerc Psychol, 2008, 6(4): 463-495.
[2] 中国残疾人联合会. 2016年中国残疾人事业发展统计公报(残联发[2017]15号)[EB/OL]. (2017-03-31). http://www.cdpf.org.cn/zcwj/zxwj/201703/t20170331_587445.shtml.
[3] AJZEN I. From intentions to actions: A theory of planned behavior [M]//KUHL J, BECKMANN J. Action Control: From Cognition to Behavior. New York: SpringerVerlag, 1985: 11-39.
[4] AJZEN I. The theory of planned behavior[J]. Organ Behav Hum Decis Process, 1991, 50(2): 179-211.
[5] ASPAROUHOV T, MVTHÉNE B. Bayesian analysis using Mplus: Technical implementation[Z], 2010.
[6] BLANCHARD C, FISHER J, SPARLING P,. Understanding physical activity behavior in African American and Caucasian college students: an application of the theory of planned behavior [J]. J Am Coll Health, 2008, 56(4): 341-346.
[7] BUTTON K S, IOANNIDIS J P A, MOKRYSZ C,. Power failure: why small sample size undermines the reliability of neuroscience [J]. Nat rev. Neurosci, 2013, 14(5): 365-376.
[8] DEPAOLI S, CLIFTON J P. A Bayesian approach to multilevel structural equation modeling with continuous and dichotomous outcomes[J]. Struct Equ Modeling, 2015, 22(3): 327-351.
[9] DEPAOLI S, RUS H M, CLIFTON J P,. An introduction to Bayesian statistics in health psychology[J]. Health Psychol Rev, 2017, 11(3): 248-264.
[10] DOWNS D S, HAUSENBLAS H A. Elicitation studies and the theory of planned behavior: a systematic review of exercise beliefs [J]. Psychol Sport Exerc, 2005, 6(1): 1-31.
[11] DOWNS D S, HAUSENBLAS H A. The theories of reasoned action and planned behavior applied to exercise: A meta-analytic update[J]. J Phys Act Health, 2005, 2(1): 76-97.
[12] GELMAN A, CARLIN J B, STERN H S,. Bayesian Data Analysis[M]. 3thed. Boca Raton: CRC Press, 2014.
[13] GODIN G, SHEPHARD R. A simple method to assess exercise behavior in the community[J]. Can J Appl Sport Sci,1985,10(3): 141-146.
[14] HAGGER M S, CHATZISARANTIS N L D. Integrating the theory of planned behaviour and self‐determination theory in health behaviour: A meta‐analysis[J]. Br J Health Psychol, 2009, 14(2): 275-302.
[15] HAIR J F, BLACK W C, BABIN B J,. Multivariate Data Analysis[M]. 7thed. UK: Pearson Education Limited, 2014.
[16] HASKELL W L, LEE I-M, PATE R R,. Physical activity and public health: updated recommendation for adults from the American College of Sports Medicine and the American Heart Association[J]. Circulation, 2007, 116(9): 1081.
[17] HAUSENBLAS H A, DOWNS D S. Prospective examination of the Theory of Planned Behavior applied to exercise behavior during women's first trimester of pregnancy[J]. J Reprod Infant Psychol, 2004, 22(3): 199-210.
[18] HOX J J, MAAS C J M. The accuracy of multilevel structural equation modeling with pseudobalanced groups and small samples [J]. Struct Equ Modeling, 2001, 8(2): 157-174.
[19] HOX J J, VAN DE SCHOOT R, MATTHIJSSE S. How few countries will do? Comparative survey analysis from a Bayesian perspective[J]. Surv Res Methods, 2012, 6(2): 87-93.
[20] IACOBUCCI D. Structural equations modeling: Fit indices, samp-le size, and advanced topics[J]. J Consum Psychol, 2010,20(1): 90-98.
[21] JONES L W, GUILL B, KEIR S T,. Using the theory of planned behavior to understand the determinants of exercise inten-tion in patients diagnosed with primary brain cancer[J]. Psychoon-cology, 2007, 16(3): 232-240.
[22] KAPLAN D, DEPAOLI S: Bayesian statistical methods[M]// LITTLE T D. Oxford Handbook of Quantitative Methods. Oxford, UK: Oxford University Press, 2013: 407-437.
[23] KARVINEN K H, COURNEYA K S, CAMPBELL K L,. Correlates of exercise motivation and behavior in a population-based sample of endometrial cancer survivors: an application of the Theory of Planned Behavior[J]. Int J Behav Nutr Phys Act, 2007, 4(1): 20-30.
[24] KRUSCHKE J. Doing Bayesian data analysis[M]. 2nded. USA: Academic Press, 2015.
[25] KRUSCHKE J K. Bayesian estimation supersedes the t test[J]. J Exp Psychol Gen, 2013, 142(2): 573-603.
[26] LEE S Y, SONG X Y. Evaluation of the Bayesian and maximum likelihood approaches in analyzing structural equation models with small sample sizes[J]. Multivar Behav Res, 2004, 39(4): 653-686.
[27] MACCALLUM R C, EDWARDS M C, CAI L. Hopes and cautions in implementing Bayesian structural equation modeling [J]. Psychol Methods, 2012, 17(3): 340–345.
[28] MCEACHAN R R C, CONNER M, TAYLOR N J,. Prospective prediction of health-related behaviours with the Theory of Planned Behaviour: a meta-analysis[J]. Health Psychol Rev, 2011, 5(2): 97-144.
[29] MEULEMAN B, BILLIET J. A monte carlo sample size study: how many countries are needed for accurate multilevel SEM?[J]. Surv Res Methods, 2009, 3: 45-58.
[30] MUTHéN B, ASPAROUHOV T. Bayesian structural equation modeling: a more flexible representation of substantive theory[J]. Psychol methods, 2012, 17(3): 313-335.
[31] MUTHéN L K, MUTHéN B O. Mplus User's Guide[M]. Los Angeles, CA: Muthén & Muthén, 1998-2015.
[32] MUTHéN L K, MUTHéN B O. How to use a monte carlo study to decide on sample size and determine power[J]. Struct Equ Modeling, 2002, 9(4): 599-620.
[33] PRICE L R. Small sample properties of bayesian multivariate autoregressive time series models [J]. Struct Equa Modeling, 2012, 19(1): 51-64.
[34] RHODES R E, NIGG C R. Advancing physical activity theory: A review and future directions[J]. Exerc Sport Sci Rev, 2011, 39(3): 113-119.
[35] STRACHAN S M, BRAWLEY L R, SPINK K S,. Self-regulatory efficacy's role in the relationship between exercise identity and perceptions of and actual exercise behaviour[J]. Psychol Sport Exerc, 2015, 18: 53-59.
[36] VAN DE SCHOOT R, BROERE J J, PERRYCK K H,. Analyzing small data sets using Bayesian estimation: the case of posttraumatic stress symptoms following mechanical ventilation in burn survivors[J]. Eur J Psychotraumatol, 2015, 6(1): 25216.
[37] VAN DE SCHOOT R, KAPLAN D, DENISSEN J,. A gentle introduction to bayesian analysis: applications to developmental research[J]. Child Dev, 2014, 85(3): 842-860.
[38] VAN DE SCHOOT R, WINTER S D, RYAN O,. A systematic review of Bayesian articles in psychology: The last 25 years[J]. Psycholo Methods, 2017, 22(2): 217–239.
[39] YUAN Y, MACKINNON D P. Bayesian mediation analysis[J]. Psycholo Methods, 2009, 14(4): 301–322.
[40] ZONDERVAN-ZWIJNENBURG M, PEETERS M, DEPAOLI S,. Where do priors come from? Applying guidelines to construct informative priors in small sample research[J]. Res Hum Dev, 2017, 14(4): 305-320.
[41] ZYPHUR M J, OSWALD F L. Bayesian estimation and inference: A user's guide[J]. J Manag, 2015, 41(2): 390-420.
①逆威沙特分布中的第2个参数代表自由度,其数值越大,则先验方差越小,所携带的信息量就越大。依据Muthén等(2012)建议的方法,本文中该参数设为12,即模型中观测条目个数加6。
Latent Variable Modeling with Small Sample Data: The Application of Bayesian Estimation
YAN Ning1,2, MAO Zhi-xiong1, LI Ying3, LI Yu-lei1, GUO Lu1
1. Beijing Sport University, Beijing 100084, China; 2. Beijing Union University, Beijing 100101, China; 3. Beijing Sino-French Experimental School, Beijing 100095, China.
The aim is to provide an empirical example of physical exercise based on the theory of planned behavior to show how Bayesian structural equation model analysis small sample data. Bayesian approach can be used with small sample sizes since they do not rely on large sample theory and allows estimating all possible residual covariance in measurement model, neither of which are possible with frequentist methods; and Bayesian estimation with informative priors allows results from all previous research to be combined with estimates of study effects using Bayes’ theorem, yielding support for hypotheses that is not obtained with frequentist methods. Compared with maximum likelihood estimation, Bayesian estimation might help to eliminate the worry about small sample sizes and the inadmissible parameters, better reflects the researcher’s theories and prior beliefs, and create cumulative knowledge. Nonetheless, Bayesian estimation is not a panacea, it is absolutely necessary to be transparent with regard to which priors were used and why.
G80-32
A
1002-9826(2018)06-0052-07
10.16470/j.csst.201806007
2017-11-15;
2018-08-11
北京体育大学科技创新团队课题(2015TD001)。
晏宁,男,副教授,主要研究方向为锻炼行为促进、大学生心理健康教育, E-mail: yanning@buu.edu.cn