基于标准赌博法探索EQ-5D量表综合指数模型
2018-02-05王国威叶静陶贡佳慧汪秀英
卓 琳,王国威,叶静陶,贡佳慧,刘 毅,徐 玲,汪秀英
1)新乡医学院基础医学院 河南新乡 453003 2)徐州医科大学公共卫生学院 江苏徐州 221004 3)中国卫生与计划生育委员会统计信息中心 北京 100044 4)徐州市中心医院肾内科 江苏徐州 221009
随着社会经济的发展、医学模式的转变,人们对自身生命健康状况越来越重视,生命质量的研究[1-3]正受到越来越多的关注。欧洲生命质量量表(EQ-5D)是一种多维健康相关生存质量测量方法[4],运用EQ-5D构建模型的方法主要有视觉标尺法、时间权衡法(TTO)、标准赌博法(SG)。SG是以冯·诺伊曼·摩根斯坦的效用理论为基础的[5],为给定健康状况下的个体提供个人的偏好“效用权重”,是用于效用评估的最好方法[6]。目前已有荷兰、日本、英国、西班牙等多个国家建立了本国综合指数模型,而我国尚没有建立公认的适合国人人群偏好的EQ-5D生命质量评分模型。本研究旨在采用SG测评典型状态,并将其结果与荷兰、英国、日本等国家进行比较分析,探讨采用何种方法更为合理,从而提高我国生命质量研究水平,为构建适合中国人群的EQ-5D评估模型提供参考。
1 对象与方法
1.1研究对象本研究选取了理解力强、依从性高的医学院校大学生作为测评对象,以分层整群随机抽样的方法按年级、专业分层抽取250名医学生作为应答者,经过统一培训询问其对18个假设状态进行评定,在计算机辅助下及时反馈信度指标,信度合格视为一个合格样本,共进行了250份问卷调查,最终回收有效问卷248份。
1.2标准健康状态的设计本研究采用EQ-5D量表五因素三水平问卷,选取L18(2*3^7)正交设计表,得到18个假设状态,见表1。
1.3SG评估生命质量SG是指应答者假设处于某种特定的健康状态,接受治疗不考虑成本但存在一定风险,治愈概率为P,治疗失败死亡概率为1-P,生命质量是应答者愿意接受治疗换取完全健康状态(11111)时所能接受的最小治愈概率值Pmin,见图1。
应答者选择治疗时,获得完全健康状态(11111)的概率为P,同时面对死亡的概率为1-P;当概率P→Pmin时应答者放弃治疗,维持现状。此时生命质量=Pmin。
表1 正交法设计的18个生命状态
1:没有障碍;2:中等障碍;3:严重障碍
图1 SG评估生命质量
1.4模型哑变量的设计本研究共设计了11个哑变量,其中M2、S2、U2、P2及A2分别表示行动能力、自我照顾能力、日常活动能力、疼痛/不舒服、焦虑/抑郁处于水平2时为1,否则为0;M3、S3、U3、P3及A3分别表示以上5个维度处于水平3时为1,否则为0。交互作用变量N3表示任意1个维度处于水平3时为1,否则为0。
1.5回归模型的选择为了控制测量值残差潜在的相关性,本研究采用加权最小二乘回归法(WLS),以残差e2的倒数为权重,分别在个体水平上和总体水平上构建模型,其中总体水平上又分别以均值和中位数为基础构建模型。
模型按照拟合优度指标进行比较,包括决定系数(R2)、预测值与均值相关系数(r)、平均绝对误差(MAE)、逻辑错误数等。R2和r越高、MAE和逻辑错误数越低则模型越好。
1.6问卷的信度控制信度的控制主要有3个指标:首先,在计算机辅助下,使用18个标准状态评分构建回归模型并对应答者自身健康状态进行预测,应答者对自身健康状态的预测值认为合理可以接受,否则需重新测评;其次,个体构建的模型中逻辑错误不得超过20%,即水平1(没有障碍)的效用值应大于水平2(中等障碍),水平2(中等障碍)的效用值应大于水平3(严重障碍),反之记为1个逻辑错误;最后,数据的分布标准差在0.25左右,离差偏移不超过20%。测评在计算机辅助下完成,3个信度指标即时完成,即时反馈。
1.7数据清洗与建模分状态绘制箱式图,识别并清理离群值,最终清理离群值1个,占0.02%。采用STATA/SE 12.0进行WLS多元线性回归。
2 结果
2.1模型系数本研究采用WLS方法构建了9个模型,见表2。
模型名称及其含义:In(individual level)表示个体水平上的模型;Am(aggregate level based on mean)表示以均值为基础构建的总体水平上的模型;AM(aggregate level based on median)表示以中位数为基础构建的总体水平上的模型;第一个数字1或0分别表示有或无常数项;第二个数字1或0分别表示有或无N3变量。建模的顺序依次为11、10、00。例如:In10表示个体水平上有常数项无N3变量的模型,AM00表示总体水平上以中位数为基础构建的无常数项无N3变量的模型。
由表2可知,在个体水平上,InWls11和InWls00的R2较高,InWls10和InWls00的r较高,又InWls00无常数项和N3变量, MAE最小且逻辑错误数为0,更为方便简洁,故在个体水平InWls00模型较优。同样,在整体水平上,模型AmWls00和AMWls00较优。模型InWls00、AmWls00和AMWls00三者相比,AmWls00和AMWls00具有较高的R2、r和较低的MAE,两模型优度相似。但当数据不满足正态分布时,以中位数为基础建模比均值更为合理,因此模型AMWls00是本研究的最优模型。
表2 以WLS为基础构建的模型系数估计表
*:较优的状态预测效用值低于较差的状态,记为1个逻辑错误
2.2参照体系见表3。
表3 本研究SG模型与其他国家的TTO模型系数
*:对生命质量影响较大的因素
2.3各模型对健康状态的评分图本研究构建的模型InWls00、AmWls00、AMWls00评分曲线见图2,3条曲线十分接近,根据模型的优度,本研究选择AMWls00与其他国家进行比较。本研究选择的最优模型AMWls00与荷兰、英国、日本的模型对健康状态的评分图见图3。图3显示,模型AMWls00对健康状态的评分曲线明显高于英国、荷兰的曲线,尤其是曲线的后半段。模型AMWls00和日本的积分曲线较为相似。
图2 模型InWls00、 AmWls00、AMWls00对健康状态的评分图
图3 模型AMWls00与 荷兰、英国、日本的模型对健康状态的评分图
3 讨论
3.1中国人群缺少自己的评分模型EQ-5D量表在成本效用评价、卫生决策分析、临床药学等很多领域中发挥着重要作用。自Dolan[7]于1997年构建出英国生命质量综合评分模型以来,已有多个国家如丹麦、日本、荷兰、美国等构建了适合本国人群偏好的EQ-5D生命质量评分模型。中国国家卫生服务调查已经连续2次应用EQ-5D,但仍没有建立适合中国人群偏好的EQ-5D生命质量评分模型,常用英国或日本的模型[8]。有研究[9-10]证明,不同国家的模型之间存在着差异性。因此,建立适合中国人群的EQ-5D生命质量评分模型很有必要。本研究采用SG构建模型,旨在探索建模的最优方法,从而为建立中国人群生命质量评分模型提供依据。
3.2本模型曲线具有东方文化特征本研究结果显示,各国模型表现出较大的差异。本研究构建的模型曲线明显高于英国、荷兰这些发达国家。这种差异可能来源于:①荷兰和英国的模型含有常数项,分别为-0.081、-0.152,这个参数会造成评分曲线的下降。②发展中国家和发达国家经济状况、文化背景不同,人们对苦难的理解也会不尽相同[11],发达国家对生命质量的期望会高于发展中国家。③使用EQ-5D量表具有一定的局限性,通常需要考虑翻译的质量等方面的影响[12]。而模型AMWls00的评分曲线与日本的较为接近,因为中国与日本在地域、文化、对健康的偏好等方面有些共同的东方文化特征。
3.3WLS有效最常用的回归模型主要有普通最小二乘回归法(OLS)、WLS、广义最小二乘回归法(GLS)3种。OLS要求样本数据具有独立性,即各数据间不相关,但本例数据不能满足此要求,同一受调查者完成18个测量存在一定的相关性;而WLS总体上优于OLS[13],作为一种特殊的GLS方法,WLS常用于存在非独立、异方差问题的线性回归模型的参数估计[14]。本研究WLS方法指定了残差的倒数为权重,即对残差量较大的测量降低其权重,进而得到比OLS方法更有效的估计。
3.4最优模型的选择本研究构建的模型AMWls00,无常数项和N3变量,简洁最优。当模型性能近似时,首选最简约的模型[7,15]。如果增加常数项,可造成曲线下降和逻辑错误。哑变量N3没有增加模型的优度,却一方面增加了变量间的相关性,另一方面增加了模型应用的复杂性。因此无常数项无N3变量的模型更为高效简洁。美国的模型也没有常数项。本研究构建的3个既有常数项又有N3的模型,均出现预测值逻辑错误,而其他模型则无逻辑错误。
理论上,个体水平上的模型优于总体水平上的模型,但个体水平上的回归模型过分依赖于个体对健康状态的理解。此外,Lee等[16]指出总体水平上的模型产生更好的结果,总体水平上的回归模型能够消除个体水平上数据的差异性。考虑到数据存在个体内部评分相关性,可能影响模型的结果,作者分别以均值和中位数为基础构建总体水平上的回归模型,并且研究结果显示在总体水平上,基于中位数的模型AMWls00和基于均值的模型AmWls00优度相似,都优于个体水平模型。理论上,当数据不是正态分布时,中位数更能代表总体的集中趋势,更能符合意愿支付法[17]。因此,基于整体水平建模时应考虑中位数。
3.5本研究方法的有效性与不足SG是在不确定条件下测量个人喜好的经典方法,可以测量冯·诺伊曼·摩根斯坦效用函数的生命年、健康状态以及用于计算生命质量调整寿命年的偏好权重。1994年,Gafni[18]应用SG研究公共事业的经济评估,并证实了它的有效性。
然而,SG方法只提供在一个特定健康状态的个人偏好分数,不能很好地考虑时间维度的影响,即忽略了应答者假设处于某种健康状态的时间长短。个体健康不像其他决策理论或经济学的研究结果,它与时间维度密切相关。因此,在不同健康状态下评估个体的生命质量时不能忽略其处于各健康状态的时间长短。在这个意义上,健康是一种二维现象。1982年,Sutherland等[19]研究不同时间段中在相同健康状态下的个人喜好效用值时发现,生存时间在短期内(3个月)的受试者大部分接受现有健康状态而不是选择死亡;而大多数生存时间更长(8 a)的受试者,他们在较低健康状态下更偏好地选择死亡。因此将健康状态评分作为一个“固定”的值可能难以覆盖个体的时间维度偏好。另外,因为概率取值仅限于1~0,所以SG对可能比死亡更差的状态评估具有局限性。
此外,本研究选取医学院校的学生为对象,提高了理解力和依从性等表面效度,证明了SG方法可行,用于衡量青年大学生群体有效,但推广应用于一般人群应谨慎。
[1] 吉珂,周王艳.欧洲生命质量量表EQ-5D的应用研究进展[J].国外医学:卫生经济分册,2010,27(4):168
[2] 李娜,赵芝焕,万崇华.慢性肺心病患者生命质量与临床客观指标的关系[J].吉林大学学报(医学版),2012,38(3):580
[3] 张升超,吴江,陈辉清,等.基于EQ-5D量表的深圳市居民健康相关生命质量研究[J].中国社会医学杂志,2017,34(2):135
[4] 李明晖,罗南.欧洲五维健康量表(EQ-5D)中文版应用介绍[J].中国药物经济学,2009(1):49
[5] VON NEUMANN JM.Theory of games and behavior[M].New York:John Wiley,1953.
[6] BALA MV,WOOD LL,ZARKIN GA,et al.Are health states "timeless":the case of the standard gamble method[J].J Clin Epidemiol,1999,52(11):1047
[7] DOLAN P.Modeling valuations for EuroQol health states[J].Med Care,1997,35(11):1095
[8] 岳明,赵绯丽,吴久鸿,等.地区因素对生活质量总体评分和效用的影响:北京昆明两地慢性前列腺炎患者生命质量比较调查[J].中国卫生经济,2010,29(11):89
[9] JO MW,YUN SC,LEE SI.Estimating quality weights for EQ-5D health states with the time trade-off method in South Korea[J].Value Health,2008,11(7):1186
[10]JOHNSON JA,LUO N,SHAW JW,et al.Valuations of EQ-5D health states: are the United States and United Kingdom different?[J].Med Care,2005,43(3):221
[11]BAILEY H,KIND P.Preliminary findings of an investigation into the relationship between national culture and EQ-5D value sets[J].Qual Life Res,2010,19(8):1145
[12]张洁,黄泰康.亚洲健康相关生命质量工具概况及其发展建议[J].中国药物经济学,2008(5):53
[13]杨剑,吕乃光,董明利.加权最小二乘算法在机器视觉系统中的应用[J].光学精密工程,2009,17(8):1870
[14]刘明.基于一元线性回归模型异方差对加权最小二乘法的考察[J].统计与决策,2012(19):11
[15]YANG Y,BRAZIER J,TSUCHIYA A,et al.Estimating a preference-based single index from the overactive bladder questionnaire[J].Value Health,2009,12(1):159
[16]LEE YK,NAM HS,CHUANG LH,et al.South Korean time trade-off values for EQ-5D health states: modeling with observed values for 101 health states[J].Value Health,2009,12(8):1187
[17]BEIKERT FC,LANGENBRUCH AK,RADTKE MA,et al.Willingness to pay and quality of life in patients with atopic dermatitis[J].Arch Dermatol Res,2014,306(3):279
[18]GAFNI A.The standard gamble method: what is being measured and how it is interpreted[J].Health Serv Res,1994,29(2):207
[19]SUTHERLAND HJ,LLEWELLYN-THOMAS H,BOYD NF,et al.Attitudes toward quality of survival:the concept of "maximal endurable time"[J].Med Decis Making,1982,2(3):299