APP下载

基于支付意愿的卫生经济学评价中成本效果阈值研究系统评价

2021-07-13李程洪刘红海黄梅香张治国

医学与社会 2021年7期
关键词:测量方法效用比值

李 环,李程洪,刘红海 ,黄梅香, 张治国,2

1华中科技大学同济医学院医药卫生管理学院,湖北武汉,430030; 2湖北省卫生技术评估研究中心,湖北武汉,430030

如何充分利用有限的卫生资源以满足人民群众日益多样化的需求是卫生决策者共同面临的一大难题。作为帮助卫生部门优化资源配置的有效工具,卫生经济学评价正在被越来越多的国家使用。成本效果分析和成本效用分析是卫生经济学评价的常用方法,通过比较干预项目的增量成本和增量效果(Incremental Cost Effectiveness Ratio,ICER)来进行经济性分析[1]。而单独的ICER并没有经济意义,需要引入成本效果阈值(Cost Effectiveness Threshold,以下简称“阈值”)来帮助判断干预是否物有所值[2]。

目前我国还未形成广泛认可的阈值,在成本-效果分析和成本-效用分析中常直接采用WHO推荐的阈值,即避免一个伤残调整生命年(Disability-Adjusted Life Year,DALY)需要支付人均GDP的1-3倍,但研究表明我国以质量调整生命年(Quality-Adjusted Life Year, QALY)为效果单位的研究要多于以DALY为效果单位的研究[3],此时直接使用WHO推荐的1-3倍人均GPD/DALY作为阈值的合理性有待考量。支付意愿法(Willingness to Pay,WTP)作为确定阈值的常用方法之一,不仅可以获取民众的主观支付意愿,也能够帮助决策者判断当前阈值是否合理[4-5]。但是国内缺乏对每QALY支付意愿相关研究的总结回顾,基于此,本研究将全面检索相关文献,归纳总结视角、方法等相关要素,以期为我国今后开展此类研究提供参考。

1 资料来源与方法

1.1 纳入与排除标准

1.1.1 纳入标准。各国人群均可;以QALY为效果单位,并使用支付意愿法进行调查的实证研究;文献中明确报告WTP/QALY值。

1.1.2 排除标准。非英文文献;综述、评论、指南和学位论文;重复发表的文献;未明确给出WTP/QALY值的文献。

1.2 文献检索策略

计算机检索PubMed、Embase和HTA Database 数据库,搜集公开发表的以QALY为效果单位、使用支付意愿法调查人群对卫生干预支付意愿的文献,检索时限均为建库至2019年5月。检索采用主题词和自由词相结合的方式,并检索纳入文献的参考文献,以补充相关文献。英文检索词包括"Willingness to Pay" "Monetary Value" "Quality-Adjusted Life Year"等。

1.3 资料提取和数据分析方法

本研究按照“切尾中位数-中位数-切尾均值-均值”的顺序提取WTP/QALY值,理由如下:①成本派生的数据通常是偏态的;②切尾分析值排除了异常值[6]。采用Excel 2013进行数据提取、整理和分析。将WTP/QALY值与人均GPD值进行比较。为了方便比较,纳入的WTP/QALY值都根据调查年份对应的世界银行汇率换算成美元单位;再根据研究年份和国家,将WTP/QALY值与世界银行提供的人均GPD值进行比较。

2 结果

2.1 纳入研究基本情况

初检共获得1346篇文献,经过逐层筛选最终纳入37篇文献。由于37篇文献中有2篇文献报告的是同一个项目的研究结果,因此本研究实际是对36项研究的回顾分析。见表1。

表1 纳入研究的特征和结果

2.2 纳入研究基本特征

纳入的36项研究样本量从69到28347不等,覆盖20个国家,其中4个国家是发展中国家,包括马来西亚、泰国、伊朗和中国,其余均为发达国家。在美国开展的调查数量最多(7项),其次是在荷兰开展的调查(6项)。在中国大陆开展的研究仅有2项,一是Zhao等开展的对一般人群和慢性前列腺炎患者的支付意愿调查[7];二是Gao等调查癫痫患者对于健康状况改善的支付意愿[8]。

2.3 研究对象和研究视角

研究对象包括一般人群、患者、医生和政客。在36项研究中,有5项研究同时调查了一般人群和患者,24项研究只以一般人群为调查对象,6项研究只调查了患者,1项研究调查对象为医生和政客。

研究视角包括个人、社会、家庭和卫生支付方。1篇文献同时包括个人、社会和家庭三个视角,1篇文献从个人和社会两个角度展开调查,1篇文献的视角为卫生支付方。剩余的33项研究中,31项从个人视角开展调查,2项从社会视角开展。

2.4 研究内容和干预结果

研究内容可以分为3类:一般健康状况、疾病或疼痛、某一干预或治疗方案。研究设计了不同的假设场景,用于调查人们在不同场景中的支付意愿,这些研究场景实际上是对于研究内容的具体描述。10项研究只设计了一种假设场景,其余26项研究的假设场景数均大于1个。设计的场景由研究内容的严重程度、持续时间这两个因素组成,例如Byrne等的研究根据膝关节炎(疾病)的严重程度给出了轻度、中度和重度膝关节炎3种假设场景[9]。

研究设计者假设支付一定的金额后,能够获得以下结果之一:改善生命质量(Quality of Life,QoL),延长期望寿命(Life Expectancy,LE),挽救生命(Save Life, SL)。在36项研究中,1项研究的结果同时包括改善生命质量、延长期望寿命和挽救生命,5项研究的结果包括改善生命质量和延长期望寿命,1项研究的结果是包括延长期望寿命和挽救生命。其余29项研究只有一种假设结果,其中26项研究为改善生命质量,2项为延长期望寿命,1项为挽救生命。

2.5 研究方法

QALY值可以通过直接或间接两类方法测量,直接测量方法包括时间权衡法(Time-Trade Off, TTO)、标准博弈法(Standard Gamble,SG),视觉模拟量表(Visual Analog Scale,VAS);也可通过生命质量量表间接测量,如EQ-5D和SF-6D。20项研究使用VAS获取QALY值,18项研究使用EQ-5D,11项研究使用TTO,7项研究使用SG,其余方法使用频率较低,如SF-6D、HUI、QWB-SA等。21项使用方法组合测量QALY(58.33%),其中3项研究同时使用SG、VAS和TTO组合获取QALY值,2项研究则同时使用TTO、VAS和EQ-5D组合;8项研究使用EQ-5D/VAS组合,3项研究使用VAS/TTO组合,其余的组合均只使用1次,包括VAS/HUI、VAS/SG、EQ-5D/SF-6D、EQ-5D/15D 、EQ-5D/ QWB-SA、SG/TTO等。

表1(续)

WTP的测量方法主要有投标博弈(Bidding Game,BG)、开放式问题(Open-ended Question, OE)、支付卡(Payment Card, PC)、二分式选择(Dichotomous Choices, DC)和离散选择试验(Discrete Choice Experiment, DCE),前4种皆为条件价值评估法。33项研究采用条件价值评估法测量WTP,其中,13项研究使用OE测量WTP,13项使用BG,12项研究使用DC,10项研究使用PC;2项使用DCE测量WTP,1项研究使用自行设计的模型获取WTP值。15项研究采用方法组合获取WTP值(41.67%), 其中5项研究使用PC/OE组合,DC/BG组合和BG/OE组合分别使用4次,DC/OE和DC/PC组合均只使用1次。

2.6 WTP/QALY值及其与人均GDP的比较

36项研究中,1项研究只说明是在欧洲9个国家开展,没有具体表明是哪几个国家,无法计算WTP/QALY与人均GDP的比值;1项研究是对于美国食源性疾病的支付意愿调查,WTP/QALY与人均GDP的比值非常高,达133.58,不是本研究阐述的一般情况。排除这两项研究后,共有34项研究纳入本节讨论当中。

1项研究既报告了单一阈值(即WTP/QALY值),又报告了阈值区间,其余33项研究中,12项研究报告的是单一阈值,21项则报告的是阈值区间。将阈值与对应国家调查年份的人均GDP相比较(以下简称比值),发现比值从负值到12.49不等。

对于单一阈值研究,13项研究(37.14%)共得到47个比值,涵盖16个国家/地区,比值从0.03到4.94不等。6个比值大于3,覆盖2个国家/地区,表明调查所得的WTP/QALY值大于对应国家当年的3倍人均GDP。其余41个比值小于3(87.23%),覆盖14个国家,表明调查所得的WTP/QALY值小于3倍人均GDP;39个比值小于2(82.97%),18个比值小于1(38.30%)。见图1。

图1 WTP/QALY值与人均GDP的单一比值

对于阈值区间研究,22项研究(62.86%)共得到41个阈值区间,涵盖16个国家,比值从负值到12.49不等。35个比值区间的上限值小于3(85.37%),覆盖16个国家,表明这16个国家的WTP/QALY值小于3倍人均GDP;32个比值区间的上限值小于2(78.05%),23个比值区间的上限值小于1(56.10%)。见图2。

图2 WTP/QALY值与人均GDP的比值区间

3 讨论

3.1 单一方法测量QALY值和支付意愿局限性大

36项研究使用最多的QALY测量方法是VAS,其操作简单、容易理解。QALY值测量方法中使用次多的是EQ-5D,该方法通常要求调查国家已经建立适用于该国的效用积分体系,比如英国建立了本国的积分体系,英国国家临床优化研究院也明确表示EQ-5D是测量效用值最合适的方法[10]。由于EQ-5D对受访者的理解能力要求相对不高,设计者即便使用直接测量方法获取QALY,也会同时使用EQ-5D来描述假设场景,比如Pinto-Prades等使用SG来测量西班牙人群的健康效用值,同时使用21112和22223(EQ-5D健康状况)来描述健康问题[11]。此外,58.33%的研究使用2种及以上方法组合测量QALY值,最常见的组合是EQ-5D搭配直接测量方法,如使用次数最多的EQ-5D/VAS组合,两方法间相互补充,EQ-5D弥补了VAS信度不高的缺点,VAS可用于测量特定的健康效用,比如对于疼痛的测量,弥补EQ-5D普适性强、但对研究者感兴趣的健康效应没有足够的反应效度的缺点[12]。基于以上发现,本研究建议使用方法组合测量QALY值,以规避单一测量方法的局限性;在众多测量方法中,尤其推荐使用EQ-5D。

除离散选择实验使用较少外,其余几种WTP测量方法的使用频率相差较小,与孙杰等的研究结果略有不同,孙杰认为WTP常用测量方法是OE和PC,BG和DC则不太常用,但是该研究结果并没有数据支撑或文献佐证[13]。本研究认为,上述4种方法并不存在明显的优先顺序,选择何种方法应综合考虑测量方法的特点和实际操作环境。在实际应用中,同样可以使用方法组合测量支付意愿。

3.2 我国对每QALY支付意愿的研究有待加强

我国对于每QALY支付意愿的实证研究起步较晚,在中国大陆开展的研究仅有两项,最早的研究年份为2009年,相关研究探索仍有大量空间。同时,在中国大陆开展的两项研究均使用英国的效用值积分体系来获得不同健康状况的效用值,这是由于我国长期缺乏适合本国居民健康偏好的效用值积分体系,学者们在进行QALY计算时只能采用英国或日本等国家的效用积分体系。效用值积分体系的缺乏也导致我国成本-效用分析中QALY值计算不规范,进而影响到对每QALY支付意愿的实证研究开展相对较少。效用值积分体系缺乏的情况一直持续到2014年,刘国恩教授团队建立了第一套广泛认可的、适用于我国城市居民的EQ-5D效用值积分体系[14]。基于此,本研究预测未来关于每QALY支付意愿研究很可能逐渐增多。

3.3 阈值区间优势明显,WHO推荐阈值过大

单一阈值的使用频率要小于阈值区间的使用频率。单一阈值能够保证决策的一致性和公平性,而阈值区间可以综合考虑经济性和公平性;相较于单一阈值可能存在的“一刀切”问题,阈值区间能够决策目标的多重性要求,因此本研究推荐使用阈值区间。分析单一阈值研究,发现WTP/QALY值与人均GDP的比值小于3的45个研究中,95.12%的比值实际上小于2;分析阈值区间研究,比值区间上限小于3的35个研究中,91.43%的比值区间上限小于2。因此,本研究认为3倍人均GDP远高于人们实际的支付意愿,即WHO推荐的阈值太大,并不能很好地代表人群的支付意愿。

4 本研究的局限性

本研究局限性主要包括以下3点:①检索了常用的3个英文数据库,但可能存在漏检;②受研究设计、数据可获得性限制,未对研究进行质量评价,可能导致纳入的部分文献代表性不足;③WHO推荐阈值的效果单位是DALY,直接与以QALY为效果单位的阈值进行比较,本身就存在单位不同的问题。因此本研究只能表明WHO推荐阈值不能在以QALY为效果单位的卫生经济学评价中作为阈值使用。

猜你喜欢

测量方法效用比值
小学美术课堂板书的四种效用
比值遥感蚀变信息提取及阈值确定(插图)
纳米硫酸钡及其对聚合物的改性效用
基于迭代稀疏分解的介损角测量方法
基于应变原理随钻钻压测量方法研究
一种高效的PCB翘曲度测量方法
不同应变率比值计算方法在甲状腺恶性肿瘤诊断中的应用
几种常见叶面肥在大蒜田效用试验
玉米田不同控释肥料效用研讨
基于压电激振的弹性模量测量方法