健康效用值测量中的映射法及其相关模型概述

2017-11-01孙园园李洪超中国药科大学国际医药商学院南京211198

中国药房 2017年29期

孙园园，余正，李洪超（中国药科大学国际医药商学院，南京211198）

孙园园＊，余正#，李洪超（中国药科大学国际医药商学院，南京211198）

目的：为将非效用量表测量结果转化为健康效用值提供方法学参考。方法：查阅国内外文献，总结健康效用值测量中的映射法及其相关模型，并以生存质量量表测量结果转换成欧洲五维健康量表效用值为例，介绍各模型在概率映射中的应用。结果：映射法可通过建立非效用量表和效用量表之间的映射关系，进而得到健康效用值；其常用模型包括普通最小二乘法（OLS）模型、最小绝对离差法（CLAD）模型、Tobit模型、多元Logistic回归（MNL）模型、贝叶斯网络（BN）模型等。其中，OLS模型相对简单，预测效度较好，但会受到天花板效应的限制；Tobit模型不受天花板或地板效应的限制，当误差项满足方差齐性及正态性时，其预测结果优于OLS模型；CLAD模型可用于误差项非方差齐性不适用Tobit模型的情况；MNL模型先通过回归分析确定一种健康状态，再确定其效用值；BN模型预测效度较好，且不涉及计量经济学中的诸多假设和限制条件，但其构建过程受领域专家的影响较大。使用MNL或BN模式计算健康效用值的方法主要有蒙特卡洛模拟法、期望效用值法和最大可能概率法等。利用拟合优度、调整拟合优度、平均误差、均方误差、平均绝对误差等指标进行模型性能评价，可选出最优模型，进而计算健康效用值。结论：由于各映射模型各有优缺点，在临床研究中需要根据实际情况选择不同的映射模型。

映射法；健康效用值；映射模型；生存质量量表；欧洲五维健康量表

在目前的健康相关生存质量（Health-related quality of life，HRQOL）测量和药物经济学评价中，质量调整生命年（Quality-adjusted life years，QALY）已成为衡量产出和健康测量的标准指标，而QALY计算的关键在于健康效用值的测量。健康效用值是个体对不同健康状态的偏好程度，通常由基于偏好的HRQOL测量工具效用量表测量得到，如欧洲五维健康量表（EuroQol group’s 5-domain，EQ-5D）、健康效用指数（Health utility index，HUI）、健康指数量表（Quality of well-being，QWB）和六维健康调查短表（Short form 6D，SF-6D）等[1]。不过在临床研究中，一些通用或疾病专用的非基于偏好的非效用量表也被频繁使用，如健康调查简表（Medical outcomes study 36-item short from health survey，SF-36）、生存质量量表（Medical outcomes study 12-item short form health survey，SF-12）和帕金森疾病调查问卷等[2]。其中，EQ-5D量表（效用量表），包含5个维度，分别为行动能力（Mobility）、自理能力（Self care）、日常活动能力（Usual activities）、疼痛或不舒服（Pain/discomfort）以及焦虑或抑郁（Anxiety/depression）。每个维度下对应3个反应水平：“水平1”代表“没有任何困难”，“水平2”代表“有些困难”，“水平3”代表“极度困难”。SF-12量表（非效用量表）包含12个条目，用以测量被测对象整体健康、体能、日常活动精力、身体疼痛、心理健康和社交活动等方面的状态。每个条目对应3～5个反应水平（即每个条目下被测对象作出回答的选项），以对应3个反应水平的条目为例：“水平1”代表“限制很多”，“水平2”代表“限制一点点”，“水平3”代表“一点也没有限制”。最后，根据12个条目的得分情况分别得到身体健康总分（Physical component summary，PCS）和精神健康总分（Mental component summary，MCS），总分越高说明被测对象的身体健康状态、精神健康状态越好[3]。由于健康效用值才是基于人群偏好的HRQOL测量结果，因此需要将非效用量表得到的结果转化成健康效用值。为解决上述问题，可以使用映射法建立非效用量表和效用量表之间的映射关系，进而得到健康效用值。笔者通过查阅国内外文献，以将SF-12量表测量结果转换成EQ-5D效用值为例，介绍健康效用测量中的映射法及其相关模型，为非效用量表测量结果转化为健康效用值提供方法学参考。

1 映射法的概念及基本过程

映射法是利用映射模型估计非效用测量方法和效用测量方法的关系，运用回归方法，以非效用量表的某一类指数为自变量、效用量表的某一类指数为因变量建立回归方程，并对所建立的回归方程进行拟合度检验，最后利用该方程预测健康效用值的方法[4]。使用映射法将非效用量表的测量结果转换成健康效用值的过程分为两种：一种是运用映射模型建立非效用量表和效用量表健康效用值之间的映射关系，直接预测健康效用值，如普通最小二乘法（Ordinary least square，OLS）模型、最小绝对离差法（Censored least absolute deviations，CLAD）模型和Tobit模型；另一种是通过多元Logistic回归（Multinomial logistic regression，MNL）模型和贝叶斯网络（Bayesian networks，BN）模型等，先建立非效用量表和效用量表各维度下反应水平之间的映射关系，再利用各反应水平的预测概率和效用量表的积分系统计算健康效用值[4]。

2 映射法的常用模型

目前，常用的映射模型主要有计量经济学的OLS模型、CLAD模型、Tobit模型以及MNL模型等，而BN模型的应用则相对较少[5]。

2.1 OLS模型

OLS是计量经济学中应用较多的一种参数估计方法，主要通过最小化误差的平方和来建立拟合度最好的回归方程[6]。由于OLS要求自变量和因变量均为连续型变量，因此当自变量为非效用量表总分、各维度得分或各条目水平得分，因变量为效用量表的效用值时，就可使用此模型。如，以SF-12量表PCS和MCS为自变量，以EQ-5D量表效用值为因变量，可使用OLS模型建立回归方程，进行健康效用值的预测[7]。

OLS模型相对简单，对数据要求也较少，而且预测效度也较好，因此应用较广泛。但是OLS模型受到天花板效应的限制，即作为因变量的效用值取值上限为1，所以该模型理论上并不完全适用于这种情况[7]。

2.2 Tobit模型

Tobit模型也称为样本选择模型、受限因变量模型，由James Tobin于1958年提出，是因变量满足某种约束条件下取值的模型[8]。

当因变量的取值受到限制，会出现天花板或地板效应，如EQ-5D量表效用值以1为上限的天花板效应。此时，若使用OLS估计回归系数就容易出现偏倚，而遵循最大似然法概念的Tobit模型就成为估计回归系数的一个较好选择。

当因变量上限为1时，Tobit模型如下所示：

其中，yi为因变量，即效用量表的健康效用值；yi*为实际观测值；xi为自变量，即影响效用值的非效用量表中某类指标；β’为未知参数；ui为误差项，且服从正态分布，即ui～N（0，σ2）。

当误差项满足方差齐性及正态性时，Tobit模型预测结果优于OLS；如果误差项不满足方差齐性或者非正态性，用Tobit模型也会产生较大偏倚[9]。

2.3 CLAD模型

由于CLAD对误差项的分布形式和方差齐性不作要求，以及对截尾数据稳健性较好，因此可用于误差项非方差齐性（不适用Tobit模型）的情况。其基本原理是通过最小化误差项的绝对值之和来估算回归系数。

CLAD模型也考虑到了天花板效应，设定健康效用值的上限为1。除了考虑PCS、MCS及其交互作用外，Sullivan PW等[5]的CLAD模型中还包含被测对象的年龄、性别、种族、受教育程度、收入水平和疾病状况等因素，以便小幅度地提高预测效度。

2.4 MNL模型

前文介绍的OLS模型、Tobit模型和CLAD模型或多或少存在一些问题，如天花板或地板效应。此外，通过回归方程预测的结果是一个健康效用值，而不是效用量表各维度下的反应水平，可能会出现预测结果为效用量表中没有定义过的健康状态。于是，Gray AM等[10]提出了一种“基于反应水平映射”的方法，即MNL模型。如，基于SF-12量表12个条目的测量结果进行MNL模型模拟，可得出EQ-5D量表各维度下各反应水平的预测概率，确定一种健康状态；再利用蒙特卡洛模拟法（Monte Carlo simulation method，MCSM）、期望效用值法（Expected-utility method，EUM）或最大可能概率法（Mostlikely probability method，MLPM）计算出EQ-5D量表的效用值。

此外，MNL模型还有一个优点。MNL模型产生的回归方程预测的是效用量表各维度下各反应水平的概率，需要再用效用量表的积分系统计算健康效用值。因此，为了得到基于不同国家水平的效用值，可使用不同国家版本的效用量表，这样可避免前面3种方法必须进行不同国家水平效用值换算的问题[11]。

2.5 BN模型

BN用来表示变量间的概率依赖关系，由一个有向无环图（Directed acyclic graph，DAG）和条件概率表（Conditional probability table，CPT）组成。其中，DAG由代表变量的节点及连接这些节点的有向边组成[12]。对于健康测量来说，一个节点代表一种健康维度，节点的状态反映出该健康维度下可能的反应水平[13]。节点分为父节点和子节点，对于子节点（xi）与其父节点[π（xi）]，条件概率分布为P{xi|π（xi）}。对于一组离散变量，网络的联合概率分布可表示为[13]：

例如，假设SF-12量表条目二和EQ-5D量表Selfcare（自理能力）维度的BN节点结构和条件概率如图1所示（其中，“HMODACT12”和“SELFEQ5D”分别代表SF-12量表条目二和EQ-5D量表自理能力维度）[14]：

图中，MA代表SF-12量表的条目二“Health limits moderate activities”，并且有3个反应水平（1，2，3）；SC代表EQ-5D量表自理能力“Self-care”维度，同样包含3个反应水平（1，2，3）。假设MA和SC的发生是相互独立的，那么联合概率分布计算[14]如下：

其中，i和j分别为MA和SC的反应水平。

图1 SF-12量表条目二和EQ-5D量表自理能力维度的BN节点结构和条件概率Tab 1BN node structure and conditional probability of the item 2 in SF-12 scale and Self-care dimension in EQ-5D scale

与计量经济学方法相比，使用BN模型建立非效用量表和效用量表健康维度之间的概率映射关系有很多优势。首先，BN模型没有关于回归方程以及函数形式的诸多假设和限制条件；其次，BN模型不仅预测效度好，还可将变量之间的关系图形化，有助于研究人员进一步探究非效用量表和效用量表不同条目和健康维度之间的相关性[15]。当然，BN模型也存在一定的局限性。由于BN结构的构建受领域专家意见的影响较大，具有较强的随意性，所以目前应用较少。

3 利用效用量表积分系统计算健康效用值的方法

使用MNL或BN模型，可以帮助建立SF-12量表和EQ-5D量表之间的概率映射关系，得到EQ-5D量表各维度下各反应水平的预测概率，再利用EQ-5D量表的积分系统采用一定方法计算出健康效用值[16]。现笔者主要介绍一下MCSM、EUM和MLPM 3种计算方法。

3.1 MCSM

Gray AM等[10]建议使用MCSM，目前这种方法使用较多。以英国版EQ-5D量表为例，具体方法如下：

通过MCSM产生服从均匀分布的0～1之间的5个随机数（ui，可以是小数），比较随机数和BN预测的EQ-5D各维度下每种反应水平概率的大小，将研究个体分配到各维度下对应的反应水平。P1（x）、P2（x）、P3（x）分别为3种反应水平“没有任何困难（level 1）”、“有些困难（level 2）”和“极度困难（level 3）”的预测概率，x代表EQ-5D量表的5个维度。每个随机数（ui）将按如下方法分配一种EQ-5D维度下的一种对应反应水平。预测EQ-5D量表反应水平：

＝1，如果ui≤P1i（x）

＝2，如果P1i（x）＜ui≤[1－P3i（x）]

＝3，如果ui＞[1－P3i（x）]

通过上式计算可以得到一种预测的健康状态，如健康状态“23211”，然后使用EQ-5D积分系统计算预测的EQ-5D效用值为0.331[17]。

3.2 EUM

EUM是一种比较精确的方法，其通过应用代数方程计算出的效用值正好等于使用MCSM重复模拟得到的结果。

以英国版EQ-5D量表为例，EUM计算公式[18]如下：

其中，Expected_Disutilities的计算方法如下：

上述公式中，“Expected_Disutility（mobility）”为“‘mobility’维度下的预期非效用”；“Expected_Disutility（any response with some/severe problems）”为“‘任何非完全健康状态’的预期非效用”；“Expected_Disutility（any response with severe problems）”为“‘至少有一个维度处于水平3’的预期非效用”；P1、P2、P3分别为相应维度处于水平1、水平2、水平3的概率值。

3.3 MLPM

在MLPM中，预测反应水平取各维度下3种反应水平中预测概率最大的。和MCSM相似，得到一种确定的健康状态之后使用EQ-5D积分系统计算预测的EQ-5D效用值[18]。

预测反应水平i

＝1，如果P1i（x）＞P2i（x）且P1i（x）＞P3i（x）

＝2，如果P2i（x）＞P1i（x）且P2i（x）＞P3i（x）

＝3，如果P3i（x）＞P1i（x）且P3i（x）＞P2i（x）

4 映射模型性能的评价

评价几种模型的性能，可以使用以下常用指标：（1）拟合优度和调整拟合优度。拟合优度主要用来检验模型对EQ-5D效用实际观测值的拟合程度，等于因变量变差中模型所能解释部分所占的比重；当解释变量为多元时，应使用调整拟合优度。拟合优度和调整拟合优度越大，表明模型拟合优度越好。（2）平均误差（Mean error，ME）、均方误差（Mean squared error，MSE）和平均绝对误差（Mean absolute error，MAE）。用ME、MSE和MAE 3个指标来衡量EQ-5D效用预测值与实际观测值之间的偏差，借此评价模型的预测能力。上述指标的值越小，说明预测值与实际观测值之间的偏差越小，即模型的预测能力越好。此外，还可以利用散点图和Pearson相关系数等方法或指标来评价、比较模型的性能。

5 结语

映射法是一种将非效用量表测量结果转化成健康效用值的有效方法，目前国内的相关研究还较少。在本文中，笔者对映射法常用的几种模型如OLS模型、CLAD模型、Tobit模型和MNL模型以及近年来国外研究中推荐的新方法BN模型进行了概述，指出每种模型的优缺点和进行模型性能评价时参考的指标。以上方法中，BN模型预测效度较好，且不涉及计量经济学中的诸多假设和限制条件，但由于BN的构建过程受领域专家的影响较大，随意性较大，因此目前应用相对较少。此外，笔者还对概率映射中的MCSM、EUM和MLPM计算方法作了简要介绍，希望可为国内相关研究中健康效用的测量提供参考。

[1]蒋艳，王煊，朱文涛.生命质量量表在药物经济学评价中的选择及应用[J].中国药物评价，2014，31（5）：313-316.

[2]何燕，赵龙超，刘丹萍，等.SF-36和SF-12在人群生命质量调查中的性能比较研究[J].现代预防医学，2017，44（5）：852-862.

[3]伍红艳，孙利华.两种常用EQ-5D量表效用值积分体系的比较及其对成本效用分析结果的影响探讨[J].中国卫生经济，2012，31（7）：9-11.

[4]付希婧，梁敏洪，孙茂，等.映射法在健康效用值测量中的应用研究[J].中国卫生经济，2014，33（10）：32-35.

[5]Sullivan PW，Ghushchyan V.Mapping the EQ-5D index from the SF-12：US general population preferences in a nationally representative sample[J].Med Decis Making，2006，26（4）：401-409.

[6]刘明.普通最小二乘法的几何分析[J].统计与决策，2012（4）：90-92.

[7]Franks P，Lubetkin EI，Gold MR，et al.Mapping the SF-12 to the EuroQol EQ-5D index in a national US sample[J].Med Decis Making，2004，24（3）：247-254.

[8]周华林，李雪松.Tobit模型估计方法与应用[J].经济学动态，2012（5）：105-119.

[9]Austin PC，Escobar M，Kopec JA.The use of the tobit model for analyzing measures of health status[J].Qual Life Res，2000，9（8）：901-910.

[10]Gray AM，Rivero-Arias O，Clarke PM.Estimating the association between SF-12 responses and EQ-5D utility values by response mapping[J].Med Decis Making，2006，26（1）：18-29.

[11]Chuang LH，Kind P.Converting the SF-12 into the EQ-5D：an empirical comparison of methodologies[J].Pharmacoeconomics，2009，27（27）：491-505.

[12]胡春玲.贝叶斯网络研究综述[J].合肥学院学报（自然科学版），2013，23（1）：33-40.

[13]Neapolitan RE.Learning Bayesian networks[M].New Jersey：Pearson Education Inc.，2004：481-527.

[14]Le QA，Doctor JN.Probabilistic mapping of descriptive health status responses onto health state utilities using Bayesian networks：an empirical analysis converting SF-12 into EQ-5D utility index in a national US sample[J].Med Care，2011，49（5）：451-460.

[15]Borchani H，Bielza C，Marti Nez-Marti NP，et alMarkov blanket-based approach for learning multi-dimensional Bayesian network classifiers：an application to predict the European quality of life-5 dimensions（EQ-5D）from the 39-item parkinson’s disease questionnaire（PDQ-39）[J].J Biomed Inform，2012，45（6）：1175-1184.

[16]伍红艳，刘国恩，官海静.EQ-5D健康量表效用积分体系的构建研究：基于我国西南地区的实证分析[J].中国药房，2016，27（14）：1877-1881.

[17]Dolan P.Modeling valuations for EuroQol health states[J].Med Care，1997，35（11）：1095-1108.

[18]Mortimer D，Segal L.Comparing the incomparable?A systematic review of competing techniques for converting descriptive measures of health status into QALY-weights[J].Med Decis Making，2008，28（1）：66-89.

Overview of the Mapping Method and Relevant Models in Health Utility Values Measurement

SUN Yuanyuan，YU Zheng，LI Hongchao（School of International Pharmaceutical Business，China Pharmaceutical University，Nanjing 211198，China）

OBJECTIVE：To provide methodological reference for converting non-utility scale measurement results into health utility values.METHODS：Referring to domestic and foreign literatures，mapping methods and relevant models in health utility measurement were summarized.The effect of each model on probability mapping was introduced by taking the Medical outcomes study 12-item short form health survey measurement results converting into the EuroQol group’s 5-domain utility values as example.RESULTS：The mapping methods can be adopted to obtain the health utility values by establishing the mapping relationship between non-utility scale and utility scale.The common models included ordinary least square（OLS）model，censored least absolute deviations（CLAD）model，Tobit model，multinomial Logistic regression（MNL）model，Bayesian networks（BN）model，etc.OLS model was relatively simple with a good predictive validity，but it would be limited by the ceiling effect；Tobit model was not limited by the ceiling or floor effect，when the error term satisfied the variance homogeneity and normality，prediction result of Tobit model was better than OLS model；CLAD model can be used for the situation of Tobit model unsuitable for non-variance homogeneity of the error term；MNL model firstly determined a health state by regression analysis and then determined its utility value；the prediction validity of BN model was good and it didn’t involved many assumptions and restrictions condition in econometrics，but the construction of BN model was greatly influenced by domain experts.Main methods for the calculation of health utility value with MNL or BN model were Monte Carlo simulation method，expected-utility method，most-likely probability methed，etc.We can carry out the model performance evaluation by using theR2，the adjustedR2，the mean error，the mean squared error and the mean absolute error，and then select the optimal model to calculate health utility values.CONCLUSIONS：Due to the advantages and disadvantages of each mapping model，it is necessary to select different mapping models based on the actual conditions.

Mapping method；Health utility value；Mapping model；Medical outcomes study 12-item short form health survey；EuroQol group’s 5-domain

R956

1001-0408（2017）29-4045-05

DOI10.6039/j.issn.1001-0408.2017.29.04

＊硕士研究生。研究方向：药物经济学。电话：025-86185038。E-mail：824580932@qq.com

#通信作者：副教授，硕士生导师，硕士。研究方向：医药国际商务、药物经济学。电话：025-86185038。E-mail：1513370906@qq.com

2016-07-26

2017-07-17）

（编辑：杨小军）