APP下载

肝硬化患者报告临床结局量表计量心理学特征考核*

2016-12-26山西医科大学公共卫生学院流行病与卫生统计教研室030001杨圆圆罗艳虹张岩波

中国卫生统计 2016年3期
关键词:效度信度条目

山西医科大学公共卫生学院流行病与卫生统计教研室(030001) 张 瑛 杨圆圆 罗艳虹 李 治 张岩波

肝硬化患者报告临床结局量表计量心理学特征考核*

山西医科大学公共卫生学院流行病与卫生统计教研室(030001) 张 瑛 杨圆圆 罗艳虹 李 治 张岩波△

目的评价自行研制的肝硬化患者报告临床结局(PROM)量表信度、效度、区分度等计量心理学特征。方法使用待评价的量表在山西省8所不同级别的医院进行调查,评价量表的信度、效度及可行性。结果调查结束回收样本598例,接受率96.45%,其中有效例数576例(肝硬化464例,健康对照112例),应答率92.32%,完成量表平均时间为10m in,可行性好;克朗巴赫α系数:量表整体0.921,生理领域0.907,心理领域0.885,社会领域0.803,治疗领域0.631;验证性因子分析显示量表具有良好的结构效度,模型拟合指数:近似误差均方根RMSEA=0.062,均方根残差RMR=0.060,规范拟合指数NFI=0.91,不规范拟合指数NNFI=0.93,比较拟合指数CFI=0.94,增值拟合指数IFI=0.94基本符合评价标准;健康对照组与肝硬化组患者比较,量表各领域得分差异有统计学意义(P<0.001),表明该量表能够很好地区分肝硬化患者及健康人群。结论自行研制的肝硬化患者报告临床结局量表(LC-PROM)信度、效度及可接受性较好,可作为肝硬化的临床试验疗效评价的测量工具。

肝硬化PRO量表 信度 效度 可行性 验证性因子分析

慢性肝炎极易进展为肝硬化,肝硬化患者往往经受各种痛苦症状,同时承受着精神心理上的折磨,单单采用客观临床化验指标不能充分评价临床疗效及患者健康状况。国际药物经济与疗效研究协会、欧洲生存质量评估协调处、美国食品药品监督管理局(FDA)与健康相关生存质量(health-related quality of life,HRQL)工作组和国际生存质量研究协会共同提出的临床疗效评价方案应包括四方面的内容:临床(医务)人员报告资料、生理(实验室指标)报告资料、护理人员报告资料和患者报告资料。其中患者报告资料即患者报告的结局(patient-reported outcome,PRO)[1],是一种患者(即没有医生或其他任何人对于患者反应的解释)对于自身健康状况的各个方面的测量[2]。它有较广泛的意义,包括患者身体症状、心理变化、社会交往活动、治疗依从性和满意度等多个方面的报告内容。作为一种量表测评形式,PRO远比HRQOL的范围涉及的要广,而HRQOL则是PRO必要的组成部分,是健康状况无法取代的[3]。PRO作为临床疗效评价体系的重要内容,能够直接测量从患者角度出发的临床结局变化,指导临床方案的选择,让患者亲自加入到诊疗过程与临床决策中来,这对于在疾病和治疗过程中遭受严重损害的患者及其家属来说具有重大意义,并且逐步为临床实践所接受。而且临床评估应用正式的特制问题和规范的访谈技巧,能够减少测评错误,还能确保连续性,这种正式评估可能比非正式的访谈要更可靠[4]。因此肝硬化患者报告临床结局(liver cirrhosis patient-reported outcome meature,LC-PROM)量表应用于临床很有必要。然而,也正是由于PRO测量的主观性,测量量表必须有良好的性能才能准确捕捉患者的真实信息,即量表在应用于临床之前要经过严格的性能评价,保证主观测量过程中的客观科学性。

本研究对严格遵循美国FDA,PRO量表研制规范自行设计的肝硬化患者报告临床结局量表进行信度、效度和可行性评价,进一步完善量表内容和结构,提高LC-PROM量表临床实用价值。

对象与方法

1.研究对象

在山西省8所不同级别的医院对620例样本进行现场调查,包括山西医科大学附属第一医院、山西医科大学附属第二医院、太原市传染病医院、阳城县人民医院、阳城县肿瘤医院、侯马市中心医院、山西博爱医院、中化二建集团医院。

病例入选标准:符合肝硬化临床诊断标准患者;年龄分布在18~72岁;志愿参加本次调查者。排除标准:病情不符合上述标准;伴有精神疾病或存在意识障碍患者;智力缺陷不能理解测量条目或不能完成测量的患者;不愿意参加调查者。健康对照指不患有肝脏系统疾病,年龄分布范围与病例相近,愿意加入研究者。

2.测量工具

本研究使用课题组前期条目筛选阶段获得的LCPROM初始量表,包括55个条目,归纳为13个维度(腹部症状ABS、皮肤症状SKS、食欲睡眠APS、认知能力COG、独立性IND、焦虑抑郁AND、自信心CON、疾病结局 DIO、社会支持 SOS、社会适应 SOA、满意度SAT、依从性COM、药物副作用DSE),分属生理领域、心理领域、社会领域、治疗领域4个领域。量表计分采用Likert五级评分法,分别计为0~4分,得分转换后整理为1~5分。

3.研究方法

(1)信度分析

本研究采用反映量表各条目间的平均一致性的克朗巴赫α系数评价量表的信度,计算量表整体及4个领域该指标值,值越大量表内部一致性越好,测量结果越可靠。但是α系数也不宜过大,一般不超过0.90,否则有理由认为量表内部各条目间存在很多重复测量。本研究以0.8作为评价标准,即克朗巴赫α系数大于0.8,认为量表信度较好。

(2)效度分析

效度即有效性,也称准确性,反应量表能够准确测量所要测量内容的程度,是量表评价的另一重要方面,主要分为内容效度、效标效度、结构效度和区分效度,本次研究仅对后两者进行评价。

①结构效度

结构效度是效度测定一个很重要的侧面,它能考察量表测量实际数据结构与量表设计阶段预想结构是否相符,说明量表构念框架在反映现实人群特征时是否合适。结构效度分析常用方法是因子分析,因子分析又分为探索性因子分析(EFA)和验证性因子分析(CFA),在理论结构未知的情况下一般采用EFA,探索观测变量与所要测量的潜在特征之间的关系。而本研究是基于已有量表结构框架,验证测量数据与预先构想的理论框架的相符程度,故而采用验证性因子分析,它的数学模型是联系潜在因子与可测变量的一系列方程组[5]。在量表中就是计算各条目在其所属领域的因子载荷并以常用的几个拟合指数评价模型拟合程度。

②区分效度

又称判别效度,是反映量表能否有效区分不同特质人群的指标。本研究对肝硬化组和健康对照组分别进行测量,对两组人群各领域及整个量表得分分别进行两样本t检验。同时将肝硬化患者病程分为以下几个级别:<1年、1~3年、3~5年、≥5年,采用方差分析比较不同病程与量表得分间的关系。若假设检验结果差异有统计学意义(P≤0.05),表明量表具有良好的区分能力,能够有效区分肝硬化患者和健康人群以及肝硬化不同严重阶段。

③可行性分析

研制的量表只有能够被测量对象所接受才可能应用于临床实践发挥其特有的测量优势。量表可行性通常以接受率、应答率及应答时间反映,一般两个指标值均不应低于85%,应答时间不超过20min。

定量资料以均数±标准差表示,将结果数据录入SPSS 16.0进行t检验和H检验(α=0.05),使用Liserl 8.70进行验证性因子分析。

结 果

1.调查对象基本情况

本次研究调查样本620例,肝硬化患者500例,健康对照120例,获得有效样本576例,包括肝硬化464例,健康对照112例。调查对象的基线情况见表1.

表1 调查样本基线情况

两组调查对象性别、年龄、身高差异均无统计学差异,肝硬化患者体重低于健康对照,饮酒、吸烟比例均高于健康对照,这些差异符合肝硬化病因学特点及病后对机体的消耗。

2.信度分析

各领域及量表整体克朗巴赫α系数见表2。除治疗领域内部一致性较低外,其他均在0.8以上,量表信度尚可。

表2 量表信度(克朗巴赫α系数)

3.效度分析

(1)结构效度

量表研制过程中已采用探索性因子分析筛选条目,在此基础上用验证性因子分析方法来对量表结构效度进行评价。各条目在其所属领域的因子载荷如表3所示,各领域及量表整体拟合优度见表4。各条目标准化因子载荷几乎都大于0.6,且差异存在统计学意义。此结果充分表明LC-PROM量表数据拟合程度与预先设想的理论框架吻合度高,量表构念合理。

表3 各条目与其所属领域验证性因子分析结果

续表3

表4 量表整体及各领域拟合优度

(2)区分效度

量表应用于不同特征人群时能够发现这种细微差别的能力是考察量表效度的另一个侧面,一个设计优良的量表除了能区分患者与非患者外,还要能够识别疾病不同严重程度的患者。本研究两组调查对象,肝硬化患者和健康对照各领域得分及量表总分t检验结果见表5;表6是不同病程患者各领域得分及总分方差分析结果。

表5 肝硬化患者与健康人群量表得分情况

表6 不同病程肝硬化患者量表得分情况

肝硬化患者与健康对照4个领域及量表总分上均存在显著统计学差异,且患者得分明显低于健康对照组,其中生理和心理领域差别较大,社会和治疗领域差别相对较小。表6表明除社会领域外,不同病程患者其他3个领域及总分差异总体上有统计学意义,且病程越长,得分越低,即随着疾病不断进展,对患者影响越大,健康相关生命质量越差,基本符合疾病发展规律。

4.可接受性

可行性是量表实践应用的基础,本研究中量表接受率96.45%(598/620),应答率 92.32%(576/598),均高于一般要求的85%,调查过程中记录测试对象量表完成时间,平均时间10min,表明量表测试条目内容清晰,易于理解,被试者能够顺利完成调查,量表可行性好。

讨 论

本研究对自行研制的肝硬化患者报告临床结局(LC-PRO)量表进行了严格、科学地评价。以 Cronbach′sα系数为指标的量表信度反映出量表具有良好的内部一致性,测量结果稳定可靠;验证性因子分析结果显示量表构念框架能够比较准确地反映患者的实际特征,进行区分效度分析后,可见量表能有效识别肝硬化患者与健康人之间及不同病程患者间的差异。另外,本次研究做了不同病程患者测量结果的区分效度分析,得到“疾病越严重量表得分越低”的结论,由此使用该量表可在一定程度上对疾病的严重程度进行识别划分,也说明量表在患者人群中也具有较好的区分度。

本研究评价的对象是自行设计的针对肝硬化患者的特异性量表,如果经过科学评价证实该量表性能良好,则可能被应用于临床实践,对临床治疗产生积极意义。现行的用于肝脏疾病的量表大致分为两类:普适性量表和特异性量表,前者虽然能够实现不同疾病患者间的比较,但这些普适性量表缺乏特异性,不能充分集中于肝病患者的特异表现,如疾病症状等,因此不能全面反映肝病患者生存质量[6]。而目前应用的特异性量表如肝炎生存质量量表(HQLQ)、慢性肝脏疾病量表(CLDQ)、肝脏生存质量量表(LDQOL)等[7-9],应用范围较广泛,并不专门用于肝硬化,同时这些量表大都是在普适量表的基础上增加了某些疾病相关条目,而且并非针对患者报告临床结局。因此,若LCPRO量表得以应用于临床实践无疑有利于疗效评价、患者掌握自身健康状况、医师及患者共同参与临床决策及卫生服务资源调配。

但是本研究尚存一些局限,PRO测量简便,在采集患者多方面信息上有其独特的优势,但始终属于主观测量方法。因此量表设计质量高低会对临床结果的判断产生很大影响,不同患者对测试条目选项主观认识的差异也会导致结果的变化,这就是说目前PRO只能作为临床诊疗的辅助工具。最后,PRO在现阶段只具有临床应用的潜能,在实际执行中特别是国内实践中还存在一些问题:病人是否配合,医生是否认同和支持,传统的以医生的报告资料和生物学报告资料为主的疗效评价标准是否能改变,这些都值得考虑。

结 论

自行研制的肝硬化特异性量表具有良好的信度、结构效度、区分效度和可行性,可在更广泛的人群中进一步验证该结果,并依据调查结果对量表作出进一步修正,切实保证量表临床应用的安全性和有效性,提高患者健康相关生命质量。

[1]张岩波,王洪奇,白文瑾.临床试验中应用PRO评价的伦理学思考.医学与哲学(人文社会医学版),2011,32(1):20-21.

[2]FDA.Guidance for industry:patient-reported outcome measures:use in medical product development to support labeling claims:draftguidance.Health Qual Life Outcomes,2006,4:79.

[3]Clare B.Feedback on the FDA′s February 2006 draftguidance on Patient Reported Outcome(PRO)measures from a developer of PRO Measures.Health and Quality of Life Outcomes,2006,4:78.

[4]吕宏梅,张岩波.患者报告结局(PRO)在临床疗效评价体系中的应用与思考.医学与哲学(临床决策论坛版),2011,32(12):1-3.

[5]张岩波.潜变量分析.北京:高等教育出版社,2009.35-59.

[6]张利霞,李星丹,郑蔚,等.慢性肝病患者的生存质量量表应用现状.中国实用神经疾病杂志,2012,15(2):8-10.

[7]Bayliss MS.Methodsin outcomes research in hepatology:Definitions and domains of quality of life.Hepatology.1999,Jun;29:3S-6S.

[8]Younossi ZM,Guyatt G,Kiw i M,et a1.Development of a disease specific questionnaire to measure health related quality of life in patients with chronic liver disease.Gut,1999,45:295-300.

[9]Gralnek IM,Hays RD,Rosen HR,et a1.Development and evaluation of the liver disease quality of life instrument in persons with advanced,chronic liver disease-the LDQOL.The American Journal of Gastroenterology.2000,95,3552-3565.

Evaluation of Patient-reported Outcomes Instrument for Patients with Liver Cirrhosis

Zhang Ying,Yang Yuanyuan,Luo Yanhong,et al(Shanxi Medical University(030001),Taiyuan)

ObjectiveTo evaluate the properties of patient-reported outcomes instrument for patient with liver cirrhosis which was developed by ourselves,then test the applicability of the scale.MethodsWe use the scale to investigate 620 patients in eight different hospitals of Shanxi Province,and to evaluate its reliability,validity and feasibility.ResultsWe receive598 cases after investigate,the recovery rate is 96.45%,there are 576 qualified cases consists of 464 cases suffered liver cirrhosis and 112 cases without liver disease,the response rate is92.32%.The mean time to complete the scale is about 10 minutes.The Cronbach′s α coefficients are 0.921 for the total scale,0.907 for the physical domain,0.885 for the psychological domain,0.803 for the social domain and 0.631 for the treatment domain respectively.The confirmatory factor analysis indicates that the structure of the scale is acceptable,its fit indexes are RMSEA=0.062,RMR=0.060,NFI=0.91,NNFI=0.93,CFI=0.94,IFI=0.94 which are conformed to the standard.Through t-test in two different groups(patients suffered liver cirrhosis versus those who without liver disease respectively),we see significant differences statistically which indicates good discrimination.ConclusionThe LC-PROM scale newly developed has good properties,after a further modification in a wide range of investigation,it can be used as a practical measure instrument in clinical.

Liver cirrhosis PRO scale;Reliability;Validity;Feasibility;Confirmatory factor analysis

国家自然科学基金资助项目(81273180)

△通信作者:张岩波,E-mail:sxmuzyb@126.com

(责任编辑:郭海强)

猜你喜欢

效度信度条目
效度验证模式系统整合与效度研究发展策略
《广东地区儿童中医体质辨识量表》的信度和效度研究
作为数学教育研究质量分析的信度
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
《词诠》互见条目述略
平衡损失函数下具有时间效应和通胀因子的信度估计
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
中文版脑性瘫痪儿童生活质量问卷的信度
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度
对县级二轮修志采用结构体式的思考