慢性心衰PRO量表条目的初步筛选*
2014-03-10山西医科大学公共卫生学院卫生统计教研室030001薛江平罗艳虹张岩波
山西医科大学公共卫生学院卫生统计教研室(030001) 吕 静 薛江平 罗艳虹 张岩波
慢性心衰PRO量表条目的初步筛选*
山西医科大学公共卫生学院卫生统计教研室(030001) 吕 静 薛江平 罗艳虹 张岩波△
目的研制适合国人的基于心力衰竭患者报告的临床结局评价量表。方法按照国际PRO量表的研制规范,通过询问患者主要和最期待改善的症状,查阅大量相关文献形成条目池;再通过各领域的专家和患者对形成的条目池和语言表达进行修正,形成初始量表。用初始量表分别在太原不同区的八所医院发放155份问卷进行预调查,回收后利用经典测量理论和项目反应理论(IRT)进行条目筛选和维度调整形成初量表;然后再在上述的八所医院进行大规模的正式调查,利用大规模调查的信息数据再一次进行条目筛选,形成终选量表。结果终选量表共有57个条目,分为生理领域、心理领域、社会领域、治疗领域4个领域,共计12个维度。结论形成的终选量表基本符合理论框架,较好的反映了慢性心衰患者生命质量的内涵。
慢性心力衰竭 患者报告临床结局(PRO) 条目筛选
慢性心衰已成为威胁公众健康的重要疾病,在慢性心衰医疗过程中,慢性心衰患者的状况会直接影响其病情的发展,所以医生需要对患者的状态有个全面的了解。随着人们对健康需求的提高以及医疗模式的转变,传统仅关注生命维持与生理功能改善,应用客观指标体系评价医疗效果显出其不足之处:一是未能表达出健康的全部内涵;二是未能体现出人的整体性和全面性;三是不能反映现代人的健康观点。这在慢性病的评价中表现得尤为突出[1]。国际药物经济与疗效研究协会(ISPOR)、欧洲生存质量评估协调处(ERIQA)、美国食品及药物管理局(FDA)[2]与健康相关生存质量工作组以及国际生存质量研究协会(ISQOL)共同组成的统筹委员会(PRO Harmonization Group)提出:临床疗效评价应包括临床医护人员报告资料、生理报告资料、照顾者报告资料和患者报告资料。其中,患者报告的临床结局(PRO)是主要内容之一[3]。PRO是在健康相关生存质量(HRQOL)的基础上发展起来的评价指标。它常以自评量表的形式出现,这种自评形式没有第三方的干扰,可直接获得病人对治疗效果的感受,往往比临床医生访谈或打分等方法更可取,获得的PRO数据比医生报告的临床测量更可靠,对临床治疗实践具有十分重要的意义;同时,PRO量表作为一种正规化、结构化的访谈技术,可以使测量误差达到最小,确保测量的一致性。所以研制适合国人的基于心力衰竭患者报告的临床结局评价量表(以下简称CHF-PRO量表)至关重要和迫切。其中,在量表研制过程中,条目筛选是重要一环。
对象与方法
1.量表的编制
根据美国食品及药物管理局(FDA)所规定的PRO量表的制作原则及流程,参考国外有关心力衰竭疾病的生存质量的调查问卷及依据心力衰竭疾病的理论基础形成理论框架,包括生理领域、心理领域、社会领域和治疗领域四个领域。同时按照每个领域查阅大量国内外相关文献,并参照国外相关问卷,通过询问患者主要的和最期待改善的症状,综合所有得到的信息,形成条目池。由三位心血管疾病专家、一位心理学专家、一位社会学专家分别对量表的各领域提出具体修改意见,并对个别患者进行访谈。按照专家和患者的建议意见,对条目进一步修改,形成初始量表,共有65个条目,条目均采用五级Likert评分法。用初始量表分别在太原不同区的八所医院发放155份问卷进行预调查,回收后利用经典测量理论(离散趋势法、因子分析法、相关系数法和克朗巴赫系数法)和项目反应理论进行条目筛选和维度调整形成初量表,然后再在上述的八所医院进行大规模的正式调查,利用大规模调查的信息数据再一次进行条目筛选,形成终选量表。
2.筛选变量的方法
(1)经典测量理论下的条目筛选
①离散趋势法
从敏感性方面来挑选条目。条目的离散程度越低,区分能力就越低,因此将离散程度高的条目纳入量表。为消除各条目量纲不同及均数相差较大的影响,一般采用变异系数作为衡量离散程度的指标。因为心力衰竭PRO量表的问题选项均为5级有序分类变量,其条目得分基本呈对称分布,可视为近似正态处理,因此在本次研究中利用各条目得分的标准差直接来衡量其离散程度。建议删除s<0.96的条目,各条目的s见表1。
②因子分析法
因子分析法是从代表性角度筛选条目[4]。通过因子分析,并做方差最大化正交旋转,删除各因子上负荷较小(<0.4)以及在两个或两个因子以上负荷大小相近的条目。表1中仅给出各条目所对应维度的因子载荷。
③相关系数法
该法从代表性和独立性两个角度对条目进行筛选。按照预想的理论结构,计算每个条目与其所属维度以及其他维度的相关系数,删除相关系数较小(<0.6)的条目。表1中仅给出各条目和所对应维度的相关系数。
④克朗巴赫系数法
该法从内部一致性的角度筛选条目。克朗巴赫α系数指的是量表中条目与条目的一致性,这是一种同质性。如果条目间没有一致性,那么每个维度中各条目得分累加的做法就没有根据。计算某一维度的克朗巴赫系数α,比较去除其中某一条目后α系数的变化。如果某条目去掉后系数有较大上升,则说明该条目的存在有降低该维度内部一致性的作用,应该删除,反之则保留。表1给出该条目删除后该方面的克朗巴赫α系数。
(2)项目反应理论
在本课题研究中用的是Likert五点计分法,故采用的模型是Samejima的等级反应模型[5]。采用适用于大样本的边际极大似然估计(MML),通过multilog7.03完成计算,估计出每个条目的区分度参数(a)和难度参数(b)[6]。一般来说,一个项目的区分度a<0.4就应考虑删除,本研究中剔除a<0.4的条目。b1、b2、b3、b4四个难度等级参数依次增加,范围一般在-3到3之间。
3.研究资料
用初始量表分别在太原不同区的八所医院(山西医科大学附属一院、山西医科大学附属二院、山西省心血管疾病研究所、太钢总医院、中化二建集团医院、山纺医院、重机医院及太原市小店区平阳路一社区卫生服务站)进行预调查和大规模的临床(现场)调查。调查对象包括心力衰竭疾病患者和健康人。预调查选取了105名患者、50名健康人,大规模临床调查选取了365例患者、100例健康人。其中,心力衰竭疾病患者的纳入标准为:由医院确诊为心力衰竭的患者,年龄>18岁,愿意接受调查者;排除标准为:并发精神疾病的患者,由于语言、智力障碍等多种原因导致不能理解或不能完成问卷的患者。健康人指的是没有其它严重的心血管疾病及恶性肿瘤的人。
结 果
通过离散趋势法、因子分析法、相关系数法、克朗巴赫系数法及项目反应理论五种方法筛选的条目,至少三种方法保留者并结合专业知识确定为入选条目。终选量表包括57个条目,其中生理领域16条,心理领域21条,社会领域8条,治疗领域12条。所有分析结果整理成表1。
以上五种方法,除项目反应理论利用Multilog7.03软件实现外,其余四种方法均采用SPSS13.0软件完成。
小结与讨论
近几十年来用于慢性心衰疾病患者生命质量测定的普适性量表主要有诺丁汉健康调查表(NHP)[7]、简明健康状况调查问卷(SF-36)、世界卫生组织生命质量量表(WHOQOL-100),特异性量表主要有明尼苏达心衰问卷(LHFQ)、慢性心衰量表(chronic heart failure questionnaire,CHFQ)、堪萨斯城心肌病问卷(Kansas city cardlomyopathy questionnaire,KCCQ)、生命质量指数-心脏版(quality of life index-cardiac version,QU-cardiac version)。但几乎都是国外的。
表1 利用不同方法筛选的结果汇总
表2 CHF-PRO终量表维度结构计分说明
心力衰竭PRO量表严格按照国际通用量表制定的原则和流程制定,经过制定条目池、预试验、正式大规模的临床现场调查三步进行编制。在量表开发阶段综合采用了各种条目筛选方法,以保证筛选条目的质量,力求每一个被筛选的条目都具有敏感性好、代表性好、独立性强的特点。在以往的研究中均采用经典测量理论(CTT)中的离散趋势法、相关系数法、因子分析法、克朗巴赫系数法等,本研究进一步采用了现代测量理论-IRT来筛选条目。通过对CTT于IRT测量原理的比较,可以发现IRT具有被试能力估计的项目选择独立性、项目难度参数与能力参数的刻度统一性、项目参数估计的样本独立性、估计测量误差的精确性等几个优点,而这正是CTT无法比拟的[8]。条目筛选的过程中除了依据于统计方法,还要结合相关的临床专业知识。例如条目PHD14:“您感到恶心想吐”,虽然满足了统计方法的条目筛选条件,但结合相关的临床专业知识得出恶心、呕吐症状在右心衰竭的临床表现中比较明显,而在左心衰竭的临床表现中不明显。所以此条目的区分度等方面表现的不好,建议删除。
条目筛选只侧重于对每个条目的评价,而忽视了整体评价。因此,在获得终选条目后,还需对量表的效度、信度、可行性等方面进行综合评价。鉴于篇幅所限相关内容另文报道。
1.Guex JJ,Zimmet SE,Boussetta S,et al.Construction and validation of a patient-reported outcome dedicated to chronic venous disorder:SQOR-V(specific quality of life and outcome response-venous).J Mal Vasc,2007,32(3):135-147.
2.U.S.Department of Health and Human Services,FDA,Center for Drug Evaluation and Research,Center for Biologics Evaluation and Research,Center for Devices and Radiological Health.Guidance for Industry Patient-Reported Outcome Measures:Use in Medical Product Development to Support Labeling Claims.Health and Quality of Life Outcomes,2006,4(1):1-20.
3.董丽敏,刘巧君,刘晓英,等.基于高血压患者报告的临床结局评价量表的计量心理学特征测评.中国药物与临床,2012,12(1):12-15.
4.张岩波.潜变量分析.北京:高等教育出版社,2009:35-59.
5.涂冬波,戴海琦.项目反映理论下Likert型量表的DIF检测方法初探.江西师范大学学报(自然科学版),2007,31(3):311-315.
6.曾宪华,马瑞,郭小玲,等.IRT等级反应模型在冠心病PRO量表编制中的应用.中国卫生统计,2012,29(5):639-641.
7.Hunt SM,M cKenna SP,M cEwen J,et al.The Nottingham Health Profile:subjective health status and medical consultations.Soc SciMed,1981,15(13Pt1):221-229.
8.沐守宽.CTT与IRT测量原理之比较.上海师范大学学报,2006,35(4):6-9.
(责任编辑:郭海强)
Item Screening about PRO Scale of Chronic Heart Failure
Lv Jing,Xue Jiangping,Luo Yanhong,et al.(DepartmentofHealthStatistics,SchoolofPublicHealth,ShanxiMedicalUniversity(030001),Taiyuan)
ObjectiveTo develop a rating scale based on patient-reported outcomes w ith chronic heart failure suitable for Chinese people.MethodsAccording to development standard of international PRO(patient reported outcome)scale,item pool was formed through asking the patient about the main symptoms and the symptoms which were mostly expected to improved and consulting a large number of relevant literatures.And then the primary scalewas gained after the experts and patients of the field correcting item pool and adjusting the language.After that,eighthospitals in different districts in Taiyuan were investigated by 155 primary scale copies for trial investigation and those copieswere collected for correction of item selection and dimension by using the classical test theory and item response theory(IRT).Large formal scale investigation was carried out in the above hospitals and items were selected again based on the datawhich were gotten from the investigation.Finally,the final scale was gained.ResultsEventually scale was formed w ith 57 items containing physical,psychological,social and therapeutic four areas.They included 12 dimensions.ConclusionThe ultimate scale is coincides w ith the theoretical framework,better reflects the connotation of the quality of life of patientsw ith chronic heart failure.
Chronic heart failure;Patient reported outcomes(PRO);Item screening
*国家自然科学基金(81273180)
△通信作者:张岩波,E-mail:sxmuzyb@126.com