基于有序变量间距差异界定对QOL-AD量表条目的分析*
2012-07-27山西医科大学卫生统计学教研室030001罗艳虹陈培翠王瑾瑶艾永梅余红梅
山西医科大学卫生统计学教研室(030001) 罗艳虹 陈培翠 王瑾瑶 艾永梅 余红梅
阿尔茨海默病(Alzheimer's disease,AD)是老年期痴呆的一个主要类型,在疾病状态不可逆的条件下,应尽可能提高AD患者的生命质量。故评价AD患者的生命质量及找出影响其生命质量的各相关因素对AD早期干预和防治、延缓疾病进程和提高生命质量具有重要的意义〔1-2〕。
本文采用阿尔茨海默病生命质量测评量表(Quality of Life-Alzheimer's Disease,QOL-AD)中文版评价AD患者的生命质量,量表条目应答选项属于多分类有序变量资料。一般而言,有序变量类别之间的间距并不固定,也就是各类之间的稀疏程度并不均匀,而常规的数据分析方法却将其作等距对待。因此,本文对多分类有序变量的间距差异进行合理界定,继而进行聚类分析〔3〕,明确各条目的影响程度。
资料来源
抽样调查AD患者及照料者200对,患者来自山西省太原市3个三级甲等医院神经内科和老年科确诊病例和太原市3个老年人集中的社区前期筛检出的AD患者。采用原作者Rebecca G.Logsdon授权研制的QOL-AD中文版,分别由患者和照料者来评价患者生命质量。QOL-AD包含13个条目,所有条目均有四个相同的选项,分别为差、一般、好、非常好,评分分别为1-4分〔1〕。患者和照料者各填一份,AD患者采用面对面问答形式,照料者独立填写。其中患者有195例可以完成全部问卷,照料者有94例可完成全部问卷。
统计方法
R × C{aiji=1,2,…,r,j=1,2,…,c}为两因素列联表,其中aij为观察频数。变量Y有r个水平,即Yi=(ai1,ai2,…,aic),i=1,2,…,r,有序变量X有c个水每个水平对应一个秩区间。X的第j个水平的合计频数的值称为秩。设第j个秩区间为:
简而言之,有序变量X的c个水平中的第j个水平的区间宽度即秩次范围为变量Y在X的第j水平上的人数,该区间的最低秩次为该水平前的所有人数加1。
将第j个秩区间的平均秩次记为Rj,j=1,2,…,c,
根据求出的秩区间和平均秩可以得到有序变量X的各个水平的代表值和取值区间。第j个水平的取值区间为〔3-5〕:
有序变量X各水平的间距差异为各水平代表值的差值,即
第j个水平的代表值为:
将变量Y各水平的观察频数aij都除以ai,得到变量Y各水平在变量X各水平上的条件概率fij,以fij的为权向量,算得变量Y各水平的总影响程度Ai,即
据此对Ai排序。进而以Ai为研究变量进行系统聚类分析〔5-7〕。
结 果
表1为AD患者及其照料者各条目影响程度列联表。经过秩分析,得到有序变量X各个水平的区间宽度、秩区间、平均秩次、取值区间、代表值和间距差异值,见表2。
表1 AD患者及其照料者受X各水平影响程度列联表
表2 AD患者及其照料者有序变量X的秩分析结果
从表2可知,有序变量X各个水平的取值并非数字1,2,3,4,而是各处于一个特定的取值区间内,且各水平之间的“距离”并不相等,中间相邻水平的间距最大。
将变量Y各水平的观测频数aij都除以ai(患者ai=195,照料者ai=94),得到变量Y各水平在变量X各水平上的条件概率fij,以fij为权向量,计算得到变量Y各水平的总体影响程度Ai,根据Ai对变量Y各水平的影响程度排序〔3,5〕。(见表3)
Ai反映了变量Y各条目对AD患者生命质量的不同影响,据此对13个条目进行聚类分析。QOL-AD患者版13个条目大致分为四类:第一类为强效条目,包括婚姻状况(A7=2.64)、与家人的关系(A6=2.63)、记忆力(A5=2.45);第二类为较强条目,包括经济状况(A12=2.21)、情绪(A3=2.11)、与朋友的关系(A8=2.09)、对自己的整体感觉(A9=2.07);第三类为普通条目,包括精力(A2=1.92)、身体健康状况(A1=1.81)、进行娱乐活动的能力(A11=1.79);第四类为弱效条目,包括做家务的能力(A10=1.54)、生活的整体状况(A13=1.42)、居住情况(A4=1.34)。QOL-AD照料者版各条目聚类分析结果与患者版类似(结果略)。
表3 AD患者和照料者变量各水平的排序结果
讨 论
1.有序变量X的秩分析结果
由表2可得,在对QOL-AD患者版和照料者版有序变量X的选择中,认为“一般”的最多(1110次和529次);认为“好”的次之(823次和402次);认为“差”的较少(495次和203次);认为“非常好“的最少(107次和88次)。各个水平都有特定的代表值,从间距差异来看,中间相邻水平的差异为1.525,明显大于其他水平。可见,患者及照料者对中文版QOL-AD的有序变量的选择较一致,AD患者总体生命质量一般,且在“一般”和“好”之间的选择差异较大。
2.QOL-AD各条目影响程度的排序与聚类
患者和照料者各自填写的QOL-AD量表各条目对患者生命质量影响程度的排序和聚类比较一致,强效条目均为婚姻状况、与家人的关系和记忆力,经济状况、情绪及与朋友的关系次之。
本文通过秩分析,将有序列联资料定量化,即通过求得有序变量各个水平的代表值和取值区间,得到各水平代表值的差值,将间距差异量化,最后计算得到变量各水平的总体影响程度,据此对变量各水平的影响程度排序,并运用聚类分析法作进一步分析。本文只是对有序变量间距差异的初步探讨,还存在许多不足,有待日后进一步研究。
1.艾永梅.阿尔茨海默病生命质量测评量表(QOL-AD)中文版研制与初步应用.山西医科大学硕士学位论文,2011.
2.杨大安,荣茂昌,段一穷.老年痴呆及防治.吉林师范大学学报,2004,4:123-124.
3.陈民恳.多分类有序变量间距差异的统计分析与实际应用.厦门大学硕士学位论文,2007.
4.朱建平.数据挖掘的统计方法及实践.中国统计出版社,2005:101-102.
5.朱建平,陈民恳.数据挖掘中有序资料间距差异的量化与聚类分析.商业经济与管理,2007,1:36-40.
6.朱建平,杨贵军,张润楚.列联资料的有向聚类分析及其应用.数理统计与管理,2002,4:28-33.
7.Julio Ms,Frederico ZP,Patricia Rosa,et al.Parametric and Nonparametric Analyses of Repeated Ordinal Categorical Data.Biometrical Journal,2004,569(4):462.