脑白质病变4个分级量表的信度研究
2012-05-08魏娜王拥军张玉梅
魏娜,王拥军,张玉梅
脑白质病变4个分级量表的信度研究
魏娜,王拥军,张玉梅
目的研究4个常用的脑白质病变分级量表的信度。方法本研究连续入选2007年8月~2008年10月在北京天坛医院神经内科住院的260例脑白质病变患者,分别用4个分级量表评分,重测信度和评定者间信度检验用kappa相关,内容一致性检验用Cronbachα相关。结果4个量表的重测信度、评定者间信度及Cronbachα系数均达到统计学意义。Y likoski量表的评定者间信度和内部一致性信度最好(评定者间信度kappa=0.656,P<0.01;Cronbachα=0.901)。结论4个量表在评价脑白质病变中各有其优缺点,建议根据研究的侧重点不同来选择适当的分级方法。
脑白质病变;分级量表;信度
[本文著录格式]魏娜,王拥军,张玉梅.脑白质病变4个分级量表的信度研究[J].中国康复理论与实践,2012,18(6):562-565.
脑白质病变(whitematter lesions,WM L)也称脑白质疏松,是加拿大神经学家Hachinski[1]于1987年首先提出的一个影像学诊断术语,指在脑室旁和半卵圆中心白质的双侧对称区域出现头颅电子计算机体层扫描(computerized tomography,CT)上的弥漫性低密度影或磁共振成像(magnetic resonance imaging,MRI)T2加权像(T2-weighted imaging,T2W I)上出现的高信号病灶。随着CT和MRI的广泛应用,脑白质病变越来越多地在中、老年人中被发现[2]。
目前,关于脑白质病变的临床意义仍存在较大争议。有学者认为这些争议的存在可能与评估白质损害时所采用的方法不同有关[3]。目前应用的CT和MRI分级量表各有其特色和可靠性,但不同的分级量表对脑白质病变范围及形态学(包括病变的直径、高信号区的解剖分布等)的描述不一,可能会导致因采用不同的分级方法评价而得到不同的研究结果,因此,评价白质病变不同分级量表间的相关性及一致性是十分必要的。目前国际上尚无公认的能用于多中心临床研究的脑白质病变的评定量表,国内多数临床研究采用的量表尚未进行过信度研究。本研究通过对文献报道的目前临床应用广泛的ARWMC、Fazekas、改良Scheltens、Y likoski等4个脑白质病变评分量表的信度进行研究,找出使用方便、具有良好信度的量表,对疾病的早期诊断和预防具有重要意义。
1 资料与方法
1.1 一般资料 连续入选2007年8月~2008年10月于北京天坛医院神经内科住院的患者共260例,男性179例,女性81例,年龄37~91岁,平均年龄(60.42± 12.51)岁。
纳入标准:参照Hachinski提出的诊断标准[4]:①MRI:脑室周围及半卵圆中心脑白质区域(皮质下区)斑片状或弥漫性融合的T2W I高信号改变,在T1加权像(T1-weighed imaging,T1W I)呈等信号或低信号,液体恢复反转序列(fluid attenuated inversion recovery, flair)上为高信号,边缘模糊呈月晕状;一般无脑室周围白质明显萎缩,无双侧脑室扩大;少见基底节、丘脑、脑干梗死灶;②临床表现:可有或无认知功能障碍和下肢功能障碍;③存在WM L危险因素:如血压异常、糖尿病、心脏疾患、高脂血症;④征得患者及家属的同意,能够配合检查并完成随访。
排除标准:①MRI显示任何一侧大脑中动脉供血区1/3以上脑梗死;②脑出血;③脑积水;④其他原因造成的白质病变(如中毒、脑炎、特异性脑白质疾病、多发性硬化、结节病、放射性脑病、阿尔茨海默病、一氧化碳中毒等白质变性疾病)。
1.2 研究方法
1.2.1 量表选择
1.2.1.1 量表1年龄相关的白质改变(Age-Related White M atter Changes,ARWMC)量表[5](0~30分),从5个不同的区域在左、右侧半球分别评分。5个不同的区域如下:①额叶区,在中央沟前;②顶-枕叶区;③颞叶区(顶-枕叶和颞叶的边界大致是从外侧裂后缘到侧脑室三角区的连线);④幕下区,包括脑干和小脑;⑤基底节区,包括纹状体、苍白球、丘脑、内囊和外囊、岛叶。根据4分量表评定白质病变的程度变化。
白质高信号评分如下:①0分:无高信号;②1分:点状病灶;③2分:病变开始融合;④3分:弥散病变累及整个区域,伴或不伴“U”形纤维受累。
基底节高信号评分如下:①0分:无高信号;②1分:1个点状病灶(≥5mm);③2分:1个以上点状病灶;④3分:弥散病变。
1.2.1.2 量表2 Fazekas量表[6](0~6分),将脑室旁和深部白质病变分开评分。两部分的分数相加计算总分。
脑室旁高信号评分:①0分:无病变;②1分:帽状或者铅笔样薄层病变;③2分:病变呈光滑的晕圈;④3分:不规则的脑室旁高信号,延伸到深部白质。
深部白质信号:①0分:无病变;②1分:点状病变;③2分:病变开始融合;④3分:病变大面积融合。
1.2.1.3 量表3 改良Scheltens量表[7](0~30分),对基底节和幕下病变,脑室旁和深部病变分开评分。
脑室旁高信号(0~6分)评分如下:①枕叶帽状高信号:0~2分;②额叶帽状高信号:0~2分;③侧脑室带状高信号:0~2分。其中:①0分:无病变;②1分:病变<5mm;③2分:病变在6~10mm之间。
白质高信号(0~24分)评分如下:①额叶:0~6分;②顶叶:0~6分;③枕叶:0~6分;④颞叶:0~6分。其中:①0分:无异常;②1分:病变范围≤3 mm,数量≤5;③2分:病变范围≤3 mm,数量≥6;④3分:病变范围在4~10mm之间,数量≤5;⑤4分:病变范围在4~10mm之间,数量≥6;⑥5分:病变范围≥11mm,数量≥1;⑦6分:病变融合。
1.2.1.4 量表4 Y likoski量表[8](0~48分),将脑室旁和深部白质分开评分。白质病变分布在4个区域:额角、侧脑室体、三角区和枕角,每个半球分开评分。将脑室旁白质分数和半卵圆中心高信号分数相加计算总分。脑室旁白质高信号(0~24分):①0分:无高信号;②1分:点状,小灶(轻微);③2分:帽状,铅笔样薄层(中度);④3分:结节样带,延伸(严重)。
半卵圆中心高信号,包括分水岭区(0~24分):①0分:无高信号;②1分:点状、小的高信号病灶;③2分:点状高信号开始融合;④3分:高信号融合区的范围较大。
1.2.2 脑白质病变的图像采集及评价 采用3.0 T磁共振,轴位扫描序列和参数:层厚5 mm,层距6.5 mm。T1W I:TR 2540 ms,TE 9.8 ms;T2W I:TR 4500 ms,TE 84ms;flair:TR 8000ms,TE 94ms。由两名相同资历的磁共振室医生在不知临床资料的情况下,依据MRI分别采用4种分级方法,独立在工作站进行脑白质病变评分,并记录各自所得结果。其中一名评分者在间隔2周后随机抽取50例图像重新评分。为保证良好一致性,评分前对阅片医生进行培训,对部位划分使用统一模板。两名评定者在本研究开始前共同评定患者,统一评定步骤和方法。
1.3 统计学分析 统计学处理采用SPSS 13.0 forW indow s统计软件。4个脑白质病变分级量表的内容一致性检验用Cronbachα系数,重测信度和评定者间信度检验用kappa相关。统计学显著性水平定为双侧检验,以P<0.05为差异有统计学意义。
2 结果
2.1 评定时间 量表1~4平均评定时间分别为:109 s、22 s、137 s和122 s。Fazekas量表用时最短,其他3个量表用时相近,均在120 s左右。
2.2 信度分析
2.2.1内部一致性 Cronbachα信度系数(Cronbachα系数)是目前最常用的内部一致性信度系数。4个量表Cronbachα系数都在0.7以上。其中,最高的是量表4,达到0.901,最低的是量表3,为0.720。见表1。
表1 量表指标内部一致性信度分析
2.2.2 重测信度和评定者间信度 对于量表1,所有项目的重测kappa值均有统计学意义。评定者间吻合度要高于两次测量的吻合度,kappa值均在0.3以上,各项均有显著性差异(P<0.05~0.001)。见表2。
表2 ARWMC量表重测信度和评定者间信度分析
对于量表2,重测信度和评定者间信度均较高,kappa都在0.3以上,均有非常高度显著性差异(P<0.001)。见表3。
3 讨论
表3 Fazekas量表重测信度和评定者间信度分析
对于量表3,项目3重测吻合度差(kappa=-0.032, P=0.637),其余项目均具有较好的重测信度(P<0.05~0.01)。量表3的评定者间信度较好,kappa值都在0.4以上,均有非常高度显著性差异(P<0.001)。见表4。
量表4的项目2重测吻合度差(kappa=0.135,P= 0.08)。量表4的评定者间信度较高,kappa值均大于0.5;其中,项目1、项目12、项目13、项目14和项目15均有非常高度显著性差异(P<0.001),其他各项均有非常显著性差异(P<0.01)。见表5。
表4 改良Scheltens量表重测信度和评定者间信度分析
表5 Y likoski量表重测信度和评定者间信度分析
脑白质病变是一种影像学表现,系指双侧脑室周围或皮质下区域点片状或弥散的改变,CT影像呈低密度,MRIT2W I上呈高信号改变。目前,大量研究提示,这种改变的发生与脑卒中危险因素以及年龄等因素相关,并可能造成认知障碍[9],其严重程度已作为血管性痴呆诊断标准及治疗性试验的重要部分。因此,为了评价白质病变的程度和范围,选择一个既能准确评价又具有较好可重复性的评价方法很有必要。
一些学者提出了基于影像学检查的评测量表[10]。目前应用的影像学分级量表各有其特色和可靠性,不同的分级量表可以适应不同的研究目的,但目前国际上尚无公认的能用于多中心临床研究的脑白质病变的评定量表,国内多数临床研究采用的量表尚未进行过信度和效度研究。本研究选取近年来常用的4个脑白质病变分级量表,对其进行信度研究。
3.1 信度分析 信度(reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。本研究中4个量表重测信度均较高,其中,改良Scheltens量表和Fazekas量表的重测一致性最好(kappa=0.301),Y likoski量表次之,而ARWMC量表稍差。本研究中4个量表内部一致性均较大,Cronbachα系数都在0.7以上,其中,最高的是Y likoski量表,达到0.901,最低的是改良Scheltens量表,为0.720。本研究中4个量表评定者间信度均较高,各量表的总分及各项目kappa值均在0.3以上,均P<0.01。其中,Y likoski量表在不同测量者间的一致性最好(kappa=0.656), 改 良 Scheltens量 表 次 之 (kappa= 0.583)。由统计结果可知,3个信度指标(重测信度、评定者间信度、内容一致性信度)均证明4个脑白质病变分级量表有很高的信度,表明这4个量表均具有较强的可靠性和稳定性。
3.2 可操作性(simplicity) 可操作性指量表简单性和易掌握的程度。常用完成量表评分所占用的时间表示。由于在量表评分过程中,后一次评分可能会因前一次评分的影响而变得简单,评分时间相对缩短。因此,我们对使用量表的顺序进行了调整,这样的调整,避免了评分顺序对结果的影响,有利于4种量表的比较。我们对50次评分所用的时间分析后发现,Fazekas量表的评分时间最短,其余3个量表的评分时间较长。可认为4个量表中Fazekas量表最简单、易操作,而ARWMC量表、改良Scheltens量表、Y likoski量表则较烦琐。烦琐的原因可能与其项目较多,有些项目评估时间较长(如Scheltens量表需测量病灶大小及数目)有关。而Fazekas量表只有两个项目,且每个项目的评阅方法简单,占用时间少。
综上所述,本研究可得出如下结论:①ARWMC量表:内部一致性和评定者间信度较好,重测信度也有统计学意义。但是,该量表在评定过程中发现其项目定义较为复杂,有些项目定义模糊,评定时较为费时,因此,给临床使用造成一定困难。②Fazekas量表:是最省时、信度效度较好的量表。该量表虽然使用方便,但其项目简单,对纵向观察脑白质病变的进展及其与临床表现的关系的指导意义不大。因此,基于较强的可靠性、稳定性和可操作性,Fazekas量表对于多中心、大样本的横断面研究来说,不失为一个好的量表。③改良Scheltens量表:是信度效度较好的量表,但评估较为费时。与其他量表不同的是,该量表在评价脑白质病变时既包括病变的大小及部位,还同时评价深部脑白质病变数目,与脑白质病变的体积之间有很好的相关性,对纵向观察脑白质病变的进展及其与临床表现之间的关系来说,选择改良Schelten量表可能更敏感。④Y likoski量表:是信度较好的量表。特别是其内部一致性信度和评定者间信度,为4个量表中最高者。不足之处是该量表项目较多,评估较为费时。但是在评定过程中发现该量表的项目分类清晰,项目定义明确,一致性好。因此,适用于多中心研究。
总之,4个脑白质病变分级量表在评价脑白质病变中各有其优缺点,建议应根据研究的侧重点不同来选择适当的分级方法。对于多中心研究,可选择一致性较好的Y likoski量表或Fazekas量表;如果要纵向观察脑白质病变的进展及其与临床表现之间的关系,选择改良Schelten量表可能更敏感。
[1]Hachinski VC,Potter P,M erskey H.Leukoaraiosis[J].A rch Neurol,1987,44(1):21-23.
[2]Schm idtR,Petrovic K,Ropele S,etal.Progression of leukoaraiosisand cognition[J].Stroke,2007,38:2619-2625.
[3]Van den Heuvel D,ten Dam V,de Craen A,et al.M easuring longitudinal whitematter changes:comparison of a visual rating scale with a volumetric measurement[J].Am JNeuroradiol,2006,27:875-878.
[4]Hachinski VC,Bow ler J.Vassular Dementia[M]//Ginsberg MD,Bogousslavsky J.Cerebrovascular Disease:Pathophysiology Diagnosisand Management.Massachusetts:Blackwell Science,1998:1132-1134.
[5]Wahlund LO,Barkhof F,Fazekas F,et al.A new rating scale for age-related white matter changes applicable to MRI and CT[J].Stroke,2001,32:1318-1322.
[6]Fazekas F,Chaw luk JB,A lavi A,et al.MR signal abnormalities at1.5 T in A lzheimer's dementia and normal aging[J].Am JNeuroradiol,1987,8:421-426.
[7]Scheltens P,Barkhof F,Leys D,et al.A sem iquantitative rating scale for the assessment of signal hyperintensities on magnetic resonance imaging[J].JNeurol Sci,1993,114:7-12.
[8]Y likoskiR,Y likoskiA,Erkinjuntti T,etal.Whitematter changes in healthy elderly persons correlate with attention and speed ofmental processing[J].A rch Neurol,1993,50:818-824.
[9]Zhang QJ,Guo YM,Zhang GJ,etal.Correlative factorsof cognitive impairment in patients with lacunar infarcts[J].Acad J Xi'an Jiao-tong Univ,2007,1:86-90.
[10]Kapeler P,Barber R,Venmeulen RJ,et al.Visual rating of age-related whitematter changes on magnetic resonance imaging scale com parison,interrater agreement,and correlations with quantitativemeasurements[J].Stroke,2003,34:441-445.
Reliability of 4 Rating Scales for W hite M atter Lesions
WEINa,WANG Yong-jun,ZHANG Yu-mei.Department ofNeurology,Beijing Tiantan Hospital,CapitalMedical University,Beijing 100050,China
Ob jectiveTo study the reliability of the four rating scaleswhich arew idely used.M ethods260 consecutive inpatients from Aug.2007 to Oct.2008 with whitematter lesionswere enrolled into the study.Interrater and intrarater reliability of four scaleswasanalyzed by using kappa correlation.Internal consistency was expressed with Cronbach'sα.Resu ltsA ll the scales have statistic significant interrater and intrarater reliability.Scale of Y likoskihas the best intrarater reliability and Cranach'sα(intrarater reliability,kappa=0.656,P<0.01,Cranach'sα=0.901).ConclusionThe four rating scales forwhitematter lesions have advantage and disadvantage.Disparate rating scales should be used according to purpose of study.
whitematter lesion;rating scale;reliability
R493
A
1006-9771(2012)06-0562-04
2011-03-18
2012-04-10)
首都医科大学附属北京天坛医院院级青年基金资助(ky2010-19)。
首都医科大学附属北京天坛医院神经内科,北京市100050。作者简介:魏娜(1978-),女,北京市人,硕士,主治医师,主要研究方向:脑血管病。通讯作者:张玉梅。
10.3969/j.issn.1006-9771.2012.06.018