高血压肝火上炎证诊断量表的信度及效度的检验
2014-04-21赵浩孔立李运伦
赵浩 孔立 李运伦
高血压病肝火上炎证规范化诊断标准的建立是高血压病中医证候研究的一项重要基础性工作。不同于传统的以症状体征简单罗列和定性,本研究团队要建立的证候诊断标准是定性与定量相结合的规范化证候诊断标准,是各种症状、体征及舌象脉象的有机组合。在此基本原则的指导下,前期研究中_,本研究团队对整个中医证候诊断规范化研究概况进行了系统回顾,并在综述高血压病中医证候研究进展的基础上,进行准确的临床辨证,以中医理论及文献研究作为重要的指导意见,将专家经验作为重要的参考依据,结合四诊信息,积极借鉴和利用循证医学和临床流行病学的研究思路与方法,以量表学和统计学的相关内容作为工具,编制出具有中医特色的高血压病肝火上炎证诊断量表,最终编制形成了包含3 个维度18 个条目的高血压病肝火上炎证诊断量表(第二版),即肝火上攻维度5 个条目(头晕、头痛、耳鸣、口苦、口干),肝火内扰维度6 个条目(胁肋疼痛、多梦、失眠、急躁易怒、大便秘结、小便黄),舌脉维度7 个条目(面红、目赤、舌质红、舌苔黄、脉弦、脉数、脉有力)。现在就针对此量表进行信度和效度的检验,以为其他中医证候诊断标准的建立提供方法学上的借鉴与参考,为中医证候规范化、标准化研究探索科学可行的研究模式。
1 对象与方法
1.1 对象
本研究以山东中医药大学附属医院心内科门诊随机抽取者作为调查对象,共纳入高血压病患者212 人,按照辨证标准将调查对象分为肝火上炎证和非肝火上炎证两组,其中肝火上炎证组139 人,非肝火上炎证组73 人,两组在性别、年龄、病程上的差异无统计学意义(P>0.05),具有可比性,调查一周后,又随机抽取肝火上炎组30 名患者进行重测,作为重测样本。
1.2 方法
应用SPSS 16.0 统计软件进行以下统计分析。
1.2.1 重测信度 重测信度是通过用同样的量表,对同一组调查者重复测验并进行相关分析,用两次测验的相关系数来反映测量结果的稳定程度,以此来评价该量表的信度高低。肝火上攻维度和肝火内扰维度的重测信度系数用基于方差分析的内部相关系数(intraclass correlation coefficient,ICC)来评价量表的重测信度;作为分类变量的舌脉维度的评估,则应用Kappa 系数来评估重测信度。重测信度系数的国际量表标准下限是0.7[1]。样本量通常为20~30 人[2]。
1.2.2 分半信度 分半信度是将量表条目按奇偶数或前后分成两半,采用Spearman-brown 公式估计相关系数R,以此为标准来衡量整个量表的信度。一般要求R>0.7。
1.2.3 同质性信度 同质性信度是用克朗巴赫α系数衡量量表的内在一致性,也是最常用的测量信度的方法。克朗巴赫α 系数大于0.7 时表示内在一致性较高[3]。本研究按照量表维度分别计算克朗巴赫α 系数。
1.2.4 内部相关系数 内部相关系数是通过计算量表总分及各维度总分,检验量表与各因子的相关系数。
1.2.5 评分者信度 本研究在山东中医药大学附属医院心内科门诊随机抽取30例高血压病患者,由2 位经过培训的调查员同时检查病人,然后分别独立评分,最后比较评分结果。症状条目用Pearson积距相关法,舌脉条目用Kappa 相关法。
1.2.6 表面效度与内容效度 表面效度是指条目书面表达的意思是否为真正要测定的内容,内容效度是指组成量表的条目是否包括了想要测量的内容的各个方面,两者均为主观指标。
1.2.7 区分效度 区分效度是指一份量表能明确区分出已知两类不同人群所测指标差异的能力。本研究分别计算肝火上炎证组和非肝火上炎证组的量表各维度得分和总得分,比较有无统计学差异,判断量表是否具有区分效度。
1.2.8 结构效度 量表中的问题是调查者预先设计的,并且人为地归结成几个维度,这称为设计结构。而实际的量表结果本身具有一定的潜结构,通过数学方法,依据调查结果,将原始问题归纳成几个模块,又可以形成统计结构。统计结构与设计结构吻合的好坏就表明了量表的结构效度。结构效度由于有理论逻辑为基础,同时又根据实际所得数据来检验理论的正确性,因此是一种相当严谨的效度检验方法[4]。本研究采用探索性因子分析进行结构效度测评。
2 结果
2.1 信度检验
2.1.1 重测信度(见表1、表2) 肝火上攻维度和肝火内扰维度的重测信度系数分别为0.910 和0.903,舌脉维度的重测信度系数分别为面红0.769,目赤0.752,舌质红、舌苔黄0.852,脉弦0.778,脉数0.789,脉有力0.779,均提示该量表重测信度良好。
表1 量表肝火上攻和肝火内扰维度的重测信度系数
表2 量表舌脉维度的重测信度系数
2.1.2 分半信度 本研究是将量表条目按前后顺序分成两半,采用Spearman-brown 公式估计相关系数R,以此为标准来衡量整个量表的信度,结果R=0.849,提示分半信度检测良好。
2.1.3 同质性信度(见表3) 结果显示,肝火上攻、肝火内扰和舌脉3 个维度的α 系数分别为0.943、0.954、0.856,表明每个维度上的各条目之间有较高的正相关,具有良好的一致性。
表3 量表的同质性信度系数
2.1.4 内部相关系数 本研究结果分析发现,量表总分与各维度之间呈高度相关,相关系数r 在0.562~0.953 之间(见表4)。3 个维度与总量表的相关系数分别为0.956、0.921、0.665,在α=0.01 水平上有统计学意义,呈现高度正相关(P=0.000),各维度之间也呈中高度正相关(P=0.000),显示各维度的方向一致。
表4 各维度与总量表的相关系数矩阵
2.1.5 评分者信度 结果显示,量表条目的评分者信度系数均在0.90 以上(见表5、表6),提示量表的评分者信度良好。
2.2 效度检验
2.2.1 表面效度与内容效度 本研究根据量表编制的规范程序,在确定了肝火上炎证的可操作性定义后,结合高血压病的特点,提出了高血压病肝火上炎证诊断量表的理论构想。通过古今文献检索和住院病例流行病学调查,构建了备选条目池。后经专家咨询、小范围预调查、研究小组多次讨论和修改,对测验项目和内容的适合性作了评估,形成了初步量表。因此,量表的理论构想、条目的提出和筛选以及专家对条目的认可,都保证了量表中的条目能够真实反映高血压病肝火上炎证的主要内容。
表5 量表症状条目的评分者信度系数
表6 量表舌脉条目的评分者信度系数
2.2.2 区分效度(见表7) 本研究分别计算肝火上炎证组和非肝火上炎证组的量表各维度得分和总得分,比较有无统计学差异,判断量表是否具有区分效度。将两组各维度得分和量表总得分数据分别进行正态性检验,结果显示肝火上攻维度、肝火内扰维度、总量表积分均服从正态分布,经成对t检验,三者t 值分别为27.729、36.429、41.293,两组差异有统计学意义(P<0.01)。舌脉维度因是分类变量,采用χ2检验。经检验,χ2=156.680,ν=4,P=0.000,说明两组各维度得分及总积分均有显著性差异,提示区分效度良好。
表7 两组患者各维度及量表总积分比较(分,±s)
表7 两组患者各维度及量表总积分比较(分,±s)
注:与肝火上炎证比较,at=27.729,aP=0.000;与肝火上炎证比较,bt=36.429,bP=0.000;与肝火上炎证比较,ct=41.293,cP=0.000
组别例数(n) 肝火上攻维度积分 肝火内扰维度积分 总量表积分141 26.85±4.962 16.43±3.148 50.63±6.281非肝火上炎证组 71 13.16±4.728a 6.40±2.121b 24.94±6.172肝火上炎证组c
2.2.3 结构效度
经检验,样本KMO 统计量为0.899,提示所有变量之间的简单相关系数平方和远大于偏相关系数平方和,表明条目间有公因子存在,适合进行因子分析。Bartlett 球形检验,χ2=8258.554,df=153,P<0.001,表明数据适合因素分析。采用主成分法提取公因子,并作方差最大旋转,遵循原量表的维度数,提取3 个公因子,方差累计贡献率为75.235%。提取每一个公因子上载荷系数大于0.5 的变量,第一公因子(F1)包括头晕、头痛、耳鸣、口苦、口干等5 个变量,第二公因子(F2)包括胁肋疼痛、多梦、失眠、急躁易怒、大便秘结、小便黄等6 个变量,第三公因子(F3)包括面红、目赤、舌质红、舌苔黄、脉弦、脉数、脉有力等7 个变量。此旋转因子模型结构与量表的条目设置完全吻合,表明该量表具有良好的结构效度。
3 讨论
所谓量表,可以解释为“尺度”,是一个标准化测量工具。它是用多个问题来测量一个概念,可以看作是衡量某一概念的综合指标[5]。它的作用在于精确测量一个较抽象的或综合性较强的概念。使用量表来研究、规范中医的辨证,对症状与证素进行量化处理,可克服辨证的模糊性、不确定性和主观性。这为中医药临床研究、诊疗评价提供了新的思路和方法。量表具有两个基本特征,即信度和效度。信度是检验量表稳定性和可靠性的指标,可以从重测信度、分半信度、同质性信度等多方面来考量。每一种考评方法都有优缺点,所以以多种方法结合互参为宜。本研究从重测信度、分半信度、同质性信度等多方面对该量表的信度进行了测评,结果均提示该量表信度良好。
同时,效度是指正确性程度,即测量工具确能测出其所要测量的特质的程度。效度越高表示测量结果越能显示出所要测量对象的真正特征。效度是个多层面的概念,可从不同角度来衡量。其中表面效度和内容效度属于专家评判的主观性指标,相比之下,区分效度和结构效度较为客观。其中结构效度被认为是最强有力的效度评价指标[6]。而利用因子分析来考察量表的结构效度被认为是效度分析最理想的方法[7],对于探讨中医证候实质及定量化研究作用很大[8]。本研究从区分效度和结构效度两个角度对该量表进行了测量,结果也均提示该量表效度良好。信度及效度的考核结果证明,高血压病肝火上炎证诊断量表(第二版)达到了量表制作的基本要求,是可靠、灵敏的,能够较全面地反映高血压病肝火上炎证的证候特征。
[1]秦浩,陈景武.医学量表条目的筛选考评方法及其应用[J].中国行为医学科学,2006,15(4):375-376.
[2]曾五一,黄炳义.调查问卷的可信度和有效度分析[J].统计与信息论坛,2005,20(6):11-15.
[3]饶克勤.卫生统计方法与应用进展[M].北京:人民卫生出版社,2008:106-107.
[4]吴明隆.SPSS 统计应用实务——问卷分析与应用统计[M].北京:科学出版社,2003:62-120.
[5]王吉耀.循证医学与临床实践[M].北京:科学出版社,2002:188.
[6]彭凯平.心理测验——原理与实践[M].北京:华夏出版社,1989:149-150.
[7]方积乾.医学统计学与电脑实验[M].上海:上海科技出版社,2006:437-440.
[8]王奇,谭芬来,梁伟雄,等.中医证候量化的临床流行病学研究初探[J].广州中医学院学报,1992,9(4):224-228.