中医证候量表条目筛选中常用的统计学方法研究进展
2015-04-03杜彩凤任剑峰陈燕清刘宏奇赵延龙梁文静
杜彩凤,赵 勇,任剑峰,陈燕清,刘宏奇,赵延龙,梁文静
(1.山西中医学院,山西 太原 030024; 2.山西中医学院附属医院,山西 太原 030024)
中医证候量表条目筛选中常用的统计学方法研究进展
Study advancement on commonly used tatistics methods in item selection of TCM syndrome scale
杜彩凤1,赵 勇1,任剑峰1,陈燕清1,刘宏奇2,赵延龙1,梁文静1
(1.山西中医学院,山西 太原 030024; 2.山西中医学院附属医院,山西 太原 030024)
近年来,在中医研究领域逐步开始探索运用量表学方法解决有关证候诊断、疗效评价等诸多问题,并编制符合中医传统理论及临床适用性较好的证候量表,在此过程中条目的筛选是关键性问题。由于数据源不同,所基于的分析评价理论不同,故选用的统计学方法也有一定的差异。在分析数据源的基础上,系统总结基于经典测量理论、概化理论及项目反应理论所涉及的常用统计分析方法,以期为量表的编制提供一定的技术支持。
量表条目筛选;经典测量;概化理论;理论项目;反应理论
量表(scale),是一种测量工具,是由反映某一抽象概念的所有测量指标和备选答案构成的标准化测定表格,用于测量研究对象的某种状态、行为或态度[1]。量化诊断标准是中医证候标准化研究的一个方向,其核心是用数值说话,由多个条目构成一个复合分数,来揭示不宜用直接方法测量的理论变量[2]。证候量表的编制要在符合中医传统理论的基础上,尽可能遵循全面性、科学性、重要性、敏感性、独立性、代表性、可操作性、目的性等原则,并使用简洁明了的文字加以表述。其中,在量表编制的诸多环节中,条目筛选是关键性问题之一。
1 数据源
1.1 文献数据源
古往今来,许多医家毕生的研究成果多以文献的形式保留下来,其中关于“证”的记载,内容丰富、资料繁多。在对古今“证”相关文献资料进行系统搜集、挖掘整理和阐述评价的基础上,从中选取与本研究病证相关的信息,作为量表条目池的重要来源,是中医证候量表编制的重要方法。如金洵等[3]以“便秘”为关键词查阅1999年-2009年中国知识资源总库(CNKI)和PubMed上的相关文献,查阅《结肠与直肠外科学》、《Constipation》等书籍的相关章节,查阅患者报告临床结局和生存质量测评工具数据库中关于便秘的量表,结合访谈法,形成慢性便秘报告临床结局评估量表最初的条目池。唐斌擎等[4]以“感冒后咳嗽”、“感染后咳嗽”等作为关键词,检索1999年-2008年中国生物医学文献数据库等电子期刊数据库,并补充查阅行业标准、国家标准以及教材其他相关资料,收集相关症状名词,经整理形成量表的备选条目。
1.2 专家咨询数据源
在中医证候量表理论框架构建过程中,专家咨询是量表条目初步形成的重要方法。其中,德尔菲法采用匿名的方式,轮番征询专家意见,并反复多次完成信息的反馈与修正,最终使专家的意见逐步趋向一致,从而对评价对象做出评价的一种定量与定性相结合的集体经验判断的预测、评价方法[5]。刘丽星等[6]采用德尔菲(Delphi)法,在前期研究基础上,形成《冠心病稳定型心绞痛(痰瘀互结证)自评量表专家问卷调查表》,向全国40余位业内专家,往返3次进行问卷调查,并借助统计学分析完成条目的筛选工作。王苗苗等[7]运用德尔菲法,调查30位专家有关高血压病肝气郁结证证候诊断的相关条目,完成证候诊断指标的筛选工作。
1.3 临床调查数据源
基于循证医学的研究理念,运用临床流行病学的调查方法,并与统计分析方法相结合,是中医证候量表条目筛选研究的重点,是建立具有临床可操作性及客观、量化证候诊断量表的必要前提和坚实基础。如姜小帆等[8]选取符合糖尿病诊断标准及糖尿病性视网膜病变诊断标准的患者120例,在此临床资料基础上,综合运用多种统计分析方法,从不同角度进行量表条目的筛选。王阶等[9]运用临床流行病学的调查方法,以获取血瘀证患者相关的整体情况、疾病主要症状、躯体症状、体征、舌脉、实验室检查等
指标,参照量表编制的基本方法,制定出血瘀证量化诊断量表。
2 数据分析方法
在量表的编制过程中,条目筛选是一个关键环节,可供选择的筛选方法很多,而且各有侧重和特点。根据数据源的不同,可有针对性地选用不同的统计分析方法。
2.1 专家咨询数据分析方法
在专家问卷调查的基础上,结合统计学中的数理统计方法,汇总专家意见,可充分发挥专家的集体效应,并从专业角度对量表条目的构成给出较为合理的意见。数理统计分析的前提是对专家应答结果进行量化分析和处理,其中最为常用的量化方法是将各种评估意见按照贡献度不同而转化为不同的分值,如Likert scale的五级评分,然后再求出各种意见的概率分布,依据概率分布情况判断事件发生的可能性大小。常用来衡量专家意见的指标有:积极性系数、集中程度、协调程度、权威系数等。①专家积极性系数反映专家对某方案的关心程度,以专家征询表的回收率来表示。②专家意见集中程度多从方案评分值的算术平均值、满分比、评价等级和来衡量。均数越大,满分比越大,表明专家意见越集中,即该方案的相对重要性越大。③专家意见协调程度反映专家意见的收敛情况,通常以肯德尔和谐系数(Kendall′s coefficient of concordance)、变异系数(CV)来表示。肯德尔和谐系数适用于多列相关的等级资料,表示专家对所有条目的协调程度,系数越大,协调程度越好。变异系数反映专家们对单个条目的重要性评价的波动程度,即协调程度,变异系数越小,协调程度越高[10]。④专家权威系数(Ca)反映所选专家的代表性,专家的权威程度以自我评价为主,有时也可相互评价。该项一般由两个因素决定,一是专家对方案做出判断的依据(Ci),常规分为理论依据、实践经验、国内外资料、直觉等;二是专家对问题的熟悉程度(Cs)[11]。Ca=(Ci+Cs)/2,为判断依据系数和熟悉程度系数的算术平均值,一般认为大于等于0.7为可接受的系数。可用它作为权数,对专家评价值进行加权平均计算。
一般来说,以专家调查为基础进行条目的筛选属于主观筛选,通常会在综合考量上述指标后作出最终判断。如孔秀路等[12]在前期形成条目池的基础上,编制小儿厌食中医证候疗效评价专家调查表,先后进行两轮专家重要性评分,通过计算专家积极系数、意见集中程度、协调程度和专家权威程度,保留同时满足均数>4、变异系数<0.4的条目。
2.2 临床调查数据分析方法
2.2.1 基于经典测量理论(Classical Test Theory,CTT)的分析方法 经典测量理论(CTT),又称真分数理论(True Score Theory),是最早实现数学形式化的测量理论[13]。基于经典测量理论完成量表条目的筛选,可供选择的方法比较多,例如离散趋势法、区分度法、相关系数法、因子分析法等,这些方法技术上相对比较成熟,且每种方法筛选条目的角度和侧重点不同[14]。①离散趋势法:此法从敏感性角度筛选条目,一般采用变异系数作为衡量离散程度的指标[15]。条目的离散程度越低,对证候的辨别区别能力就越低[16],因此证候量表的条目筛选应尽可能选择离散趋势较大的条目。②区分度分析法:此法从区分性和重要性的角度筛选条目,区分度越大,说明其越具代表性。如戴霞等[16]在研究中以证候为分组变量,对各症状条目进行两个独立样本的t检验或χ2检验,在比较两组之间统计学差异的基础上,考虑条目的删除。③相关系数法:此法从代表性和独立性角度筛选条目。基于同一维度中指标间的重叠性应尽量低,不同维度之间关联性应尽量低的原则,借助如积差相关法、点二列相关法及双列相关法[17]等方法,计算每个条目与其所属维度的相关系数,绝对值越大(一般认为>0.4),说明代表性较好。同时计算每个条目与其他维度的相关系数,绝对值较小,则说明独立性较强,基于此完成冗余条目的删除。④因子分析法:此法从代表性角度筛选条目。因子分析通过从变量群中提取共性因子,不仅可以达到消除变量间的多元共线性,达到降低变量维度的目的,又可以将本质相同变量归入同一个因子,对变量进行分类[14]。同时,依据条目在公因子上的载荷大小确定条目的取舍。⑤克朗巴赫系数法:此法从内部一致性的角度筛选条目,反映量表条目之间的同质性。量表中各条目间相关程度越高,α系数越大,可信度越大。通过计算克朗巴赫(Cronbach)系数α,比较去除某一条目后α系数的变化,若α系数增大,则说明该条目有降低该维度内部一致性的作用,应予以删除。
目前在中医证候量表的编制过程中,基于临床调查数据基础上的条目筛选工作,往往综合运用多种手段和方法,同步选取两种或两种以上方法共识的条目作为量表的有效条目。如师宁等[18]调查200
例反流性食管炎(RE)患者,分别应用复杂系统熵聚堆法、离散趋势法、频数分布法、因子分析法、复杂网络技术对其中出现频率在10%以上的四诊信息53项进行了条目的分析与筛选,形成了初步的RE证素诊断量表条目。王均琴等[19]采用横断面调查法,对201名类风湿性关节炎患者实施问卷调查,联合运用频数分析法、因子分析法、相关系数法、逐步回归分析、克朗巴赫系数法和重复测量等筛选方法,最终保留了35个四诊条目,构成了类风湿性关节炎中医证候量表。姜小帆等[20]选择105例风湿病患者,采用反应度法、t检验法、相关分析法、因子分析法对条目进行筛选,删除其中有3种以上方法提示需要被删除的条目,同时结合专业知识与意见,得到类风湿性关节炎中医证素评定量表的条目。赵灵燕[21]在文献调研、专家咨询的基础上,调查2型糖尿病患者179例,运用相关分析、逐步回归、因子分析等方法对证候要素条目进行筛选。王一[22]在前期工作基础上调查广州中医药大学第一附属医院及柳州市中医院胃癌患者,运用经典测量理论对量表条目进行删减,形成包括脾胃虚寒证、气血两亏证、气滞血瘀证、肝胃不和证、胃热伤阴证、湿热蕴脾证、痰凝气滞证在内的胃癌中医证候量表。
2.2.2 基于概化理论(Generalizability Theory,GT)的分析方法 概化理论是基于“随机平行测验假设”,在将测量误差多个来源维度有效分解的基础上,对经典测量理论进行扩展。其研究方法主要包括G研究和D研究,G研究(Generalizability Study)又称概化研究,是指在观测全域之上,研究者需对所有侧面和测量目标以及它们间的交互作变异分量估计。D研究(Decision Study)又称决策研究,是指在概括全域或概化全域上,对各测量面或测量对象或它们之间的交互作用的研究[23]。在量表编制的过程中,运用该理论,可以通过改变条目数,估计出不同条目数对量表信度的影响,最终为改进量表的条目设置提供依据[24]。李微等[25]采用经典测量理论(CTT)与概化理论(GT)相结合的方式对卵巢癌患者生命质量测定量表(FACT-O)中文版的信度进行评价,其中D研究结果显示:共性模块各领域条目数适宜,特异模块可增加条目至15条,表明FACT-O中文版具有较好的信度。2.2.3 基于项目反应理论(Item Response Theory,IRT)的分析方法 项目反应理论又称潜在特质理论或项目特征曲线理论,是继经典测量理论(CTT)之后,针对CTT的弱点提出的一种新的测量理论,广泛应用于教育、心理、医疗等研究领域。IRT的题目参数有难度、区分度和猜测系数。项目特征曲线(Item Characteristic Curve,简称ICC)称为项目特征函数,是IRT分析中一个非常重要的分析图。通过观察ICC曲线图,可以分析①项目的区分度,用曲线拐点处的斜率来表示;②项目的难度,由曲线在横坐标上的投影来表示;③项目的猜测系数,用曲线的截距来表示。另外,项目信息函数将项目特征的难度、区分度和猜测度合而为一的参数,反映了不同特性的项目在评价不同被试特质水平时的信息贡献关系。信息函数值越大,对被试能力的估计就越精确。鉴于项目反应理论有着经典测量理论所无法比拟的优势,近年来基于IRT理论的分析方法已逐步扩展到中医证候量表条目筛选研究中。如陈炳为等[26]选取高血压病患者1 280例,在探索性因子分析的基础上,以肝阳上亢证为例进行IRT模型分析,利用单参数、双参数及三参数分别进行拟合,得到区分度系数、难度系数及信息函数的估计值。其结果显示两参数模型结果最佳,所筛选出的九个四诊信息能较好地反映肝阳上亢证,提示在中医的证候规范标准研究中应用项目反应理论模型是可行的。
量表具有客观、量化的基本特征,近些年,许多学者尝试从不同的角度编制中医证候的相关量表,如证候诊断量表、证候疗效评价量表等,其中条目的筛选是量表编制的关键环节。由于数据源不同,理论基础不同,所选用的统计分析方法也有一定的差异性。目前,在量表编制过程中,较少采用某一种方法作为唯一的条目选择标准,多是综合运用多种方法,甚至多种理论进行统计分析,以期所选条目在临床上能够更好地代表或反映该证候的基本特征以及临床轻重程度的变化。另外,量表的编制是一个循序渐进的过程,不是一蹴而就的,还需要反复的临床应用与调试,才能最终完成量表的编制工作。
[1]孙振球.医学统计学[M].2版.北京:人民卫生出版社,2002:529.
[2]刘丽星,张哲,杜蕊,等.中医证候量表的研究现状[J].辽宁中医药大学学报,2011,13(9):28-30.
[3]金洵,丁义江,丁曙晴,等.慢性便秘患者报告临床结局评估量表条目池的建立和筛选[J].世界华人消化杂志,2012,29(2):2 855-2 859.
[4]唐斌擎,张天嵩,黄海茵,等.基于顽固性感冒后咳嗽患者报告的中医证候临床结局量表的构建[J].上海中医药杂志,2012(4):13-15.
[5]平卫伟,谭红专.Delphi法的研究进展及其在医学中的应用[J].疾病控制杂志,2003,7(3):243-246.
[6]刘丽星,张哲,杜蕊,等.基于德尔菲法的《冠心病稳定型心绞痛(痰瘀互结证)自评量表》条目筛选[J].辽宁中医杂志,2011(5):827-829.
[7]王苗苗,李运伦,张蕴慧.基于德尔菲法的高血压病肝气郁结证问卷分析[J].湖南中医杂志,2014(4):137-138.
[8]姜小帆,曾进,段俊国.糖尿病性视网膜病变中医证素评定量表的编制策略及条目筛选[J].中华中医药学刊,2013(1):24-27.
[9]王阶,姚魁武,衷敬柏,等.基于临床流行病学的血瘀证量化计分表研究[J].中医杂志,2008(3):270-272.
[10]陆远,任现志.基于德尔菲法初步建立过敏性紫癜性肾炎中医生存质量量表条目[J].河南中医,2014(3):561-562.
[11]郝建玲,徐洪莲,邱群,等.大肠癌造口患者症状评估量表条目池的建立和初步筛选[J].解放军护理杂志,2012(9):12-14,18.
[12]孔秀路,徐田华,胡思源,等.基于Delphi法的小儿厌食中医证候疗效评价量表的条目筛选[J].天津中医药,2014(9):522-525.
[13]一帆.经典测验理论[J].教育测量与评价:理论版,2009(7):26.
[14]孟凡波,杨传华,齐冬梅,等.高血压病肝阳上亢证诊断量表条目筛选的研制[J].南京中医药大学学报,2012(3):225-228.
[15]吕静,薛江平,罗艳虹,等.慢性心衰PRO量表条目的初步筛选[J].中国卫生统计,2014(3):379-382.
[16]戴霞,王成岗,韩晓春,等.中医证候量表条目筛选的方法学探讨[J].中华中医药杂志,2010(8):1 168-1 171.
[17]冯艳宾,马洪超.关于经典测量理论和项目反应理论中难度和区分度的探讨[J].中国考试,2012(4):10-14.
[18]师宁,陈建新,刘敏,等.反流性食管炎证素诊断量表的编制研究[J].现代中医临床,2014(6):9-12.
[19]王均琴,李国春,周学平,等.类风湿性关节炎中医证候量表条目筛选[J].辽宁中医药大学学报,2014(3):80-82.
[20]姜小帆,曾进,李娟娥,等.类风湿性关节炎中医证素评定量表的编制策略及条目筛选[J].中华中医药学刊,2014(9):2 225-2 228.
[21]赵灵燕.2型糖尿病中医证候要素诊断量表的研制及初步应用研究[D].北京:北京中医药大学,2013.
[22]王一.基于量表的胃癌证候构成规律研究[D].广州:广州中医药大学,2014.
[23]敖勇前.概化理论研究综述[J].皖西学院学报,2008(2):49-52.
[24]孟琼,万崇华,罗家洪,等.癌症患者生命质量测定量表体系之胃癌量表QLICP-ST的研制[J].癌症,2008(11):1 212-1 216.
[25]李微,罗家洪,万崇华,等.经典测量理论与概化理论结合评价卵巢癌患者生命质量测定量表中文版的信度研究[J].中国全科医学,2013(9):751,754.
[26]陈炳为,许碧云,陈启光,等.两分类项目反应理论在中医证候中的应用[J].中国卫生统计,2011(1):16-18,21.
(编辑:梁葆朱)
R311
A
1671-0258(2015)05-0067-04
山西省基础研究青年基金项目(2012021031-3);2015年度山西中医学院博士科研启动基金项目(2015BK01)
杜彩凤,博士,副教授,硕士研究生导师,E-mail:ducaifeng1020@163.com