第四讲 中医药研究中定性资料的χ2 检验误用分析
2023-10-09黄孟云金岳龙姚应水
黄孟云, 金岳龙, 姚应水
(1.安徽中医药高等专科学校 临床医学系,安徽 芜湖 241002;2.皖南医学院 公共卫生学院/慢性病防制研究所,安徽 芜湖241002)
医药统计学是一门在医药研究领域中收集、整理、分析和解释数据的工具性学科,在医学调查中发挥核心作用[1]。中医药作为我国重要的卫生、经济、科技、文化和生态资源,传承创新发展中医药是新时代中国特色社会主义事业的重要内容。如何提升中医药竞争力、实现中医药科学的可持续发展,与科研水平能力直接有关。在推进中医药现代化和国际化的进程中,科研人员逐步认识到从数量角度探求中医现象的重要性[2]。严谨的科学思维为研究的开展奠定良好的基础,如果在数据处理方面不恰当,将严重影响成果质量,阻碍中医药的发展。
定性资料又称分类资料或计数资料,是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得到的资料,一般无度量单位,各属性之间互不相容。这类资料的常见统计分析有χ2检验、Fisher 确切概率法、秩和检验、等级相关分析、Ridit分析等。使用频率最高、应用最广泛的是χ2检验。许多学者对于定性资料会盲目的使用χ2检验,而忽略了其应用条件和范围,使得χ2检验误用也是最常见的。为此笔者对中医药研究领域中关于定性资料存在的χ2检验错误案例进行了分析总结,以期能引起作者、读者和编者的注意。
1 定性资料的χ2 检验用途及注意事项
推断两个或两个以上总体率或构成比之间有无统计学差别,描述两变量间有无相关关系以及检验频数分布的拟合优度等。
根据科研设计资料的类型,常分为一般四格表、配对四格表和R×C资料的χ2检验,①一般四格表资料χ2检验:若n≥40 且T≥5,用一般四格表χ2检验;若n≥40 且1 ≤T<5,用校正四格表χ2检验;若n<40 或T<1,用Fisher 确切概率法。②配对四格表资料χ2检验:若b +c ≥40,用配对χ2检验;若b +c <40,用校正配对χ2检验。③R×C资料χ2检验的注意事项:若全部格子T≥1或少于1/5 的格子1 ≤T<5,用R×C表的χ2检验;若有T<1 或有多于1/5 的格子1 ≤T<5,用R×C表的Fisher 确切概率法。若R×C表的χ2检验结果差异有统计学意义,根据研究目的,采用χ2分割进一步分析。
2 中医药研究中常见的定性资料χ2 检验误用
2.1 Fisher 确切概率法误用χ2检验
例1:为研究解毒化瘀通腑方对酒精性肝硬化肝胆热患者肠道菌群的影响,将研究对象分为观察组18 例,对照组19 例,两组均接受西药治疗,观察组另加用解毒化瘀通腑方口服,通过中医证候分级量化标准进行评分,将治疗效果分为有效和无效,经过4周治疗后,观察两组疗效有无差别。
原分析:作者采用一般四格表χ2检验,结果显示,西药加解毒化瘀通腑方的有效率高于单纯西药组(P<0.05),结果见表1。
表1 两组中医症状疗效比较
解析:四格表χ2检验其应用条件是n≥40 且Tmin≥5,本例n= 37 <40,故不适合用一般四格表χ2检验。当出现n<40 或Tmin<1 的四格表资料,应选用Fisher 确切概率法,本资料的Fisher 检验结果P= 0.079 >0.05,因此尚不能认为两组的有效率有差别。
例2:某研究者欲了解穴位贴敷联合中药治疗慢性支气管炎临床疗效,将收集的85 例慢性支气管炎患者分为中药治疗组与穴位贴敷联合中药治疗组,根据咳痰咳嗽的次数减少情况及肺部功能情况,将治疗效果分为有效和无效,比较两组有效率差异。
原分析:作者采用一般四格表χ2检验,结果显示,穴位贴敷联合中药治疗组与对照组有效率间无统计学差异(P>0.05),详见表2。
表2 两组慢性支气管炎的疗效
解析:本例为2×2 的四格表χ2检验,n= 85 >40,但最小理论频数Tmin= 0.941 <1,故不适用一般四格表χ2检验,应采取Fisher 确切概率法,本资料的Fisher 检验结果为P= 0.496 >0.05,虽得到的结论与原结论一致,尚不能认为两组的有效率有差别,但原分析的统计方法选用不当。
2.2 校正四格表χ2 检验误用一般四格表χ2 检验
例3:在激光光凝联合中药治疗糖尿病黄斑水肿的临床研究中,将糖尿病黄斑水肿患者53 例随机分为观察组与对照组,对照组采用黄斑区改良格栅样光凝治疗,观察者采用光凝后同时给予中药治疗,问治疗后两组黄斑水肿消退率有无差异?
原分析:作者采用一般四格表χ2检验,结果显示,观察组黄斑水肿消退总体有效率(92.6%)明显优于对照组(69.2%)(P <0.05),详见表3。
表3 对照组与观察组治疗后黄斑水肿消退率的比较
解析:本资料为一般四格表资料,样本量n=53 >40,但本例中理论频数Tmin= 4.91,在1 ≤T<5范围内,故应采用校正χ2检验。本资料= 3.320,P= 0.068 >0.05,与原结论相反,尚不能认为两种治疗方法对黄斑水肿消退率有差异。
2.3 配对χ2 检验误用一般四格表χ2 检验
例4:研究人员开展配对设计研究,将两组肿瘤小鼠同胎、同体重进行匹配(共42 对小鼠),分别给予中药治疗和生理盐水,请比较试验后肿瘤大小有无统计学差异?
原分析:作者采用一般四格表χ2检验,样本量n= 42 >40,且理论频数Tmin= 5.14 >5。结果显示,两种治疗方法肿瘤大小差异有统计学意义(P<0.05)。结果见表4。
表4 两组肿瘤大小的比较
解析:本研究设计可以看出小鼠按同胎、同体重进行匹配,应采用配对四格表χ2检验进行分析,同时注意b +c = 26 <40,应采用校正配对χ2检验,= 0.962,P= 0.327 >0.05,与原结论相反,尚不能认为两种治疗方法肿瘤大小有统计学差异。
2.4 R×C 资料χ2 检验误用两两四格表χ2 检验
例5:为探讨不同炮制方法对中药临床疗效的影响,学者将收治的188 例患者分成3 组,A 组患者服用修制中药,B 组患者服用火制中药,C 组患者服用水制中药。将炮制处理后中药饮片在自来水中浸泡30 min,再文火煎煮30 min,中途加水2 次,药水控制在250 mL,2 次/ d,4 周为1 疗程,观察患者治疗效果及药物反应来判定药物疗效,将判定结果分为有效和无效。请比较采用不同方法炮制中药后临床疗效有无统计学差异?
原分析:作者利用一般四格表χ2检验进行两两分析,A 与B 比较,Tmin= 12.95,χ2= 4.150,P= 0.042;B 与C 比 较,Tmin= 18.60,χ2= 0.923,P= 0.337;A与C 比较Tmin= 10.44,χ2= 1.302,P= 0.254。得出结论为A 与B 两组间的有效率差异有统计学意义,A组修制中药效果好,结果见表5。
表5 三组患者采用不同方法炮制中药后临床疗效对比
解析:一般对于R×C表进行分析时,应先对整体进行χ2分析,如果得出P>0.05,不需要再进行两两分析;若P<0.05,再进一步作两两比较,即采用χ2分割,此时的检验水准α' = 2α/k(k-1),k 为组数。本例整体的χ2分析结果为,Tmin=12.75,χ2= 4.228,P= 0.121 >0.05,尚不能认为这三组间有效率差异有统计学意义,无需进行两两比较。
2.5 等级资料误用χ2 检验分析
例6:在一项中药联合甲硝唑维B6治疗痤疮疗效的研究中,学者将205 例痤疮患者分为对照组99和治疗组106 例,两组均口服甲硝唑维B6,治疗组加服中药,经过8 周治疗后,问中药联合甲硝唑维B6治疗效果是否优于对照组?
原分析:采用R×C表的χ2检验结果显示,两组的治疗效果差异无统计学意义(P>0.05),结果见表6。
表6 治疗8 周后两组痤疮疗效比较
解析:从研究设计上可见,本资料属于单向有序设计(其结果表达为治愈、有效、好转、无效),而R×C表的χ2检验只适用于相互独立的无序资料,因χ2检验只能检验内部构成或频率分布是否相同,不能检验疗效等级间有无差别,故应采用秩和检验或Ridit 分析,经秩和检验结果显示,两组治疗效果差异有统计学意义(Z= 2.019,P= 0.043 <0.05)。另外,也可对数据进行合并处理,将等级资料转化为二分类资料(有效、无效),再采用一般四格表χ2检验,但需注意合并的逻辑性和合理性。
2.6 线性趋势χ2 检验分析误用为秩和检验
例7:研究者想了解不同浓度的益肾泄浊方灌肠治疗剂量与慢性肾脏病的疗效的关系,将药物浓度分为4 组,高剂量组给予原方灌肠,中高剂量组给予原方3/4 灌肠,中剂量组给予原方1/2 灌肠,低剂量组给予原方1/4 灌肠,经2 周治疗后评价疗效。
原分析:作者将组别的低剂量、中剂量、中高剂量和高剂量当成等级资料,采用秩和检验,结果显示,四组有效率的差异无统计学意义,尚未发现灌肠治疗慢性肾脏病的疗效随着益肾泄浊方浓度的增加而提升(H= 7.783,P= 0.051 >0.05),结果见表7。
表7 治疗2 周后四组疗效的比较
解析:本资料虽属于单向有序设计,即分组变量为有序变量(药量逐渐增加),而结局为无序变量(有效和无效),所以本资料并不适合采用秩和检验方法进行统计分析;另外,通过秩和检验也无法得到线性及相关关系。对于结局为二分类的定性资料,常见的正确的统计方法为:①探究不同药物浓度有效率有无差异,应选用一般R×C表的χ2检验,如果多组间存在差异,须进一步采用χ2分割进行两两比较。本研究χ2检验结果显示,四组有效率差异有统计学意义(χ2= 7.867,P= 0.049 <0.05)。进一步χ2分割结果显示,仅高剂量组和低剂量组的差异有统计学意义。②因为不同药物浓度存在剂量梯度关系,还可开展剂量反应分析,应选用线性趋势χ2检验分析不同药物浓度与其治疗的有效率是否存在线性关系。经线性趋势χ2检验结果显示,药物浓度与疗效间存在剂量反应关系(4.851,P= 0.028 <0.05)。本案例作者研究的目的是想了解有效率是否随着药物浓度的增加而增加,因此宜采用线性趋势χ2检验。
2.7 误用χ2 检验回答相关性问题
例8:一项中医药参与治疗中晚期(Ⅱ期、Ⅲ期、Ⅳ期)卵巢癌的回顾性临床研究中,探讨卵巢癌分级与p53 基因表达的相关性。
原分析:采用R×C表的χ2检验结果显示,中晚期卵巢癌的分级与p53 表达水平存在明显相关性(P<0.001),表明p53 表达与卵巢癌分化程度呈正相关,结果见表8。
表8 p53 基因表达与卵巢癌分级的关系
解析:从研究设计上可见,本资料属于双向有序设计,而χ2检验一般仅用于双向无序的R×C资料统计分析,目的是研究分组变量中各组的结果构成的差异是否有统计学意义,但无法说明等级排列意义,更不能得出结局变量与分组变量相关的变化趋势。正确统计方法为:①如果研究者只关心分组变量取不同水平时,有序的结果变量之间的差别是否有统计学意义,则可将其视为单向有序数据,即把结局变量视为有序分类变量,此时应选择秩和检验,H= 41.459,P<0.001,三组p53 基因表达的差异有统计学意义。②如果研究者要得到结局变量的等级变化与分组变量等级变化之间关系,且由于结局变量与分组变量都是双向有序的,则应首选秩相关分析。计算得到等级相关系数rs= 0.685(P<0.001),表明中晚期卵巢癌分级与p53 基因表达之间存在中度相关性。③若想探寻卵巢癌的不同时期与p53 表达之间是否存在线性变化趋势时,可以使用Mantel-Haenszel 卡方检验(趋势χ2检验)。计算结果χ2= 62.018,P<0.001,表明卵巢癌分期与p53 表达水平存在线性关系。
3 讨论
医药科学研究工作,是利用反证法的思想,从统计学的角度,对收集到的样本信息进行分析,达到推测总体情况的目的。当统计方法选择不当,分析所得的结果也是不可信的。随着我国对学术期刊质量要求越来越高,统计学方法的正确使用已逐渐成为其基本要求。众多学者在医药相关领域发现统计方法使用不规范或误用情况普遍存在[3-4]。χ2检验作为定性资料最常用的一种统计分析方法,被不少学者认为是处理此类资料的“万能工具”而随意使用。事实上,不同的χ2检验有其基本的适用条件,不能盲目随意选择χ2检验。
3.1 定性资料统计分析方法梳理
四格表资料在进行统计分析时先判断是否属于配对设计,如果仅是一般四格表数据,根据一般四格表χ2检验的应用条件选用正确的统计学分析方法。R×C表在进行统计分析时首先要根据资料属性进行区分,X(分组变量)和Y(因变量)是有序还是无序资料,再根据研究目的和适用条件选择正确的统计方法,具体见表9。
表9 分类变量资料的统计选择
3.2 防范及思考
3.2.1 巩固统计学理论知识的学习 中医药现代化研究是利用西医科研思维分析和讨论中医药理论,需要对各种数据进行统计学分析,方法选择不当不仅会降低论文的质量,更会影响论文的科学性,关键要巩固统计学理论知识的学习。①正确识别资料类型。分析资料前,首先明确是定性资料还是定量资料,统计学应用的关键是针对不同资料类型选用不同的统计分析方法,资料类型是合理选用统计分析方法的首要前提。定性资料针对每个调查对象而言获得的是一个属性,例:性别、效果、类型等。根据其属性特点可分为有序和无序两种情况,有序资料是指各变量值间存在等级关系,又称等级资料,如:基因表达水平、疗效、满意度等;无序资料是指各变量值间无等级关系,又称分类资料,如:血型、中医症候分布(气滞血瘀、痰湿阻络、肝肾亏虚、气血虚弱、风热湿寒)等。另外,分组变量也可分为有序和无序两种情况,对于有序分组,不同的分析方法得到的统计学结论也不尽相同,具体需根据研究目的而定。②明确研究设计类型和目的。每一种统计方法解决的问题各不相同,正确区分设计类型对统计方法恰当的选择具有重要意义。③熟悉掌握不同的统计学方法的应用条件,当不满足条件时,可以选用的统计学分析方法有哪些,明确各自的优缺点,选择恰当的方法。
3.2.2 医学期刊重点关注的统计学问题 医学期刊中统计学方法的描述常常有以下问题:①方法学只是简单的写出采用χ2检验,但未明确是何类型χ2检验。如:配对χ2检验和一般四格表χ2检验,最终呈现的统计量都是χ2值,并且未注明是否选择了校正值。②在结果部分描述时,表格中常常没有检验统计量的数值以及关键性指标P值,应在表格中罗列出来或者以文字形式在结果部分阐述。③统计结果表述不规范、不准确,如将本应是P值小于0,记为 0.000,写法不规范,应记为P< 0.001 等[5]。
3.2.3 提高研究者的统计学素养 医药统计学不是学习如何使用复杂繁琐的公式来计算数据,而是学习如何使用这些统计方法作为从数据中得出有效结论的工具。数据分析的目标是揭示研究背景情况的潜在模式、趋势和关系。研究者不仅需要巩固统计学理论知识的学习,还应该借助各种统计分析软件,如:SPSS、SAS 等[6-7],将理论应用到实际中。此外,多阅读高质量论文,参加学术交流会议,提升统计学综合素养。