APP下载

探讨Bayes判别分析在食管癌淋巴结转移CT诊断中的价值

2015-02-14邵华飞刘剑芳姚丽波刘戬屈东王铸

放射学实践 2015年8期
关键词:判别函数诊断模型检验法

邵华飞,刘剑芳,姚丽波,刘戬,屈东,王铸

食管癌是我国高发的恶性肿瘤之一,其主要症状为吞咽不顺、疼痛等,但早期阶段症状往往不明显,患者就诊时常已处于中晚期,因此预后较差,5年生存率仅15%~25%[1]。淋巴转移是食管癌最常见的转移方式,也是关系到食管癌患者预后的主要影响因素,因此正确判断淋巴结转移是肿瘤分期的重要组成部分,也是选择最优治疗方案的重要前提。

判别分析是一种分类诊断统计方法,是根据已掌握的一批明确分类的样本建立判别函数,再将待判样本的数据代入判别函数中,判别其类型,从而做出诊断。贝叶斯(Bayes)判别准则是根据先验概率并综合样本所具备的信息,寻求一种判别规则使得属于第K类的样品,在第K类中取得最大的后验概率,从而判断样品的分类。这种方法在自然科学及国民经济等许多领域应用甚广,近年来也被一些学者应用于疾病诊断,尤其是中医辨证分析中,但这种分类诊断方法在影像诊断中应用很少。

材料与方法

将本院2011年7月-2013年6月期间收治的208例有完整临床资料、并经根治性切除手术病理证实的胸段食管癌患者纳入研究。所有患者术前1周均行螺旋CT增强扫描,患者取仰卧位,扫描范围自下颈部或锁骨上水平至上腹部。扫描参数:120kV,80~150mAs,64i×0.625mm,螺距1.375,层厚5mm,重建层厚1.0mm,层间距0.8mm;经肘静脉快速注射非离子型对比剂60~100mL,注射流率2.0~3.0mL,注药后延迟30~35s开始扫描。

将扫描的原始数据进行图像后处理,采用多平面重组(multi-planar reformation,MPR),随后由两位影像科医师通过Carestream PACS Diagnostic Profile 5.3观察分析图像,测量并记录淋巴结的长径、短径、强化程度(淋巴结与同层肌肉CT值之比),观察淋巴结有无中央低密度、边缘模糊、是否成簇出现等CT征象,由一位高年资医师进行质控。

在208例患者资料中随机抽选166例(80%)作为实验组即训练样本,用以建立方程,其余42例(20%)作为检验组即验证样本,用以检验方程。

使用SPSS 17.0统计分析软件进行Bayes逐步判别分析,建议诊断模型,并用自身检验法、交叉验证法以及42例患者资料对其进行考核。

结 果

1.观察指标的测量结果

本组208例食管癌患者中共有1524枚淋巴结,其中转移淋巴结270枚。实验组中共1217枚淋巴结,转移淋巴结214枚;检验组中307枚,转移淋巴结56枚,患者的其它观察指标见表1。

表1 患者资料描述

2.筛选并建立判别函数

将以上各项数据进行逐步判别分析(分类变量赋值化:0为特征阴性,1为特征阳性),筛选出淋巴结最大短径、最大长径、横纵比、最大截面积、有无中央低密度、有无边缘模糊、是否成簇分布这7项变量纳入方程,先验概率因未获得相关历史资料而取等概率[2-3]。计算后获得诊断方程的函数系数,并以此建立Bayes判别函数:非转移组为Y0=-7.499X1+7.957X2+167.761X3-0.087X4+0.459X5-5.528X6-0.711X7-66.080;转移组为Y1=-6.697X1+8.231X2+181.686X3-0.106X4+2.219X5-3.331X6-0.124X7-83.183。其中,X1为淋巴结最大短径,X2为淋巴结最大长径,X3为横纵比,X4为最大截面积,X5为是否边缘模糊,X6为是否中央低密度,X7为是否成簇分布。

3.判别函数的结果及检验

采用自身检验法及交叉验证法来检验判别函数模型的诊断能力,结果见表2。

表2 Bayes诊断模型检验结果 (枚)

再将检验组42例(20%)患者共307枚淋巴结的数据代入诊断模型以验证模型的诊断能力,结果见表3。

表3 检验组数据对诊断模型的验证结果 (枚)

讨 论

传统的影像诊断主要凭借个人知识经验加以综合分析推理,因此准确性很大程度上依赖于诊断医师的知识结构和医学经验,即使面对相同的信息,不同的医生也很有可能得到不同的诊断。而Bayes判别分析的优势恰恰弥补了传统影像诊断的不足,将医师的经验半定量化,将检查报告中给出的"可能性大"量化为发生的概率,从而降低医生在诊断过程中的主观性,使诊断结果更加客观准确,文献报道利用Bayes判别分析建立的诊断模型有助于提高不同医师乃至不同医疗机构间的诊断一致性[4],陈伟等[5]的研究结果亦证实,利用这一方法建立的诊断模型与高年资医师的诊断符合率相当,并明显高于经验欠缺的低年资医师。

本研究通过对以往影像学资料的归纳处理,并综合多位学者提出的诊断食管癌淋巴结转移的CT征象,即淋巴结最大短径、最大长径、横纵比、最大截面积、强化程度、有无中央低密度、有无边缘模糊、是否成簇分布,利用Bayes逐步判别分析筛选变量:除强化程度外,上述7项变量均可选入用以建立诊断方程。利用Bayes判别分析法建立诊断模型,非转移组为Y0=-7.499X1+7.957X2+167.761X3-0.087X4+0.459X5-5.528X6-0.711X7-66.080;转 移 组 为Y1=-6.697X1+8.231X2+181.686X3-0.106X4+2.219X5-3.331X6-0.124X7-83.183。其中,X1为淋巴结最大短径,X2为淋巴结最大长径,X3为横纵比,X4为最大截面积,X5为是否边缘模糊,X6为是否中央低密度,X7为是否成簇分布。对上述检验模型进行验证,结果显示全部1217枚淋巴结,对1003枚非转移淋巴结共判对898枚,正确率为89.5%(即特异度);214枚转移淋巴结中,判对169枚,正确率为79.0%(即敏感度),诊断模型的诊断符合率为87.7%,共误判150枚,误判率为12.3%。交叉检验法与自身检验法所得结果相近。

由于自身检验法及交叉验证法常常低估误判率,从而夸大判别效果,因此我们采用验证样本对诊断模型作前瞻性误判概率的估计,这种方法所得的误判概率比较客观。非转移淋巴结组共251枚淋巴结,判对223枚,正确率为88.8%(即特异度);转移淋巴结组共56枚,判对37枚,正确率为66.1%(即敏感度);模型诊断符合率为84.7%,共误判47枚,误判率为15.3%,与上述两种检验法所得结果相近,且未超过20%,说明该诊断模型具有临床应用价值[4]。

本研究的不足之处是采用验证样本所得出的诊断模型的诊断敏感度偏低,分析可能的原因:①验证样本中的转移淋巴结数量较少造成误差较大;②本组病例均为可进行食管癌根治手术的患者,肿瘤处于早中期,可能造成一定的数据偏倚;③诊断模型中分类变量所占比例较大,而分类变量不同于连续变量,且一定程度上受到判断者的主观因素影响,可能也是造成数据偏倚的原因之一;④分类变量所对应的CT征象尽管对食管癌淋巴结转移的诊断有一定价值,并证明具有统计学意义,但在样本中出现概率较小;⑤部分征象,如在癌灶旁的淋巴结常因与病灶重叠分界不清而出现“边缘模糊”征象,再如隆突下淋巴结常常呈现为“成簇分布”,而食管癌患者在这一区域的淋巴结却很少被证实为转移,这些都可能导致误判。

通过Bayes判别分析法所建立的不同CT征象对食管癌淋巴结转移的联合诊断模型具有一定的诊断价值(可以量化诊断,减少人为及经验误差)。但本文仅仅是对此的初步探索,由于本组病例包含的转移与非转移淋巴结分类欠均衡,因此所得的诊断模型可能尚不具备广泛的代表性,若将其用于其他样本,诊断准确性可能存在一些偏差。目前理论上认为病例数越多,分析指标越细,判别函数的准确性越好,所以随着病例数的增加以及对各种影像学征象的进一步观测、分析,判别诊断模型将会得以进一步的完善。

[1]Pennathur A,Gibson MK,Jobe BA,et al.Oesophageal carcinoma[J].Lancet,2013,381(9864):400-412.

[2]孙振球,徐勇勇.医学统计学[M].北京:人民卫生出版社,2008:384-398.

[3]黄泽丰,谷凌雁.基于Bayes公式的医生辅助诊断系统研究[J].中国数字医学,2009,4(5):43-45.

[4]吴明祥,马捷,凌人男,等.基于判别分析模型的乳腺BI-RADS计算机辅助分类[J].放射学实践,2013,28(3):346-351.

[5]陈伟,刘进康,李文政,等.Bayes分析在孤立性肺结节CT诊断中的应用[J].实用放射学杂志,2009,25(5):646-743.

猜你喜欢

判别函数诊断模型检验法
Fisher判别法在个人信用风险评估中的应用
CD4细胞计数联合IGRA预测AIDS/Ⅲ型TB影像诊断模型分析
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
PCR 检验法和细菌培养法用于阴道细菌检验的效果
对于电站锅炉燃烧经济性诊断模型的研究
基于Fisher判别函数的酒店员工离职预警研究
关于协方差的U统计量检验法
阿基米德Copula函数的拟合检验
水准点稳定性F检验法与t检验法异同的研究