基于模式识别的人体肺癌电阻抗检测方法研究
2014-05-08陈晓艳赵秋红
陈晓艳,赵秋红
(天津科技大学电子信息与自动化学院,天津 300222)
肺癌发病率及病死率居全球癌症首位,已成为威胁人类健康和癌症死亡的主要病因之一.据统计,肺癌 5年生存率为 13%~15%,早期诊断率仅 15%,因此对肺癌患者早发现、早诊断、早治疗,以减少肺癌晚期转移与恶化的可能性是非常重要的[1].目前,肺癌早期诊断方法主要有:影像学检查、肿瘤标志物检查、痰液涂片脱落细胞检查、支气管镜检查、胸腔镜和纵隔镜等[2],痰液涂片脱落细胞检查是确诊肺癌的最简便手段,但受多种因素的影响,其阳性率较低,不作为早期肺癌的检查手段;支气管镜能直接观察病变形态特征以及支气管狭窄情况,但是会对气管造成物理伤害;影像学检查是诊断肿瘤最重要的方法之一,包括 X 射线、CT、MRI、PET、EIT 等.通过这些影像学检查可以获取癌变的准确位置和大小,但在肺癌早期尚未形成结节之前,现有影像技术并不能预警病变,并且频繁使用会对人体造成更大的伤害.因此,临床需要无创监测肺癌早期病变的新方法和新技术.
电阻抗对病变较敏感,组织或器官在尚未形成结构性结节之前,其阻抗就已经发生了变化,通过测量组织或器官的电阻抗,可以对肺癌早期进行筛查,起到预警作用;而且电阻抗测量具有无毒素、无射线、无损伤等突出优势,是一种理想的、具有诱人应用前景的无损医学检测手段[3–4].目前,国内外关于电阻抗进行癌症组织的辨识方法研究尚少,国内开展人体活性组织介电特性与表征方法研究的有第四军医大学,其研究侧重乳腺与脑出血病变[5–6],宁波大学马青教授研究了动物及人血液细胞的阻抗谱分析方法[7–8];天津大学王化祥教授研究小组进行肺部活性组织介电特性与表征方法研究,已发表 1篇阻抗测量结果[9],但均未采用模式识别方法对病变组织进行辨识.
本文根据阻抗频谱理论及模式识别理论,对手术中切除的恶性肿瘤组织及非肿瘤组织进行阻抗测量和辨识,研究内容属于初期探索.
1 原理与方法
1.1 阻抗特征参数
根据 Cole-Cole理论,生物阻抗可等效为内、外电阻和膜电容生物阻抗模型[10]
式中:特征参数0R为低频电阻的极限值;R∞为高频电阻的极限值;α为松弛因子;τ为时间常数;ω为
角频率.用于计算生物阻抗特征参数的 Cole-Cole阻抗圆模型见图1.其中:(x0,y0)为圆弧的圆心坐标;r
为圆弧的半径.
图1 Cole-Cole阻抗圆Fig.1 Cole-Cole plots
阻抗特征参数的计算公式如下:
这里采用最小二乘法拟合曲线,使目标函数 F最小.
1.2 模式识别
模式识别诞生于20世纪20年代,至今已有很多种模式识别分类方法[11–12].由于统计模式识别方法比较成熟,能够考虑干扰噪声等影响,识别模式基元能力强,所以对统计模式识别法中的线性分类方法,即LMSE算法和Fisher算法进行了研究.
1.2.1 LMSE算法
LMSE算法是对准则函数引进最小均方误差这一条件而建立起来的,适用于线性可分的情况,其把对满足XW>0的求解改为对满足 =XW B的求解.LMSE算法的出发点就是选择一个准则函数使其达到极小值时,可以得到 =XW B的最小二乘近似解[13–14].算法的实现步骤如下:
(5)循环执行步骤(2),直到属于iω类的所有样本都满足
1.2.2 Fisher算法
Fisher准则[15]的基本原理是:找到一个最合适的投影轴,使两类样本在该轴上投影之间的距离尽可能远,而每一类样本的投影尽可能紧凑,从而使分类效果为最佳.算法的实现步骤如下:
(1)计算各类样本的均值向量
其中,in表示iω类的样本个数.
(2)计算样本类内离散度矩阵iS和总类内离散度矩阵wS.
(3)计算类间离散度矩阵bS.
(4)若希望投影后,在一维空间里各类样本尽可能地分开,也就是两类样本均值之差越大越好,同时希望各类样本内部尽量密集,即希望类内离散度越小越好.因此,定义Fisher准则函数为
使得 ()JW 取得最大值的*W为
式中,W*是样本投影到投影线上的投影向量.
(5)将训练集内所有样本进行投影.
(6)计算在投影空间上的分割阈值0Y.
投影后,各类样本均值
(7)根据决策规则分类
2 实 验
实验数据均来自天津医科大学总医院肺外科手术室,样本离体时间均不超过 30,min.采集仪器是Aglient4294A 阻抗分析仪,夹具是 16092A,测试舱内的温度为 37,℃,相对湿度为 90%以上.获取的待测样本经过修剪后放入标本测试盒,采用二电极法,在100,Hz~100,MHz范围内,取成对数递增的31个频率点测量样本的阻抗谱.
临床获取的所有样本均做了病理切片,临床医生根据切片进行病理分析,确诊是否为恶性肿瘤组织,并判断恶性肿瘤类型.根据医生诊断结果,选取 123个训练样本,其余162个作为测试样本.在4个参数R0、R∞、τ、α中任选 2个作为模式识别的特征参数,共有 6种组合方式,分别是(0R ,R∞)、(R∞,τ)、(τ,α)、(0R ,α)、(0R ,τ)、(R∞,α).由于 LMSE算法以及Fisher算法属于线性分类算法,对于线性不可分的情况不适用.(R∞,α)、(τ,α)、(R∞,τ)这3种组合的样本均属于线性不可分的情况,因此2种算法对此都不适用.实验表明,对于(0R,α),2种算法虽能适用,却得不到辨识结果.
2.1 LMSE算法识别结果
采用 LMSE 算法对(0R,R∞)和(0R,τ)进行辨识,结果如下:
(1)当输入量是(0R,R∞)时,分界线为
判别函数为
123个训练样本及从待测试样本中随机选取 23个样本的分布及模式识别结果如图2所示.
图2 (0R ,R∞)的LMSE识别结果Fig.2 Results of(0R ,R∞ )identified by LMSE
(2)当输入量为(0R,τ)时,分界线为判别函数为
123个训练样本及23个测试样本的分布及模式识别结果如图3所示.
图3 (0R ,τ)的LMSE识别结果Fig.3 Results of(0R ,τ)identified by LMSE
2.2 Fisher算法识别结果
采用 Fisher算法对(0R,R∞)进行辨识,结果
如下:
则投影线为
式中:w为投影向量;1w为正常样本;2w为肿瘤样本.采用式(13)计算在投影空间上的分割阈值,计算过程中的各参数值见表1.
表1 阈值0y的各参数意义及其数值Tab.1 The parameters and their values of threshold0y
123个训练样本分布及对23个测试样本进行模式识别的结果如图4所示.
图4 (R0,R∞)的Fisher识别结果Fig.4 Results of(R0 ,R∞ )identified by Fisher
采用同样的方法对(0R,τ)进行投影计算,得不到正确的投影线和分界线,所以无法辨识.
3 结 语
在 LMSE和 Fisher此 2种模式识别中,训练样本量相同,即61个恶性肿瘤组织,62个非肿瘤组织,共计 123个.为了突出辨识效果,从测试样本中随机选用 16个恶性肿瘤组织,7个非肿瘤组织,共计 23个.图2—图4的识别结果表明:测试集23个数据中有 7个数据属于非肿瘤组织,16个数据属于恶性肿瘤组织,与病理分析结果完全一致.
在实际测试中,对更多的(98个恶性肿瘤组织和64个非肿瘤组织)样本进行识别,除经过初步筛选剔除掉的3种情况(第1种为术前进行过化疗;第2种为测试样本在测试盒中未充分填充;第3种为测试样本的血液含量过多)外,辨识结果与病理分析结果仍是高度一致.
由于临床无法获得已发生癌变但尚未形成器质性结节的组织,所以本研究中的恶性肿瘤样本仅局限于已经形成器质性结节的组织.研究结果表明,利用LMSE以及 Fisher算法对术旁切除恶性肿瘤组织及非肿瘤组织能够获得良好的分类结果,为下一步更加细化研究癌变过程中组织的阻抗变化奠定了基础.在今后的研究中,可以通过动物实验实现在体培养肿瘤,分阶段测量组织阻抗,以获得早期病变阻抗信息,探寻阻抗变化与病理变化之间的对应关系,以期对肿瘤的早预防、早诊断、早治疗提供一种新的检测方法.
[1] 宁康,王超. 肺癌早期诊断方法研究进展[J]. 山东医药,2010,50(21):108–110.
[2] 王玉新. 11例肺炎型肺癌的误诊及其影像学特点分析[J]. 临床肺科杂志,2013,18(1):166–167.
[3] 董秀珍. 生物电阻抗成像研究的现状与挑战[J]. 中国生物医学工程学报,2008,27(5):641–643,649.
[4] Kao T J,Boverman G,Kim B S,et al. Regional admittivity spectra with tomosynthesis images for breast cancer detection:Preliminary patient study[J]. IEEE Transactions on Medical Imaging,2008,27(12):1762–1768.
[5] 付峰,臧益民,董秀珍,等. 部分离体动物组织复阻抗频率特性(100,Hz~10,MHz)测量系统及初步测量结果[J]. 第四军医大学学报,1999,20(3):220–222.
[6] 季振宇,史学涛,尤富生,等. 电阻抗扫描成像乳腺癌早期检测设备研制及初步评估[C]//中国科协第十四届年会第十七分会场环境危害与健康防护研讨会论文集. 北京:中国生物医学工程学会,2012:169–172.
[7] 陈晓敏,丰明俊,王力,等. 10,kHz~100,MHz 人血液细胞介电性能[J]. 医学研究杂志,2009,38(3):42–45.
[8] 陈林,马青,王力,等. 大鼠红细胞悬浮液阻抗谱 Cole-Cole数学模型分析[J]. 航天医学与医学工程,2010,23(3):182–187.
[9] 王洁然,王化祥,徐晓. 人体肺部组织介电特性实验研究[J]. 中国生物医学工程学报,2013,32(2):178–183.
[10] Foster K R,Schwan H P. Dielectric properties of tissues and biological materials:A critical review[J]. Critical Reviews in Biomedical Engineering,1989,17(1):25–104.
[11] Satosi Watanabe. Pattern Recognition,Human and Mechanical[M]. New York:John Wiley & Sons,1985.
[12] 赵喜林,赵喜玲,江祥奎. 模式识别方法及其比较分析[J]. 信阳农业高等专科学校学报,2004,14(3):37–40.
[13] Yang Shuying,Zhang Cheng,Zhang Weiyu,et al. Unknown moving target detecting and tracking based on computer vision[C]//Proceedings of the 4,th International Conference on Image and Graphics. Piscataway:IEEE,2007:490–495.
[14] 胡国胜. 入侵检测的 Fisher、Bayes和 MSE 识别算法及等价性证明[J]. 计算机应用与软件,2012,29(4):293–296.
[15] 张新明,李振云,郑颖. 融合 Fisher准则和势函数的多阈值图像分割[J]. 计算机应用,2012,32(10):2843–2847.