基于BEMD与随机森林算法的HIFU治疗无损测温方法
2019-01-05丁亚军钱盛友
郭 燕, 丁亚军,, 钱盛友, 陈 兴
(1. 湖南师范大学 信息科学与工程学院, 湖南 长沙 410081;2. 湖南师范大学 物理与电子科学学院, 湖南 长沙 410081)
高强度聚焦超声(High Intensity Focused Ultrasound, HIFU)治疗已成为临床医学中组织器官的恶性与良性实体肿瘤的非侵入性治疗方式. 其原理是将低能量的超声波聚焦在治疗区域, 聚焦产生的高能量使焦域局部组织瞬间凝固性坏死, 从而达到既不损伤正常组织又能消除病变组织的目的[1]. HIFU治疗过程中, 温度决定了组织消融的程度, 温度过低会导致病变组织残留, 温度过高会损伤正常组织, 因此温度的实时监控非常重要[2]. HIFU治疗的超声图像含有许多与温度相关的信息, 自2002年侯珍秀等人提出通过B超图像的灰度变化来估测热疗的温度变化以来, 许多HIFU测温的研究人员开始把目光投入了B超图像的无损测温方法. Zhang发现灰度-梯度共生矩阵的8个纹理参数, 尤其是小梯度优势、 混合熵和灰度均值与温度有着很好的线性相关性[3]. 盛磊发现灰度直方图中的灰度均值, 灰度共生矩阵中的熵以及灰度梯度共生矩阵中的混合熵、 逆差距、 相关等5个参数与组织温度间具有较高的线性相关性[4]. 李勇发现辐照前后差值图像离散Walsh变换的直流分量以及辐照前后图像的交叉熵均与温度成近似线性关系[5-6].
近些年来, 以概率和统计为基础的机器学习是人工智能中的热点研究问题, 在数据挖掘、 计算机视觉、 语音处理、 生物医学工程等方面有着十分广泛的应用[7].
本文从机器学习的角度, 提出一种基于BEMD与随机森林算法的HIFU治疗无损测温方法, 最终实现对温度的有效测量.
1 基本理论
1.1 随机森林
随机森林(Random Forest, RF)由Breiman L于2001年提出[8], 是一种兼顾运算效率和预测精度的机器学习模型. RF的“随机”体现在两方面: 样本的随机选取和特征的随机选取. 如被解释变量有k个样本值,m个特征值, 通过bootstrap抽样方法从原始数据中随机抽取n(n RF将多个弱分类器集成组合成一个强分类器, 从而避免了单分类器容易出现的过度拟合现象, 对异常值和噪声有很好的容忍度; 并且RF对多元共线性和非平衡的数据不敏感, 因此具有很高的预测准确率和稳定性以及极强的数据挖掘能力[10]. 经验模式分解(Empirical Mode Decomposition, EMD)是一种非线性、 非平稳性信号的处理方法, 能自适应地将信号分解为一系列的从高频到低频的IMF分量和一个余量, 此分解过程称为“筛分”. 自1998年Huang[11]等人提出一维EMD分解算法后, 2003年Nunes正式提出了可应用于二维数字图像处理的二维EMD(Bidimensional EMD, BEMD)分解算法. BEMD原理与一维EMD类似, 筛分过程为: 1) 初始化, 设二维图像信号为I(x,y),令R0(x,y)=I(x,y),m=1. 2) 提取第m个IMF分量IMFm: ①C1(x,y)=Rm-1(x,y); ② 查找出Cn(x,y)的局部极大值和局部极小值点, 选择合适的曲面插值方法得到由极大值点插值构成的上包络面Cmax和极小值点插值构成的下包络面Cmin. 得到平均包络面 ③Cn+1(x,y)=Cn(x,y)-Cmean(x,y),n=n+1; ④ 重复步骤②和③, 直到满足迭代终止条件:标准差SD小于0.3. 3)Rm(x,y)=Rm-1(x,y)-IMFm(x,y). 4)m=m+1, 重复步骤2)和3), 直到得到所要求的IMF数量M. 此时, 余量RES(x,y)=Rm-1(x,y). 最后二维图像被分解为若干个IMF分量和余量之和的形式, 计算公式为 实验系统由超声诊断系统和HIFU探头组成, 如图 1 所示. 将新鲜离体猪肉组织放置在HIFU探头正下方的吸声橡胶上, 由超声诊断仪获取B超图像后通过图像采集卡输入计算机. 启动HIFU, 收集每次HIFU辐照前后猪肉组织的B超图像以及热电偶测量得到的辐照后目标区域的瞬时温度. 记录9组实验的B超图像及其对应温度, 每组实验的温度测量范围为37~80 ℃. 图 1 实验系统Fig.1 Experiment system 对获得的B超图像截取以辐照焦点为中心的64*64像素部分作为实验数据进行处理. 为了减小实验环境和不同猪肉组织之间的差异性对B超图像的影响, 在处理实验数据时先对B超图像与37 ℃图像做差, 得到减影图像, 如图2(c)所示. 图 2 64×64 HIFU焦域处超声图像及减影图像Fig.2 64 × 64 HIFU image around focus and subtraction image 众多已有研究发现了B超图像的一些特征参数与温度的近似线性相关性, 其中灰度均值与温度有着较好的线性相关性, 是能够良好表征猪肉组织B超图像温度的参数之一. 9组B超减影图像的灰度均值分别与温度通过最小二乘法线性拟合得到的每组确定系数及均方根误差如表 1 所示. 虽然每组灰度均值与温度呈现较好的线性相关性, 但是由于猪肉组织样本的差异性, 不同组B超图像的灰度均值与温度关 图 3 9组灰度均值与温度的线性拟合结果Fig.3 The linear fitting between average gray and temperature of 9 groups 系的拟合直线有所差别, 不具有代表性. 于是我们利用9组B超图像灰度均值与温度线性拟合得到关于灰度均值的温度估计线性回归方程, 回归方程直线如图 3 所示, 回归方程确定系数及估测温度与热电偶测量温度均方根误差如表1所示. 此回归方程预测B超图像温度的均方根误差为5.259 ℃, 误差较大, 难以实现温度的准确预测. 由图 3 可知, 随着温度的升高, 灰度均值开始发散, 尤其到了55 ℃左右, 组织开始消融, 蛋白质发生变性后, 灰度均值与温度的线性关系更不明显, 使得温度估计方程误差变大. 因此难以用一个确切的线性函数模型来描述温度与灰度均值的关系并进行预测. 对于这样的一个非线性关系, 更适合用一个非线性模型来预测温度. 表 1 9组数据线性拟合确定系数及均方根误差的比较 随机森林算法作为机器学习算法中的一种, 它对复杂的非线性系统有着较强的适应能力, 是一种能够有效地解决多变量预测效果的非线性建模工具. SVM(Support Vector Machine)同样作为一种非线性建模工具, 拥有很强的非线性处理能力[12], 能以较高的精度逼近非线性连续函数. 为了体现本文方法的有效性和优势, 采用SVM模型与RF模型作对比. 将这9组B超减影图像作为样本数据D, 共125个样本. 从中随机选取89个样本数据进行训练, 36个样本用于测试. 提取减影图像的灰度均值作为解释变量分别输入到RF模型和SVM模型进行训练与测试. 得到测试样本的预测温度与热电偶测量温度的均方根误差如表 2 所示. 可以看出, 通过RF模型和SVM模型测温的均方根误差均低于通过灰度均值建立的温度估计线性回归方程. 且RF模型测温效果优于SVM模型, 预测效果更好. 表 2 4种测温方法误差比较 本文通过BEMD方法对猪肉组织的减影图像进行2级分解, 分解为两个IMF分量和一个余量. 在BEMD分解之前, 先对得到的减影图像采用镜像延拓方法来克服BEMD的边界效应, 分别向上、 向下延拓60行像素, 向左、 向右延拓60列像素. 如图 4(a)~(c)分别为焦域处于70 ℃时的减影图像的IMF1,IMF2和余量图像. 其中, 极值点的选取采用的是4邻域比较法, 插值方法是delaunay三角剖分插值. 提取样本数据D经BEMD分解后的两层IMF分量和余量图像的灰度均值, 并作为3个解释变量分别输入RF模型和SVM模型, 训练与测试样本仍为之前随机选取的89个与36个样本. 测试样本的预测温度与热电偶测量温度的均方根误差如表 2 所示. 由于BEMD方法所得的若干个IMF分量可以使灰度均值自适应地在不同的分辨率下显示出来, 非常有利于非线性非平稳信号的分析处理. 通过BEMD多尺度多分辨率的表达, 提髙了灰度均值这一特征参数描述B超图像非平稳特性的能力, 使其描述B超图像温度更为准确. 因此, BEMD-RF测温方法有着较宽的噪声影响的适应性及样本差异的兼容性, 测温优势更大. 由表 2 也可以看出, BEMD-SVM模型和BEMD-RF模型测温误差均低于SVM模型和RF模型,其中BEMD-RF模型预测精度最高, 测温效果最好. 图 4 减影图像经过BEMD分解后的各分量图像Fig.4 The components of the subtraction image decomposed by BEMD 对于测试样本, 未使用BEMD方法的RF模型的预测温度与热电偶测量温度对比如图 5(a) 所示, BEMD-RF模型的预测温度与热电偶测量温度对比如图 5(b)所示, 两种测温方法误差如图 6 所示. BEMD-RF模型整体误差较小, 在75 ℃以下绝对误差在3 ℃以内, 75 ℃以上误差变大. 图 5 预测温度和热电偶测量温度对比Fig.5 The comparison between the predicted temperature and the actual temperature 图 6 测温误差分析Fig.6 Error analysis of temperature measurement 本研究采用基于BEMD与随机森林算法的B超图像测温方法, 通过机器学习的方法构建测温的随机森林模型进行HIFU治疗无损测温, 突破了以往从寻找线性关系的角度探索温度与B超图像灰度均值关系的研究. 文中引入了SVM模型进行测温, 对比发现RF模型的测温结果要优于SVM模型, 表明RF模型在HIFU治疗无损测温中的应用具有比较明显的优势, 数据挖掘能力更强. 同时通过BEMD多尺度多分辨率表达后的各分量灰度均值输入RF模型预测得到的温度更为准确. 因此BEMD-RF测温方法测温效果更好, 精确度更高, 为HIFU无损测温提供了一种有效的新思路. 在75 ℃以下时, 该测温方法测温误差小于3 ℃, 75 ℃以上误差变大.1.2 二维EMD
2 无创测温实验
2.1 实验系统与实验方案
2.2 实验数据预处理
3 灰度均值与温度关系分析
4 随机森林无损测温方法
4.1 随机森林测温模型
4.2 基于BEMD的随机森林测温模型
5 结 论