运用人工神经网络技术结合穴位敏化理论探索慢性稳定性心绞痛疾病辅助预测模型的构建思路*
2021-04-10温川飙张艺凡
高 原,杨 娇,赵 凌,温川飙,张艺凡,罗 悦**
(1. 成都中医药大学医学信息工程学院 成都 611137;2. 成都中医药大学针灸推拿学院 成都 611137;3. 成都市第一人民医院 成都 610016)
1 引言
发表于Nature Reviews Cardiology的文章指出“急性冠脉疾病主要是由于斑块破裂和血栓引起,而侵入性诊断手段具有造成斑块破裂的风险,这为冠心病的无创检测提供了独特的机会”[1]。慢性稳定性心绞痛(Chronic Stable Angina,CSA)是指由心肌缺血缺氧引起的典型心绞痛发作,其主要表现为在1-3 个月内心绞痛发作的频率、程度、诱发及缓解因素相对稳定的冠心病类型,也是严重危害人类健康的主要心血管疾病。目前冠心病诊断的“金标准”仍是冠状动脉造影和血管内皮超声,但其皆为有创性检查,且可能具有造影剂过敏、肾毒性、心律失常等副作用[2]。最新的《冠心病合理用药指南》(2018版)[3]指出冠脉造影临床上主要应用于危险分层较高的患者,而对高危患者则慎用(高危检查),这严格限制了适用的人群,在临床上并不做常规推荐;其检测成本较高,加重了患者的经济负担。因此,探索建立一种无创、安全、简便、低成本的CSA 疾病辅助诊断方法,弥补当前冠状动脉造影检测的局限性将具有良好的临床运用价值。
人工神经网络(Artificial Neural Network,ANN)是由大量处理单元(或称“神经元”)在系统内部广泛互连而成的可训练网络,是在现代神经科学研究成果的基础上提出的能模拟人脑智能和形象思维能力的一条重要途径和方法[4]。ANN 通过模拟人脑神经系统的组织方式来构成的非线性自适应信息处理系统,具有强大的学习和自我组织能力,是现代信息技术的研究热点。基于ANN 的模式分类,已经实现了各类复杂问题的分类应用,如图像分类[5]、自然语言处理[6]、语音识别等[7]。在医学领域,尚宇等[8]采用误差反向传播网络(Back Propagation,BP)及其改进算法,实现了对HRV信号的初步识别。王振飞等[9]提出了1 种自适应模块化神经网络结构模型(AMNN)用来预测心血管疾病的方法。实验结果表明,该模型相对标准的随机森林算法预测疾病准确率高、收敛速率快。安莹等[10]提出1种基于电子病历数据挖掘的心血管疾病风险预测模型,该模型利用循环神经网络等技术对患者的历史电子病历数据进行表征学习,不仅能有效捕获电子病历数据中的时序特征,而且其特征工程无需人工干预。叶学松等[11]基于整周期心音信号小波分析提取冠状动脉疾病心音特征,并将CAD 病人组及非冠心病对照组提取的心音特征结合人体的个体特征参数输入到神经网络进行学习,最后实现冠状动脉疾病的智能化诊断。徐冠等[12]提出了1 种基于优化算法的神经网络智能诊断系统,即首先采用LM 算法对网络进行训练,然后通过黄金分割优选法对网络隐含层节点数进行优选。
综上可见,ANN 技术为包括冠心病在内的多种心脏疾病辅助诊断提供了新思路。本文以ANN 技术为技术基础,同时以中医经络腧穴理论(穴位敏化)为理论基础,提出了1种CSA疾病辅助预测模型构建思路。
1 技术基础——ANN技术
1.1 ANN技术的概述与基本原理
人工智能技术是当前国内外信息技术领域的研究热点。广义上讲,人工智能技术包括传统机器学习技术与ANN 技术。相较于以统计学理论为基础的传统机器学习技术[13](如支持向量机、贝叶斯网络、决策树),ANN 技术基于仿生学理论,该技术通过模拟大脑神经元的感知方式,能更加逼近人类真实的思维活动,特别是随着网络深度的增加,ANN 表现出了强大的特征提取能力[14]。由于连接方式的不同,典型的神经网络可分为多层感知器神经网络(MLP)、卷积神经网络(CNN)、循环递归神经网络(RNN)等[15-17]。从结构上讲,ANN 由大量的神经元组合而成,各神经元之间通过带可变权重的有向弧连接。网络通过对已知样本数据反复学习训练,逐步调整神经元连接权重,达到信息处理目的[18]。
1.2 ANN技术的特点
真实世界中,很多事务之间都存在着特定的高维多阶复杂映射关系,而ANN 提供了一种基于样本驱动的方式拟合高维多阶复杂映射函数的通用方法。该方法使计算机具有极好的数据处理能力和自我组织学习能力,能在大量样本集训练和学习后自动找出运算需要的参数和模式,最终实现模式分类[19]。神经网络通过不断自我学习和修正,最终拟合出以特定事务为输入、特定事务为输出的高维多阶复杂映射函数[20]。
2 理论基础——中医经络腧穴理论
2.1 穴位诊断与穴位敏化
穴位是动态的,其开合状态和功能强弱与内脏功能变化密切相关。腧穴是人体脏腑经络气血输注出入的特殊部位,具有反映病症、协助诊断的双重作用。《灵枢·九针十二原》篇云:“五脏有六腑,六腑有十二原……明知其原,睹其应,而知五脏之害矣。”可见,当脏腑发生病变时,就会在相应的穴位上出现可感知的异常反应(压痛、硬结、感觉敏感、色素沉着、温度变化等)。例如,《灵枢·背腧》篇亦云:“欲得而验之,按其处,应在中而痛解,乃其腧也。”指出背俞穴往往是内脏疾患的病理反应点,通过体表按压可进行精准定位。临床上也常根据腧穴和脏腑的相关性,通过观察腧穴的色泽、寒温、结节、皮疹、压痛、肿胀、凹陷、血络浮沉等异常变化现象来判断疾病的病变脏腑等。
穴位敏化是指在疾病状态下患者体表特定区域发生了感觉异常,使得其对各种刺激敏感度增加。研究发现[21]敏化穴局部出现肥大细胞聚集数量和脱颗粒及其局部P物质(P-substance,SP)的表达增加等变化,这可能是穴位出现敏化现象的生物学基础。研究发现[22-24]随着脏腑功能的变化,穴位功能从相对“沉寂”状态向相对“激活”状态转化。在病理情况下,即穴位“激活”状态时,通过经络相连和对应的某些穴位出现体表感受野扩大以及形敏、热敏、痛敏、电敏等敏化现象,穴位的功能强弱和范围大小发生变化。当内在脏腑发生病变后,可在本脏腑相关腧穴上出现阳性反应,如腧穴表面络脉色泽变化、压痛、皮下结节、皮肤隆起、凹陷,以及皮肤电阻变化等穴位敏化现象。研究发现[25-28]脏腑发生病变时,相关腧穴可能出现感受野扩大、痛敏、热敏等多种形式的敏化现象。传统中医理论认为经穴能够反映病情,能够用于疾病辅助诊断,腧穴诊断是中医诊断的重要特色,敏化腧穴在脏腑病的诊断过程中发挥了重要作用。
图1 CSA患者与健康人群穴位压痛阈值和温度值差异对比
2.2 CSA疾病是穴位敏化良好载体
CSA 是临床常见病、多发病,具有明确的体表-脏腑关联性,是探索脏腑病穴位敏化特异性规律的良好载体。国内学者研究[29-31]发现:冠心病心肌缺血缺氧病理状态下,在神门、大陵等特定穴体表可出现皮肤色泽、痛敏、热敏、红外辐射改变,其中神门敏化发生率达到52.8%,大陵高达54%。盖国才等[32]对48 例冠心病病人进行临床压诊的诊疗过程中,发现93%左右的冠心病病人,左手少阴心经的灵道穴,有明显压痛反应。施静等[33]通过观察1000 余例心绞痛患者体表压痛点发现,左胸部及左上肢尺侧,类似心经、心包经循行部位压痛点出现比例最高。由上述可见,脏腑发生病变时,相关腧穴可能出现感受野扩大、痛敏、热敏等多种形式的敏化现象。
根据2018 年《苏格兰校际指南网络》(Scottish Intercollegiate Guidelines Network, SIGN)中对 CSA 患者管理指南,心绞痛发作最常发生在胸骨后区或左侧胸部,并可辐射至左臂和背部[34],这些部位与中医心经、心包经、膀胱经的循行一致,这些经络的循行都与CSA 疾病密切相关。基于此,课题组选择左胸、左臂内侧和背部3 个区域常见穴位,同时结合前期相关文献[35-37],最终筛选确定出12个最常用穴位:极泉、神门、阴郄、少海、内关、郄门、曲泽、膻中、巨阙、厥阴俞、心俞、督俞。同时采集多中心的CSA 患者“痛敏,热敏”样本数据,其中使用Wagner压痛仪进行压痛阈值的标准化检测与采集,使用Fotric 全平台热像仪进行温度值的标准化检测与采集。图1 与表1 分别描述了317例CSA患者和200例健康人群穴位压痛阈值和温度值的统计学结果。
现代针灸临床研究已发现大量的穴位敏化现象[38-43],至今已有100多种循环、呼吸、消化等系统的器质和功能性病变被观察到痛敏、热敏、形敏、电敏等形式的敏化穴位。通过对图1 与表1 的分析,CSA 患者和健康人群具有明显的压痛阈和温度差异,说明CSA患者具有显著的穴位敏化现象,这为穴位敏化理论用于CSA 疾病的辅助预测提供了理论支撑。基于此,本文提出一种基于ANN 技术结合穴位敏化理论构建CSA疾病辅助预测模型的思路和方法。
3 ANN 技术结合穴位敏化数据构建CSA 疾病辅助预测模型的思路和方法
ANN 技术结合穴位敏化数据构建CSA 疾病辅助预测模型的研究思路和方法如框图2所示,包括数据采集和模型构建。
3.1 数据采集
高质量的数据样本是构建CSA 疾病辅助预测模型的前提。在构建数据集的过程中,首先需明确CSA人群和健康人群的纳入标准和排除标准,具体参考2007 年联合颁布的《慢性稳定型心绞痛指南》以及中国心血管相关专家小组2010年颁布的《慢性稳定性冠心病管理中国共识》。同时根据确定的优势穴位,完成对目标人群的“热敏、形敏、痛敏、电敏”的数字化信息采集,需要强调的是采集过程中要严格数据采集标准和规范数据,制定CSA 穴位敏化的临床操作方案。其中采用Fotric 全平台热像仪采集穴位热敏特征数据,采用形态学检测方法记录穴位形敏特征数据,采用Wagner压痛仪采集穴位压痛特征数据,采用穴位阻抗测定仪采集穴位电敏特征数据。
表1 CSA患者与健康人群穴位压痛及温度敏化比较统计
图2 ANN技术结合穴位敏化数据构建CSA疾病辅助预测模型逻辑图
最后需对采集到的数据进行预处理、清洗、降维等,分类建立CSA 人群和健康人群数据集。具体包括:去除内容不完整、有误的数据并进行数据脱敏;基于AUC(Area Under the Curve)曲线明确形态学检测值、体表感觉检测值和皮肤电阻值的最佳判定点(Cut-off point);基于聚类分析、主成分分析等方法对原始数据进行降维,初步筛选穴位敏化表征下的CSA关键指标。最终对形敏、痛敏、热敏、电敏等不同模态数据作归一化处理,建立包含健康人群与CSA 人群的穴位痛敏、热敏、形敏、电敏等特征大数据集。
3.2 模型构建
图3 模型网络示例
合适的算法网络是构建CSA 疾病预测模型的关键。首先基于多层感知器、卷积神经网络等基础网络类型搭建项目所需的网络结构(模型网络示例如图3所示),同时尝试对不同的网络类型、不同的网络深度(即隐含层或卷积层、池化层数目)、不同的神经元数目进行组合。其次将样本数据分为训练集与验证集,把穴位敏化特征数据作为输入,诊断结果作为输出,采用有监督学习算法进行训练。训练由信号的正向传播和误差的反向传播两个过程组成,正向传播算法即输入向量通过若干个权值矩阵与若干偏重向量进行一系列线性运算和激活运算,从输入层开始,一层层向后计算,一直运算到输出层,最终得到输出向量。反向传播算法即通过链式法则逐层求出损失函数对各层权值(或偏重)的偏导数,构成损失函数对权值(或偏重)的梯度,然后通过优化方法对权值(或偏重)进行修改。整个训练过程涉及到sigmoid、tanh、relu 等激活函数的选择,交叉熵、均方差等损失函数的选择,BGD、MBGD、Adagrad 等优化方法的选择,正则化、Dropout 等防止过拟合方案的选择,以及学习率、批量大小、正则项系数等超参数的选择。
最后需对完成的模型进行评价。CSA 疾病辅助预测模型为二分类模型,输出结果为CSA(是)和健康(否),评价指标选择精准率、召回率、F1-score、ROC 曲线等。同时基于上述评价结果对网络结构、超参数等进行反复优化或组合,最终得到表现最佳的模型作为CSA 疾病辅助预测模型。假定构建的模型性能表现优秀,则能够实现基于穴位敏化表征的CSA 疾病辅助预测。
4 结语
本文以穴位敏化和中医腧穴诊断为理论基础,选取穴位敏化特征有明显差异的CSA 疾病为研究载体,结合目前信息技术领域研究热点ANN 技术,探索构建CSA 疾病辅助预测模型,提出一个新的无创、安全、低成本的辅助检查方法。该方法促进和丰富了针灸经络诊断理论的现代研究和临床运用,亦为针灸学科的穴位敏化理论和计算机学科的ANN 技术的学科交叉提供了思路。目前CSA 疾病的诊断虽已有“金标准”,但存在的负面效应给本文提出以ANN 技术构建慢性稳定性心绞痛疾的穴位敏化辅助预测模型提供了机会。但该模型在构建过程还需充分考虑到ANN 的技术要求,如:构建的数据集要具有足够的学习样本;数据采集要求具有统一的方法和标准;学习样本要具有可靠的数据质量;模型训练过程中注意避免出现欠拟合和过拟合;模型推理过程中保证足够的推理性能等。