基于深度神经网络的原发性肝癌证型诊断分类预测模型＊

2020-04-09章新友刘莉萍牛晓录郭永坤

世界科学技术-中医药现代化 2020年12期

丁亮，章新友＊＊，刘莉萍，牛晓录，郭永坤

（1. 江西中医药大学计算机学院南昌 330004；2. 江西中医药大学药学院南昌 330004）

原发性肝癌病（Primary Liver Cancer，PLC）是临床上特别常见的恶性肿瘤疾病之一，据最新数据报告显示，中国的原发性肝癌病的新增患者人数和死亡人数均居世界首位[1-4]，且发病率和死亡率呈逐年上升形势。因此，积极的预防原发性肝癌病的发生，提高原发性肝癌病的治疗效果是当下亟待解决的难题。当今对肝癌病的治疗均以手术治疗、放化疗、分子靶向药等现代化医疗手段结合为主[5-10]，但其临床效果却并不理想。近年来，有研究者发现，中西医结合治疗原发性肝癌病在临床上起到了意想不到的效果[11-15]。传统中医诊疗疾病方法均讲究的辨证论治，而“证”则是中医诊疗的核心内容，但是现行原发性肝癌病的中医辨证方法众多，证型分类不规范，中医症状、体征以及四诊信息等缺乏标准化，这些问题阻碍了原发性肝癌病治疗效果的提高。因此，为了更客观、更准确的反应疾病的特征，提高中医临床的辨证论治的准确性，本研究根据中医症状、体征和四诊信息等证型相关因子与证型之间的非线性关系，建立了深度神经网络证型诊断分类预测模型，旨在为临床诊疗提供相应的技术支撑，以提高中医证型分类的准确性和科学性。

1 研究对象

本文收集了2014 年1 月-2019 年6 月就诊于江西省中医院1176例肝癌病患者（首次就诊）的病历资料，其病历资料包含了中医症状、体征、舌象、脉象和治则治法等详细信息。其中976例将作为训练集，200例作为测试集，本文将依据训练集建立神经网络证型分类预测模型。

表1 976病历中证型相关因子（中医症状和体征）统计表

表2 976病历中证型相关因子（舌质、舌苔和脉象）统计表

2 研究方法

2.1 原发性肝癌证型的分类及证型相关因子的确定

为使该模型能对临床病历数据中的中医症状等信息进行有效分类，首先需要建立原发性肝癌的证型分类判定标准。因为模型的判定标准涉及到中医症状、体征以及四诊等信息数据，因此将上述数据统一命名为证型相关因子。

本文依据《中医诊断学》《中医症状鉴别诊断学》以及相关资料文献的基础上，结合中医专家经验，形成《原发性肝癌病中医症状调查表》，并对976 例原发性肝癌病患者进行证型相关因子（中医症状和体征）统计，共计96个，选取出现频次最多的前40个（表1），通过统计分析不难发现，除去慢性病患者常见的寐差、纳差、乏力之外，原发性肝癌病患者最常见临床表现为口干、口苦、腹胀、腹痛、胀痛和胁痛。再分析976例病历可知，舌质可分为淡红等；舌苔可分为薄白等；脉象可分为弦等（表2）。

本文以《新药（中药）治疗原发性肝癌临床研究指导原则》《原发性肝癌诊疗规范（2017 年版）》、卫生部“十二五”规划教材陈家旭邹小娟主编的《中医诊断学》和张伯礼和薛博瑜主编的《中医内科学》等[16-18]为主要依据，确定原发性肝癌的证型分类及证型相关因子（表3、图1）。

2.2 证型因子的量化

本文结合文献所记载的方法[19-21]，并采用模糊数学（Fuzzy mathematics）对四诊信息和中医症状进行量化处理。首先从收集的病历中得知，原发性肝癌的的辩证分型共有8 种，将这些证型分别记为L1,L2,L3,L4,L5,L6,L7,L8，其次再根据上文中对每个证型的主要的诊断标准，共统计出74 个证型因子，并将其分别命名为W1,W2,W3...W74，但同一证型的不同证型因子对该证型的影响程度是不同，所以本文采用专家赋值的方法对证型的证型因子进行权重评定（表4）。

以湿热蕴结证为例，其临床表现为：口苦W1，口干W2，恶心呕吐W3，腹胀W4，胸闷W5，小便少W6，色黄W7，大便秘结或便溏不爽W8，舌红W9，黄腻W10，脉弦滑W11按照上述方法邀请4 位从事中医学科的专家填写表4，得到以下4个评分矩阵：

表3 原发性肝癌证型的分类及证型相关因子统计表

图1 原发性肝癌证型占比图

表4 证型因子权重赋值评分表

再对所有专家评审的评分矩阵求和：

再求出加权平均评分矩阵：

算出的未归一化的权值按照λ= 0.5为标准，区分主要证型因子和次要证型因子，由此可知湿热蕴结证的主要证型因子：口苦W1，口干W2，小便少W6，大便秘结或便溏不爽W8，舌红W9，黄腻W10，脉弦滑W11。次要证型因子为：恶心呕吐W3，腹胀W4，胸闷W5，小便少W6，色黄W7。

然后对证型因子的权值进行归一化处理：

按照上述方法对各证型的证型因子逐一归一化处理，统计所得到的不同证型所对应的证型因子的权值。

每个证型因子的程度一般分为3 级分别是轻度（V1），中度（V2），重度（V3），本文将证型因子的量化级别命名为H(Wi)，主要证型因子量化赋值为2 分、4 分、6分，次要证型因子的赋值为1分、2分、3分（式1）：

若病历中没有描述程度，或者出现不属于辨证主要因素的证型因子（式2）：

最终通过上述模糊数学的方式处理，得到较为合理的中医证型因子的量化数据，再将这些量化后数据输入至深度神经网络证型分类预测模型中，为下一步建立该模型奠定数据基础。

2.3 深度神经网络证型分类预测模型构建

鉴于中医药数据大多为非线性的特点，而传统的数据挖掘算法更适合处理线性的、有序的或者逻辑关系强的数据集。因此，急需一个合适的非线性的建模方法去处理这些中医药数据[22-24]。而人工神经网络（Artificial Neural Network，ANN）可以充分逼近任意复杂的非线性关系，具有很强的鲁棒性和容错性，对处理非线性的中医药领域数据有得天独厚的优势[25-28]（图2）。针对中医药数据的非线性、多靶点、影响因素众多等特点，所以本文拟采用深度神经网络构建原发性肝癌证型分类预测模型。因为每一例病历内均有中医症状，舌质，舌苔和脉象等详细信息，所以本文决定由这4种证型因子（中医症状，舌质，舌苔和脉象）共同决定证型分类，其中输入层为4种证型因子（即中医症状体征、舌质、舌苔和脉象），建立2 层隐藏层，两层隐藏层的激活函数均为relu 函数，输出为8 种原发性肝癌证型（图3）。

2.4 关联规则验证

在数据挖掘中2个或多个变量之间会存在一定的关联性，而关联规则挖掘就是用来挖掘出数据之间隐藏的关系。在关联规则算法中，强关联规则的产生一般由支持度（Support）、置信度（Confidence）、提升度（Lift）3 个指标决定。支持度表示项集在总项集中出现概率，用来剔除频次较少的项集，而置信度则是在某事件发生前提下，该事件出现的概率的大小（即在含有X 的项集中，含有Y 的可能性），可以用来表示项集与项集之间的关系（式3、式4）：

图2 神经网络结构图

图3 深度神经网络结构图

本文参照《中医诊断学》和《中医内科学》对肝癌病中湿热蕴结证、肝郁脾虚证、气滞血瘀证、正虚瘀结证、肝气郁结证、肝肾阴虚证、痰瘀互结证和脾虚湿困证的判断标准进行模糊数学量化处理。再采用关联规则的方法[29，30]对976 例病历的量化数据进行挖掘分析，以此为据来判断教材中的判定标准是否适用于本文数据集，从而对模型的准确性起到一定的验证作用。

3 实验结果与分析

3.1 模糊数学量化处理结果

仿照湿热蕴结证证型因子的量化操作，依次对气滞血瘀证等进行量化（表5）。

3.2 深度神经网络分类预测模型结果

常见的模型的评价指标一般有3 种准确率（Accuracy）、精确率（Precision）、召回率（Recall），在分类问题中，一般分为2 类正例和负例，令TP 表示实际为正例同时预测也为正例的样本数，TN表示实际是负例同时预测也是负例的样本数，FP表示实际为负例但预测却是正例的样本数，FN表示实际为正例但预测却是负例的样本数。各个评价指标计算式（式5、式6、式7）如下所示：

表5 证型因子归一化数值表

①准确率：被正确预测（正例和负例）的样本数占总样本数的比重：

表6 深度神经网络与其他分类算法准确率对比分析表

②精确率：预测正例且实际也为正例的样本数占所有预测为正例的样本数的比重：

③召回率：预测正例且实际也为正例的样本数占所有实际为正例的样本数的比重：

在保证模型的稳定性和泛化性的前提下，通过对比分析不同的超参训练下的预测模型的情况，最终确定迭代次数epoch = 30，minnibatch = 32，为防止过拟合这一现象的出现，本模型参照文献所提出了提前终止测试集、L1和L2正则化加权、soft weight sharing 以及dropout 等方法，经过不断地调参和尝试，最终使用dropout=0.5，因为此时的dropout 的随机生成的网络结构最多，同时也能减少神经元之间复杂的共适应关系来防止过拟合的出现。并采用Adam 优化器替换传统随机梯度下降过程，提高模型的收敛速率，因其能基于训练数据迭代地更新深度神经网络的权重，更有利于提高模型分类的准确率和运算速率。在上述这些参数的条件下所得到的深度神经网络预测模型，并根据上文评价指标中的准确率计算公式，计算出每个证型所预测出来准确率的测试结果并与其他分类算法进行对比分析（表6、图4），观察图表不难发现，从模型预测的准确率来看深度神经网络预测模型相较于支持向量机和贝叶斯网络预测模型占据一定优势，尤其在湿热内蕴证、肝郁脾虚证、肝肾阴虚证和脾虚湿困证的模型预测的准确率均在90%以上，可以达到令人满意的分类结果，同时随着数据量的不断增加，深度神经网络的在原发性肝癌证型分类预测模型中的优势就越来越明显。

表7 频繁集与教材判定标准对比分析表

图4 深度神经网络与其他分类算法准确率比较

3.3 关联规则验证结果

在关联规则分析中，我们设置支持度、置信度均为0.6，挖掘结果如下所示（表7），其中符合率即在频繁集（即证型中频繁出现的证型因子）中符合教材判定标准的证型相关因子个数与判定标准的总数之比。从符合率上看来，均超过75%，说明该数据集符合中医教材中的证型判定标准，具有一定科学性和准确性，也从而验证之前模糊数学量化数据的有效性，对进一步构建深度神经网络证型分类预测模型提供了有力的理论支撑。

4 讨论

本文基于深度学习的理念，采用模糊数学和深度神经网络相结合的方法，建立了原发性肝癌病证型诊断分类的预测模型，预测准确率介于82.86%-92.76%，并用关联规则方法验证了预测结果，其符合率介于75%-100%，本研究成果为今后中医证型分类的预测研究奠定了实验与理论基础。考虑到中医证型诊断分类存在特征繁多的情况，通过深度神经网络预测模型恰当减少的参数，用少量必要的参数模拟出复杂的非线性关系，从而达到了提高模型稳定性的效果，并通过关联规则的方法验证了预测结果的准确程度，其结果表明收集的原发性肝癌数据符合卫生部“十二五”规划教材陈家旭、邹小娟主编的的《中医诊断学》和张伯礼、薛博瑜主编的《中医内科学》对中医证型分类的判定标准，进一步保障了原始数据和模型的可信度。但由于深度神经网络模型容易出现过拟合现象，以及收敛速度缓慢等不足，所以其网络结构仍有待优化，这正是笔者进一步研究的内容。