基于数据挖掘技术的荨麻疹治疗研究综述*
2020-03-12宋佳阳
高 静,宋佳阳
(首都经济贸易大学,北京100070)
1 前言
数据挖掘是从大量、不完全、有噪声、模糊、随机的数据中提取人们事先不知道但具有潜在有用的信息和知识的过程;是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
BP 神经网络是一种按误差反向传播(简称误差反传)训练的多层前馈网络,它的基本思想是梯度下降法,利用梯度搜索技术,以期使网络的实际输出值与期望输出值的误差均方差为最小。
将数据挖掘技术和人工神经网络的技术应用于医学诊断领域已经日渐成熟,对于荨麻疹的治疗也变得十分重要。用数据挖掘技术对荨麻疹中医治疗中的处方进行分析,发现规律,以得到更好的治疗效果;利用人工神经网络技术,构建无监督学习的中医证型预测模型和有监督的荨麻疹中医证型分类器,为荨麻疹中医临床辨证论治提供帮助;利用建立BP 神经网络模型的方法,对痒性荨麻疹痒感度进行预测,该模型有较高的参考价值,对于相关痒感理论的研究有一定的意义。
2 数据挖掘与人工神经网络基本理论和相关应用
数据挖掘分为有监督的数据挖掘和无监督的数据挖掘。有监督的数据挖掘是利用可用的数据建立一个模型,这个模型是对特定属性的描述;无监督的数据挖掘是在所有的属性中寻找某种关系。
具体而言,分类、估值和预测属于有监督的数据挖掘;关联规则和聚类属于无监督的数据挖掘。
在荨麻疹的中医治疗中,利用数据挖掘技术的关联分析可以进行组方规律分析,运用关联分析技术首先需发现频繁项集,即计算所有可能组合数的支持度,找出不少于人为设定的最小支持度的集合。
发现关联规则,即计算不小于人为设定的最小支持度的集合置信度,找到不小于认为设定的最小置信度规则。以关联规则分析结果为基础进行聚类分析,以获得新的处方核心组合。聚类分析是把数据集分割成多个具有某种相似特征的子集的过程,目前已广泛用于研究方剂配伍规律及辅助发现新药新方的研究领域。
神经网络的基本组成单元是神经元。神经元的通用模型如图1 所示,其中,常用的激活函数有阈值函数、sigmoid函数和双曲正切函数。
图1 神经元的通用模型
神经网络是将多个神经元按一定规则联结在一起而形成的网络,如图2 所示。
从图2 可以看出,一个神经网络包括输入层、隐含层(中间层)和输出层。输入层神经元个数与输入数据的维数相同,输出层神经元个数与需要拟合的数据个数相同,隐含层神经元个数与层数需要设计者根据一些规则和目标来设定。在深度学习出现之前,隐含层的层数通常为一层,即通常使用的神经网络是三层网络。
图2 神经网络模型
在荨麻疹的治疗过程中,应用人工神经网络技术建立评价痒性风团痒感度的预测模型,采用3 层BP 人工神经网络,神经网络结构由输入层、输出层和1 个隐层组成。从原始数据中筛选能反映特征的多个参数后,网络使用12 个输入端,每2 个输入端组成1 组,用二进制信号表示输入信号的量化值,即每个输入信号可表示为4 个等级。输入信号分别为:①风团的面积S;②表面相对高度H;③表面相对光滑度G;④颜色C;⑤表面相对硬度D;⑥其他O。
网络使用2 个输出端y0,y1,用二进制信号11,10,01,00 表示输出信号痒感度的量化值,即将痒感度划分为重、中、弱、无四个等级。可采用的三层人工神经网络结构如图3 所示。
图3 采用的神经网络结构
通过对该模型的有关参数的估计,对痒性风团痒感度进行定量度量和预测。利用临床采集的痒性风团的体表特征S0,S1,H0,H1,G0,G1,C0,C1,D0,D,O0,O1和与之对应的痒感度量化值y0,y1,依次对BP 网络进行训练,采用相应的误差逆传递算法获得输入层与隐层之间的各权值Wij以及隐层与输出层之间的各权值Wki的值,所以,一个基于人工神经网络技术的痒性风团痒感度预测模型最终被建立起来。
3 荨麻疹治疗方法现状
中医对荨麻疹的发病机理的认识已趋统一,认为荨麻疹的发病多与风邪有关,西医目前多采用竞争抑制组胺受体药物、降低血管壁通透性药物、皮质类固醇激素等药物治疗,但这些药有一定的副作用,远期疗效不理想。抗组胺药治疗荨麻疹,能缓解多数患者症状,但停药后风团又复发,所以现代西医学对本病尚无特效疗法。
大量的研究表明,中医对荨麻疹的治疗具有疗效确切、副作用小、不易复发的优势,所以积极探求中医药对治疗荨麻疹的有效方法就非常重要。
国外目前还没有关于荨麻疹的治疗、人工神经网络与数据挖掘技术等结合的文献,国内近年来有学者将数据挖掘技术与人工神经网络技术、荨麻疹的治疗结合在一起,发表了相关的文献,应用不同技术辅助荨麻疹治疗的对比分析如图4 所示。
图4 相关文献对比分析图
4 部分相关研究文献
近年来国内部分利用数据挖掘技术、人工神经网络技术辅助荨麻疹治疗的相关文献和研究成果如表1 所示。
可以看出,数据挖掘技术和建立BP 神经网络预测模型的方法都可以对荨麻疹的治疗起到促进作用。目前,医疗诊断和治疗已经不能停留在传统方法上,需要采用数据挖掘技术进行分析,运用人工神经网络技术辅助荨麻疹的预测、诊断和治疗。
5 研究展望
近年来,对于荨麻疹的治疗应用了更多的数据挖掘技术和人工神经网络技术,但是数据挖掘的结果只是建立在数据的基础上,应用数据挖掘技术分析得到的核心组合和新处方还须经过临床检验。
除了对荨麻疹的中医处方数据挖掘分析之外,在未来,随着人工智能技术的迅速发展和医学研究的深入研究,医学治疗会更加智能化,更加适用于生活,它还将开发更有效的算法模型,对荨麻疹更好地预测和治疗。
6 结语
荨麻疹病程较长、迁延难愈,需要选择科学的疗法,才能提升治疗水平。要不断将荨麻疹的治疗与其他数据挖掘算法相结合,力求找到荨麻疹的最优数据处理方法和最精确预测结果。
表1 相关文献和研究成果