基于MLP神经网络算法的中医肥胖体质分类模型研究
2021-09-10谢永康丁梦清徐啸黄燕王珍佘侃侃
谢永康 丁梦清 徐啸 黄燕 王珍 佘侃侃
摘 要:目的:基于MLP神经网络算法,构建超重和肥胖人群的中医肥胖体质分类模型,以辅助中医肥胖干预及诊疗。方法:从2016—2018年江苏某省级综合性医院体质调理门诊数据库中,筛选出2 911个样本数据作为数据集,利用MLP神经网络算法建立中医肥胖体质分类模型,并验证模型的准确率。结果:根据超重肥胖人群的体检指标,对肥胖的类型进行中医体质分类,建立的中医肥胖体质分类模型,分类准确率达到90%以上。结论:MLP神经网络算法建立的中医肥胖体质分类模型,可为肥胖症的中医药防治提供辅助诊断和治疗。
关键词:肥胖;中医体质分类;MLP神经网络算法
0 引言
肥胖是由环境、遗传等多种因素引起的脂肪堆积过多或分布异常的慢性代谢疾病,是糖尿病、高血压等多种疾病的危险因素[1]。中医药在调节人体体质、平衡代谢方面具有独特的优势,在肥胖的防治中起到了重要作用。中医认为,肥胖与人的体质类型具有一定的相关性。在临床实践中,可以运用BMI指数判定人是否肥胖,再结合中医体质分类学说来辨识肥胖患者体质类型,并采用相应的中医干预方案来防治肥胖。虞晓含等[2]对21 948例中医体质与健康状况调查数据进行统计与分析,发现BMI指数与中医体质类型之间存在关联性,不同BMI指数人群的中医体质类型分布特点不同,气虚质、痰湿质与超重肥胖的相关性较高。岳子敬等[3]针对不同中医体质的超重肥胖人群,给予相应的中医调体方案,发现中医方案在减重、改善肥胖人群体质方面具有良好的干预效果。中医体质分类理论在辅助肥胖诊断和治疗的应用中取得了一些成果,然而对于肥胖人群如何划分中医体质类型,医师通常依靠个人经验进行判断,缺乏全面和客观的判定手段[4]。应用MLP神经网络算法建立中医肥胖体质分类模型,输入超重肥胖人群的相关指标可以判定其中医体质类型,为中医方法辅助治疗肥胖症提供了新思路和新方法。
1 数据集来源与分类标准
数据集来源于2016—2018年江苏某省级综合性医院体质调理门诊数据库。根据《中医内科学》[5]教材的肥胖分型方法,将超重肥胖人群的中医体质类型分为胃热滞脾、痰湿内盛、脾虚湿盛、脾肾阳虚4种类型。超重?肥胖的分类是根据卫生部《中国成人超重和肥胖症预防控制指南》[6]推荐的标准,以体质量指数(Body Mass Index,BMI)<18.5为体重过轻,18.5≤BMI<24为体重正常,24≤BMI<28為超重,BMI≥28为肥胖,其中BMI=体重(kg)/身高2(m2)。
2 MLP神经网络模型研究
多层感知器模型(MultiLayer Perceptron,MLP)是人工神经网络模型中的一种,能够描述一组输入变量到输出变量之间复杂的映射。肥胖的指标体系BMI指数、舌苔厚腻等变量之间存在着复杂的非线性关系,并且输出的结果是多分类的变量,采用传统的决策树算法或者单层感知器算法均无法解决此类问题[7]。MLP模型引入了隐含层来拟合输入数据和输出数据间的复杂关系,适用于解决这种非线性可分数据的多分类问题。
2.1 MLP模型的构建过程
MLP模型通常是由一个输入层,一个或多个隐含层,一个输出层组成。MLP模型构建的完整流程可分为前向传播和反向传播过程。前向传播通过网络结构和前一次迭代的权值与阈值,计算出神经元的输出。反向传播用于参数的训练,是从输出层向前计算出各权值和阈值对总误差的影响,然后调整权值和阈值,并使误差达到最小的过程[8]。
在前向传播中,设输入层的特征向量为xij,输入层到输出层的权重和阈值分别用wij和θij表示,隐含层节点的输出值aj(公式1),f表示激活函数,一般使用Sigmoid函数(公式2)表示:
在反向传播学习中,tk是神经网络训练的期望的输出信号,yk是神经网络实际的输出信号。神经网络学习的目的就是使yk和tk之间的误差降低到给定的精度,常用的误差函数E是均方差函数,它可以表示为:
2.2 MLP模型的参数设计
MLP神经神经网络模型是由多层神经元节点互联而成的复杂网络。每个神经元都通过与其他神经元相互连接来传递训练过程中的信息,不同的参数设计产生不同的拓扑结构,也决定了信息在网络中的传递方式,从而对网络的训练过程和结果产生决定性的影响[9]。文中MLP模型的参数设计是指隐含层个数的设计与各层神经元数目的确定。
(1)隐含层个数的设计。
在理论上,只有一个隐含层的神经网络只要包含足够多的神经元就可以逼近任意连续函数。隐含层个数的增加一方面可能引起网络计算时间的增加,另一方面也容易产生过拟合问题,从而影响预测的表现[10]。因此,Kaastra等[11]建议在应用神经网络建模时,网络隐藏层数最好为1层或至多为 2层。在后面建立中医肥胖分类模型的实验中,使用的是只包含一个隐含层的MLP神经网络模型。
(2)输入层、输出层、隐含层神经元数目的设计。
在MLP模型中,输入神经元和输出神经元的个数按照一般惯例进行设置,即输入层神经元数目为输入变量的个数,输出层神经元的个数为输出变量的个数。而对于隐含层节点个数,目前学术界还没有统一的看法。在建立中医肥胖分类模型的实验中是采用试验的方法来确定隐含层节点个数的,即节点值从1开始逐个增加,当增加到MLP神经网络模型的精确度不能再提升时,此时的节点值即为隐含层节点个数。
2.3 中医肥胖分类模型建模流程
在中医肥胖分类模型建模中,首先需要对读入的数据集进行清洗和归一化处理,预处理完成后,还需要将数据集划分为训练集和测试集。将训练集导入,确定MLP模型各层节点的个数,利用上文的相关公式对模型进行计算和训练,当满足条件之后,就将模型输出。最后,输入测试集数据,验证模型的准确率。中医肥胖分类模型建模的流程如图1所示。
3 中医肥胖分类模型建立
3.1 数据读入与预处理
将数据集导入Microsoft Office Excel 2016软件中,剔除无效数据以及信息记录不全者,并根据BMI公式筛选出超重与肥胖人群的样本,得到2 911例有效样本的数据集。最后根据离差标准化公式(其中max为样本数据的最大值,min为样本数据的最小值)对数据进行归一化处理。预处理后,样本数据情况如表1所示。
3.2 中医肥胖分类模型建立
对预处理后的数据集进行随机抽样,将其中60%作为训练集,其中40%作为测试集。读入训练集数据,将BMI指数、肌易浮肿等14个指标作为输入变量,分类类别作为输出变量。按照上文的方法进行MLP神经网络各层节点的参数设计。输入变量有14个,因此输入层神经元个数为14个;输出变量个数为4个,故输出层神经元个数为4个;隐含层神经元节点的个数按照试验的方式确定,个数为6个。该网络的神经结构如图2所示。然后按照上文的方法对中医肥胖分类模型进行计算和训练,最后输出训练好的分类模型。
4 模型验证与结果分析
4.1 分类模型的准确率
训练完成后,将测试集数据输入至MLP神经网络模型,分别计算训练集和测试集的预测正确的样本占总样本的比例,得到模型预测的准确率。结果显示训练集的准确率为92.04%,测试集的准确率为90.12%。
4.2 结果分析
MLP肥胖分类模型分类结果如表3显示,在2 911例超重肥胖人群样本中,中医体质类型为痰湿内盛型、胃热滞脾型的样本最多。
MLP中医肥胖分类模型的变量重要性如表4所示。结果显示,肌易浮肿、胃部腹胀、BMI指数、舌苔厚腻是对分类结果影响最大的4项指标。医生可重点考虑这几项指标,在一定程度上辅助临床决策,优化诊断和治疗肥胖症。
5 结语
在国内临床实践中,往往以传统中医学的望闻问切方法对超重肥胖人群进行中医体质的判定,受个人主观因素影响很大,不具有普遍性。文中研究了MLP建模方法与流程,并将其应用于肥胖的中医体质分类,建立了中医肥胖分类模型。从训练集和测试集的准确率来看,中医肥胖分类模型的精确度达到了90%以上,具有较强的实用意义,为中医防治肥胖症提供了一条新的路径。对变量进行重要性分析,得出肌易浮肿、胃部腹胀、BMI指数、舌苔厚腻等指标重要性最高。在临床实践中,应该对具有相关异常指标的超重和肥胖人群进行重点预防及筛查,及早对其进行生活方式和药物的干预,纠正其偏颇体质,提高中医临床疗效。
[参考文献]
[1]王志遠.中医对肥胖的认识及其防治优势[J].光明中医,2012(9):1728-1730.
[2]虞晓含,朱燕波,王琦,等.体重指数与中医体质类型的对应分析[J].中医杂志,2015(2):105-107.
[3]岳子敬,杨宜婷,林晓亮,等.对超重/肥胖人群采用中式体质量管理方案早期干预效果的临床观察[J].中华中医药杂志,2016(9):3838-3842.
[4]罗辉.中医体质学体病相关临床研究的系统评价和方法学研究[D].北京:北京中医药大学,2019.
[5]张伯礼,崔博瑜.中医内科学[M].北京:人民卫生出版社,2012.
[6]中华人民共和国卫生部疾病控制司.中国成人超重和肥胖症预防控制指南[M].北京:人民卫生出版社,2006.
[7]周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017(6):1229-1251.
[8]黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述[J].计算机学报,2018(7):1619-1647.
[9]丁晖.基于神经网络模型的人民币汇率预测研究[D].长沙:湖南大学,2008.
[10]林杨.基于深度学习的刀具磨损状态监测技术的研究[D].合肥:中国科学技术大学,2017.
[11]KAASTRA I,BOYD M.Designing a neural network for forecasting financial and economic time series[J].Neurocomputing,1996(3):66-68.
(编辑 何 琳)