APP下载

人工智能在糖尿病诊断中的应用

2018-01-09王能才

中国医学装备 2017年12期
关键词:数据挖掘神经网络人工智能

韦 哲 薛 翔 王能才

人工智能在糖尿病诊断中的应用

韦 哲①②薛 翔②*王能才①

通过概述人工智能、人工神经网络、专家系统及数据挖掘的方法与原理,分析人工智能在糖尿病诊断领域的应用与研究方向。糖尿病的诊断需要大量的医疗资源支持,将人工智能应用于糖尿病诊断,不仅可以节约医疗资源,还能帮助糖尿病患者及高危人群及时掌握病情,降低糖尿病并发症患病风险。

人工智能;专家系统;人工神经网络;数据挖掘;糖尿病

美国纪念斯隆-凯特琳癌症中心(MemorialSloan-Kettering Cancer Center)与IBM合作,引入“沃森”技术对与病情、治疗方案和治疗结果有关的数据进行分析,以此来找出隐藏的形式和相关性来帮助癌症治疗[2]。糖尿病的诊断需要大量的医疗资源支持,在目前医生人手不足,糖尿病患者群体庞大的背景下,将人工智能应用于糖尿病诊断,不仅可以节约医疗资源,还能帮助糖尿病患者及高危人群及时掌握病情,降低糖尿病并发症患病风险。

1 人工智能概述

1.1 人工智能

人工智能(artificial intelligence,AI)是研发用于模拟、延伸和扩展人的智能的理论、方法及技术应用系统的一门前沿学科和交叉学科[3]。早在1956年“人工智能”一词被提出,此后研究者又提出了许多与之相关的理论和原理,人工智能的概念也逐渐扩展。美国斯坦福大学的Nilsson提出人工智能是有关知识的科学,包含知识的表示、获取以及应用。英国著名科学家图灵被称为人工智能之父,他在1950年发表的著名论文“计算机机器与智能”首次从行为主义的角度给出了人工智能的定义并提出了“机器思维”的概念,通过“图灵实验”来判别机器是否具备智能[3]。人类的许多活动,如解算题、猜谜语、网上购物、编制计划和编写计算机程序,甚至驾驶汽车等等,都需要“智能”。如果机器能够执行这种任务,就可以认为机器已具有某种性质的“人工智能”。

1.2 人工智能的特征

人工智能作为一门科学,有其独特的技术特征,主要表现在:①利用知识,能利用问题领域知识来求解问题;②利用搜索,边试探边求解,找出不完全知识以及未知知识的规则;③利用抽象,可以在处理问题时将重要与非重要特征进行区分,从而更加有效和灵活地处理问题;④利用推理,基于知识表示的AI程序通常采用推理机制与知识相分离的体系结构,这种结构可以模拟人类思维规律。

2 专家系统

2.1 在医疗领域的研究现状

20世纪70年代初,斯坦福大学的Edward Shortliife和BruceBuchanan等人合作研制了一种帮助医生对住院的血液感染患者进行诊断和用抗菌素类药物进行治疗的MYCIN专家系统,在对MYCIN专家系统的测试过程中发现其对败血症、菌血症及肺部感染等方面的诊疗水平已经超过了该领域的专家[4]。匹兹堡大学的Miller等在1982年开发了名为Internist-Ⅰ的内科计算机辅助诊断系统;哈佛医学院Baenett等在1991年开发的“DXPLAIN”软件已经包含2200种疾病和5000种症状[5]。

在我国,2008年杭波等[6]采用正向不精确推理与反向精确推理相结合的二次诊断策略,解决了某些系统将症状知识库整理成多级索引的树形结构而可能引起的漏诊和误诊。罗洋等[7]使用案例推理临床获益率(clinical benefit rate,CBR)的方法建立了糖尿病诊断专家系统,系统通过查找的方式在源案例中找出与当前问题相似的案例来解决问题,相比于其他专家系统而言,更加直观易懂,也是当前人工智能领域的一种主流推理方式。

2.2 专家系统的组成

专家系统由知识库、推理机、解释机构、全局数据库、知识获取机构和人机接口6部分组成。在实际使用中,由于应用领域和应用目标的不同,需要对上述部分进行简化、细化、增加或删除。知识库和推理机是专家系统的核心部分,知识库存取和管理着用于问题求解的专家知识和经验,推理机使整个专家系统在其控制和管理下,以逻辑方式协调地工作,可以将知识库中的知识与用户输入的数据相结合,根据一定的推理策略,采用类似专家水平的问题求解方法,进行分析、判断并作出决策[8](如图1所示)。

图1 专家系统基本结构框图

2.3 专家系统的特点

专家系统具有下述特点。

(1)针对性。专家系统是对某个具体的领域进行专门研究,如医疗领域、故障诊断领域等,而医学领域的专家系统又会针对某种专门的疾病,如MYCIN专家系统针对菌血症、败血症以及肺部感染。

(2)灵活性。知识库与推理机在体系结构上是相互分离又相互联系,便于系统学习新的知识,用于糖尿病诊断的专家系统可以随医学的发展进行不断的修改和扩充。

(3)透明性。专家系统中的解释机构将系统采用的知识和方法展现给用户,可以与用户进行相互交流,不仅增加了用户对系统的了解,而且使用户对诊断结果更加信任。

3 神经网络

3.1 人工神经网络

人工神经网络(artificial neural networks,ANN)可以模拟动物神经的行为特点,建立算法数学模型对分布式数据并行信息进行处理。人工神经网络算法的系统复杂程度高,内部大量节点之间的连接关系可调,从而有利于达到处理信息的目的[9]。

心理学家Mcculloch和数学逻辑学家Pitts在1943年首先提出神经元的数学模型(MP模型),在分析和总结神经元基本特性的基础上,证明了单个神经元能执行逻辑运算功能,开启了ANN研究的新时代。1957年,计算机科学家Rosenblatt设计制作了能够用来模拟生物感知和学习能力的感知器;1969年M.Minsky等在著作《Perceptron》(感知器)中指出线性感知器功能是有限的,并不能解决高阶谓词问题,ANN的研讨一度进入低谷;美国物理学家Hopfield于1982年和1984年在美国科学院院刊上发表了两篇有关ANN研究的论文,再次掀起了ANN的研究热潮[10-11]。

3.2 神经网络结构

根据连接的拓扑结构,神经网络模型可分为前向网络和反馈网络。

(1)前向网络。前向网络是一个两层前向神经网络,该网络中只有输入层和输出层,其中f为传递函数,x为输入,W为权值,y为输出。该网络通常用于线性分类,如图2所示。

图2 两层前向神经网络示图

而图3所示为一个多层前向神经网络,该网络由一个输入层,一个输出层和多个隐含层组成,其中隐含层和输出层神经元为计算节点。

(2)反馈网络。反馈网络(recurrent network)又称自联想记忆网络,其设计目的是在初始输入下,使网络经过反馈计算最后到达稳定状态,这时的输出即是

图3 多层前向神经网络示图

用户需要的平衡点,如图4所示。

图4 反馈神经网络示图

3.3 神经网络算法

根据网络模型拓扑结构、神经元特征以及学习规则的不同,目前已有近40种ANN模型,其中常用的ANN算法有BP神经网络、径向基核函数(radial basis function,RBF)神经网络和模糊神经网络(fuzzy neural network,FNN)。

(1)BP神经网络。BP神经网络的学习算法是δ学习规则(误差校正学习算法),属于有指导性的学习,其目标函数采用为实际输出向量,Tk为期望值向量,k=1,2,…,N为训练样本个数),其将输出层表现出的误差沿着与输入传送相反的方向逐级向网络的输入层传递,从而获得所有其他各层的误差估计。

(2)RBF神经网络。RBF径向基神经网络能以任意精度逼近任一连续函数,在解决分类问题时,RBF网络先通过隐层单元将非线性可分的输入空间设法变换到线性可分的特征空间(通常是高维空间),然后再用输出层来进行线性划分,从而完成分类功能。

(3)FNN。FNN是模糊系统与神经网络相结合的产物,是具有模糊权系数或者输入信号是模糊量的神经网络,其结合了神经网络与模糊系统的优点,集联想、识别、自适应及模糊信息处理于一体。

4 数据挖掘

4.1 医疗大数据挖掘

医疗数据库是对病患的病理体征数据、病历数据以及所有病患与非病患的体检数据进行收集的数据库,其中包含了医生与患者的交谈记录,医生的临床观察记录,医疗设备和仪器所拍摄的影像资料,社会普查记录等等。糖尿病具有多病因、多体征参数和原发性复杂的特点,数据挖掘技术对此有非常好的适用性,对大量的体检和病历数据的挖掘为糖尿病诊断系统的可靠性提供了基本保证。医疗大数据挖掘的一般流程如图5所示。

图5 医疗大数据挖掘流程框图

4.2 医疗数据挖掘技术的研究现状

Breault等[12]利用CART分析方法对糖尿病数据库进行分析后,找出了分类曲线和回归曲线,虽然准确率仅有59%,但却首次证实了数据挖掘技术在糖尿病诊断领域的潜在价值。采用Relief方法对患病因素初步分析后,再用朴素贝叶斯方法、IB1法和C4.5方法建立分类预测模型,使准确率达到了79%左右[13]。2010年,Purnami等[14]用修正条光滑向量机算法在一定参数下对糖尿病进行了很高准确率的诊断。2015年,Abdul等利用改进的K-means算法对以年和月为周期发病的疾病数据库进行分析,找到了预防和治疗的有利策略[15]。

国内与国外相比,将数据挖掘应用于临床诊断的研究较晚。2012年,庞博[16]提出贝叶斯算法与中医学特点相结合的理论,建立了中医医案信息化平台,系统的解释了中医经验、知识和证据的关系。由于国内电子病历和医疗信息系统近年来才兴起,所以相关研究主要集中在中西医结合的领域。但是西医在糖尿病中的研究进展远比中医有竞争力,空腹血糖值、尿糖值、胆固醇值等这些数据都对糖尿病诊断非常有利。

5 人工智能在糖尿病诊断领域的应用

糖尿病是由胰岛素分泌缺陷和(或)胰岛素作用缺陷所引起的,并以慢性高血糖伴碳水化合物及脂肪和蛋白质的代谢障碍为特征的慢性疾病。主要的分型为:1型糖尿病和2型糖尿病。分型中的1型糖尿病主要是由于胰岛β细胞的自身免疫性破坏所造成的,而2型糖尿病患者自身的β细胞并无自身免疫性缺陷,患者大多存在肥胖或超重现象,全球糖尿病患者绝大多数为2型糖尿病。

目前,国际上通用的糖尿病诊断标准为:①空腹血糖≥7.0 mmol/L(126 mg/dl);②口服糖耐量试验(oral glucose tolerance test,OGTT)后2 h血糖浓度≥11.1 mmol/L(200 mg/dl);③餐后任意时间的随机血糖浓度≥11.1 mmol/L(200 mg/dl)[17]。

专家系统具备收集、整理和记录专家知识的能力,能将过往以及目前世界各地的糖尿病专家提供的专业知识和相关书籍融合在一起解决现实问题。血糖监测、饮食治疗、运动治疗、药物治疗及糖尿病教育是糖尿病现代治疗的“五架马车”,糖尿病诊断专家系统够将其整合成诊疗意见,当患者根据专家系统给出的提示,输入主诉及体征信息时专家系统就会结合知识库存储的知识给出诊疗意见,不仅有助于解决因糖尿病患者人数众多而导致专家资源紧张的问题,还可以及早发现隐藏的糖尿病病情,做到早发现早治疗[18-19]。

各大医院中的医院信息化系统、实验室信息系统、电子病历系统等已经积累了规模庞大的糖尿病患者临床数据,这些临床数据中隐藏着许多与糖尿病诊断及治疗有关的规律,对于掌握糖尿病发病机理及治疗效果评估有着重要的意义[20]。这些数据的特征是非线性,而ANN有良好的智能特性和强大的非线性处理能力,利用其容错性、自适应性和并行处理等优点,采用适当的学习算法,可以对糖尿病数据进行准确的处理,达到糖尿病诊断以及预测的目的。

6 展望

谷歌旗下Deep Mind研发的AlphaGo通过围棋人机大战一战成名,带动了人工智能的火爆,这一技术也从另类走向主流。然而,目前人工智能在国内医学中的发展及应用规模都远不及西方发达国家,在技术水平、算法的成熟度和模型精度等方面的差距还很大。未来,人工智能、大数据、云计算、三维打印及纳米粒子平台等先进技术将颠覆传统技术,将其更好地应用于医学领域,必然会引起人们对医学的深入探索,新成果必将会不断出现。

[1]孔祥溢,王任直.人工智能及在医疗领域的应用[J].医学信息学,2016,37(11):1-5.

[2]Kulikowski C A.Artificial intelligence methods and systems for medical consultation[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,1980,PAMI-2(PAMI-2):464-476.

[3]孙宏安.电脑先驱-图灵[M].济南:山东教育出版,2006.

[4]赵欣,王运斗,郭立军.医疗专家系统推理机的常用设计方法与发展展望[J].医疗卫生装备,2013,34(12):100-102.

[5]Feldman MJ,Barnett GO.An approach to evaluating the accuracy of DXplain[J].Comput Methods Programs Biomed,1991,35(4):261-6.

[6]杭波,马计.基于二次推理的糖尿病诊断专家系统研究[J].微计算机信息,2008,24(5):228-229,244.

[7]罗洋.基于案例推理的糖尿病诊断系统的研究与应用[D].哈尔滨工业大学,2013.

[8]高峰,孙时珍,曲建岭.人工智能在故障诊断中的应用[J].科技信息,2010,2(23):63-64.

[9]高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2007.

[10]Alshayea Q.Artificial Neural Networks in Medical Diagnosis[J].International J Computer Science Issues,2011,8(2):197-228.

[11]刘彦杰.优化BP神经网络在糖尿病患病风险分析中的应用[D].兰州理工大学,2016.

[12]Breault JL,Goodall CR,Fos PJ.Data mining a diabetic data warehouse[J].Artif Intell Med,2002,26(1-2):37-54.

[13]Huang Y,Mccullagh P,Black N,et al.Feature Selection and Classification Model Construction on Type 2 Diabetic Patient's Data[M].Advances in Data Mining.Springer Berlin Heidelberg,2004:251-262.

[14]Purnami SW,Zain JM,Embong A.A New Expert System for Diabetes Disease Diagnosis Using Modified Spline Smooth Support Vector Machine[M].Computational Science and Its Applications-ICCSA 2010.Springer Berlin Heidelberg,2010:83-92.

[15]Khaleel MA,Dash GN,Choudhury KS,et al.Medical Data Mining for Discovering Periodically Frequent Diseases from Transactional Databases[M].Computational Intelligence in Data Mining-Volume 1.Springer India,2015:87-96.

[16]庞博.施今墨学派名老中医诊治糖尿病学术思想与经验传承研究[D].北京:北京中医药大学,2012.

[17]钱荣立.关于糖尿病的新诊断标准与分型意义[J].临床内科杂志,2000,17,(3):113.

[18]马冬梅.生化检验在糖尿病诊断中的应用分析[J].大家健康旬刊,2016,10(7):43.

[19]陈潋.面向糖尿病的临床大数据分析研究与应用[D].上海:东华大学,2016.

[20]郭奕瑞,李玉倩,王高帅,等.人工神经网络模型在2型糖尿病患病风险预测中的应用[J].郑州大学学报(医学版),2014,(2):180-183.

Application of artificial intelligence in diagnosis of diabetes

/WEI Zhe, XUE Xiang, WANG Neng-cai

To analyze the application and research direction of artificial intelligence in the diagnosis field of diabetes through summarized the methods and principle of artificial intelligence, artificial neural network, expert system and data mining. The diagnosis of diabetes need be supported by large medical resource. The artificial intelligence is applied in the diagnosis of diabetes not only can save medical resource but also can help patients with diabetes and high risk group of diabetes to grasp their state of illness in time, and reduce the sickening risk of diabetic complication.

Artificial intelligence; Expert system; Artificial neural networks; Data mining;Diabetes

Department of Information, General Hospital of Lanzhou,Lanzhou 730050. Telecommunications Institute, Lanzhou University of Technology, Lanzhou 730050, China.

韦哲,男,(1963- ),博士,高级工程师。兰州军区兰州总医院信息科,从事医疗仪器及医疗信息系统的研制开发、科研、技术及管理等工作。

1672-8270(2017)12-0142-04

R-058

A

10.3969/J.ISSN.1672-8270.2017.12.039

①兰州军区兰州总医院信息科 甘肃 兰州 730050

②兰州理工大学电信学院 甘肃 兰州 730050

*通讯作者:xuexiang1990@126.com

//China Medical Equipment,2017,14(12):142-145.

2017-06-04

猜你喜欢

数据挖掘神经网络人工智能
探讨人工智能与数据挖掘发展趋势
神经网络抑制无线通信干扰探究
2019:人工智能
人工智能与就业
数读人工智能
基于并行计算的大数据挖掘在电网中的应用
下一幕,人工智能!
基于神经网络的拉矫机控制模型建立
一种基于Hadoop的大数据挖掘云服务及应用
复数神经网络在基于WiFi的室内LBS应用