APP下载

运用Python优化证素辨证心系疾病诊疗系统的思考*

2019-01-29邓文祥何德智陈桂萍张文安黄惠勇湖南中医药大学中医学院湖南长沙410208湖南中医药大学中医诊断学省重点实验室湖南长沙410208广州市佳医帮健康管理有限公司广东广州510030珠海市香洲区华发新城社区卫生服务中心广东珠海519000

中国中医药现代远程教育 2019年11期
关键词:证素心血管中医药

邓文祥何德智 陈桂萍 敬 勇 张文安 黄惠勇(1 湖南中医药大学中医学院,湖南 长沙 410208;2 湖南中医药大学中医诊断学省重点实验室,湖南 长沙 410208;3 广州市佳医帮健康管理有限公司,广东 广州 510030;4 珠海市香洲区华发新城社区卫生服务中心,广东 珠海 519000)

Python是目前人工智能(Artificial Intelligence,AI)开发的主流语言,由Guido van Rossum于1989年公开发布,其优势为免费开源,简单易学。Python现已广泛应用在机器学习、概率分析、统计分析等人工智能场景[1-2]。例如谷歌的AlphaGo项目研发与Python有关[3-4]。同时,百度、阿里巴巴、网易、新浪等大型互联网公司的人工智能项目也是基于Python研发[5-6]。

目前,我国心血管疾病死亡率居首位,超过居民疾病死亡的40%[7]。心血管疾病属于中医心系疾病范畴,中医在心血管疾病的防治中发挥着重要作用[8-9]。

《“十三五”中医药科技创新专项规划》提出:“要坚持中医药原创思维,加强系统生物学、大数据、人工智能等多学科前沿技术与中医药的深度交叉融合……”[10]。如何借助大数据、人工智能等多学科前沿技术提升基层医疗机构运用中医药防治心血管病的服务能力,是一个亟需解决的问题。

通过对中医辨证方法:脏腑、八纲、三焦、六经、病性、卫气营血、气血津液辨证等的挖掘与创新,中医诊断学现主要有病证结合辨证、病机辨证、方证辨证、藏象辨证、证素辨证、微观辨证等现代辨证方法[11]。其中证素辨证是近代中医诊断学发展与应用的重要组成部分,大量临床与实验研究证明了其理论的先进与实用性。由于既往技术的限制,现有的证素辨证系统缺少人工智能模块,不利于在人工智能时代进行辨证的数据挖掘与分析等工作,阻碍了中医辨证的智能化发展。

本文对近年来人工智能以及证素辨证在心血管疾病中的应用进行综述,分析Python在中医人工智能中的优势,以期为证素辨证借助Python进行升级优化做出参考。

1 人工智能在西医诊疗中的应用

AI是在计算机科学、控制论、信息论、语言学、哲学、神经心理学等学科的基础上发展起来的。它融合了新思想、新概念、新理论和新技术。广泛应用于机器人、语言识别、军事等各个领域[12]。

目前,AI在心血管西医诊疗的具体应用,主要集中在风险管理与预警方面:黄飞等[13]设计了一个高血压患者心血管风险等级智能分级系统,根据高血压患者的体检信息,识别高血压患者的心血管风险等级。聂蕾[14]研发了高血压病智能分级系统。系统主要具有智能处方、提示、血压趋势、远程会诊、智能诊断、电子病历等功能。利用医学对象研究高血压水平,可直接为心血管疾病的治疗、诊断和预防提供依据。张晓芬[15]基于安卓智能手机平台,采用状态描述方法来对心音信号进行分类识别实现对心音信号的预诊断,从而实现心血管疾病的自动诊断及预警,实现心血管疾病早期患者的家庭保健,达到降低心血管疾病发病率的目的。马莉等[16]设计了一种基于智能设备的心血管疾病前端系统,可以作为先天性心脏病筛查和常规监测设备。其依靠现代信号处理技术和数据挖掘的方法对心音信号进行分析处理,并最终提取信号的病理特征,以达到自动识别正常异常心音信号[17]。冯静[18]通过研究心血管危险因素智能评价系统对高血压合并糖尿病的辅助治疗作用,分析其可明显提高患者服药依从性,改善患者血压、血糖水平以及生活质量。武汉亚洲心脏病医院的Standard医疗“岐伯”人工智能引擎主要是将自然语言处理、认知技术、自动推理、机器学习、信息检索等技术应用于临床资料(包括医学专著、论文、治疗方案、试验数据、临床报告、医学期刊、教科书等)的深度学习,总结出心脑血管疾病的辅助诊断、治疗和预防的建议[19]。

2 人工智能在中医诊疗技术的应用

中医人工智能的研究可分为4个阶段:20世纪90年代是中医药智能信息研究的开始,以专家系统研究为主,2000年左右是中医药智能研究的低谷,主要表现在数据库和知识工程方面。2005年以后神经网络研究增加;2012年以后临床数据开始积累,人工智能与中医诊疗主要集中在基于文献数据的挖掘、现代中医诊断技术的研究等方面[20-21]。

2.1 文献研究 目前中医文献、医案中研究较多的是利用聚类[22](clustering)、关联规则 (association rule,AR)[23]、决策树(decision tree,DT)[24]、无尺度网络(scale-free network,SN)[25]、粗糙集理论(rough set theory,RST)[26]等数据挖掘技术从复杂症状中提取和总结中医证型,分析症状与症状、症状与方剂、症状与证型、证型与方剂、方剂与药物等潜在的关联规律。从数量庞大的方药中发现药物配伍规律以及潜在药物、核心药物、核心处方等,不仅可为临床医师提供诊疗策略,模拟中医思维方法和处方生成过程,而且对中医理论的创新发展及其客观化、规范化研究具有重要的推动作用[27-28]。

2.2 现代中医诊疗技术与诊疗系统研究 目前中医诊断技术与诊疗系统研究主要包括:(1)四诊信息的客观化、规范化。将中医自然语言描述的表达分为定量和标准化的客观表达,如脉象“位、数、形、势”的定量表达、舌诊和面色中颜色定量的正确表达、问诊中症状的定量表达等;(2)四诊特征的提取与分析方法的研究。利用现代计算机技术(神经网络、贝叶斯网络等)、数学建模、图像分析、频谱分析等技术,分别研究四诊特征信息的采集、识别和分析;在面色,脉象、舌象等方面形成采集规范;(3)仪器设备的研发与应用。利用现代科技研发了一批四诊信息检测的传感器和检测仪器,并开展四诊信息融合的研究,以及仪器设备的临床观察与应用[29-31]。

2.3 中医人工智能在心血管疾病的研究 中医学侧重于心血管疾病的人工智能研究:R Guo等[32-33]应用多尺度熵对冠心病患者中医脉象的复杂性进行研究,为脉诊作为无创诊断技术的发展和推广打下基础。杨涛[34]将软计算方法引入中医辨证系统的研究领域,构建了心系基础综合征诊断的知识库模型。吕胤[35]运用Cite Space(知识可视化软件)对高血压病中医证型的相关文献绘制知识图谱,分析了高血压病中医辨证分型的现状,提出了研究方向和方法。

3 心血管相关疾病的证素研究与思考

朱文锋教授从20世纪70年代开始研究中医智能辨证方法,先后研发了“中医数字辨证机”“中医辨证论治电脑系统”与“WF文锋-Ⅲ中医辅助诊疗系统”,并建立了“加权求和浮动阈值运算”数学模型与“双层频权剪叉算法”,于2008—2009年先后出版《证素辨证学》《实用中医辨证手册》等专著,创建了完整的证素辨证体系[36]。证素辨证的核心内容:将证素作为辨证的核心要素,其中包括病位证素以及病性证素的辨别,总结归纳了20项病位证素与33项病性证素[37]。

近年来,众多的临床与科研工作者基于证素辨证理论对心血管病进行了大量的研究,主要集中在冠心病、高血压、慢性肺源性心脏病、充血性心力衰竭、扩张型心肌病、不稳定型心绞痛等方面[38]。以冠心病的证素研究为例,其证素评判标准的来源有:(1)治疗指南。如《慢性稳定性心绞痛的诊断与治疗指南》《不稳定性心绞痛与非ST段抬高性心肌梗死的诊断与治疗指南》《中医内科常见病证诊疗指南·中医病证部分》;(2) 教材。如《中医内科学(第8版)》;(3) 自主建立。如基于研究近10年冠心病辨证的现代文献建立excel的数据库研究;(4)学会协会标准。1986年中国中西医结合学会活血化瘀专业委员会制定的血瘀证诊断标准、1986年全国中西医结合虚证与老年病研究专业委员会修订的虚证辨证标准;(5)国家标准。1997年中华人民共和国国家标准《中医临床诊疗术语——证候部分》;(6)证素辨证学。2008年人卫出版的《证素辨证学》;(7)其他。未明确证素诊断标准[39-44]。

由于“WF文锋-Ⅲ中医辅助诊疗系统”(以下简称“WF文锋-Ⅲ”)是单机版本等其他技术限制,其存在以下几个方面的不足:(1)证素研究的数据纳入标准不统一;(2)证素研究的评判标准不统一;(3)“WF文锋-Ⅲ”未根据临床与科研的研究结果进行学习与升级;(4)“WF文锋-Ⅲ”未借助互联网建立大数据采集平台;(5)“WF文锋-Ⅲ”缺少既往史维度的数据库;(6)“WF文锋-Ⅲ”的证候未按照望闻问切进行分类,不利于与现有的四诊智能诊疗设备进行对接与整合;(7)“WF文锋-Ⅲ”及其研究成果未能借助互联网与移动智能终端推广至基层医疗机构。

4 运用Python实现中医人工智能的优势

首先,基于Python自然语言处理(natural language processing,NLP)的文本分类研究在目前已得到广泛应用。自然语言处理在错综复杂的中医古籍、医案、临床数据、指南等资料中进行数据挖掘发挥着重要的作用。NLTK(Natural Language Tool Kit)是自然语言工具包的简写[45],它提供了与自然语言处理相关的词性标注、文法分析、文本分类等工具。NLTK内置文本分类研究所需的文档和语料库,可以直接用于语言处理的相应操作[46]。Jieba分词是Python中文分词工具之一,Jieba分词采用了基于Trie树结构的算法,Jieba分词利用该算法高效实现了词图扫描,并且利用词图扫描将得到句子中汉字所有的成词可能,并且将这些所有成词可能的情况构成有向无环图,为深入研究打下基础[47]。另外,Jieba分词可通过自定义字典的学习功能,对文本的关键词进行提取,同时通过Python的Pandas模块统计各自的词频数,可以为证素辨证学权值拟定提供更便捷的工具,实现智能化的证候、证型、证素的识别与统计功能。另外,Python中TF-IDF算法是最常见的特征权重计算方法[48],用于评估字词对文件集或语料库中某篇文档的重要性,字词的重要性随着它们在文档中出现的次数而正比增加,但与它们在语料库中出现的频率成反比下降。其与证素辨证学中“按高频变量权轻,低频变量权重的原理”思路一致,可实现各证素权值的智能化的提取。

然后,Python有丰富的数据分析库,有利于做大数据分析:Python是跨平台且开源的,开发成本小,可方便快捷的实现数据可视化[49]。比如用于科学计算领域的有Numpy和Scipy,基于Web的可视化工具Django和Plotly以及统计模型可视化工具Seaborn。与传统数据处理工具R语言相比,Python易于学习,近年来在各类编程语言中的排名逐渐上升。Python拥有丰富的脚步资源库,如Py-Pl,方便使用者直接调用成熟的大数据分析模块。

最后,Python中的Tensorflow框架[50],是由谷歌团队研发,用于大规模、异构环境下运行的机器学习系统。Tensorflow已经成为深度学习生态系统的基石,其循环神经网络 (Recurrent Neural Network,RNN)[51]、长短期记忆网络 (Long Short-Term Memory,LSTM)[52]、卷积神经网络 (Convolutional Neural Networks,CNN)[53]等神经网络方法已广泛运用于人工智能的深度学习应用中。例如Python已经成功统计学家深度神经网络(Deep Neural Networks,DNNs)的工具因为它避开了困难的语言语义,允许研究人员主要关注算法的设计。Python在DNNs研究领域成功的另一个关键因素是它的便捷可移植性和大量的数据库,比如 Numpy、Scipy、Pandas、Theano等[54]。

5 小结与展望

运用Python实现中医人工智能的优势十分明显,因为Python的开源性和丰富的应用模块,其应用模块集成了各种最先进的机器学习算法,方便学习与应用。且国内尚未有基于Python对证素辨证心系疾病的诊断方法进行研究的报道。因此,通过Python语言,借助大数据挖掘、人工智能机器学习等先进科技手段,基于证素辨证学的理论研究心系疾病智能诊断方法,并运用于基层医疗机构的课题研究,具有十分重要的意义与应用价值,其体现在以下几个方面:(1)政策方面:通过多学科前沿技术与中医药的深度交叉融合,助力基层中医药服务能力提升工程的落地;(2)学术方面:利于中医药在人工智能领域的发展,促进中医诊断学在中医辨证学与数字中医药方向的发展;(3)应用方面:为基层医疗机构提供辨证论治的辅助工具,提升其运用中医药防治心血管病的服务能力。

猜你喜欢

证素心血管中医药
COVID-19心血管并发症的研究进展
糖尿病前期中医证型及证素特点分析
2型糖尿病合并肥胖患者的相关危险因素和中医证素分析
基于因子分析及聚类分析的241例感染后咳嗽中医证素证型研究
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
从《中医药法》看直销
中医药立法:不是“管”而是“促”
lncRNA与心血管疾病
胱抑素C与心血管疾病的相关性