中医数字辨证配套医案智能采集与分析系统构建研究
2020-10-14韦昌法罗丽琴晏峻峰
韦昌法 罗丽琴 晏峻峰
〔摘要〕 中医数字辨证是中医智能辅助诊断的核心,辨证模型的质量直接影响辨证的准确度和效率。为了建立中医数字辨证模型并验证其准确度,需要准备大量的配套医案。根据中医数字辨证模型对医案的需求,设计了中医数字辨证配套医案智能采集与分析系统,利用人工智能技术和Python编程技术实现了医案采集、医案展示、医案检索、数据统计分析及可视化等功能,有助于快速采集并筛选出符合条件的中医医案,提高中医数字辨证模型的创建效率和质量。
〔关键词〕 中医数字辨证;人工智能;医案采集;医案分析
〔中图分类号〕R2-03 〔文献标志码〕A 〔文章编号〕doi:10.3969/j.issn.1674-070X.2020.01.016
〔Abstract〕 The digital syndrome differentiation of TCM is the core of intelligent assistant diagnosis of TCM. The quality of syndrome differentiation model directly affects the accuracy and efficiency of syndrome differentiation. In order to establish the digital syndrome differentiation model of TCM and verify its accuracy, a large number of supporting medical cases need to be prepared. According to the requirement of TCM digital syndrome differentiation model for medical cases, an intelligent acquisition and analysis system of supporting medical cases for TCM digital syndrome differentiation was designed. Using artificial intelligence technology and Python programming technology, the functions of medical cases collection, medical cases display, medical cases retrieval, data statistical analysis and visualization were realized, which are helpful to quickly collect and screen qualified TCM medical cases, and to improve the efficiency and quality of the establishment of TCM digital syndrome differentiation model.
〔Keywords〕 traditional Chinese medicine digital syndrome differentiation; artificial intelligence; medical cases acquisition; medical cases analysis
辨证论治是中医学认识疾病和治疗疾病的基本原则。中医数字辨证指的是在研究中医辨证论治规律的基础上,建立辨证过程的数字模型,通过计算机程序对患者病情资料进行分析判断,最终得出辨证结果[1-3]。国学大师章太炎先生曾说:“中医之成绩,医案最著,欲求前人之经验心得,医案最有线索可寻,循此钻研,事半功倍。”[4]为了建立中医数字辨证模型并验证其准确度,往往需要准备大量的配套医案,构建中医数字辨证配套医案智能采集与分析系统,有助于快速采集满足需求的中医医案。
1 中医数字辨证模型对医案的需求
在辨证论治中,辨证是论治(立法、处方、用药)的前提,辨证准确与否,是临床疗效的关键[5]。中医数字辨证是中医智能辅助诊断的核心,辨证模型在系统中起着关键性的作用,模型的质量直接影响辨证的准确度和效率。因此,辨證模型也成为基于人工智能的中医诊断研究者普遍关注的热点问题。
我国的研究者从上世纪70年代中后期就开展了以中医专家系统为代表的中医智能辅助诊疗系统的研发,先后研发出关幼波中医肝病诊断处方专家系统、中医数字辨证机等一大批中医专家系统。40多年来,许多人工智能方法被应用于构建中医数字辨证模型,不同的辨证模型采用了不同的知识表示和知识推理方法,它们对医案的需求也不尽相同。中医医案是医生对所诊治病证的发生、发展及其转归的真实记录,是对疾病辨证分析、治疗过程的真实记载,对医案进行研究和分析有助于挖掘中医专家的诊疗经验[6]。中医数字辨证模型对医案的需求主要集中在两大方面,一方面需要从医案中挖掘出中医专家的辨证经验,将这些经验嵌入到中医数字辨证模型中,使数字辨证模型能集成中医专家的经验来开展辨证;另一方面,在验证数字辨证模型的准确率时,也需要大量的医案来评估数字辨证模型的辨证结果与中医专家的辨证结果的一致程度。
中医数辨证配套医案的来源有很多,其中一个重要的来源是中医名家的医案集,这些医案集中的医案质量较高,在中医数字辨证模型的创建及验证过程中具有重要的作用。因此,笔者开展了面向医案集的中医医案智能采集与分析系统构建研究,以期为中医数字辨证研究提供快速获取高质量配套医案的工具。
2 中医数字辨证配套医案智能采集与分析系统的设计
中医数字辨证配套医案智能采集与分析系统拟利用光学字符识别(optical character recognition,OCR)技术将医案集的医案图片转换成医案文本,存储到医案数据库中,进而对医案文本信息进行自动校验和结构化处理,最后对医案数据进行统计分析及可视化处理,并通过web页面将医案数据和相应的统计分析及可视化结果予以直观展示,以供用户查看、筛选和导出医案。
中医数字辨证配套医案智能采集与分析系统可分为4个主要模块:医案采集模块、医案展示模块、医案检索模块、数据统计分析及可视化模块,系统功能模块图如图1所示,系统业务流程图如图2所示。
医案采集模块利用OCR技术将医案集的医案图片转换成医案文本,并利用人工智能分词技术和模糊匹配技术实现對医案数据进行自动校验,以确保通过OCR技术转换出来的医案文本内容与原始的医案图片内容是一致的。医案采集模块利用正则表达式匹配技术对医案文本信息进行结构化处理,得到医案基本信息:患者性别、年龄、初诊信息、辨证结果、治法、方药、其他诊次信息等内容,并存储到医案数据库中。
医案展示模块将已采集的医案数据展示出来,用户在浏览医案数据时,可以对医案数据进行人工校验,比对医案数据与原始医案图片是否一致。因为医案采集模块已提供了医案数据自动校验功能,故人工校验功能不是必须的,但是它可以增强用户对系统的认可度和信任度。
医案检索模块负责根据用户的需要对医案数据进行检索,用户可以在性别、年龄段、辨证结果、治法信息和方药信息等字段中输入要检索的关键词,系统根据用户输入的条件对数据库中的医案数据进行精确或模糊检索,并将检索结果直观展示出来。
数据统计分析及可视化模块负责对已采集的医案数据进行统计分析,生成相应的统计图表和词云图,使用户可以更直观地了解数据库中的医案数据特征,为他们的科研和临床工作提供参考。系统根据用户的统计需求,从医案数据库中读取相应的数据,进行数据可视化相关的参数设置,最终生成相应的统计图表。系统还可以在数据统计分析的基础上,对辨证结果、治法信息和方药信息等内容生成词云图,让用户更直观地了解统计分析结果。
3 中医数字辨证配套医案智能采集与分析系统的实现
课题组研究团队采用Python编程语言开发实现了中医数字辨证配套医案智能采集与分析系统,并以郁病医案为例,开展了医案智能采集与分析工作,成功采集了一大批郁病医案的基本信息:患者性别和年龄信息、初诊信息、辨证结果、治法信息、方药信息、其他诊次信息等内容,并从辨证结果、治法信息、方药信息、性别、年龄、医生和医案来源七个角度对所采集的医案数据进行统计分析,得出相应的统计分析图表和词云图,使用户可以更直观地了解医案数据特征,以便筛选出符合要求的医案来开展中医数字辨证研究。
3.1 医案采集模块的实现
医案智能采集与分析系统所采集的医案可能来源于不同的医案集,这些医案集对医案信息的组织结构不尽相同,为了支持从不同的医案集中采集医案,系统引入了医案采集模板的概念,用户可以为不同的医案集建立相应的医案采集模板。进行医案采集时,系统根据用户指定的医案采集模板将医案集的医案图片转换成医案文本,进而对医案数据进行自动校验和结构化处理,并将医案信息存储到医案数据库中。系统采集到的医案信息如图3所示,医案信息中的辨证结果、治法信息和方药信息如图4所示。
3.2 医案展示模块的实现
医案展示模块将医案数据库中的医案数据展示出来,用户可以分页查看所有的医案,医案信息包括患者基本信息、初诊信息、辨证结果、治法信息、方药信息、医生和医案来源等内容,医案展示界面如图5所示。在浏览医案信息时,用户还可以对医案数据进行人工校验,校验界面如图6所示,该界面的左半部分显示了医案图片,右半部分显示了系统采集并结构化处理后得到的医案信息,如果用户在校验过程中发现医案信息与图片中的信息不一致,可以即时修正。如前所述,因为医案采集模块已提供了医案数据自动校验功能,故人工校验功能不是必须的,但是它提供了一个备用的校验渠道,使得系统更加完善。
3.3 医案检索模块的实现
医案检索模块根据患者性别、辨证结果、治法信息、方药信息、医生信息等检索条件对医案数据进行检索,将用户所需的医案筛选出来予以直观展示。例如,可以在医案数据中检索辨证结果包含“肝气郁结”的医案,其结果如图7所示。
3.4 医案数据统计分析及可视化模块的实现
数据统计分析及可视化模块根据用户的需求对医案数据进行统计分析,生成相应的统计图表和词云图,使用户可以更直观地了解医案数据特征,以便筛选出符合要求的医案来开展中医数字辨证研究。该模块可以细分为辨证结果统计及可视化模块、治法信息统计及可视化模块、方药信息统计及可视化模块、性别和年龄统计及可视化模块、医生和医案来源统计及可视化模块,部分实现效果如图8、图9和图10所示。
4 结论
为了建立中医数字辨证模型并验证其准确度,需要准备大量的配套医案。本文分析了中医数字辨证模型对医案的需求,设计并实现了中医数字辨证配套医案智能采集与分析系统,并以郁病医案为例开展了医案智能采集与分析工作,从辨证结果、治法信息、方药信息、性别、年龄、医生和医案来源七个角度对所采集的医案数据进行了统计分析,得出相应的统计分析图表和词云图,使用户可以更直观地了解医案数据特征,有助于快速采集并筛选出符合要求的医案来开展中医数字辨证研究,提高中医数字辨证模型的创建效率和质量。
参考文献
[1] 朱文锋.《中医数字辨证机》研究技术报告(医理部分)[J].湖南中医学院学报,1980(1):1-11.
[2] 韦昌法,晏峻峰.从知识表示与推理方法探讨中医数字辨证发展[J].中华中医药杂志,2019,34(10):4471-4473.
[3] 黄惠勇.证素辨证与数字中医药[J].湖南中医药大学学报,2012,32(11):3-6.
[4] 盛增秀,陈永灿.借古鉴今写好医案[J].浙江中医杂志,2018,53(7):469-471.
[5] 朱文锋.证素辨证学[M].北京:人民卫生出版社,2008:1.
[6] 张家玮,鲁兆麟.也谈中医医案研究的价值与意义[J].国际中医中药杂志,2011,33(1):63-65.
(本文编辑 李路丹)