中医四诊智能化研究现状及热点分析
2022-03-12李红岩李灿郎许锋杨涛周作建战丽彬
李红岩,李灿,郎许锋,杨涛,周作建,战丽彬
(1.南京中医药大学人工智能与信息技术学院,江苏 南京 210023;2.辽宁中医药大学中医药创新工程技术中心,辽宁 沈阳 110847)
中医药作为中华文明的瑰宝,在抗击非典型性肺炎和新型冠状病毒肺炎疫情中都发挥了重要的作用,并做出了巨大的贡献。在中医药传承发展,守正创新的时代背景下,四诊作为中医诊断辨证的基础,在人工智能等新技术的赋能下也开始加速发展。本文针对中医四诊智能化的研究现状和热点展开讨论,以期对该领域的进一步发展和研究起到参考和借鉴。
1 人工智能赋能中医四诊的时代背景
中医四诊要求医生在获取信息的基础上利用经验进行分析并做出准确判断。然而,这种诊断方法依赖于医生的知识水平和实践经验,主观性很强,并且对医生具有极高的要求,从而导致不同的医师针对同一病例的诊断也可能会有较大的差异。此外,由于时空限制,目前中医医疗资源分配不均,大部分患者很难获取优质的医疗资源。在中医人才供给不足,诊疗负担重,经验要求高的情况下,如何突破中医发展的困境,促进中医的传承创新,不仅是中医人需要思考的问题,也是国家和人民对中医药发展的殷切期望。
与此同时,人工智能作为计算机科学的一个分支,被认为是21世纪三大尖端技术之一。近30年来人工智能发展迅速,已广泛应用于各大学科领域,对行业的赋能作用不断凸显,制造业、交通业、医疗业等各大行业都迎来了智能化进程。利用人工智能为中医四诊赋能,实现四诊智能化,让四诊发挥更好的价值,已成为近年来广大中医药和科技工作者共同的追求。
自1982年郭振球[1]探讨如何通过人工智能模拟中医辨证思维规律以来,越来越多的学者开始关注中医药与人工智能的融合发展。伴随着人工智能的迅猛发展,中医四诊智能化的研究更是逐步吸引了中医学、自动化技术、计算机科学与技术、生物医学工程、仪器仪表以及电信技术等不同学科学者的关注,开展更为深入的技术和应用研究。
2 中医四诊智能化研究现状
我们检索并筛选了中国知网(CNKI)和Web of science(WOS)上近十年有关中医四诊智能化的中英文文献,统计发现近十年来关注中医四诊智能化问题的学者越来越多,对这一科学问题的研究也得到了国家的高度重视。自2016年以来,随着人工智能重要分支深度学习技术的成熟,人工智能发展火热,国家和广大学者对中医四诊智能化的研究也开始高度重视。如图1(a)所示,2017年开始,无论是CNKI还是WOS上的学术文献的发文量都开始大幅增加,此后每年增长幅度平均约为前一年度的2.15倍。图1(b)的国家合作网络中则明显展示出我国大陆地区为该研究领域的主体,并与中国台湾地区、澳大利亚、德国、加拿大、美国、英国、罗马尼亚有不同程度的合作。日本、芬兰、韩国、印度等国家也已经开始开展相关研究。可见伴随着中医魅力的展现以及人工智能技术的迅猛发展,全世界范围开始有越来越多的学者关注中医四诊智能化研究。由图1(c)文献资助情况来看,我国国家级科研基金对该主题研究领域的资助已超过总体资助的一半以上,更可见我国政府对该研究领域的重视程度之深及学者们对该问题的研究兴趣之浓厚。
(a)年度发文统计 (b)国家合作网络
为了解该领域学者的关注点及合作情况,我们分析并绘制了文献作者合作关系网络及关键词共现网络,如图2所示。图中颜色代表了首次发表文献的时间,节点和标签的大小则对应于发文量的多少。从图2(a)来看,上海中医药大学的王忆勤团队[2-8],许家佗团队[9-12],成都中医药大学的温川飚团队[13-16]和天津中医药大学的王泓午团队[17-18]在CNKI上发文较多。华南理工大学文贵华团队[19-24]在WOS上发文较多。而上海中医药大学许家佗、屠立平团队[9-12,25-32],福建中医药大学的李灿东团队[33-40]在CNKI和WOS上均有较多发文。我们对这些团队在四诊智能化领域的研究兴趣及内容进行了梳理,详见表1。
表1 中医四诊智能化主要团队及研究内容Table 1 The main team and research contents of intelligent four-diagnosis in TCM
(a)作者合作网络
图2(b)中关键词术语共现图谱中节点(及标签)大小表示术语出现的频次,紫色外圈表示该节点具有较高的中介中心性。由图中可以看出,CNKI文献中人工智能、机器学习和深度学习已成为三大高频关键词,分别出现44、20和19次。WOS文献汇总深度学习、舌诊舌像和机器学习成为高频术语,分别出现17、28和12次,而卷积神经网络则自2019年开始广泛出现在各研究文献中,成为中医四诊智能化的基本技术和主要手段。
3 中医四诊智能化研究热点
得益于计算机视觉和语音识别技术的发展,目前中医四诊智能化研究的热点主要集中于舌诊、面诊、脉诊、问诊方面。而闻诊中声诊和嗅诊的研究由于数据采集过程中环境干扰因素交错,目前大多仍关注于采集仪器的研制和数据去噪等质量提升工作方面,智能化的诊断还相对较少。
当前研究热点中舌诊和面诊均是直接针对采集图像进行学习,早期文章多采用传统的图像处理技术,后来则逐渐采用机器学习的方法,近年来采用深度学习方法的文献显著增多。脉诊可看作是在二维脉图数据上通过信号处理或学习的方式完成分析与预测。问诊数据大多为量表化数据,在选择和推荐问诊问题时,大多数研究仍采用基于图模型、内容或邻域的传统推荐算法。在针对获取到的问诊数据进行证候分类时则多采用机器学习或深度学习建模的方式来完成。
3.1 舌诊智能化
目前中医诊断智能化研究大多集中在舌诊方面。部分学者对于舌诊客观化研究[13,17],人工智能技术在舌诊中的应用[4]以及基于舌像的疾病诊断[18]方面的研究现状进行了分析和综述。在技术实现上,主要侧重于舌像的标准化采集,已获取舌像的图像质量评估[26]、颜色校正[31]等预处理手段,以及进行舌体分割、构建舌像数据库,为应用人工智能技术作准备。其次,主要是舌像特征学习的研究,如舌像中齿痕和裂纹的检测[38],舌苔的检测和标定及舌体构成识别[23-24],舌像局部及全局特征的提取[30]等。由于医学数据的特殊性及个人隐私保护的需要,目前相关研究均采用自己采集数据的方式,每种方法采用的评价指标也不尽相同,因此方法之间难以进行定量比较。针对舌体分割问题,一般多采用动态轮廓(Snake)模型,支持向量机(SVM)或深度学习的U-Net、Seg-Net以及改进的全卷积神经网络(FCN)模型。针对舌裂纹检测,则多采用深度学习的方法,如卷积神经网络、YoLo、Faster RCNN、DenseNet等。从近两年文献报告来看,李渊彤等[41]采用FCN-16s模型结合单像素损失函数LCLoss进行舌体分割,分割平均像素精度达到98.51%,平均交并比达到96.32%,进而对齿痕的识别精度达到85%以上,对裂纹、芒刺、腐腻、瘀点、厚薄、苔色等纹理特征的分析平均准确率为82.07%。颜建军等[6]采用深度学习完成舌体分割,继而利用YoLoV5检测齿痕,最后借助随机森林完成对正常、轻度和重度齿痕舌的分类,分类平均准确率为93.17%。刘佳丽等[42]融合YoLoV3和DenseNet,提出Double-D模型实现舌裂纹的检测,检测结果召回率为92.93%,精准率为97.56%,特异性为98.75%,平均检测速度为0.029 s。基于对舌体的分析和学习,可进一步实现通过中医舌诊基于机器学习来构建糖尿病风险预测模型[27-28]、慢性胃炎识别模型[30]等。Wen等[19]则构建了舌像与中医处方对应的数据库,在舌像分析的前提下利用神经网络完成了处方及药材推荐。
3.2 面诊智能化
面诊的智能化研究目前主要集中于面部分割后的面色识别。面色识别近年来多采用机器学习的K近邻(KNN)、K均值聚类(K-means)和SVM方法,以及深度学习的BP神经网络和卷积神经网络方法。2018年,陈梦竹等[11]采用BP神经网络对面色为白色的分类准确率可达89.5%。2020年,林怡等[9]融合多种不同面部特征对比使用BP神经网络和SVM和KNN方法对赤、黄、白、黑4种面色进行识别,识别率最高为91.03%。2021年,孙康宁等[43]进一步将青色也加入面色识别中,并对比了K-means、支持向量机和卷积神经网络CNN 3种方法的识别效果,得出CNN分类效果最佳,整体面色分类准确率为89.33%,局部面色识别准确率为95.11%。Liao等[22]尝试使用深度学习挖掘患者的面部与中药处方之间的关系,并提出构建卷积神经网络,根据患者的面部图像生成中药处方。
3.3 脉诊智能化
脉诊的智能化研究大多是在获取脉搏波后,分析提取脉搏波特征来进行脉象识别,或利用脉搏变化预测血压情况,分析方法多采用机器学习的决策树、K近邻、SVM和逻辑回归,以及深度学习的概率神经网络和循环神经网络。如张嘉琪等[44]对比循环神经网络RNN和概率神经网络PNN对脉位失常、脉率失常、脉型失常的识别能力,证明在噪声数据为0.1时,RNN的识别准确率为95.51%,F1度量为98.72%。李勐等[45]对冬至和夏至时期采集到的脉搏信号采用K近邻、SVM、决策树和Bagged Tree 4种机器学习方法进行数据分类,以验证所设计的脉诊机器人系统的有效性。其中Bagged Tree的分类准确率为97.5%,ROC为98%。颜建军等[3]对脉图波形进行时域特征提取,并基于随机森林等机器学习算法建立血压预测模型,预测精度已达到AAMI国际电子血压计的标准。Luo等[29]通过观察脉搏波的动态变化,评估高血压的风险。分析了脉冲波对多种机器学习模型准确性和稳定性的影响,在采用AdaBoost方法时评估准确率高达86.41%,为中医药在现代疾病诊断和疗效动态评价方面提供了研究方向和基础。
3.4 问诊智能化
问诊智能化的研究主要有两种方式,一是如何通过推荐算法完成问卷设计,二是结合其他诊疗方法以提高问询效率。如迪盼祺等[2]借鉴了物品推荐中常用的协同过滤算法和遗传算法,实现了中医智能问诊系统,达到了仅在进行13次提问的情况下,便可使证候分类器的辨证效果达到90%以上。Fan等[20]提出了一种基于机器学习技术的个性化身体素质查询方法。问卷设计首先根据患者舌苔图像的识别结果对问题进行排序,从而为患者选择个性化的问题,大大减少了患者回答问题的时间和数量。与直接采用《中医体质问卷》相比,患者回答问题减少了68.3%,回答时间则减少了80.3%。除了确定智能问诊中需要“问什么,怎么问”之外,也有部分研究基于问诊数据进一步实现证候分类。如迪盼祺等[2]利用问诊数据完成心系疾病的证候分类,分类精度可达90%以上。颜建军等[7]则基于慢性胃炎的问诊数据,采用深度森林算法gcForest并对比DBN和DBM深度学习方法以及BSVM、ML-KNN、RankSVM、ECC和LIFT 5种机器学习多标记方法的证候分类效果。实验证明,gcForest可取得更好的证候分类效果,分类平均精度为83.4%,覆盖距离为16.2%,汉明损失为13.5%。
3.5 其他
目前的研究除了针对某一种诊法如何实现智能化以外,研究热点也包括数据及系统构建和多信息融合两个方面。
数据及系统构建方面,成都中医药大学温川飚团队[16]采用音视频设备及传感器采集四诊信息,并对采集到的信息进行脱敏和压缩,从而建立中医四诊数据仓库。该团队进一步在中医四诊的基本理论指导下,通过多学科交叉,构想制定中医的体检服务体系。福建中医药大学李灿东团队[33,36]则致力于构建中医健康状态辨识系统,期待完成中医四诊信息的智能化采集和辨识。
多信息融合方面目前也有两种做法,一种是融合四诊的不同信息,另一种则是融合中西医的不同指标和方法。如Shi等[25]采用智能舌诊和脉诊分析仪采集舌像和脉图数据,基于两种信息建立综合分类模型,以辨别非小细胞肺癌的气虚证和阴虚证。Fan等[20]在舌像识别的基础上进行中医问询,以实现将舌诊和问诊相结合的诊查方式。Xia等[39]则在2020年首次探讨了中医证候元素与39项理化指标之间的相关性,并基于同一患者可发生多种中医证候的特点,构建多标签学习算法获取对代谢综合征的中医诊断结果。2021年Xia等[37]进一步融合了14个理化指标和6个中医指标,包括弦脉、胸闷、自汗等预测代谢综合征。从其研究结果来看,基于融合指标构建的模型相比于单纯理化指标模型和中医指标模型特异性、准确性及敏感性更高,具有更好的预测能力。
4 思考与展望
从已有研究来看,目前中医四诊的智能化研究大多仍基于某一种诊断方法进行。尽管近两年来,逐渐有学者融合不同诊断方法,如将舌诊与面诊、舌诊与脉诊、舌诊与问诊相结合,但四诊合参的智能化仍处于探索阶段,尚缺少真正的技术化实现。而四诊合参才能真正体现中医诊断的整体观念,对于全面了解和辨别病情具有重要的意义。因此,如何进一步完善四诊的多信息融合,真正实现中医四诊合参的智能化将是亟待解决的重要问题。
此外,目前的中医四诊智能化技术主要以学习方法为主,即采用机器学习或深度学习挖掘采集的诊疗信息中所蕴含的规律。然而基于学习的方法,其结果极大依赖于用于训练的数据量及数据标注质量。而根据收集的四诊信息进行标注是一个非常冗繁耗时的过程,且需要经验极为丰富的中医专家完成。而当不同的专家去完成标注时,因其经验和观察侧重点不同也往往会出现意见相左的情形。因此,如何在学习过程中更好地利用标注信息,继而实现知识与学习的融合,学习结果的即时反馈也是将来需要进一步研究和探讨的问题。