APP下载

基于置信规则库的慢性萎缩性胃炎陈永灿辨证经验挖掘

2022-01-11林雨琪高玉才陈永灿黄瑶白钰指导

浙江中医药大学学报 2021年12期
关键词:中医师置信度陈氏

林雨琪 高玉才 陈永灿 黄瑶 白钰(指导)

1.浙江中医药大学基础医学院 杭州 310053 2.杭州电子科技大学 3.浙江省立同德医院

慢性萎缩性胃炎(chronic atrophic gastritis,CAG)为消化系统常见病,是胃黏膜上皮遭受反复损害导致固有腺体减少,伴或不伴纤维替代、肠腺化生和(或)假幽门腺化生的一种慢性胃部疾病[1]。目前由Correa[2]提出的 “慢性非萎缩性胃炎→CAG→胃黏膜上皮化生→异型增生→黏膜内癌→浸润性癌”的胃癌发生模式得到了国内外学者的普遍认可,并认为CAG是胃癌前病变。由此可见,CAG是胃癌演变过程中的关键环节。目前西医治疗CAG主要采取根除幽门螺杆菌感染、抑酸或抗酸护胃、保护胃黏膜及增强胃动力等西药治疗,均存在一定弊端。但大量临床数据表明,中医药治疗在缓解症状和逆转CAG病情进展方面显示出明显优势[3-5]。

中医药治疗的核心在于“辨证论治”,辨证的本质是通过四诊(望闻问切)等手段对“证”进行判别,其准确度对临床疗效起到决定性作用。由于中医辨证强调动态观察和因人而异,地域、时间和个人体质的差异,往往会导致疾病的辨证分型难以统一[6]。相较于一般临床中医师,名老中医具有更丰富的理论知识和临床经验,因而更能精准地把握疾病的证型。陈永灿主任中医师(下称陈氏)是全国老中医药专家学术经验继承工作指导老师、全国优秀中医临床人才、浙江省名中医,从事消化系统疾病诊治三十余载,尤其对CAG的辨治有着自己独到的见解。近年来,得益于近些年来人工智能在医学领域应用的快速发展,Logistic回归[7]、BP神经网络(Back Propagation Neural Network)[8]、决策树(Decision Tree)[9]等方法被广泛应用于疾病的辨证分型研究中。然而,多数计算机辅助辨证算法缺乏对多源异类信息的综合应用和处理能力,对证型的判断往往不准确,并且受到数据量的限制,使得证型判断结果往往与中医师的辨证结果背道而驰,导致准确率偏低,且波动较大。本文基于置信规则库(belief rule base,BRB)探究名老中医陈永灿对CAG的辨证经验,利用名老中医丰富的经验作为先验知识,借助计算机强大的分析能力解决疾病证型判断的个体差异,探索人工智能技术应用于中医传承创新的意义。

1 资料和方法

1.1 资料来源 数据源自2015年1月1日至2021年1月1日于浙江省立同德医院中医消化科陈氏门诊初次就诊的CAG患者。经3名专业中医师的严格筛选,排除部分模糊及无效病例,最终选取了572例门诊病例作为研究样本。

1.2 诊断标准 CAG西医诊断标准参照 《慢性胃炎中医诊疗专家共识意见(2017)》:内镜下可见黏膜红白相间,以白相为主,皱襞变平甚至消失,部分黏膜血管显露,可伴有黏膜颗粒或结节状等表现;慢性胃炎活检显示有固有腺体的萎缩,即可诊断为CAG,不必考虑活检标本的萎缩块数与程度[10]。

1.3 纳入标准 (1)符合CAG西医诊断标准;(2)病例资料完整,至少包括2次就诊记录,具体内容包括患者的基本信息、四诊信息、辨证论治、主方(药物及剂量)四部分;(3)年龄18~85岁,性别不限。

1.4 排除标准 (1)合并胃食管反流病、消化性溃疡、胃息肉、胃部手术史、Menetrier病(肥厚性胃炎)等的患者;(2)合并严重肝、肾、造血系统等原发性疾病者;(3)合并精神疾病或不配合调研者。

1.5 方法 由于在对CAG的辨证过程中,存在中医师主观性对辨证结果影响较大、信息不确定等问题,本文利用Yang等[11]基于证据推理的置信规则库的方法 (Belief Rule-Base Inference Methodology using the Evidential Reasoning approach,RIMER) 构建一个CAG辅助诊断模型,来协助中医师对CAG证型的判断。基本步骤主要由BRB构建、激活权重计算、激活规则的融合三步组成,具体如下。

1.5.1 BRB构建 BRB是在Dempster-Shafer证据理论、决策理论和传统规则的基础上发展而来[11]。BRB模型不仅具有处理定性知识和定量信息的能力,还能够在信息处理过程中保留信息的不确定性部分,目前广泛应用于医疗诊断领域[12]。BRB可表示如下:

其中xi(i=1,2,…,n)为第k条规则的前件输入特征,Aki(i=1,2,…,n)为第k条规则第i个输入特征xi考值集合,n为输入特征的个数;Dj(i=1,2,…,N)是置信规则的后件输出特征,βj,k(j=1,2,…,N)为对输出特征Dj(j=1,…,N)对应的置信度,而N代表输出特征的个数。

1.5.2 激活权重计算 第k条规则的激活权重wk由公式(2)计算得到,表示该规则对生成输出结果所起作用的大小;

1.5.3 激活规则的融合 经过公式(2)得到每条规则的权重,再利用证据推理(evidence reasoning,ER)融合算法对激活的规则进行融合,融合的公式如下所示:

其中βj是第j个输出特征的置信度,而βjk是第k条规则第j个输出特征的置信度,在规则库中已知,由陈氏经验给出,所以最终的输出结果如公式(4)所示:

输出结果为预测的概率值,即每类得出一个概率值并且它们的和为1。

本文将症候信息共计102个输入特征归类为形体、饮食口味、头面部症状、咽喉部症状、胸脘腹症状、二阴症状、舌诊、脉诊、其他症状共九大类,每一类别又根据其特点进行细分,形成树状层级分类关系。根据此层级规则,把症候信息编码成0~9(根据类别数目变化)的数字,“0”代表没有此症状,即正常;“数字”代表有此症状,并以此作为上述公式(1)中的输入特征。全部资料导入Excel中,建立CAG中医症候信息数据库,并选取已有的陈氏临床数据中69.93%(400例)作为规则,剩余30.07%(172例)作为测试数据。同时,参照朱文峰教授的《证素辨证学》和陈氏的辨证经验,确定与CAG相关的证素:寒、热、气滞、阴虚、肝郁、湿、痰饮(浊)、脾气虚、毒、血瘀、阳虚、心神(脑)十二项,并作为输出结果,然后通过CAG辅助诊断模型得出每一类证素的预测置信度。最后根据输出特征 (证素)置信度得出证型,辨证流程见图1。

图1 CAG辅助诊断模型辨证流程图Fig.1 CAG-assisted diagnosis model syndrome differentiation flowchart

2 结果

2.1 基本信息 本文共收集CAG初诊患者572例,年龄25~83岁 , 平 均 (56.16±11.98) 岁 ; 男256例(44.76%)、女316例(55.24%),男∶女=1∶1.23。

2.2 数据分析

2.2.1 评价指标 通过构建好的、以BRB+ER算法为基础的CAG辅助诊断模型进行计算分析,并以输出证素匹配度作为准确率(即模型输出的置信度与陈氏制定的证素置信度的匹配程度)。由于在实际辨证过程中,中医师根据患者的主要症候信息确定患者的主要证型,因此在陈氏所制定的证素置信度中,首先将证素分为主要证素和次要证素,证素个数限定在2~4个,其次主要证素的置信度在40%~80%,次要证素的置信度在10%~40%,且所有证素置信度之和为100%。

2.2.2 CAG辅助诊断模型定量分析 根据上述评价指标,在172例测试样本中有136例与陈氏制定的证素置信度结果相匹配,准确率达到79.07%,充分证明了所提出模型的有效性,符合预期。现举例说明样本匹配过程,患者1中陈氏认为其主要证素为脾气虚,次要证素为气滞、热;CAG辅助诊断模型预测证素置信度前三位为脾气虚、气滞、热,则说明该样本测试结果与陈氏制定的证素置信度结果相匹配。重复上述过程,患者2、3、4的测试结果均相匹配。 见图2、3。

图2 陈氏证素置信度图Fig.2 Confidence chart of syndrome elements formulated by Prof essor CHEN

图3 CAG辅助诊断模型预测证素置信度图Fig.3 Confidence chart of syndrome elements predicted by CAG-assisted diagnosis model

为了验证模型的有效性,本文选取常见的机器学习方法支持向量机(support vector machine,SVM)算法[17]进行对比研究,SVM的其非线性以及训练高效的特点使其在泛模式识别领域有着极为重要的地位,在医学领域中亦有广泛的应用[18]。本文将102个症候信息编码后作为输入特征,分别采用SVM算法中的“一对多”以及“一对一”策略进行训练,最终利用训练好的模型进行测试,其中测试数据与本文的BRB+ER算法保持一致。见表1。本文提出的BRB+ER算法优于传统的SVM算法,充分说明了BRB+ER算法的有效性。

表1 SVM算法与BRB+ER算法对比Tab.1 Comparison of SVM algorithm and BRB+ER algorithm

2.2.3 证型结果分析 通过统计方法对136例预测准确的样本的证型结果进行分析,本文归纳出了3种主要证型,分别是脾虚气滞型、寒热错杂型、肝胃郁热型;除此之外,还包括脾胃虚寒型、胃络瘀血型、胃阴不足型、中焦湿热型等,且上述证型均符合临床实际。见表2。前期对陈氏治疗CAG的用药特色挖掘研究中,总结出陈氏临床上CAG患者主要以脾虚湿滞型、脾胃气滞型、肝胃郁热型为主[19],这与本研究结果也基本相符。

表2 CAG证型结果统计表Tab.2 Statistical table of CAG syndrome type results

2.3 典型病例举隅 患者女,51岁,2021年2月2日初诊。主诉:脘腹时有胀满1个月余。现病史:脘腹时有胀满,口苦,时有嗳气,夜寐不安,纳可,舌嫩红,苔薄腻,微糙,脉细。2021年1月14日外院胃镜示:CAG。西医诊断:CAG;中医诊断:痞满,证型:气滞阴亏、郁热扰神证。处方:百合24 g,乌药9 g,紫苏梗9 g,炒麦冬15 g,羊乳15 g,无花果15 g,蒲公英30 g,炒黄连6 g,吴茱萸2 g,淡竹叶9 g,合欢皮15 g,炒酸枣仁15 g,柏子仁18 g,枸橘15 g,甘草6 g,大枣30 g。共7剂,一日二次,水煎服。

根据现病史提取主要症候信息,确定相关证素:主要证素为气滞、阴虚;次要证素为热、心神(脑)。将主要症候信息转换为计算机语言后输入到CAG辅助诊断模型中。见图4。选择置信度的前4位证素,依次为阴虚、热、气滞、肝郁,则该病例证型为阴亏内热、气滞肝郁证,与陈氏判断的证型基本相符。

图4 典型病例证素输出结果图Fig.4 Output result chart of case syndrome elements

3 讨论

胃癌是危害人体健康的最常见的消化道恶性肿瘤之一,有研究表明胃癌发生风险与CAG的程度和范围有关,及早治疗干预CAG可阻止胃癌前病变进展,可显著降低胃癌风险[20]。因此,探究对CAG的高效诊治手段,对胃癌发病的预防和控制具有重要意义。“方从法出,法随证立”是中医遣方用药的基本原则,故探究CAG的诊疗方法,确定“证”的重要性可见一斑。在实际诊疗中,受信息不确定性的影响,中医师难以完全确定某一证型,而是对多种可能存在的证型赋予一定的信度。本文通过BRB+ER算法模式建立的CAG辅助诊断模型,输出的不再是某一疾病的单一证型,而是由多个证素及其信度赋值构成多种证素的组合,中医师可以通过证素信度的排序确定患者的证型,更加贴合临床实际。与医学领域中常用到的SVM算法比较,本文提出的算法结合了名老中医经验及统计学知识,而不是单纯依赖于数据的统计特征,因此能够达到更好的辅助判断效果。表1中的实验结果对比也证明了本文所提出方法的有效性。

本研究结果显示,由于筛选样本量大、时间跨度广、囊括CAG证型较全面,本研究建立的CAG辅助诊断模型预测准确率高,说明该模型可应用于临床实际诊疗中。在后续的研究中可以继续完善CAG辅助诊断模型,形成一个完整的系统,使其可针对具体的CAG证型提供相应的方药信息和诊疗方案建议,主要包括用药类型、用药剂量、生活习惯指导等。

通过BRB挖掘名老中医辨证经验,不仅能为年轻中医师、基层医师的临床诊疗提供依据,也能为传承和学习名老中医诊疗经验提供有效途径。未来可以建立更多的疾病辅助诊断模型,进一步挖掘名老中医在疾病辨证方面的特色经验,将人工智能技术更充分地应用到名老中医经验的传承中。

猜你喜欢

中医师置信度陈氏
基于数据置信度衰减的多传感器区间估计融合方法
一种基于定位置信度预测的二阶段目标检测方法
义宁陈氏家风
《中医药法》助力中医师职业教育发展的完善路径
吕华主任辨治支气管扩张经验
陈远
林挺
陈氏兄弟
校核、验证与确认在红外辐射特性测量中的应用