APP下载

基于数据挖掘的淋巴瘤医案集外关联解析

2021-10-13朱垚姬承诺倪海雯陆明

中国中医药信息杂志 2021年9期
关键词:医案茯苓淋巴瘤

朱垚,姬承诺,倪海雯,陆明,3

1.南京中医药大学,江苏 南京 210029;2.南京中医药大学附属医院,江苏 南京 210029;3.南京医中科技数据挖掘中心,江苏 南京 210029

淋巴瘤是由淋巴造血系统病变引起的恶性肿瘤,可发生在身体各部位,症状复杂,主要临床表现为无痛性淋巴结肿大、肝脾肿大等,常伴有发热、盗汗、消瘦、皮肤瘙痒或皮疹等全身性症状,随病情发展逐渐导致全身各组织器官受累,晚期可转化为急性淋巴细胞白血病。现代医学运用靶向药物、免疫制剂与化疗联合方案能够延缓病情进展,在一定程度上改善患者预后,但毒副作用较大,且存在耐药及复发情况。根据临床表现,淋巴瘤可归属中医学“石疽”“阴疽”“痰核”“恶核”“虚劳”等范畴。中医药干预淋巴瘤主要基于辨证论治,不同医家的辨治经验各有特点,系统整理研究淋巴瘤的中医辨证思路及用药经验,有助于优化该病的中医临床诊疗方案。本研究通过收集淋巴瘤相关临床医案论文,提取病历信息,建立淋巴瘤临床医案数据库,采用数据挖掘方法对医案数据进行集外关联解析,研究淋巴瘤医案不同子项集之间潜在的辨治规律,尤其关注中医四诊辨证信息、病机证素与治疗药物之间的高关联特征。

1 资料与方法

1.1 数据来源

以“淋巴瘤”AND“医案”OR“验案”OR“治验”为核心检索式,选择中国知识资源总库(CNKI)为目标单源数据库,检索建库至2019 年8 月15 日公开发表的中医治疗淋巴瘤医案类论文,形成论文数据库,保留Download Index 索引清单,进行双人复核,确保论文数据库与索引清单的量值一致。

1.2 筛选标准

纳入标准:①论文医案描述中明确“淋巴瘤”诊断;②论文医案描述中存在中药内服干预方案;③论文医案描述中有复诊信息,存在可供医案疗效判断的症状。排除标准:在不同论文中记录了同一主诊医师的相同医案,排除时序首位记录外的所有医案。

1.3 数据库构建

在论文数据库基础上,采用Medcase V3.8 诊籍中医师工作室-名老中医经验传承辅助平台进行医案数据文本提取,建立淋巴瘤专病医案数据库。录入完成后进行二次数据审核。不同研究人员录入及审核,控制相异率<3%。

1.4 数据预处理

针对医案录入与数据文本提取过程中发现明显的症状、病机、治法、药物、理化检查等数据源错字、别字、误字、异字及检查单位、剂量的错记、误记、漏记等非研究性数据噪点,进行溯源性预处理,达到降噪、优化的目的。不同研究人员对溯源数据值与修正数据值进行实时双备份标记。

1.5 数据规范化

预处理后的医案研究数据库整体数据,按照不同分析类型进行数据规范化。中医药术语分项集进行规范化,症状项集、诊断项集、病机项集参照《中医诊断学》[1],药物项集参照《中药学》[2]。数据规范化操作参考《中医临床医案数据挖掘研究数据规范化标准》(QB/GL MCT 102-2019):①症状项集规范症状原生描述前饰或后饰的时间节律与程度特征;②诊断项集规范相同患者的病种与年龄;③病机项集规范同一患者多诊医案的默认病机;④药物项集规范药物异名与特殊煎制等。

1.6 数据分析

Medcase V3.8 诊籍中医师工作室-名老中医经验传承辅助平台系江苏省科技创新专项研究成果,由南京中医药大学国医大师周仲瑛工作室、第二临床医学院、人工智能与信息技术学院联合研发[3],已在江苏地区中医临床、教学、科研单位广泛使用。本研究采用Medcase 系统的XMiner V1.0 中医药数据挖掘平台进行格式化和编码,并根据文本特征计算数据权重,参考《中医临床医案数据挖掘研究数据分析操作标准》(QB/GL MCT 202-2019)执行系统常规极值处理,实时记录调参标值,基于FP-Growth 加强关联分析算法进行挖掘运算,并进行数据可视化表达。

2 结果

2.1 医案一般情况

共纳入医案138 则,涉及患者138 人次、354 诊次,其中男性176 诊次(49.72%),女性178 诊次(50.28%),年龄6~86 岁。涉及病机59 条,症状215 种,脉象18 种,舌象80 种,药物451 种。仅记录初诊的单诊次医案54 则;同时记录复诊的多诊次医案84 则,其中临床症状改善医案81 则(96.43%);超过5 诊次的长诊次医案17 则,诊疗时间超过6 个月的长疗程医案9 则,超过12 个月的长疗程医案9则,长诊次及长疗程医案临床症状改善率均为100%。

2.2 集外关联规则

2.2.1 临床症状与药物

临床症状与药物集外关联规则共29 条(见表1)。支持度>0.08、置信度>0.5 的关联规则为咳嗽与黄芪、咳嗽与陈皮、咳嗽与茯苓、夜寐不安与茯苓、淋巴结肿大与茯苓、神疲与黄芪、乏力与茯苓、乏力与黄芪。乏力、神疲等与黄芪、茯苓的关联度较高。黄芪味甘性微温,归肺、脾、肝、肾经,可补肺脾肾之气,临床用于治疗淋巴瘤虚损性证候;茯苓味甘、淡,性平,有渗湿健脾功效,可补益肺脾,治疗气虚等证。

表1 138 则中医治疗淋巴瘤医案临床症状与药物集外关联规则(支持度>0.03,置信度>0.5)

2.2.2 病机与药物

病机与药物集外关联规则共23 条(见表2)。痰与香附、夏枯草、菟丝子等有较高关联,气虚、血虚等与黄芪有较高关联,湿与茯苓有较高关联,气滞与柴胡、香附等高关联,脾虚与人参、山药高关联,肾虚与菟丝子、山药高关联。提示治疗淋巴瘤化痰散结行气多用香附、夏枯草;出现气血不足虚性病机常用黄芪、党参等补虚药健脾补气,以气生血;脾肾两虚是淋巴瘤常见病机,多用山药、人参、菟丝子等补肾健脾之品。

表2 138 则中医治疗淋巴瘤医案病机与药物集外关联规则(支持度>0.05,置信度>0.5)

2.2.3 舌象与药物

舌象与药物集外关联规则共21 条(见表3)。苔厚与生姜、黄芪、山药、甘草、茯苓高关联,质淡与白术、茯苓、黄芪高关联,苔黄与茯苓、陈皮高关联,苔腻与茯苓高关联。苔厚多为湿阻之候,生姜发汗利湿,茯苓利水渗湿,黄芪、山药、甘草健脾益气。质淡多提示气血不足,白术、黄芪有健脾益气功效。苔黄提示有内热,结合淋巴瘤病症特点,临床多为气郁、痰湿久积化热所致,高关联药物陈皮、茯苓有理气健脾、利湿化痰之功。

表3 138 则中医治疗淋巴瘤医案舌象与药物集外关联规则(支持度>0.03,置信度>0.5)

2.2.4 脉象与药物

脉象与药物集外关联规则共18 条(见表4)。沉脉、弦脉与陈皮、黄芪、茯苓有较高关联,弦脉与茯苓高关联,细脉与黄芪高关联。淋巴瘤多以虚为主,兼有虚实夹杂。沉脉主里证,弦脉多为气滞肝郁,细脉多主虚证,故用陈皮理气调中,黄芪益气升阳,茯苓利水渗湿兼具补益之功,三药均有补虚功效又各有所长,可用于虚实错杂证候。

表4 138 则中医治疗淋巴瘤医案脉象与药物集外关联规则(支持度>0.05,置信度>0.5)

2.2.5 临床症状与病机

临床症状与病机集外关联规则共23 条(见表5)。齿松、口僵、夜尿、目涩、喜热饮、皮肤损伤、感冒与痰高关联,脾肿大、皮肤损伤与湿高关联,足痛、口僵、夜尿、腹泻、目涩、溃疡、浮肿等与各种虚证高关联,口僵、皮肤损伤、溃疡与火热高关联。提示淋巴瘤与虚证高关联的症状较多,涉及气虚、阴虚、阳虚、脾虚等。无以固摄,肾气虚则膀胱失约,夜尿增多,脾阳虚则运化水液失职,易于浮肿,气滞水停则聚而生痰。阴液不足,虚热内生,则见目涩、溃疡等虚火上炎诸证。

表5 138 则中医治疗淋巴瘤医案临床症状与病机集外关联规则(支持度>0.005,置信度≥0.5)

3 讨论

基于中医医案的数据挖掘与知识发现是近年来中医药研究的热点范式之一。中医医案数据挖掘研究方法众多,符合中医临床辨治特点且能有效总结专家经验的挖掘方法以频数解构、关联规则、聚类分析为主。关联规则挖掘算法主要研究项集内频繁项之间的关联性。通过对中医医案实际数据样本集的系列研究分析发现,通常一个医案数据样本集可根据中医临床辨治特点设立多项字段,从而划分成若干子项集。不同医案数据子项集内的项有较高的相关性,而不同医案数据子项集间的项也存在符合中医临床辨治知识规律的高相关性,提示每个医案数据子项集与其外部的潜在因子间存在着正向或负向关联。因此,基于中医药学知识发现的客观规律与前期大量中医医案挖掘实践[4-8],笔者所在研究团队提出集内关联与集外关联的概念,并根据关联规则在中医医案研究中的主要目的,确立集内关联与集外关联的内涵及外延,扩展和丰富了关联规则挖掘在中医医案领域的应用。本研究通过对淋巴瘤医案的集外关联解析,系统梳理中医诊治淋巴瘤临床真实世界中症状、舌脉、病机与药物不同项集间潜在的辨治规律。

中医临床诊疗的既往知识发现,多在临床医师大量诊治同类疾病积累经验的基础上,总结高频关联性药症规律,形成知识留存。因此,中医临床常有“有是症用是药”的专症专药的特色药物知识提炼规则。郑佳彬等[9]运用测评量表对单纯中医药治疗阶段的淋巴瘤患者症状进行系统性研究,探索淋巴瘤症状特征及中医证型特点,发现淋巴瘤患者普遍存在多种症状,其中发生频率最显著的3 个症状为口干、疲劳、睡眠不安,强度最显著的3 个症状分别是疲劳、出汗、口干;淋巴瘤患者辨证常出现两证或三证相兼的情况;在证型频次中,虚实夹杂证出现最多,其次为虚证,实证较少。本研究结果显示的临床表现与同类研究基本一致,其中神疲、乏力与黄芪高关联,淋巴结肿大、夜寐不安与茯苓高关联,对于临床表现芜杂的淋巴瘤对症用药有一定参考价值。

病机的构成要素包括病性、病位、病势和病理因素,是疾病发展的动态核心,决定了疾病发展的走向与转归。证候是疾病阶段性特点的归纳与总结,构成了疾病特定时点的诊断要素。病机证素与证候要素在中医辨证环节有着共性特征,但从术语表达层面很难明确区分,需结合运用语境与辨治思路判别。《恶性肿瘤中医诊疗指南》将恶性淋巴瘤分为气虚证、阴虚证、血虚证、痰湿证、血瘀证、气滞证[10]。王臻等[11]将淋巴瘤分为寒痰凝滞型、气滞毒瘀型、肝肾阴虚型、气血双亏型、血热风燥型5 种证型辨证论治。陈锦峰等[12]将淋巴瘤分为3 类:虚证类以脾肾亏虚型、脾胃气虚型、肝肾亏虚型、气血双亏型为主,实证类以血热风燥型、寒痰凝滞型、气郁痰凝型、气滞毒瘀型、痰饮凝聚型、痰瘀互结型为主,虚实夹杂类以阴虚内热型、脾虚夹湿型为主。国医大师周仲瑛教授临证精于病机辨证,善治疑难重症,多从“癌毒”病机辨治淋巴瘤。周仲瑛工作室研究团队系统总结周仲瑛教授辨治淋巴瘤经验,明确淋巴瘤属于本虚标实之证,五脏气血亏虚为本,癌毒夹杂痰浊、瘀热为标[13]。扶正以益气养阴、补益脾肾为主,祛邪多用解毒抗癌,佐以清热化痰散结为法。病机辨治分为五型:以痰毒凝结为核心病机,治宜化痰解毒散结;以瘀毒互结为核心病机,治宜解毒活血;以热毒蕴结为核心病机,治宜清热解毒、祛痰散结;以气虚痰毒为核心病机,治宜温阳利水祛湿;以阴虚痰毒为核心病机,治宜滋补肝肾、解毒散结。本研究结果显示的病机证素与现有专家病机分型高度重合,气虚、血虚与党参、黄芪,气滞、痰与柴胡、香附、夏枯草,脾虚、肾虚与人参、山药高关联,对于淋巴瘤辨证获取核心病机证素及辨机用药有指导意义。

本研究为单源数据库类研究,旨在研究单一来源数据库的医案数据结构特点,其优势在于能够有效降低建库噪点,减少研究复核能耗,留存单源数据研究样本,为多源数据库类研究形成比对数据,确保后续多源数据库类医案挖掘研究的差异值显现最大化。但单源数据库类研究存在总体文献样本量偏小的客观研究属性,采用集外关联研究其数据结果多为实际辨证中的高关联、高频率经验,显示规则条目相对集中,可解释临床意义范围相对局限。另外,不同集外关联平台采用的底层算法不同,在样本数据量较小的情况下,挖掘结果存在算法矫正偏倚可能,从而使部分数据规则与已知临床知识提炼规则存在一定偏移。因此,今后在医案类集外关联规则研究中,为达到有效降低偏倚、规则显现最大化、临床意义高解释性的研究目的,应采用单源数据库类与多源数据库类研究平行采集、交叉校验的复合型数据挖掘方法,并根据中医临床医案的文本特征不断优化底层算法。

猜你喜欢

医案茯苓淋巴瘤
Antihepatofibrotic effect of Guizhifuling pill (桂枝茯苓丸) on carbon tetrachloride-induced liver fibrosis in mice
HIV相关淋巴瘤诊治进展
健脾安神话茯苓
茯苓健脾 孩子健康
医案聊斋续篇 吐泻案
医案聊斋续篇 晨泄案
桂枝茯苓透皮贴剂的制备
不一致性淋巴瘤1例及病理分析
鼻咽部淋巴瘤的MRI表现
原发性甲状腺淋巴瘤1例报道