基于动态知识图谱的中医疫病古籍知识演化研究
2025-02-16沈旺于琳冯欣陈晓美温雯婷
摘 要: [目的/ 意义] 通过构建动态知识图谱实现中医疫病古籍知识动态组织与可视化, 并依此挖掘中医疫病古籍隐性知识。[方法/ 过程] 构建融合动态元素的中医疫病古籍知识元语义描述模型, 以温病学派为例,基于知识元语义描述模型和深度学习技术进行知识抽取并构建动态知识图谱, 结合知识计算方法对温病学派疫病古籍知识进行组方用药规律演化分析以及辩证发展规律探析。[结果/ 结论] 结果表明, 随着时间推移, 温病学派逐渐偏向使用甘苦寒类中药, 各时期疫病症状描述较为一致, 辩证理论日益扩充, 研究揭示了中医疫病古籍知识演化发展规律并为中医古籍知识发现等相关研究提供新思路。
关键词: 数字人文; 动态知识图谱; 知识演化; 知识元; 中医古籍
DOI:10.3969 / j.issn.1008-0821.2025.02.003
〔中图分类号〕G255 〔文献标识码〕A 〔文章编号〕1008-0821 (2025) 02-0026-12
中医古籍研究工作重要性日渐提升。2022 年4月, 中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》明确指出, 要梳理挖掘古典医籍精华, 推动中医药传承创新发展[1] 。中医所述疫病是指由疫疠病邪引起的具有强烈传染性和广泛流行性的一类外感病, 相当于现代的传染病[2] 。中医疫病古籍中记载着海量有关疫病的辩证理论和组方配药知识, 对现代流行病和传染病的防治具有重大指导作用。2022 年3 月, 世界卫生组织发布《世界卫生组织中医药救治新冠肺炎专家评估会报告》,明确肯定了中医药救治新冠肺炎感染的有效性和安全性[3] 。因此, 充分挖掘中医疫病古籍内容是传承中医文化、助益中医价值实现的重要环节。
中医疫病古籍涵盖阴阳五行、脏象经络等学说,其内容结构和知识关联错综复杂, 辩证理论及用药规律也多有更新变化。中医疫病知识是由两千年的疫病防治经验长期积累而成, 尤其是明清时期形成的温病学派在发展过程中逐渐形成了全面的疫病诊疗体系, 至今在防治传染病方面仍有极大的临床意义, 温病学派代表性古籍也是温热性质类传染病最具研究价值的中医疫病古籍。中医温病学派在长期演变历程中, 不断形成全新药物组合、变更方剂内容并补充辩证方法, 同名方剂、症状或疾病等知识概念产生新内涵, 导致中医古籍考证和知识梳理工作时易产生混淆或遗漏。因此, 对各发展阶段的古籍知识内容进行纵向对比, 有助于厘清中医疫病史的知识发展脉络、掌握中医知识创造规律, 并据此产生中医用药诊疗创新思路。然而, 现有研究多针对一本古籍的单一知识内容进行知识挖掘, 忽略了疫病知识的动态发展变化规律, 中医疫病学发展过程中的知识完整性以及知识动态演变规律缺乏研究。
因此, 本文以温病学派古籍为例, 构建融合动态元素的知识元语义描述模型, 对温病学派古籍进行涵盖时间和属性特征的全面知识组织, 并依此构建动态知识图谱, 展示温病学派疫病知识动态演变过程, 之后借助知识计算的方法对温病学派各发展阶段的知识内容进行深层次的知识演化分析, 挖掘用药偏向、方剂演变和辩证理论发展等知识动态变化规律, 以帮助实现中医疫病古籍知识的充分展示和利用。
1 相关工作
1. 1 动态知识图谱相关研究
知识图谱的基本组成单位是“实体—关系—实体” 三元组以及实体的相关属性, 实体间通过关系相互联结, 构成网状的知识结构[4] 。知识图谱可以清晰地表示知识结构, 近年来被广泛应用于知识组织和知识可视化的相关研究, 但通常不考虑时间元素, 只能表示单一维度的知识结构。Leblay J 等[5]将知识图谱表示为<s,p,o>(<主语,谓语,宾语>)的三元组结构, 并在此基础上添加了时间标签t, 将三元组扩展到四元组<s,p,o,t>形成动态知识图谱,用于解决时间预测和与时间相关的查询问题。动态知识图谱是融入时间因素的知识图谱, 如图1 所示,随着时间因素的改变, 原本时间节点下的知识结构会发生变化, 知识图谱的节点和边也会随之变化,因此, 动态知识图谱可以用来表示随时间改变的知识结构。目前基于动态知识图谱的图学习研究有:Sankar A 等[6] 提出了动态自注意神经网络结构(DyS⁃AT), 通过学习节点表示捕捉动态知识图谱结构的演变完成链路预测实验。Pareja A 等[7] 提出了进化图卷积网络(EvolveGCN), 通过使用循环模型进化图卷积网络, 用于捕获和学习图序列的动态变化特征。Duan P T 等[8] 提出了一个耦合过程模型(Dy⁃CPM)来捕捉图动态机制, 通过神经网络参数化时间点过程(TPP)来表征时间动态规律。
在动态知识图谱的应用方面, 杨波等[9] 构建了企业动态风险知识图谱并提出Res Net 动态知识推理方法, 有效提高实体预测和关系预测的准确性,适用于企业领域知识推理和预测。陈宗源等[10] 用动态四元组的形式表达电网调度的历史运行数据, 通过时空同步图卷积网络挖掘数据的时空关联并构建动态知识图谱, 利用其提高新能源消纳能力来评估精度与速度。
上述研究均注重动态知识图谱的预测功能, 将已有时段的局部图谱作为动态学习和推理的模块,用于对未来事件或知识的推理预测。本文则利用动态知识图谱对不同时段知识的表示能力, 将不同时期的古籍知识可视化并深入回溯挖掘, 探讨知识的演化规律。
1."2 知识元相关研究
知识元可以帮助细粒度组织中医疫病古籍知识,尤其可以很好地融合和表达中医知识复杂的属性特征和知识发展动态特征。对于知识元的概念, 文庭孝[11] 认为, 知识元是知识的基本单元, 由不能再分割的知识框架表示且知识元之间存在着复杂的关系。索传军[12] 认为, 知识元是指语义上相对完整的知识单元, 知识元的形式上具有多样性, 在内容上具有独立性和完整性。董坤[13] 认为, 知识元是可以自由切分、表达、存取、组织、检索和利用的最小的独立知识单位。另外, 也有“知识单元” “知识实体”等相关概念被提出, 文庭孝等[14] 经过梳理“知识基因” “知识元” 和“知识因子” 等众多相似概念后, 认为知识单元是有可表达性、独立性和具有一定内部结构的知识单位。温雯等[15] 认为, 知识实体是具有专业领域性且能表达核心知识的术语。章成志等[16-17] 认为, 知识实体是知识的基本单位,知识实体之间存在关联关系, 并实现了对知识实体的细粒度抽取和关联分析。对于知识元的语义结构,戎军涛[18] 认为, 知识元包含知识项、知识资源和属性函数。高劲松等[19] 将文献知识元表示为文献知识元={知识元概念, 知识元属性, 知识元方法, 知识元关系}。索传军等[20] 认为, 一个知识元可以分为N 个语义三元组, 且三元组之间存在逻辑关系。
在知识元的应用方面, 曾刚等[21] 构建了万里茶道知识元语义描述模型, 基于该模型实现知识抽取和知识语义层面的细粒度组织。任亮等[22] 以知识元为核心, 构建科技文献细粒度知识组织模型并构建知识图谱, 揭示科学知识之间的内在关联。宋雪雁等[23] 构建了水书习俗非遗资源知识元语义描述模型, 对水书习俗非遗资源进行细粒度知识组织与可视化, 实现了水书习俗非遗资源多维知识关联关系揭示。
综上所述, 知识元是对知识进行细粒度组织的工具, 目前已在科技文献、文化知识等领域被有效利用, 但在中医药古籍知识组织研究领域还未被应用。
2 融合动态特征的中医疫病古籍知识元语义描述模型构建
2. 1 知识元的概念与语义结构
对于知识元的概念, 本文认为知识元的独立性、完整性与其可以自由切分组合并不矛盾, 知识元的独立性体现在语义表达方面, 即一个知识元可以完整地表达某个特定知识(如一篇文献、一个理论或一则公式等), 而知识元可自由切分是指可以将原本的语义内容拆解, 拆分后的知识元无法用于表达原本的知识内涵, 但同时形成新的知识元(如一篇文献可以拆解出数据、概念、原理和方法等)。综上, 本文将知识元定义为可以切分重组、关联组织、独立存储、检索利用的知识语义描述单元。
对于知识元的语义结构, 本文认为知识元语义结构是可以独立表达知识元内涵和知识元之间关系的完整结构, 知识元内涵可以理解为由多项属性共同描述的知识特征总和, 知识元之间的关系是不同类别知识元之间产生的关联关系。据此, 本文将知识元语义结构定义为: 知识元={知识元标识, 知识元属性, 知识元关系}。
2. 2 中医疫病古籍知识元动态特征描述
依据前文描述, 中医疫病古籍知识元结构应包含: 知识元标识, 即知识元名称, 用中医疫病知识术语表示; 知识元属性, 即知识元自身具有的各类属性特征, 例如疫病症状的病势、疫病方剂的剂型和中药的性味等; 知识元关系, 即该知识元与其他关联知识元之间的具体关系。该结构能够完整描述一项疫病知识, 具备独立性和固定性, 满足了中医知识的传承需求。然而随着疫病知识的演变发展,不同时期古籍中的同名知识元内容也会有变更, 这与著作当时疫病情况以及著者医术观念等有关, 不代表先前的知识内容失去价值, 因此需要对同名知识元加以区分。在知识元结构中加入动态特征属性即可区别不同时期的同名知识元, 而为了方便存储检索以及保护知识元的完整性, 本文选择在知识元属性之外独立添加动态特征描述项。综上, 本文将中医疫病古籍知识元结构定义为: 中医疫病古籍知识元={知识元标识, 知识元属性, 知识元动态特征, 知识元关系}。
中医疫病古籍知识元动态特征的作用是区别不同时期的同名知识元, 因此有必要对中医疫病史的变革阶段进行划分。回顾中医疫病史, 在明朝末期,疫病肆虐, 吴又可“每见时师误以正伤寒法治之,未有不殆者”, 于是著成《温疫论》以区分伤寒和温病。中医学专著《中医疫病学》认为, 《温疫论》是第一部中医疫病学专著, 同时, 主治疫病的温病学派也就此开始形成。清朝中期, 由叶天士口述,其弟子顾景文执笔著成《温热论》, 开始形成完整的疫病辩证体系。清朝中后期, 吴瑭结合在北京大疫中的救治经验, 在前人著作的基础上创作了《温病条辨》, 标志着温病学说体系正式形成。清朝末期, 王士雄深究温病学说, 结合多部疫病著作逐条注释解析, “以轩岐仲景之文为经, 叶薛诸家之辨为纬” 写成《温热经纬》, 标志着古代疫病学的成熟。综上, 本文结合温病学派从产生至成熟的发展历程以及代表性古籍的产生时期, 将中医疫病古籍知识元的动态特征划分为4 个阶段, 分别标注为t1、t2、t3、t4, 具体内容如表1 所示。
2. 3 中医疫病古籍知识元类型及关系
为详细探讨中医疫病古籍知识元的内容结构和关联关系, 构建动态知识图谱知识框架, 本文将梳理中医疫病古籍中的知识元类型、各类知识元属性及其关联关系。本文参考了中医药学语言系统(TC⁃MLS)和《中国中医药学主题词表》等中医药领域权威资料, 并结合《温疫论》《温热条辨》等疫病古籍内容, 将中医疫病知识元类型定义为: 疾病知识元、症状知识元、方剂知识元、中药知识元、人体基础部位知识元, 具体内容如下:
疾病知识元: 包括中医疫病古籍中记载的各类疾病, 如温病、肝热病等。
症状知识元: 指广义的症状概念, 包括中医疫病古籍中记载的各种症状(狭义), 如头痛、呕吐等, 以及体征, 如舌象、脉象等。
方剂知识元: 指用于治疗疾病、症状的药方,包括中医疫病古籍中记载的方剂、加减方剂等。
中药知识元: 指中医疫病古籍中记载的中药材,包括草本植物药材、动物类药材和矿物类药材等。
人体基础部位知识元: 包括中医理论中的人体组成部分, 如五脏、穴位和经脉等。
为全面描述知识元内涵, 需将知识元的各类属性进行整合, 结合中医学知识与实际诊疗需求, 本文选择了各类知识元的重要属性特征纳入知识元语义描述模型, 如表2 所示。
结合古籍内容以及中医辩证逻辑梳理了各类知识元之间的关联关系, 例如, 方剂治疗某疾病或症状、方剂包含各类中药、中药作用于具体的人体基础部位、疾病包含多种症状或体征, 具体如表3 所示。
2. 4 中医疫病古籍知识元语义描述模型构建
中医疫病古籍知识元语义描述模型是抽象表示中医疫病古籍知识元语义结构的逻辑框架,前文将中医疫病古籍知识元语义结构定义为:中医疫病古籍知识元={知识元标识,知识元属性,知识元动态特征,知识元关系}。借鉴Leblay J 等[5] 和董坤[13]的研究构建如下模型:
KE =<E,P(k:v),T,R>
其中, KE 为中医古籍知识元语义描述模型;E 表示知识元标识, 主要是中医疫病古籍术语; P表示知识元属性, 包括描述项k 和属性值v; T 表示知识元动态特征, 包括t1 ~ t4 这4 个阶段; R 表示知识元之间的语义关系。上述模块在构建动态知识图谱后均可通过查询语言进行限定查询和增删改操作。
表示知识元属性, 包括描述项k 和属性值v; T 表示知识元动态特征, 包括t1 ~ t4 这4 个阶段; R 表示知识元之间的语义关系。上述模块在构建动态知识图谱后均可通过查询语言进行限定查询和增删改操作。
3 基于知识元语义描述模型的中医温病学派古籍动态知识图谱构建
3. 1 数据来源与预处理
温病学派是中医疫病学代表性学派, 其提出的“杂气由口鼻入” 的观点与现代传染病认同的传染方式一致, 其将各类由温邪导致的急性外感热病称为温病或温疫, 温病学派初起到兴盛的过程也是中医疫病学迅速发展成熟的过程。本文选取中医温病学派发展历程中的四部代表性古籍作为数据源探析中医疫病学知识的发展演变规律, 分别是《温疫论》《温热论》《温病条辨》和《温热经纬》。《温疫论》是明朝吴又可所著, 是第一部疫病学专著;《温热论》是清朝叶天士所著, 提出了温病治疗中重要的卫气营血辨证体系, 是温病学理奠基之作;《温病条辨》是清朝吴瑭所著, 标志着温病学派“三焦辨证” 论治体系正式形成; 《温热经纬》是清朝王士雄所著, 是温病学之集大成者。四部古籍内容的不断补充发展可以映射温病学派疫病学各发展时期的理论知识演变。
根据前文所述知识元语义描述模型的内容, 对即将构建的动态知识图谱中的节点、边、节点属性和时间特征进行归纳描述: 节点类型即知识元类型,包括疾病、症状、方剂、中药、人体基础部位; 边是知识元之间的关联关系, 包括治疗关系、包含关系、作用于、有症状; 节点属性即知识元属性; 时间特征指知识元所在的发展时期, 包括t1 ~ t4 共4个阶段。由于数据量较大, 本文采用深度学习模型实现全部数据的实体抽取和关系抽取, 预先使用自然语言处理平台“Label Studio” 对古籍原文中的相关知识元实体与关系进行人工标注, 标注样例如图2 所示。两位标注人员提前了解中医基础知识并通读古籍原文, 明确各类知识元的相关概念和知识关联, 在标注过程中借助《中国中医药学主题词表》等工具书查询确认难以界定的术语。标注完成后使用Kappa 指标评估标注者在标注结果中的一致性。当Kappa 值大于或等于0. 80 时, 可以认为对比内容完全一致。经计算, 本文标注人员对古籍原文中各类实体与关系的标注结果的Kappa 值为0. 82, 说明不同标注者的工作一致性强, 标注质量良好。最终标注结果交由中医专家检查修订后导出,分别形成实体数据集和关系数据集, 用于知识自动抽取。
3. 2 知识抽取
为构建动态知识图谱, 需依据知识元语义描述模型抽取各阶段古籍知识内容, 主要包括中医疫病知识元标识、知识元关系、知识元属性以及时间特征。为保证抽取结果的准确性, 本文采用深度学习技术与人工检查辅助的方式进行中医疫病古籍知识抽取。
3. 2. 1 知识元实体抽取
在中医文献命名实体识别领域, BERT-BiLSTMCRF模型被证明有较高的实体识别准确率[24] 。本文随机抽取人工标注数据集的80%设为训练集,用于训练对中医疫病古籍有效的BERT-BiLSTMCRF实体抽取模型20%设为测试集, 用于测试模型效果, 使用精确率(Precision)、召回率(Recall)和F1 值(F1-score)作为评价指标。经过参数调试和实验, 最终模型训练效果如表5 所示。其中, 方剂和中药实体的识别效果最好, 人体基础部位实体识别效果不显著, 可能与标注数据中的相关实体数量较少有关。使用训练好的模型分阶段对古籍原文进行实体抽取, 进行人工检查和补充后, 将实体数据存储。
3. 2. 2 知识元关系抽取
本文使用BERT 模型进行实体关系抽取, 随机抽取数据集的80%为训练集, 用于训练对中医疫病古籍有效的BERT 实体关系抽取模型, 剩余20%为测试集, 用于测试模型效果, 使用准确率Accu⁃racy(ACC)作为评价指标。经过实验, 最终模型训练效果如表6 所示。其中, 方剂与中药实体的包含关系识别效果不显著, 这与文本中相关实体数量较多且关系复杂有关。使用训练后的模型分阶段对古籍原文进行关系抽取并将抽取结果存储。
3. 2. 3 知识元属性与时间特征抽取
知识演化分析过程中需要结合疫病知识元实体的属性特征进行分析, 而前文设定的知识元属性中,部分实体的对应属性值在古籍原文中没有提及, 无法进行大规模自动抽取。由于中药实体的相关属性如性味等是固定不变的, 因此本文采用词典匹配的方式, 从《中药大辞典》中查询匹配相关中药的属性值并赋值给对应实体。对于方剂等数据量和属性值较少的实体, 在动态知识图谱构建阶段直接录入相关属性。
知识演化分析过程中需要结合疫病知识元实体的属性特征进行分析, 而前文设定的知识元属性中,部分实体的对应属性值在古籍原文中没有提及, 无法进行大规模自动抽取。由于中药实体的相关属性如性味等是固定不变的, 因此本文采用词典匹配的方式, 从《中药大辞典》中查询匹配相关中药的属性值并赋值给对应实体。对于方剂等数据量和属性值较少的实体, 在动态知识图谱构建阶段直接录入相关属性。
3. 3 中医温病学派古籍动态知识图谱构建与可视化
本文使用Python 后端链接Neo4j 数据库, 将知识抽取得到的实体词典和关系词典中的数据循环输入到图谱中生成相应节点、边和属性, 时间特征作为节点属性存储到图谱中。由于古籍中存在部分术语简写的情况, 在实体抽取时将同义实体重复存储,如“安宫牛黄丸” 和“牛黄丸”, 因此进行人工消歧并融合同义实体, 最终共得到实体1 826个, 关系1 499条, 涵盖了各阶段古籍中抽取的全部知识元和知识元关系。经试验可以使用图谱查询语言对知识元结构中的E(知识元标识)、P(知识元属性)、k(属性描述项)、v(属性值)、T(知识元动态特征)和R(知识元关系)等各个模块进行限定查询展示以及更新删改, 可以有效助力后期知识挖掘和知识计算等工作。经中医专家阅览和操作检查, 确定本文构建的中医温病学派古籍动态知识图谱规模完整、功能健全。
通过Neo4j 查询语言Cypher 实现单个节点的知识元语义描述结构查询与展示, 如图3 所示, 以中药节点“甘草” 为例展示中药知识元的模型实例,知识元类型为中药(Medicine), 知识元标识为“甘草”, 知识元属性包括甘草的性味属性“甘平”、归经属性“心脾肺胃” 以及时间特征t1, 知识元关系包括甘草与方剂、人体基础部位等其他知识元之间的关系。
通过查询语言限定时间特征实现t1 ~t4 不同阶段的图谱状态查询与动态展示, 图4 是t1 ~t4 阶段中医疫病古籍知识图谱的全局动态变化过程。随着时间阶段的递进, 图谱规模和知识结构都有所改变,其中t2 时期的无关联节点较多, 该时期的古籍《温热论》对舌象、齿象、斑疹等症状描述较多而其他相关知识描述较少, 导致缺乏关联节点。
4 基于中医温病学派古籍动态知识图谱的疫病知识演化分析
4. 1 中医温病学派组方用药规律演变分析
随着温病学辩证理论的发展, 治疗温病的方剂组配方式也在不断完善, 本文依据中医温病学派古籍动态图谱, 分别对温病学派发展不同阶段的组方用药规律进行演变分析。鉴于t2 时期和t4 时期中涉及的方药论述较少, 本文主要抽取t1 和t3 时期的数据进行分析, 通过限定时间特征从图谱中查询两个阶段的相关方药信息并进行分析, 共查询到t1时期中的方剂32 首, t3 时期中的方剂109 首。
4. 1. 1 关键中药对比分析
本文使用复杂网络中的度中心性概念计算中医古籍动态知识图谱中的关键性药物。度中心性描述一个节点在网络中与其他节点的关联性强弱, 度中心性越高, 该节点在网络中就越重要[25] 。在中医古籍动态知识图谱中, 度中心性高的中药节点即代表该中药的使用率高, 在组方中是关键药物。节点度中心性计算如式(1) 所示:
D(i)= di/N-1 (1)
其中, di 为网络中与节点i 相连的边数, N 为节点总数, N-1 为节点i 与其他节点都相连的边数。
经查询与计算得出t1 和t3 时期的药物节点度中心性部分结果如表7 所示, t1 时期的关键性中药是甘草、当归、大黄、知母等, t3 时期的关键性中药是人参、厚朴、麦冬、杏仁等, 可见t3 时期治疗疫病使用频率较高的中药已发生明显变化。通过知识元属性查询发现, t1 时期的关键性药物的性味多为甘平、寒苦、辛苦温等, 多入脾经、胃经、大肠经, 符合该时期创立的病理学说“邪伏膜原”的治法, 膜原与肠胃相连, 多用脾胃大肠经药物;t3 时期关键性中药的性味多为甘、甘温、苦寒等,多入肺经、脾经, 这与该时期创立的三焦辨证治法相符, 用药多对应三焦腑脏。
4. 1. 2 方剂用药变化规律分析
在温病学派发展过程中方剂会不断演变, 主要包括同一方剂的加减变化和针对同一病症的方剂替换, 例如, 在t3 时期桃仁承气汤发生加减变化, 如图5 所示。通过在图谱中查询不同时期的方剂节点及其相关节点, 对比提取出发生变化的方剂, 通过匹配方剂链接的中药节点分别返回节点信息, 使用Jaccard 相似度计算方剂变更前后的相似性, Jac⁃card 相似度常用于计算两个集合之间的相似程度。
其计算如式(2) 所示:
其中, A 和B 为两个集合, J(A,B)介于0~1之间, 值越大则相似度越高。
分别将抽取出的方剂和配对中药文本处理为集合, 计算后部分结果如表8 所示, 可以看出无论是加减变化还是替换变化, t3 时期在治疗同类疾病时, 配药方案较t1 时刻发生很大变化, 这说明在温病学派, 自身存在改革和创新。
对发生变化的新旧方剂中的中药进行统计, 将出现频次最高的几类中药在方剂中的替换关系可视化, 如图6 所示。可以发现t1 时期有50%的原方剂中的甘草和当归被替换, 在图谱中查询到这两味中药的性味分别是甘平和甘温; 在t3 时期有67%的变更方剂中新加了细生地, 50%新加了元参、知母和麦冬, 上述4 味中药的性味均为甘苦寒。由此可见,在t3 时期, 对相同症状的用药方式发生改变, 更倾向于使用性味甘苦寒的中药, 这与该时期提出卫气营血辨证理论有关, 此类中药同时也是治疗营分证和血分证的常用药。
对发生变化的新旧方剂中的中药进行统计, 将出现频次最高的几类中药在方剂中的替换关系可视化, 如图6 所示。可以发现t1 时期有50%的原方剂中的甘草和当归被替换, 在图谱中查询到这两味中药的性味分别是甘平和甘温; 在t3 时期有67%的变更方剂中新加了细生地, 50%新加了元参、知母和麦冬, 上述4 味中药的性味均为甘苦寒。由此可见,在t3 时期, 对相同症状的用药方式发生改变, 更倾向于使用性味甘苦寒的中药, 这与该时期提出卫气营血辨证理论有关, 此类中药同时也是治疗营分证和血分证的常用药。
4. 2 中医温病学派辩证理论发展探析
中医通过辨证和论治两个过程诊疗疾病, 辩证是通过四诊(望、闻、问、切)收集患者的症状和体征信息并依此分析判断疾病性质; 论治是根据辩证结果给予患者相应疗法。本文通过分析各时期古籍中的症状知识进而发现温病学派辩证理论的发展规律。
4. 2. 1 症状描述相似度分析
本文使用余弦相似度计算不同时期出现的疫病症状表现相似性, 余弦相似度是n 维空间中两个n维向量之间角度的余弦, 用于测量文本相似度时,两段文本的用词越相似则余弦相似度值越大。使用查询语言检索图谱中各个时期的症状节点并分别导出, 余弦相似度计算结果如表9 所示。对比发现,各阶段古籍对于疫病症状的描述较为相似, 均达到70%以上, 且由于t4 阶段古籍具有综述性质, 该时期与其他各时期症状相似度都较高。由此可见, 各时期古籍对疫病症状的记载较为统一, 符合温病学派自成一脉的知识特征。
具体而言, 4 个时期均出现的症状有发热、汗出、烦躁、喘、神昏、斑疹等, 即温病学派描述的疫病主要症状, 主要参考的体征信息有脉象、舌象,即温病学派主要辨证依据。主要区别在于t2 时期出现了大量关于齿象的描述, 例如齿缝流清、齿焦有垢、切牙啮齿等, 这与该阶段独特的验齿辩证方法有关, 下文将对这一发现进行详细阐述。
4. 2. 2 症状类型对比分析
由前文可知, 温病学派古籍在症状描述方面有较大的相似性, 然而在某些阶段仍然出现较为特殊的知识内容以至于相似度有所降低, 例如t1 与t3 阶段、t2 与t3 阶段。因此, 本文综合查询4 个时期的症状节点, 观察节点在图谱中的网络关系, 将边数多的节点视为重要描述的症状, 并将其归为九类,分别是热痛情况(发热、身痛等)、汗出情况(大汗、战汗等)、消化情况(呕吐、大小便异常等)、皮肤情况(斑疹、面赤等)、神智情况(不安、狂言等)、渴状(口渴、烦渴等)、舌象、脉象、齿象。分别查询统计各阶段上述症状或体征描述词的词频, 如图7 所示, 整体而言4 个时期古籍中关于热痛情况、汗出情况和皮肤情况的描述频率较为一致, 说明发热身痛、汗出异常、斑疹等症状在各时期均有出现且作为辨证依据的重要程度相似。
具体而言, 在t1 时期描述频率最高的是消化类症状或体征, 说明该时期呕吐、腹痛、大小便异常等情况被作为主要辨证依据着重诊疗。
t2 时期出现了其他各时期均未描述的齿象体征,且从词频可以看出该时期关于舌象、齿象的论述篇幅很大, 说明该时期主要依据舌象、齿象辨证论治,是极具特色的辩证方法。
t3 时期相对其他时期在脉象方面的论述较多,除了齿象外的各类症状描述比重较为一致。
t4 时期除了齿象, 其他各类症状的描述情况与其他时期较为重合, 该时期整合了前期各古籍的内容形成综述, 是温病学派古籍的集大成者。
4. 2. 3 辩证理论发展分析
通过查询图谱中各时期的症状节点及与其相关的边, 可以看出症状节点的聚类效果, 结合前文所述的各时期症状类型描述特点, 可以归纳各时期辩证理论。
如图8 所示, t1 时期聚集出现的症状有“发热—汗—渴—舌象”、消化情况、神智情况等, 通常需要结合多类症状体征进行辨证, 这与该时期形成的“九传治法” 有关, 通过以上各类症状的交替联合出现情况推断“外邪” 与“表里” 的位置关系, 进而辨证用药。
t2 时期图谱显示常见症状有舌象和齿象, 且二者聚类现象不明显, 说明舌象和齿象均可作为独立辨证依据, 这意味着辨舌验齿法在该时期成为温病的一项系统的诊断方法。
t3 时期图谱中症状聚集现象显著, 脉象、舌象、热痛、汗、渴等症状通常同时出现, 说明该时期的辩证方法需要综合各类体征和症状, 出现了较为全面和系统的辩证方法体系。
t4 时期图谱中症状类型更加丰富, 聚类情况也更为复杂, 说明该时期可诊疗的疫病症状已经较为全面且温病学派辩证理论发展已经较为成熟。
上述发现结果说明, 自t1 时期确立疫病学论述基调以来, 后续发展阶段中均围绕相似的症状类型展开讨论, 但各时期或出现新的辩证依据, 或对已有症状类型进行新的组合聚类进而辩证。整体而言, 温病学派各时期古籍辩证理论各有所长且在发展历程中互相补充完善, 最终形成拥有辨舌验齿等诊断方法、卫气营血辨证和三焦辨证等辩证理论体系的特色温病诊疗系统, 在论治温病方面形成科学的中医诊疗范式。
5 结 语
中医疫病古籍中记载了大量疫病诊疗知识, 其中温病学派古籍更是对疫病的起因、症状、辩证、用药等有着系统且详实的阐述, 对现代传染病防治有重要借鉴意义。本文使用知识元语义描述模型对中医疫病古籍知识体系进行建模, 突出描述中医各类知识元的属性和关系, 并且通过融入动态元素构建动态知识图谱, 将温病学派古籍知识分时期组织、存储和展示, 最终结合图结构和知识计算等方式对动态知识图谱中的中医知识进一步挖掘, 从方剂用药规律演变和辩证发展过程两方面探析了温病学派4 个时期的知识特征, 为中医疫病辨证治疗和现代传染病防治提供可借鉴知识。本文在动态知识图谱构建过程中只使用了温病学派古籍作为数据集并加以分析, 然而伤寒学派古籍在防治疫病方面同样有重要参考价值, 未来将考虑结合多学派古籍对中医疫病知识进行更全面的对比分析和挖掘利用, 使中医古籍知识得到更加全面地开发和使用。
参考文献
[1] 中华人民共和国中央人民政府. 中共中央办公厅 国务院办公厅印发《关于推进新时代古籍工作的意见》[ EB/ OL]. ht⁃tps: / / www.gov.cn/ zhengce/2022- 04/11/ content_5684555. htm,2022-04-23.
[2] 谷晓红. 中医疫病学[M]. 北京: 中国中医药出版社, 2023.
[3] 中华人民共和国中央人民政府. 世卫组织: 中医药对治疗新冠有效[EB/ OL]. https: / / www.gov.cn/ xinwen/2022-04/06/ con⁃tent_5683689.htm, 2022-04-06.
[4] 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53 (3): 582-600.
[5] Leblay J, Chekol M W. Deriving Validity Time in KnowledgeGraph [ C] / / Companion Proceedings of the World Wide WebConference, 2018: 1771-1776.
[6] Sankar A, Wu Y H, Gou L, et al. DySAT: Deep Neural Repre⁃sentation Learning on Dynamic Graphs via Self-Attention Networks[C] / / Proceedings of the 13th International Conference on WebSearch and Data Mining, 2020: 519-527.
[7] Pareja A, Domeniconi G, Chen J, et al. EvolveGCN: EvolvingGraph Convolutional Networks for Dynamic Graphs [ J]. Proceed⁃ings of the AAAI Conference on Artificial Intelligence, 2020, 34(4): 5363-5370.
[8] Duan P T, Zhou C, Liu Y T. Dynamic Graph RepresentationLearning via Coupling-Process Model [ J]. IEEE Transactions onNeural Networks and Learning Systems, 2024, 35 (9): 12383-12395.
[9] 杨波, 廖怡茗. 面向企业动态风险的知识图谱构建与应用研究[J]. 现代情报, 2021, 41 (3): 110-120.
[10] 陈宗源, 余涛, 丁茂生, 等. 基于时空卷积动态知识图谱的新能源消纳评估方法[J]. 电力系统自动化, 2023, 47 (15):46-54.
[11] 文庭孝. 知识单元的演变及其评价研究[J]. 图书情报工作,2007, 51 (10): 72-76.
[12] 索传军. 知识转移视角下的学术论文老化与创新研究[J]. 图书情报工作, 2014, 58 (5): 5-12.
[13] 董坤. 基于知识元的非物质文化遗产知识抽取与组织研究[J]. 情报理论与实践, 2021, 44 (9): 155-160, 148.
[14] 文庭孝, 罗贤春, 刘晓英, 等. 知识单元研究述评[ J]. 中国图书馆学报, 2011, 37 (5): 75-86.
[15] 温雯, 伍思杰, 蔡瑞初, 等. 面向专业文献知识实体类型的抽取和标注[J]. 中文信息学报, 2018, 32 (1): 102-115.
[16] 章成志, 谢雨欣, 宋云天. 学术文本中细粒度知识实体的关联分析[J]. 图书馆论坛, 2021, 41 (3): 12-20.
[17] 章成志, 谢雨欣, 张恒. 学术文献全文内容中的方法实体细粒度抽取及演化分析研究[J]. 情报学报, 2023, 42 (8): 952-966.
[18] 戎军涛. 学术文献内容知识元语义描述模型研究[ J]. 情报科学, 2019, 37 (7): 30-35.
[19] 高劲松, 马倩倩, 周习曼, 等. 文献知识元语义链接的图式存储研究[J]. 情报科学, 2015, 33 (1): 126-131.
[20] 索传军, 盖双双. 知识元的内涵、结构与描述模型研究[ J].中国图书馆学报, 2018, 44 (4): 54-72.
[21] 曾刚, 赵雪芹. 基于知识元的万里茶道数字资源知识抽取与组织研究[J]. 情报理论与实践, 2021, 44 (10): 173-178, 164.
[22] 任亮, 杜薇薇, 刘伟利. 面向科技文献知识元的知识图谱构建研究[J]. 情报科学, 2022, 40 (9): 26-31.
[23] 宋雪雁, 张祥青, 张伟民. 水书习俗非物质文化遗产知识元组织与可视化研究[J]. 现代情报, 2023, 43 (10): 3-15.
[24] 胡为, 刘伟, 石玉敬. 基于BERT-BiLSTM-CRF 的中医医案命名实体识别方法[J]. 计算机时代, 2022, (9): 119-122, 135.
[25] 吴果, 房礼国, 李中. 基于多指标综合的复杂网络节点重要性评估[J]. 计算机工程与设计, 2016, 37 (12): 3146-3150.
(责任编辑: 郭沫含)
基金项目: 国家社会科学基金冷门绝学专项研究项目“本草典籍整理、知识组织与智慧化建设研究” (项目编号: 23VJXT024)。