基于“知识元”理论的《伤寒论》标引实践*
2021-02-14周冉冉李伊然罗亚敏宋慧荣陶晓华
周冉冉,李伊然,罗亚敏,宋慧荣,李 冉,葛 飞,陶晓华
北京中医药大学,北京100029
中医古籍是中医药传承与创新的根基。近年来,随着临床对中医古籍整理需求的转变与提升,在中医古籍整理中融入现代信息技术所形成的智能化中医古籍知识服务方法方兴未艾。本团队基于国家重点研发计划项目“基于知识元理论与临床需求深度融合的中医古籍整理及专题文献研究”,在传统中医古籍整理基础之上,首创“病脉证并治”知识元标引体系,融合现代信息技术,对600种中医古籍实施深度标引并建立中医古籍数据库。本文即对《伤寒论》进行线上“病脉证并治”知识元标引,提供实践示例,梳理标引疑难要点,并探讨可行的解决方法,进一步完善“病脉证并治”知识元标引体系。
1 “病脉证并治”知识元概述
知识元是表达一个完整概念时,不可再分解的最小知识单位,由多个字、词、词组或短语等语义成分相互关联构成,在内容上表达相对完整的知识,在形式上多以短语或句子为主,具有相对独立性、知识表达完整性、语义单元最小粒度性等特征[1-2]。
《伤寒论》“病脉证并治”临床诊疗模式源自“观其脉证,知犯何逆,随证治之的”辨治观。从“病-脉-证”出发,不仅强调中医临证诊治全过程,而且体现临床诊疗决策的复杂性、整体性与动态性。项目团队首倡“病脉证并治”知识元理论标引,应用知识体、知识元、语义成分、语义类型、语义关联等一系列赋予古籍原文内涵的新概念,其中“病脉证并治”标引模板涵盖“病名、病因、病位、病程、鉴别诊断、脉位、主脉、兼脉、死脉、辨证、病机、治则、治法、方剂、药物、剂量、炮制、加减法、煎法、制法、服法、中病反应、欲解时、针灸、其他治法、治案、预后、宜忌、误治、释义、其他”等31个知识元数据。
2 “病脉证并治”知识元标引
标引是根据文献特征,赋予某种检索标识的过程[3]。自由标引是指标引人员在遵循相应标引原则的前提下,未借用特定的词表而自行设定标引词进行自由标引,其中尊重古籍原文为标引的重要原则。中医古籍种类繁多、内容广杂,特定的中医古籍叙词表难以形成统一规范,使得标引人员更加依赖对古籍原文和标引原则的理解,自主拟用确切措词直接表达所要分析的主题概念,因此知识元标引基本属于自由标引[4-5]。“病脉证并治”知识元标引以仲景“观其脉证,知犯何逆,随证治之”为准则,以上述“病名”“脉象”“辨证”等知识元为基本单位进行标引,现以《伤寒论》标引为例简述其流程:标引人员登录中医古籍“病脉证并治”知识元标引系统,上传已校勘的《伤寒论》电子文本,划定目录,选中知识体原文进入“病脉证并治”标引模板,对知识体原文进行结构层次分析,对知识元在模板内选用相应的属性要素进行标注,再抽取出各种属性类型的语义成分,最后将该知识体内抽取的各种语义进行相互关联,并进行知识体关联,建立知识元语义网络。见图1。
图1 中医古籍“病脉证并治”知识元标引
3 《伤寒论》“病脉证并治”知识元标引
3.1 《伤寒论》标引文本录入《伤寒论》版本众多,笔者对8种古传版本进行考证,选定钱超尘、郝万山先生整理的宋版《伤寒论》来校勘电子文本[6-7],将其上传至中医古籍“病脉证并治”知识元标引系统(http://114.255.40.130:60080/metaservice2/),按照纸质版篇章划分书体结构目录[8],通过“病脉证并治”标引模板进行线上自由标引。标引系统包括书体结构、标引模板、知识体、知识元、语义成分、语义类型、语义关联类型、知识体关联类型等。见表1。
表1 中医古籍“病脉证并治”知识元标引系统
3.2 标引实践示例《伤寒论·辨太阳病脉证并治中第六》第38条云:“太阳中风,脉浮紧,发热恶寒,身疼痛,不汗出而烦躁者,大青龙汤主之。若脉微弱,汗出恶风者,不可服之。服之则厥逆,筋惕肉瞤,此为逆也。大青龙汤方。八。
麻黄(六两,去节)桂枝(二两,去皮)甘草(二两,炙)杏仁(四十枚,去皮尖)生姜(三两,切)大枣(十枚,擘)石膏(如鸡子大,碎)
上七味,以水九升,先煮麻黄,减二升,去上沫,内诸药,煮取三升,去滓,温服一升,取微似汗。汗出多者,温粉粉之。一服汗者,停后服。若复服,汗多亡阳遂虚,恶风烦躁,不得眠也。”
此条知识体原文讲述太阳伤寒兼里热证“病脉证并治”的辨证论治诊疗过程,因此选用标引系统“病脉证并治”模板进行标引。笔者分别抽取出“病名”“主脉”“辨证”“方剂”“药物”“煎服法”“中病反应”等知识元进行标注,如“病名:太阳病”“病因:太阳中风”“主脉:脉浮紧”“主脉:脉微弱”“辨证:发热恶寒,身疼痛,不汗出而烦躁者”“辨证:汗出恶风”“辨证:厥逆,筋惕肉瞤”“辨证:汗多恶风烦躁,不得眠”“病机:亡阳遂虚”“方剂:大青龙汤”等。”同时,对抽取的知识元进行语义提取,如“辨证”知识元提取出“发热”“恶寒”“身疼痛”“不汗出而烦躁”4个“证候表现”语义。“药物”知识元可直接选用语义关联类型“药制量关系(药物<->炮制<->剂量)”对知识元内不同的药物、炮制、剂量逐一标引。然后,将不同属性类型的语义成分按照相对应的类型进行语义关联,如“药制量关系”:麻黄(药物)<->去节(炮制)<->六两(剂量)。“辨治关系”:发热;恶寒;身疼痛;不汗出而烦躁(证候表现)<->浮紧(脉象)<->太阳中风(病因病机)<->大青龙汤(方剂)<->汗出多者,温粉粉之(服法)<->取微似汗(疗效)。见图2。
图2 “病脉证并治”知识元标引《伤寒论》第38条
3.3 标引疑难要点
3.3.1 知识体命名《伤寒论》论述了六经病正治、误治、传变等各种临证状况,并记载各经病证经过误治、传变可转归为坏病或他经病证。复杂多变的病证使得对知识体条文命名的难度增加,现以太阳病篇为例进行研讨。太阳病本证条文,即以“太阳病”“伤寒”“中风”命名,如第12条命名为“太阳中风”。太阳病变证、坏证条文,可选用主证来命名,如第152条命名为“结胸证”。条文内未论及病证名称,而方证内容较为详尽,可根据本书目录、原文或上下文内容提取病证名称,如第149条命名为“痞”。条文明确提出病名者,则以之命名,如167条命名为“脏结”。84-88条以“xxx家”为首,根据具体语境将其标为“xxx家”,如84条命名为“淋家”。此外,当知识体条文中出现多种病证名时,选用一个可精确地概括本则知识体内容的名称作“病名”知识元内容,其他的病证名各自提取为该知识元内相应属性的语义。
3.3.2 脉象标引脉象反应人体内气血阴阳的盛衰,有助于判断疾病及其发展、预后。《伤寒论》脉理精微,言及脉诊条文有150余条,且仲景于篇名“病脉证并治”内将“脉”置于“证”之前,可见临床脉诊至关重要,故“病脉证并治”标引模板设有“主脉”“兼脉”“脉位”和“死脉”知识元按钮,但仲景条文内有多脉相兼者,而主脉与兼脉不易区别,如《辨痉湿暍脉证第四》云:“太阳中暍者……其脉弦细芤迟”“弦细芤迟”四种脉象可同作主脉,然“弦”作主脉,“细”“芤”“迟”视作兼脉亦可。
《伤寒论》言及阴阳脉者有二十余条,其中“辨脉法第一”开篇即言:“凡脉大、浮、数、动、滑,此名阳也;脉沉、涩、弱、弦、微,此名阴也”,对常见脉象进行阴阳分类。笔者认为阴阳脉有多种含义:第一,“寸部为阳尺为阴”,如第3条“脉阴阳俱紧”、第6条“脉阴阳俱浮”标引为“主脉”知识元,再分别抽取“脉位”和“脉象”的语义即可;第二,指浮取和沉取两种指法,如第100条“阳脉涩,阴脉弦”,抽取出“阳脉涩”和“阴脉弦”两个“脉象”语义即可;第三,阴阳脉有时即指“浮取和沉取”,又隐言病证的病机,如第12条“阳浮而阴弱,阳浮者热自发,阴弱者汗自出”,此处应当提取“阳浮而阴弱”为“脉象”语义和“阳浮”“阴弱”两个“病因病机”语义。此外,标引描述脉象的条文较为特殊,如第178条描述鉴别结脉和代脉及其预后,笔者抽取“脉按之来缓,时一止复来者”为“辨证”知识元,再提取“按之来缓”“时一止复来”两个“证候表现”语义。总而言之,《伤寒论》的脉诊复杂多变,需要根据具体条文内容来标引脉诊内容。
3.3.3 知识元多重属性“病脉证并治”标引模板内不同属性“知识元”分界模糊,使得知识体内相同原文可选用多个知识元按钮进行标引,如“不可发汗”“不可下”“不可攻”等既可标为“宜忌”,又可标为“治则(法)”,笔者认为两种知识元均须标出,以提高检索准确率。此外,“病因”与“误治”知识元亦可属性重叠,根据出现于知识体主体内容先后时机的不同,抽取为“病因”或“误治”知识元。如第34条葛根黄芩黄连汤证原文中的“太阳病,桂枝证,医反下之”,既是导致葛根黄芩黄连汤的病因,又是桂枝汤证的误治,此处应当标引为“病因”知识元。
3.3.4 语义提取规范知识元提取语义应简而不失其意,全而不失其真,尊重古籍原文及本意。《伤寒论》记述了不同部位和程度的“汗出”证侯表现,如第8条“额上汗出”、136条“头微汗出”、191条“手足濈然汗出”,须提取原文为“证候表现”语义成分即可,但第20条“遂漏不止”则应提取“漏汗”为语义成分。仲景描述症状多次使用连词“而”,前后有因果关系,应整体提取。如149条“心下满而硬痛”,应提取为“心下满而硬痛”,不可提取为“心下满”和“心下硬痛”;又如第355条“心下满而烦”,应提取为“心下满而烦”,不可提取为“心下满”和“心烦”。由此可知,标引时要坚持尊重古籍原文和理解条文语境。
3.3.5 语义关联上文已述两个证候表现有共同之处时可用省文,两个病证之间亦是如此,但进行语义关联时不得省略,如第386条“霍乱,头痛发热,身疼痛,热多欲饮水者,五苓散主之;寒多不用水者,理中丸主之”。此条知识体讲述了两个独立的霍乱病证治过程,故应创建两个“辨治”语义关联,“霍乱”“头痛”“发热”和“身疼痛”四个语义“证候表现”应分别关联其中:第一,霍乱(病证)<->寒多;不用水(病因病机)<->头痛;发热;身疼痛;(证候表现)<->理中丸(方剂);第二,霍乱(病证)<->热多;不用水(病因病机)<->头痛;发热;身疼痛(证候表现)<->五苓散(方剂)。
4 小结
秉承尊重古籍原文和理解条文语境的基本标引原则,基于“病脉证并治”知识元理论选用古籍标引系统“病脉证并治”模板进行线上自由标引《伤寒论》,呈现原文实践标引,注重语义提取简而不失其意、全而不失其真,并就标引过程中遇到的疑难点进行探讨、提供解决思路,不断完善中医古籍“病脉证并治”知识元标引系统,为后续600种中医古籍标引提供示范。