《伤寒论》信息化研究进展*
2021-06-28林睿凡刘亮亮张妮楠周洪伟
林睿凡,刘亮亮,张妮楠,周洪伟△,谢 琪
(1.中国中医科学院中医临床基础医学研究所,北京 100700; 2.上海对外经贸大学统计与信息学院,上海 200000; 3.中国中医科学院学术管理处,北京 100700)
中医古籍是中医药学术的载体,它以图文形式记录了中医药学数千年来积累的丰富理论知识和临床经验,具有重要的学术价值和文物价值,不仅是现代中医药学发展与实践探索的源泉和动力,而且对中医学的发展具有重要的启发和指导作用。《伤寒论》作为一部理论联系实际的著作,其六经辨证以及理法方药于一体的理论体系,至今依然指导临床实践,是中医知识结构的重要基石,临床实践的有效指导工具。
1 《伤寒论》古籍整理
1954年,中央提出“整理出版中医古籍,包括编辑和翻印古典和近代医书”,其后《伤寒论》纳入古籍整理工作的一部分[1]。在版本流传考证方面,我国著名文献学家钱超尘教授做出了重要贡献,主要对宋本、唐本、金匮玉函经、高继冲本、敦煌残卷、康赔本、康治本以及安政本等版本进行考证,并且论证了《汤液经法》《伤寒论》《辅行诀》之间的关系[2-4]。《伤寒论》原文考注类文献多以图书形式出版。1957年由科技卫生出版社出版、任应秋教授主编的《伤寒论语译》,对《伤寒论》原文中晦涩难懂的词语或者古今异义的词语进行注释,并配原文以翻译[5]。1982年由湖南科学技术出版社出版、朱佑武教授主编的《宋本伤寒论校注》在校注生僻字词的同时,不仅给出条文的内容提要,点明每条的主旨大意,还增加了按语以助读者深刻理解原文含义[6]。1996年天津科学技术出版社出版的郭霭春教授主编的《伤寒论校注语译》,该书在校注和注解原文的基础上,收录了成无己注解[7]。1988年马继兴教授对敦煌古医籍进行整理,并出版《敦煌古医籍考释》,其中收录《伤寒论》敦煌本考注,对条文中难以理解的词汇进行注释并标明文字删减[8]。
2 《伤寒论》数字化
20世纪50年代是数字化技术飞速发展的时期,数据库则是数字化的重要产物。《伤寒论》作为中医古籍的重要组成部分,多为孤本或绝本,除了具有临床学术价值之外,同时具有一定文物价值,长期手工翻阅势必会对原版资料造成不可修复的损毁。并且由于《伤寒论》版本众多,收藏地点分布较广,手工整理速度缓慢,无法足以满足文献研究、版本比对以及文献保护的需要,古代文献与现代文献在文字表达方面也存在差异。因此古籍数字化可以处理部分整理过程中所面临的难点。以上原因促使《伤寒论》数字化工作的开展,成果收录于不同种类的古籍数据库(表1)。
表1 《伤寒论》数字化成果简介
3 《伤寒论》信息化研究
从严格意义上说,中医古籍文献的数字化是“形式”上的研究,中医古籍文献的信息化是“内容”上的探索[9]。运用信息科学技术使中医理论可视化、可重复、可操作,是在继承意义上的再创造[10]。因此进入21世纪,我国开始由中医古籍数字化向内容梳理和信息化过渡。此阶段除对《伤寒论》原文进行处理外,还包括基于经方的医家诊疗经验总结,此类总结通常围绕医案展开,故不包含在分析范围之内。
3.1 《伤寒论》六经系统研究是信息化的基础
上世纪80年代,有学者提出六经之间信息的多变性和复杂型取决于六经系统的多样性和层次性,并且《伤寒论》的思维模式包括整理、联系和转化,均是信息论所具备的特点,因此可以尝试从信息的角度进行分析[11]。通过整理各代医家对于六经本质的看法,结合现代系统科学知识,笔者认为六经体系本质实际是系统模型,隶属于系统科学体系[12]。故将宋本《伤寒论》作为研究对象,对其所收录的条文进行分类,总结六经病下所包含的本证、兼证、辨证、疑似证等类别,为《伤寒论》的信息化研究打下基础[13]。
3.2 《伤寒论》逻辑方法分析
不同学者从多种角度分析《伤寒论》潜在逻辑。杨振华认为,《伤寒论》中主要使用三重逻辑思维法,包括类比取象法、假说思维法和科学抽象法,其中由于误治导致的变证是假说思维法的成功运用,通过科学归纳法对条文进行总结,从而系统的认识疾病,掌握发展中的病邪[14]。赵明君认为,《伤寒论》的六经证及其变证和兼证,病证相应、异病同治和六经病治均体现从一般到特殊的思维方法[15]。贾春华认为,《伤寒论》中存在墨子创建的名、理、故、类逻辑法,以及现代逻辑体系中的三段论和命题逻辑等多种逻辑形式[16]。吴清荣在明因学的背景下,以《伤寒论》条文为例,探究中医辨证论治过程与明因论式之间的关系,认为2种思维体系颇为接近[17]。穆勒五法作为一种排除归纳法,可以对张仲景方进行归纳分析,建立条文的因果关联。研究结果表明,方剂与证候之间存在联系,使用相同方剂时其证候不必完全相同,围绕其主症即可[18]。杨培坤采用集合论的思想,构建《伤寒论》信息处理模型。本工作仅选取少部分条文,并且在增加病机的前提下完成条文的模型构建[19-21]。
更多学者则是从命题逻辑的角度分析经方原文。杨培坤论述《伤寒论》方证系统涉并认为从证和病到方的过程都属于条件关系推理过程,整个推理系统是一种强关系下的条件推理,为知识库的构建提供理论支撑。通过条件关系分析,认为脉浮、头项强痛、恶寒是太阳病的三大必要条件,同时也可以将太阳伤寒和太阳中风相区分。并且通过举例说明条文中所涉及的内容与其取非后的可以产生逻辑推理关系[22]。基于任何科学都要遵守逻辑的基础,贾春华对《伤寒论》涉及充分条件、必要条件和充分必要条件的条文进行陈述,并认为方证之间命题是属于广义模态逻辑的道义逻辑[23-24]。范吉平基于命题逻辑,分析《伤寒论》的推理过程,将条文内部逻辑分为联言命题、选言命题和假言命题,并举例说明[25]。邹崇理和贾春华认为,《伤寒论》中存在条件句,并认为可以细化分为条件句前和条件句后的关联关系,其成分相干蕴含,也就是条件句和主句同时具有显性和隐形构成成分,同时条件句依赖“语义”“语用”需要相关的背景知识来解释。基于此进而从信息流推理的角度去理解《伤寒论》中的逻辑推理[26-27]。王瑞祥以数理逻辑对太阳中风和太阳伤寒条文进行逻辑分析,得出中风的充分条件为“脉浮、头项强痛、恶寒、发热、汗出、脉缓”,伤寒的充分条件是“脉浮、头项强痛、恶寒、体痛、呕逆、脉阴阳俱紧”,中风和伤寒均为太阳病[28]。贾春华基于命题逻辑中的充分条件,对《伤寒论》中麻黄、桂枝、芍药、半夏的主治进行推理,认为麻黄治疗实证水肿,桂枝治疗大便不坚之小不利,芍药用于非虚寒性腹痛,半夏用于止呕[29]。
3.3 《伤寒论》数据挖掘
关联规则采用CMAR子算法可以挖掘张仲景用药模式,对寒证、热证、虚证、实证、表证及不同脏腑、六经病证等病证进行用药分析,概括不同病证的用药规律,与临床用药相互印证[30]。采用布尔关联规则Apriori算法,分析《伤寒论》药对分布情况,可以得出张仲景用药多使用生姜、甘草、大枣顾户脾胃的结论[31]。通过经典关联规则算法Apriori,挖掘《伤寒论》症状组合规则以及药-症关联规律,总结出一系列病机相同的症状群,如烦躁-小便不利-渴等,指出症状群常使用的药物,如渴-身疼痛症状群多使用猪苓-泽泻药对[32]。基于数据挖掘方法的双向强关联规则算法,研究伤寒桂枝类方,得出结论桂枝汤类方主要用于虚证,桂芍1∶1用于外感发热类疾病,1∶2用于腹痛虚劳等疾病,并提取出桂枝汤中存在的药对以及对桂枝汤适用的主证兼证进行归类[33]。采用中药处方智能分析系统(CPIAS)对麻黄汤的方证知识进行挖掘,通过贡献度分析方剂的君臣佐使配伍,指出其方剂属于辛温发散的性味归经,主要功效为辛温解表,使用于感受寒邪以及伴有胃气上逆和肺气不宣的患者[34]。采用数据挖掘方法对《伤寒论》中非衡量器药物剂量进行探讨,以小青龙汤为例,将各家发表的《伤寒论》 中非衡量器计量的药物剂量考察结果输入CPIAS,确定五味子半升的计量为20 g[35]。基于中药计量是处方发挥功效的重要因素,作者使用CPIAS结合文献法,对《伤寒论》的112方重新进行中药计量范围的界定。以桂枝汤为例,将新旧药物使用剂量进行对比,并对桂枝汤药物贡献度进行排序,认为生姜在桂枝汤中的贡献度大于炙甘草[36]。基于平均常用量线性模型,探究《伤寒论》中方剂由于加减而带来的寒热变化情况,从量化和可视化角度阐述寒热性质,尝试将计算机科学与中医进行交叉领域研究[37]。层次分析法(AHP)作为一种用于分析复杂大系统的数学方法,引入中医领域辅助进行方证理论验证,以头痛、发热、汗出、恶风为例,判断出其适用方剂为桂枝并非麻黄汤[38]。
3.4 采用机器学习方法分析《伤寒论》
采用支持向量机(SVM)方法,可以从不同角度进行《伤寒论》方剂分类,一方面便于现代人理解张仲景思维模式,另一方面可以发现《伤寒论》的隐藏知识[39]。使用决策树算法建立葛根芩连汤、黄芩汤、白头翁汤分类模型,为三方的临床选择提供指导[40]。作者使用人工神经网络算法研究药物和症状之间的非线性对应关系,进一步明确了方剂和对应症状之间的关系,但仍存在症状归类标注欠缺、条文症状收录不完整、方药剂量描述不精准等不足之处[41]。基于人工神经网络技术构建《伤寒论》主证-药物对应关系与方-证要素对应关系数学模型,分析了方证要素对应系统收敛效果强于主证药物的原因[42]。通过整合随机森林、支持向量机和神经网络算法,构建一种复合结构智能化的变证选方模型(RSB),以尝试优化对症选方。将RSB与支持向量算法、随机森林算法和BP神经网络算法进行比较,其中RSB推荐准确性最高[43]。
3.5 图像法剖析《伤寒论》
偏序结构图(POSD)是燕山大学洪文学教授及其研究团队提出的一种知识可视化方法,包括属性偏序结构图和对象偏序结构图,其中属性偏序结构图将共同特征的对象聚类,对象偏序结构图则可以将具有特异性对象与其他对象相区分[44]。基于此方法,广州中医药大学李赛美团队与洪文学团队联合对《伤寒论》条文进行分析,挖掘深层知识。利用这种多层次复杂概念网络生成法,可以对《伤寒论》进行全部、客观的知识发现,从而对中医知识发掘提供新的途径[45]。如分析出张仲景使用和法、温法以及汗法的必用基础药物、基础药对和基础方,将桂枝类方、柴胡类方和泻心类方进行二次分析,发现三类方剂的加减规律以及所形成的类别[46]。对小便类方剂进行分类归纳,主要形成甘草类集合、大黄类集合、茯苓类集合以及其他散在集合,并对四类集合的组方规律进行分析[47]。以甘草用量进行分类,分别探讨甘草使用二两、三两、四两的配伍特点[48]。对《伤寒论》整体结构进行梳理,认为其收录方剂主要为12大类,包括桂枝类、麻黄类、葛根类等,并将方剂按照治法进行分类,同时总结每类治法的用药特点[49]。另外,主题图技术作为一种知识组织技术,可以定义知识之间的关系,实现分布式知识集成和共享,通过此技术对《伤寒论》原文进行内容整理,探索主题图技术在中医药领域的应用[50]。知识图谱作为一项新兴技术也尝试使用于《伤寒论》研究。采用基于条件随机场(CFR)的方法,识别《伤寒论》文本的症状、病名、脉象、方剂等中医术语,识别准确率为85%,F值为75.56%[51]。以《伤寒论》中涉及方剂的条文为蓝本,利用人工神经网络对245条构建方证数据库,先以100条原文为训练样本,通过桂枝汤证、麻黄汤证、小柴胡汤证和白虎汤证症状作为测试,进行从症状到药物的预测分析,模型准确率达79%[52]。使用Neo4j图数据库构建经方桂枝汤类方的小型知识图谱,对证、方和药进行可视化分析,为中医类知识图谱的构建奠定基础[53]。
4 小结
纵观上述文献,其目的均为从哲学、计算机以及其他多科领域角度分析《伤寒论》背后的意义,通过与不同领域相结合的方式进行研究,取得一定成果。但通过阅读《伤寒论》原文可知,不同概念之前存在混淆或异词同义的情况,概念之间关系错综复杂。述评所含文献由于技术所限并未完全对《伤寒论》中概念之间的联系进行梳理和呈现,但仍然为后续研究提供了哲学思路基础和方法上的借鉴。