APP下载

基于相似度算法的痛风病因病机演变规律研究

2024-04-08石晗李园白杨卫彬李宗友韩鹏

中医药信息 2024年3期
关键词:痛风病病位词典

石晗,李园白,杨卫彬,李宗友,韩鹏✉

(1. 国家中医药管理局监测统计中心,北京 100027; 2. 中国中医科学院中医药信息研究所,北京 100700; 3. 中国中医科学院研究生院,北京 100700)

痛风(gout)是由多种原因引发机体嘌呤代谢紊乱和(或)尿酸(uric acid,UA)排泄障碍的一种全身性代谢疾病[1]。由于体内单钠尿酸盐沉积而出现高尿酸血症(hyperuricemia,HUA)、晶体相关性关节炎和关节功能障碍等临床症状表现,严重者会引发痛风石、肾功能损害,是慢性肾病、高血压、糖尿病等多种疾病的独立危险因素和过早死亡的独立预测因子[2]。

“痛风”作为独立病名最早见于元代《格致余论》的记载中[3],但中医药治疗痛风的历史可追溯至秦汉时期,早在有关“痹症”“历节”“白虎风”的记述中[4-6],就可窥见古代医家对痛风的认识和辨治思想。中医药治疗痛风有着悠久历史和独特优势,随着现代中医学的发展,需要建立具有中医自身特色的临床证据分级及规范化推荐系统[7-9],其中古籍和医案是重要数据来源[10]。中医药传承迭经朝代更替,对痛风中医理论的研究,目前已进行了大量文献挖掘和梳理工作[11-15],但主要从共性治法和用药出发,或多以寻章摘句为主,对该病理论演变的系统梳理和纵向把握还需进一步探索。如能从时间线角度将理论进行比较分析,发现其中的差异变化,将有助于理清疾病认识的发展脉络。本研究通过相似度比较,以信息算法为桥梁,对不同时期医家的痛风病因病机理论认识进行对比分析,构建痛风病因病机演变的体系性认识,探求适合中医理论演变的研究方法。

1 资料

1.1 古代病名选定

参考《痛风及高尿酸血症中西医结合诊疗指南》《中国高尿酸血症与痛风诊疗指南(2019)》《中医大辞典》、全国普通高等教育“十五”“十一五”“十二五”全国规范化教材《中医内科学》,以及既往学者有关现代痛风古代命名考据的研究报道[16-26],通过专家咨询,明确与现代痛风相关的古代疾病病名有:痛风、历节(白虎历节、历节白虎)、白虎风、痹证、痹症、痹病、痛痹、风痹。

1.2 数据来源和检索

以选定的“痛风”“历节”“白虎历节”“历节白虎”“白虎风”“痹证”“痹症”“痹病”“痛痹”“风痹”病名为检索词,分别检索古今医案云平台的古医案库和《中华医典》,得到与检索病名相关的所有论述。依托国家图书馆和中国中医科学院图书馆的纸质书籍对检索到的内容进行校对。

1.3 制定纳入和排除标准

参照《痛风及高尿酸血症中西医结合诊疗指南》《中国高尿酸血症与痛风诊疗指南(2019)》和中华人民共和国中医药行业标准《中医内科病证诊断疗效标准》(ZY/T 001.1—94)中痛风的诊断依据[27-29]。

1.3.1 纳入标准

①与选定古代病名相关的论述;②“主症”论述中涉及的症状表现与痛风典型症状相近:包括关节红、肿、热、痛,常见于四肢末梢关节,例如“历节疼”“骨节急痛”;疼痛剧烈,例如“疼痛不可忍”“痛如虎啮”“痛如刀割”;发作时间以夜间多发,可见“昼静夜剧”等;关节疼痛反复发作,间歇发作,或时发时止,如包括“发作不定”“发作无时”等;③“次症”论述中涉及除关节症状外的其他兼症,可见体温升高、头痛、口干、疲乏、汗出、烦躁及胸脘满闷等,如“发热”“头痛”“四肢懈惰”“黄汗出”“口干躁烦”“胸满”等。凡满足①、具备②“主症”中的任意1项,包含或不包含③“次症”中所列症状即可纳入。

1.3.2 排除标准

①论述中涉及关节症状的描述与“主症”相差甚远,如“两脚筋缩,脚根缩粘至腿”“瘫痪”,或所论兼症与“次症”相差甚远者,如“胸高喘胀”“暴上气而喘”等;②有关脏腑痹的论述;③同时期重复的论述。

1.4 数据筛选和录入

将检索到的内容按照纳排标准采用双人录入的形式进行筛选,双人核对后筛选出的内容参照纸质书籍校对。将校对后的内容中涉及病因病机的数据项分朝代摘录至Microsoft Excel。

1.5 数据标准化处理

将录入的病因病机数据项参照《中医药主题词表》《中医临床诊疗术语国家标准证候部分》《中医临床诊疗术语国家标准疾病部分》进行标准化处理,对存在争议的内容保留原文。具体见表1。

表1 数据标准化示例

2 方法

本研究选用文本相似度(textual similarity)算法中的本体概念相似度作为计算方法。本体概念相似度属于文本相似度中的语义文本相似度[30],此方法通过制定特定文本语义词典,区分词典中不同文本之间的含义,从而判断文本间语义关系,即在语义词典基础上计算每个文本数据项在词典层次体系中的节点长度(数),从而得到两者之间的相似度[31]。其结果范围0~1,0 代表完全不同,1 代表完全相同,数值越大表示相似度越高。本体概念相似度计算公式[32]如下:

其中,Lcan(ci,cj)表示两个被比较对象ci、cj在词典中相同节点的路径长度,即两者共有的层级数。IC(ci)、IC(cj)分别表示所比较对象ci、cj在词典中的层级数[32-33]。

2.1 语义词典建立

通过专家咨询和专家论证的方式,确定数据项间的语义层级,利用Xmind软件建立痛风病因病机语义词典。词典中囊括经标准化处理后的所有痛风病因病机数据项。本研究建立的痛风病因病机语义词典共有119 个数据项、119个节点,其中包括一级节点1个,二级节点5 个,三级节点14 个,四级节点32 个,五级节点48 个,六级节点17个,七级节点2个。语义词典示例见图1。

图1 痛风病因病机语义词典示例

2.2 病因(病机)间相似度计算

根据语义词典,计算每个病因或病机在词典层次体系中的节点长度(数),从而得到两者之间的相似度。如计算外感风寒暑湿和风热阻络的相似度为0.667。关系图见图2。

图2 外感风寒暑湿和风热阻络语义关系图

2.3 朝代间相似度计算

朝代间相似度计算采用聚类分析中的组间联接算法,即计算两个朝代两两病因病机相似度的平均值,得到两个朝代间的相似度。如计算秦汉与晋南北朝间的病因病机相似度为0.632。结果见表2。

表2 秦汉与晋南北朝病因病机相似度比较

3 结果

3.1 基本数据结果

本研究最终纳入143 部中医著作中有关痛风病因病机理论数据,包括中医论著、方书、本草和医案医论,年代跨度从秦汉、晋、南北朝、隋、唐、宋、元,到明、清。

3.2 相似度算法结果

3.2.1 病因病机相似度

根据计算结果,晋南北朝与隋唐的病因病机相似度最高(56.0%),宋元间相似度最低(28.5%)。从秦汉到隋唐相似度呈上升趋势,从隋唐到宋的相似度开始下降(35.1%)。隋唐以前,医家对该病的认识较为集中,从宋代以后认识逐步深入,相似度值的变化趋于平缓。结果见图3。

图3 朝代间病因病机相似度比较结果趋势图

3.2.2 病因相似度

对病因相似度做单独比较。本研究病因分外感、内伤两部分,外感包括外感风邪、寒邪、热邪、湿邪,内伤分为内生五邪、阴阳失调、气血津液失调及病理产物致病和饮食内伤四类。其中内生五邪包括内生寒邪、热邪、湿邪,阴阳失调包括阳虚、阴虚两部分,气血津液失调及病理产物主要包括气滞、血瘀和痰饮。

宋之前病因的相似度较高,从宋之后呈下降趋势,并逐渐趋于平稳。宋之前医家对该病病因的认识较为集中,以外感为主,主要是外感风寒湿邪,散在有气血两虚和寒邪内生的内伤认识。宋之后出现更多内伤病因,包括阳虚、阴虚、内热、内湿、痰饮、血瘀,以及饮食内伤。元代出现气滞记载。到了明清时期,内伤以内热、血虚、气虚记述最多,气滞、血瘀、阴虚、内生湿邪次之。结果见图4。

图4 朝代间病因分布及相似度趋势图

秦汉时期是外感内伤致病理论“萌芽”阶段,《金匮要略·中风历节病脉证治》中所论“历节”“少阴脉浮而弱,弱则血不足,浮则为风,风血相搏,即疼痛如掣”[5],血弱受风,风邪入血则关节痛,“荣气不通,卫不独行,荣卫俱微……便为历节也”。晋南北朝时期可见诸多治疗风寒湿痹和寒热风痹的药物记载,《神农本草经》载治疗寒湿风痹的茜草,治疗内寒风痹的王不留行,以及主风热邪气的秦艽[34]。此时期的认识以外感为主。

到了隋代,《诸病源候论》对《金匮要略》的“饮酒汗出当风”做出解释,“由饮酒腠理开,汗出当风所致也。亦有血气虚,受风邪而得之者。风历关节,与血气相搏交攻,故疼痛”[4],并承前人经验认为“风寒湿三气杂至,合而成痹。其风湿气多而寒气少者,为风湿痹也”,同时认为感邪之人是由于气血两虚感受风寒湿邪所致,“由血气虚,则受风湿,而成此病”。唐代《新修本草》记载诸多《本经》及《本草经集注》中治疗风湿痹痛的药物[35]。隋唐有了明确气血两虚兼外受风寒湿邪致关节痛的记载。

宋之前相似度较高,以围绕外感为主。宋时期对历节、痛风关节痛的认识虽以外感风寒邪气为主,但已出现内在气血不足、气血不畅的病因,并且病变过程中有热化趋势,是从外感认识到内伤过渡阶段。宋·杨士瀛在《仁斋直指方论》言:“一方,治酒湿痰痛风”[36],第一次出现治疗饮酒所致痛风的方药记载。《太平圣惠方》载针对肝肾不足、外受风寒湿邪关节痛的萆薢丸方[37],并载虎杖散针对血脉结滞之白虎疼痛,发无定时,以及《世医得效方》治疗肝肾虚、外受风寒湿邪之川膝煎[38]。出现痰湿、气滞、血瘀,以及郁而化热的病机认识,并第一次出现历节关节痛忌食生冷鱼肉油腻之品的记载。

元代病因病机的重心开始从外向内转变,相关理论主要见于朱丹溪的著作中。朱丹溪提出血热理论,是病因病机认识的重要转折点,认为痛风病在血分,根据症状特点,分血虚生热、痰气交阻和湿热血瘀的不同,病程后期伴有阴血不足。此时期开始出现气滞的认识。

明清医家对丹溪的血热理论做进一步阐释。陈士铎《辨证录》提到“火郁于中上二焦”[39],肝胆气郁不宣,下克脾土,耗伤气血,经络不荣而痛。对病因认识已脱离外感病的范畴,认识到该类病是一种内伤疾病。病因病机涉及肝胆火旺、肾虚火旺、湿热、痰热、血热、血虚生热、久病化热,也涉及气滞、血瘀、痰浊、肝肾阴虚。同时,此时期注意到发病与天气有关,受凉、受湿会诱发关节痛,饮酒、劳累也会诱发,并且提出肥胖多痰热,瘦人多痰火,“痰”与患痛风有着密切关系。《成方切用》提出脾肾两虚外受风湿[40]。《医述》中提到胃热之热痹[41]。到清代,对病因病机有了更全面的认识。

3.2.3 病位相似度

对病位相似度做单独比较。病位的划分以脏腑辨证为主,涉及肝、肾、胆、脾、胃、肺和三焦。

明代之前朝代间病位相似度都为0,明清间病位相似度为0.481。秦汉时期涉及肝、肾、三焦病位;晋南北朝、隋唐和元代不涉及脏腑辨证;宋代脏腑辨证在肝、肾、肺;明代涉及肝、肾;清代涉及肝、胆、肾、脾、胃、肺。可见,围绕肝、肾、脾、胃辨证为多,结果见图5。

图5 朝代间病位分布图

《金匮要略》描述历节为:“寸口脉沉而弱……沉即为肾,弱即为肝”,论其成因“味酸则伤筋……咸则伤骨……荣气不通,卫不独行,荣卫俱微,三焦无所御”[5],这里提及偏嗜酸咸伤肝肾,“三焦无所御”更多的是指感受外邪所致。

宋代《太平圣惠方》对《诸病源候论》中的痹病方药做了补充[37],从“坚骨益筋”角度治疗风寒湿痹的萆薢丸方,祛风除湿同时加入补肝肾的牛膝。《世医得效方》记载针对肝肾虚外受风寒湿邪之川膝煎[38]。此时期有明确病位在肝、肾。

《明医杂著·卷之四·风症》中对丹溪所论血热痛风做进一步阐释,“盖肝藏血而主风,又肝气为阳为火,肝血为阴为水。若肝火旺则肝血必虚”[42],指出血热是由于肝火旺血热,火旺肝血虚,肝经风火,血燥生风。同时提到骨节痛而热者归属肾虚生热,并以涌泉处、两足生热为多。明代对血热痛风有了脏腑病位的划分,主要在肝、肾。

清代《黄帝内经素问集注》中指出“历节黄汗出,此言毁伤筋骨,故肝与肾脉并至,而其色苍赤”[43],病位在肝肾。《成方切用》提及脾、肾,“此类历节病,由风湿外邪,而兼脾肾俱虚之方也”[40]。《医述》中记录两种关节红肿疼痛的情况[41],“痛痹一证,肝肾为病,筋脉失于荣养,虚火乘于经络,红肿疼痛……又有过服热药,胃中蕴热日深,筋脉不利,手足肿痛如锥,以阳明主宗筋”,一种是由于肝肾阴虚,虚火乘于经络,筋脉失荣而致红肿疼痛,另一种是胃中蕴热日久,阳明主宗筋,而出现筋脉不利、手足关节肿痛如锥。《辨证录·卷之三·遍身骨痛门(四则)》认为痛风是由于风湿入络,甚者风湿入骨髓,“风湿入于经络则易去,风湿入于骨髓则难祛,以骨髓属肾”“人亦以为痛风也,谁知乃火郁于上中二焦……盖火生于郁。则肝胆之气不宣,木必下克脾胃之土,而土气不升,则火亦难发,以致气血耗损,不能灌注于经络而作痛矣”[39],肝胆气郁不宣,下克脾土,耗伤气血,不荣经络而痛。此时期也提出脾胃虚弱致痹,“腿并臂间发作不定,此脾胃虚,卫气不温分肉”。清代对因脾胃受损致病有了更多认识,肝胆火旺、木克脾土,脾肾两虚,外受风湿致历节关节痛,胃中蕴热、胃中湿热,或肝木犯胃射肺,而出现筋脉热痛。

4 讨论

通过对医家认识演变过程的比较性梳理,我们可以总结出医家对痛风的认识呈现从分散到集中,再到完善的过程,对病因病机的认识从以外感为主到向内伤过渡,并逐步深入和具体。痛风总属本虚标实之证,主要为肝肾阴(血)虚血热,气滞、痰湿热瘀,其中核心病机是痰湿热瘀、气滞,次要病机包括脾胃两虚,胃热,肝胆气郁火旺,外感风寒湿邪是常见诱发病因。此外,与现代痛风发病相关的饮食、饮酒内伤,或饮食禁忌也有较多记载。本研究利用相似度算法,将文字表述转化为可量化的数字形式展示,串联出整个历史时期对痛风理论认识的线性变化趋势。

文本相似度算法通过制定一定策略,将两个或多个实体(文本、词语等)的相似度进行数值量化,通过概念的语义组织和概念间的关系,将文本表示与上层应用[44],以及文本潜在信息之间创建联系[30],具有良好的结构信息和人机可读属性[45],是处理海量数据,挖掘有价值信息的关键技术。目前被广泛应用于工业技术、文字信息处理、人工智能和计算机网络等领域,并已日渐成为生物医学领域组织资源的重要方式[45]。文本相似度算法大致分为表面文本相似度和语义文本相似度两类[30,46]。本研究选用的本体概念相似度是基于文本含义确定文本间差异[31],根据两个概念节点在本体语义网络中的位置距离来比较两者不同,是属于基于知识库的语义文本相似度的一种[47]。通过比较的概念将一段时间中的变化串联有助于掌握这段时间变化的整体趋势。人们对事物的认识受到历史因素的限制,将疾病的研究建立在历史观的基础上有助于对整个认识过程的把握。通过相似度比较将认识的过程进行量化,帮助建立全局概况,找到关键节点,形象展示其中的演变趋势。虽然相似度算法在中医领域应用较少,但既往有学者做了相关探索,在中医医案、证候、处方用药相似度和中医领域本体库构建方面进行尝试[48-51]。中医理论包含大量文本专业术语,将文本术语量化、结构化,将相似度算法应用于中医理论研究,对中医理论深入挖掘探索,以及中医诊疗标准化工作的推进不无裨益。

猜你喜欢

痛风病病位词典
蓄血证病机病位探析
鸡痛风病的发生原因、临床症状、诊断与防治措施
米沃什词典
《思考心电图之164》
豆腐
——痛风
中医对痛风的认识
消渴病合并抑郁症之病位探析
评《现代汉语词典》(第6版)
词典例证翻译标准探索
藏医药及放血疗法治疗痛风病的疗效观察