APP下载

基于复杂网络社区发现算法的2型糖尿病证候组成及时序演变规律研究*

2020-04-20张润顺文天才

世界科学技术-中医药现代化 2020年11期
关键词:阴虚时序气虚

邢 颖,皮 敏,张润顺,杨 杰,文天才,**

(1. 中国中医科学院中医临床基础医学研究所 北京 100700;2. 深圳市中医院 深圳 518033;3. 中国中医科学院广安门医院 北京 100053;4. 中国中医科学院中医药数据中心 北京 100700)

1 前言

2 型糖尿病(type 2 diabetes mellitus,T2DM)是一种多病因、长病程的慢性进展性疾病。现代流行病学研究显示,T2DM 是遗传因素和环境因素(包括饮食结构、起居环境、生活方式、社会经济状况等)的综合产物[1];中医认为,先天禀赋不足、饮食不节、嗜食肥甘、缺乏运动、情志失调等皆是导致T2DM 发生的致病因素[2]。在病机方面,病性涵盖火热、痰湿、血瘀、气滞、气虚、阴虚等多种因素[3],病位涉及肺、脾胃、胃肠、肝肾多个脏腑[4],其发生发展变化错综复杂。T2DM 证候时序演变是指机体在病因病机影响下偏离有序稳态后某一具体时间范围内机能状态的反应。T2DM 病因病机的复杂性决定了其证候时序演变呈现出多样复杂的特点,这为临床根据证候变化进行干预靶向和范围调整带来许多困难。因此,研究T2DM 证候时序演变对于明确干预的调整方向、预估疾病转归及预后从而指导中医临床实践、确定T2DM 中医辅助治疗方案具有重要意义[5]。

传统研究T2DM 证候演变的方法主要是临床试验[6],包括横断面研究[7]、回顾性研究[8]、前瞻性队列研究[9]等多种临床研究类型;其次是动物模型研究,如吴晏[10]等人通过高脂喂养合并腹腔注射小剂量链脲佐菌素(STZ)制备T2DM 大鼠模型,观察得出模型大鼠在STZ 注射后4-8 周为阴虚内热证型,在STZ 注射后10-13 周为气阴两虚证型。但随着电子病历日益普及,真实世界临床数据的大量积累为开展真实世界数据挖掘研究奠定了坚实基础,使得从T2DM 真实世界证候时序数据中挖掘其证候演变规律成为可能。

T2DM 证候时序数据属于时间序列数据,具有明显的时间属性。时间属性是理解证候随时间演化模式的关键[11],赋予证候时序数据挖掘方法学的新挑战。既往T2DM 证候演变数据挖掘研究中,多是从证的静态或空间分布的角度对证候演变展开研究,如通过提取各时点证候信息,简单地以频率分布变化来描述证候演变情况[12]。但这种方法明显将各时点的证候孤立起来,无法充分体现T2DM 证候时序数据的时间属性,不能完整描绘出T2DM 证候在一段时间内的连续演变模式。也有研究者运用转移概率矩阵、非线性混合效应模型[13]、结构方程模型或潜在类别分析等新方法[14]试图解析T2DM 的证候演变规律,但此类方法较为复杂,不易理解实施和推广应用。因此,如何简洁明了地从证候动态时间演变的纬度刻画出T2DM 的证候演变模式成为亟待解决的难题[15]。因此,本文运用复杂网络社区发现算法、有向加权复杂网络、桑基图等真实世界数据挖掘方法,首先对T2DM 证候组成进行社区划分,再结合证候时序数据的时间特性构建T2DM证候有向加权网,并利用桑基图实现对T2DM 长期证候演变进行可视化分析,创新性地从数据可视化角度出发,简单清晰地展示出T2DM 证候在纵向时间维度的连续性、动态性的演变模式,最终归纳出T2DM 的证候时序演变规律,以供临床参考。

2 资料与方法

2.1 数据来源

从中国中医科学院中医药数据中心临床数据仓库中筛选T2DM 患者电子病历数据,提取患者病历号、就诊时间、西医病名及证候诊断,利用Excel 2016建立T2DM中医证候数据库。

2.2 数据筛选标准

①所选病历必须为完整病历,必须同时包含中医病名及证候诊断,西医病名;②中医主要诊断为“消渴”,且西医诊断为“2 型糖尿病”或其并发症;③就诊次数≥2次;④年龄≥18周岁。

2.3 证候规范化

参照《中华人民共和国国家标准·中医临床诊疗术语证候部分》[16]、《糖尿病中医诊疗标准》(2011)[17]、《中药新药临床研究指导原则》第一辑[18]、《22 个专业95 个病种中医诊疗方案》[19]对进行证候规范化,将部分证候术语表达不规范或同证异名的证型进行统一标准化处理。参考《证素辩证学》[20]将证候进行拆分成证素。

2.4 数据分析

2.4.1 数据分析方法简介

本文主要采用复杂网络社区发现算法进行T2DM证候分类,利用有向加权复杂网络和桑基图分别实现证候短期和长期演变分析。

(1)复杂网络社区发现算法

复杂系统通常用由节点和边组成的网络表示,网络中的节点是复杂系统中的一个实体,节点之间的边则是系统中实体之间的一种关系[21,22]。复杂网络具有多个统计特征,包括小世界性质、无标度性质、聚集性或网络传递性等[23-25]。社区结构是复杂网络的关键特性之一,它是由复杂网络中具有相同类型的结点所组成的子图[26]。本文使用复杂网络社区发现算法,对证候拆分后的证素复杂网络进行社区划分,从而更容易发现T2DM证候分布及组成的群聚规律。

(2)有向加权复杂网络

复杂网络分为无权网络和有权网络,有权网络是从网络结构和节点权重来综合考虑网络的动态演变情况[27]。另外,在现实网路中,除了要考虑节点或边的权重以外,往往还需要考虑节点之间的方向性,因为很多时候,节点之间的联系往往是有方向且不对等的,因此,有向加权复杂网络是在复杂网络的基础上,针对不同需求,综合考虑节点联系的方向性和边的权重值而产生[28-30]。考虑到实际临床数据中证候的演变具有时序特征,因此本文利用有向加权复杂网络来发现T2DM证候的短期演变规律。

(3)桑基图

又称为热平衡图或能量流程图[31],它由边、流量、节点组成。节点代表不同分类以划分能量流动的不同阶段或分区,边连接不同阶段或分区的节点,代表着流动的能量或数据,流量代表流动数据的具体数量,流量与边的宽度成正比,边越宽,数值越大,并且输入节点的总宽度要与输出节点的总宽度相等,即输入和输出的总量(总数)平衡[32-34]。本文利用桑基图来展示T2DM 中医证候长期演变特点,为丰富证候动态时序数据的可视化表达提供了一个新的思路。

2.4.2 数据分析过程

本文首先运用Gephi 0.9.2 建立T2DM 证候无向加权复杂网络,其中节点表示病位和病性组成的证素,边表示一个证素对同时出现在所有诊次中的频次。使用Gephi 0.9.2 内置的Fast Unfolding 算法进行证候社区划分[35],并总结各社区证候的主要特征。其次,将原始数据整理为疗前和疗后两阶段数据,利用Cytoscape 3.7.1软件绘制证候演变有向网络图,节点代表T2DM 证候社区,边代表疗前向疗后转化的证候社区演变方向。最后,截取原始数据中所有患者前10个诊次数据,运用Origin 9.1 绘制证候长期演变桑基图,其中以证候社区为节点,以诊次数据为边,边的宽度表示证候变化的诊次数据量。

3 结果

3.1 证候复杂网络全局图与社区划分

本文共纳入患者2826 名患者,共10247 个诊次,病位、病性证素组合共计414种。在T2DM 证候全局网络中,排名靠前的证候主要是痰、火(热)、脾虚、胃火(热)、气虚、阴虚、血瘀等,且他们相互之间共同出现的频次也较高(图1a)。

图1 T2DM证候复杂网络与社区划分

通过对T2DM 证候全局网络进行社区划分,得到最核心的7 个社区占原始网络节点比例的90.67%(图1b)。在社区A 中,以气虚血瘀和阴阳两虚为主,同时兼有气滞、湿、热等,该社区占全部节点的26.84%,为所有证候中最大的社区。社区B 占有所有节点16.38%,主要特点为脾虚胃热,同时兼有肝火旺盛和肝气瘀滞。在社区C中,以痰热互结表现为主,占所有节点的16.1%。社区D 占所有节点的10.17%,表现主要为湿热内蕴。在社区E中,以肾虚为主,其次表现为肝虚、经络闭阻,肝暑湿和胃暑湿象,占9.6%。社区F占6.78%,主要表现为肝肾阴虚,以及心阴虚、脾气虚或肾气虚。社区G占4.8%,主要表现为脾肾阳虚。

3.2 两阶段证候演变规律

在以证候社区表示的T2DM 两阶段证候演变的加权有向复杂网络中,箭头所指方向为证候变化方向,边的上标数字为产生这种证候演变的诊次数量(图2)。以证候社区A 为例,标有7008的有向线条指向自己,表明有7008 次诊次证候表现为A 的患者,经过一轮治疗之后,证候并未发生改变,因此箭头指回向自己;而标有1187 的有向箭头指向社区C,表明有1187诊次证候表现为A 的患者经过一轮治疗以后,证候转化为C。其他有向箭头的具体含义同理。由此可见,尽管T2DM 的证候演变存在复杂的转化关系,但多数证候趋向保持稳定,即T2DM 证候在疗前和疗后两个诊次间趋向于不发生变化。

从证候社区的两阶段演变规律来看,51-67%的证候社区不发生变化,其中以气虚血瘀并阴阳两虚证(A 类)和脾肾阳虚并浊毒内蕴证(G 类)的稳定性最高,分别为65.00%和66.64%不发生变化。在所有证候社区中“肝肾阴虚并心脾两虚证(F 类)→气虚血瘀并阴阳两虚证(A 类)”和“阴虚火旺并痰热互结证(C类)→气虚血瘀并阴阳两虚证(A类)”两类证候转化率超过20%。同时,在发生不同证候社区间转化的情形下,有5 类证候社区都首先转化为气虚血瘀并阴阳两虚证(A类)(表1)。

图2 T2DM证候两阶段演变网络图

表1 T2DM疗前疗后二阶段证候发生变化的诊次数量

3.3 长期证候演变规律

提取所有患者的前10 个诊次(6-10 个月)证候数据,以横坐标代表诊次,纵坐标代表证候社区,运用桑基图对证候社区长期动态演变规律分析。因并非所有患者都有10个以上诊次数据,且随着观察时间的延长能够观察到的患者也越来越少,因此随着时间的延长边的流量会越来越小。但在可观察的证候社区演变数据中,仍然可以发现所有证候社区均保持较高稳定性即不发生转化。而也有部分证候社区发生长期演变:脾虚胃热并肝气瘀滞证(B类)、阴虚火旺并痰热互结证(C类)在长期趋势中有相当的比例会演化为气虚血瘀并阴阳两虚证(A类)(图3)。

图3 T2DM证候演变长期规律

4 讨论

上述结果表明,T2DM 在证候组成上以虚实结合为主;其证候有着复杂的时序演变过程,遵循由实到虚的演变过程,气虚血瘀并阴阳两虚类证为T2DM 证候演变中的关键证候。

从证候社区划分来看,证候社区B(脾虚胃热并肝气瘀滞证类)、C(阴虚火旺并痰热互结证类)、D(湿热内蕴并脉络阻滞证类)、E(肾虚络阻并肝胃暑湿证类)以实证或虚实夹杂为主,证候社区A(气虚血瘀并阴阳两虚证类)、F(肝肾阴虚心并脾两虚证类)、G(脾肾阳虚并浊毒内蕴证类)以虚证为主要,总体呈现虚实夹杂的证候特点。在证候演变过程中,尽管平均存在51-67%的证候社区不发生演变,但其余产生变化的证候均不同程度地向其他6 个证候社区演变,表明各证候社区之间错综复杂的演变关系。这是因为T2DM是一种多病因、长病程的慢性进展性疾病,病程可达数年甚至数十年之久[36]。因此,在其缓慢的疾病发展中,证候呈现出一个动态、复杂的演变过程。具体而言,T2DM 起病往往是从中焦实热开始[37],但之后的演变常常会受病人体质、治疗等多种因素影响而产生不同方向的改变:如素体偏虚者,早期常表现为脾虚胃热证等,随着疾病演变表现为气阴两虚、阴阳两虚等证;而体质偏阳者,前期实热的表现较为明显,并且内热会从中焦脾胃波及到肝、肺、肠等多脏腑,可有湿热、痰湿互结、肝胃郁热、肺胃郁热等多种不同表现,随着热邪伤阴耗气而表现为阴虚火旺、气阴两虚证等。

但正如仝小林院士所说:“消渴早中期证候虽同属中满实热病机,却因侧重脏腑病位不同,早中期发展走向有所区别,但至虚的阶段后期,二者发展走向基本一致,殊途同归。”[38]也就是说,尽管T2DM 病机存在复杂、多样的演化方向,但在向虚转化的过程中很可能存在一个关键必经证候或证候群。结合本文结果来看,每个证候社区均有着向社区A(气虚血瘀并阴阳两虚证类)转化的趋势。以实证为主要表现的证候社区B(脾虚胃热并肝气瘀滞证类)、C(阴虚火旺并痰热互结证类)、D(湿热内蕴并脉络阻滞证类)在短期和长期证候演变中均有相当比例转向以虚为主的社区A(气虚血瘀并阴阳两虚证类),由此可见,T2DM 证候演变大致遵循一个由实到虚的演变过程,并且,气虚血瘀并阴阳两虚类证应当为T2DM 证候演变中的关键证候群。这一结果是符合T2DM 疾病发展理论规律的,T2DM 早中期热邪为主,伤阴耗气,后期逐渐出现气虚、阴虚表现,气虚、阴虚日久,阴损及阳,最终导致阴阳两虚。而虚证以及疾病过程中形成的痰湿、气滞等病理因素均可导致血瘀的发生。研究表明,瘀贯穿T2DM 的全过程,在早期往往表现不明显,但随着疾病进展,到中晚期成为导致并发症发生发展的主要因素[39]。本文过程中也发现存在相当比例证候经过治疗并不发生变化,思考原因可能是T2DM 病程普遍较长,而本文所选诊次时间段最长为10个月,尚未能充分展示出全部证型的演变规律,因此,可能还需要更多长期治疗的患者数据进行进一步研究与验证。

5 结论与总结

综上,本文创新性引入复杂网络社区发现算法、桑基图等数据挖掘和数据可视化方法,以图文并茂的方式,展现了T2DM 短期和长期证候时序演变规律,并通过总结归纳出:T2DM 证候存在复杂的演变关系,整体呈现出由实到虚的演变规律,其中,气虚血瘀并阴阳两虚类证为T2DM 证候演变中的关键证候。这一研究结果对把握T2DM 疾病发展动向、及时调整诊疗措施、有针对性地施以方药、从而提升T2DM 中医辨治疗效具有重要意义。并且,本文不仅丰富了中医证候动态时序数据的研究方法,还提出一条新的证候演变可视化研究思路,以供其他研究者参考。

猜你喜欢

阴虚时序气虚
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
补肝汤治疗肝肾阴虚型慢性乙型肝炎效果分析及对患者中医证候积分的影响
自拟地芍龙牡汤加减联合西药治疗阴虚热盛型糖尿病的疗效分析
自拟芪龙头痛汤治疗气虚血瘀型偏头痛的临床观察
中医辨证治疗脾胃气虚型功能性消化不良的临床研究
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
中医辨证治疗脾胃气虚型胃痛的临床疗效探讨
你不能把整个春天都搬到冬天来
2型糖尿病阴虚体质者的中医症状临床研究