基于网络生物学的中风证候基础研究问题及新趋势探讨*
2020-04-20刘晓庆何玉瑶杨艳平钟利群
张 靖,韩 树,刘晓庆,何玉瑶,赵 赫,杨艳平,钟利群
(北京中医药大学东直门医院 北京 100700)
辨证论治是中医临床医学的灵魂[1],而证候则是辨证论治的核心和精髓。证候作为临床上确定治法、谴药处方的重要依据,在日常诊疗中占有重要地位。但是,由于证候通常由医师个人确定,其准确与否往往取决于医师的学识及综合判断能力,这就导致证候的辨识不可避免地存在一定程度的主观性和不确定性。加之证候反映的是疾病过程中某一阶段或某一类型的病理特点[2],具有时空性和动态性。证候的这种复杂多变的特性使得我们至今难以准确地揭示其真正的内涵,大大制约了中医学诊疗特色的发挥。
中风病作为一个高发病率、高死亡率、高复发率的疾病[3,4],其预防、治疗和康复一直是国内外学者十分关注的课题。为了找到安全有效的治疗药物,学者们进行了大量的临床实验研究。但是,传统的辨证方法已难适应这些群体化研究的要求,研究的临床价值受到质疑,在这种情况下有学者提出了“群体辨证”的概念[5]。为了找到科学有效的群体辨证方法,研究者们不断探索,但始终无法确定一套公认的可靠方案。直到复杂科学和网络生物学的出现使这一困境有了缓解的曙光。在未来阶段,网络生物学技术有望帮助我们打破传统的证候研究模式,从微观层面深入阐明证候实质,为中风病的辨证分型提供新的依据。
本文将重点阐述网络生物学技术特别是组学技术在证候研究中的应用价值,以期为中风病证候研究提供新的思路。
1 完善证候研究的必要性
1.1 证候在中医个案研究中具有不可替代性,但它同时又存在不确定性
1.1.1 证候是中医理论的核心,其个体性、动态性特点体现了中医学的诊疗特色
郭蕾等[6]认为,证候具有“内实外虚”“动态时空”和“多维界面”的特征。“内实外虚”之“实”是群体在某一特定病变过程中所具有的共性规律,对于证候的诊断起着决定性作用;“虚”是指患者表现出的个性化症状信息,对干预原则和方法具有一定的影响作用。“动态时空”是指证候的演变而言,它随着时间和空间范围的改变而发生变化。“多维界面”则可以理解为证候是由多种要素组成的。这些特征说明了中医学重视个性化诊疗和关注疾病的动态变化,而这恰恰是中医学不同于现代医学的诊疗优势所在。现代医学没有证候的说法,只有疾病亚型,而这些亚型并没有性质上的不同,因而对治法的选择不会产生太大的影响。而中医学的证候有别于现代医学的疾病和疾病亚型,是一种在疾病背景下独立存在的病理生理整体反应状态,对选方用药有直接的指导意义[7],这一概念反映了中医学依据疾病的病因、病性、病势、病位及不同病程阶段选择不同治法的诊疗特色。因此,证候是中医个性化诊疗的核心和基础,证候研究在中医现代化进程中的重要性不容忽视。
1.1.2 证候的模糊性和隐匿性使宏观辨证和治疗效果受到制约
证候由一系列具有内在联系的症状与体征构成,而在中医日常诊疗中,我们通过“四诊”所获取的症状、体征信息往往具有模糊性。例如望诊中舌质的颜色、闻诊中语声的高低、问诊中“口渴”与“口不渴”、切诊中脉象的有力或无力等都没有一个清晰的界定,只能由医师根据经验进行大致的判断,尚缺少统一的量化标准,使临床诊断的准确性受到局限。此外,在某些疾病的早期,患者还没有表现出相应的症状和体征,运用中医的“四诊”可能无法获得可供诊断的信息,这种情况下可能会延误患者的病情[8]。证候的这种模糊性和隐匿性使宏观的辨证论治受到制约,因此从微观角度对证候进行量化和客观化势在必行。
1.2 群体辨证是中医临床研究的必然要求,但尚未找到科学有效的方法
长期以来,临床试验研究是评价中医药临床疗效及其安全性的重要手段。中风病是临床上的多发病、难治病,学者们一直在努力寻找安全有效的治疗方案,因而进行了大量的临床研究,其中不乏论证强度相对较高的随机对照试验(RCT)。然而,这些RCT 研究虽然属于群体研究,但它们大多仍是在个体化辨证的基础上进行的,依然存在不确定性。例如,在采集临床四诊信息特别是问诊信息时,经常存在信息遗漏或者患者表达不清的情况,导致资料采集和证型判定仍存在主观性;尚无一个统一的辨证分型标准,且现有的分型尚不能囊括临床上所有患者,导致研究者们在前期辨证分型时缺乏标准参照,从而使一些研究在纳入对象时选择放弃使用中医标准,不考虑辨证的概念,而是依据西医的疾病进行纳入,使研究缺乏科学性,降低了疗效证据的可信度和临床应用价值。
鉴于尚未标准化、客观化的证候体系给群体研究带来的困难,一些研究者们开始寻找与群体研究相适应的辨证方法来解决这些难题,如有学者采用文献调研、专家调研、临床流行病学调查等方法综合制定出符合中医基础理论和临床实际的中医辨证量表,使数据更加精确,辨证更加客观化[9];还有人采用系统评价、横断面研究等多种途径获得特定疾病的证候名称和分布,并结合文献整理和临床医师的诊疗经验对证候术语进行筛选和调整[10];李可建[5]正式明确了“群体辨证”的概念,提出将某一疾病群体作为研究对象,探析其证候分布规律和证候特点,并将其作为确定临床试验措施的重要依据。这些理论和实践的成果对于中风病证候研究的影响已初步显现,例如有研究者[11]采用横断面研究、回顾性研究的方式,利用证候量表进行了中风证候的动态演变研究,揭示了中风病患者群体的证候演变规律。但是遗憾的是,这些研究受到样本量和观察时间的限制,往往只能阐释单证候的动态演变。
随着科学技术的进步,数据挖掘技术及现代统计学方法被应用于群体辨证。数据挖掘方法如关联规则、聚类分析、决策树、支持向量机、贝叶斯网络、人工神经网络等使大规模的数据处理成为可能,有助于发现大样本群体中证候的整体分布规律。但是,面对错综复杂的定量与定性结合、主观与客观结合、确定与模糊结合、线性与非线性结合的海量的中医数据,任何一种数据挖掘方法都没法做到面面俱到,因此目前仍缺少获得界内公认的符合中医特点的一套挖掘方法[12]。对于中医证候这个高维性、高阶性、非线性的复杂系统,想要探究它的真正内涵,必须找到一套与这种复杂性相适应的新方法,而组学技术和网络生物学的发展为微观角度的证候研究带来了机遇。
2 网络生物学为中医证候研究带来机遇
2.1 网络生物学技术简述
复杂网络是描述复杂系统的有力工具,长于在功能复杂性中发掘普适规律[13]。近年来随着生物信息技术的发展,生物学与复杂网络相结合,形成了一门新兴的学科—网络生物学。网络生物学这一概念是Barabasi 等在2004年提出的[14],认为通过建立网络模型,可以将复杂生物系统的相互作用抽象表达成网络,通过对复杂网络拓扑结构和特性的分析来揭示生物系统的原理和本质,认识生命活动规律[15-17]。高通量测序技术、芯片技术以及基因组学、代谢组学、转录组学、蛋白组学等组学技术的日益成熟、新的计算方法的开发、公共数据库的建立大大促进了网络生物学的发展[18]。
下面将简单阐述网络生物学的几个重要方法学概念:
2.1.1 网络建立方法
(1)蛋白-蛋白相互作用网络(protein-protein interaction,PPI)
蛋白-蛋白相互作用网络中,每个节点代表1个蛋白质,每条边代表2个蛋白质,它们具有物理上或者在功能上的相互作用关系[18]。这些相互作用关系可以通过公用数据库获得,常用的蛋白质相互作用网络数据库 有 STRING[19]、HPRD[20,21]、BioGRID[22]、In-tAct[23]、DIP[24]等,其中STRING(http://string-db.org)数据库目前已收录了超过5000 多个物种、2000 多万种蛋白和20 多亿个相互作用的数据[25],这些蛋白质相互作用既包括直接的物理作用,也包括共表达相关性。通过分析这种网络,有利于我们更好地理解蛋白质的功能及其相互作用关系。
(2)基因共表达网络(co-expression network,CEN)
在基因共表达网络中,每个节点代表1个基因,每条边代表2 个基因具有相似的表达模式[18]。基因芯片数据是基因表达数据的主要来源之一[26],其数据可从GEO[27],ArrayExpress[28],Ensemble[29]等公用数据库中获得。基因共表达网络大多是以基因间表达谱数据的相关性为基础而实现构建的,其构建主要分为两个步骤,即对所有基因进行相似性度量和通过阈值的选择确定共表达网络的边[26]。
(3)代谢网络(metabolic network,MN)
代谢网络是由生物体内所有的代谢反应或途径,以及相关的调节过程所构成的复杂网络系统。在代谢网络中,每个节点代表1 个代谢物,每条边代表2 个代谢物之间存在生物化学反应[18]。随着基因组测序技术的迅速发展,完整的基因序列信息、高通量的实验技术和生物工程理论的基础使得我们能利用已知生物体的一系列生化反应,将从细菌到人类等不同生物的代谢网络完整地重建出来[30]。目前许多生物代谢网络已经构造完成并且可以通过在线互联网络获得相关的信息,其中比较著名和常用的代谢反应数据库有KEGG[31]、HMDB[32]、SMPDB[33,34]等。这些数据库可以帮助我们准确、批量地获取网络构建所需的信息,已成为代谢网络研究的重要工具。
2.1.2 GO功能分析和KEGG通路分析
网络生物学中,为了了解重要节点的生物学功能,通常要进行通路分析和功能分析。通路分析通常指KEGG(kyotoencyclopedia of genes and genomes)通路分析,功能分析通常指GO(gene ontology)功能分析。GO(gene ontology)是基因本体联合会(Gene Onotology Consortium)建立的数据库,目的在于建立对基因和蛋白质功能进行限定和描述,可以适用于各个物种,并且随着研究不断深入而更新的语言词汇标准。GO 注释分为分子生物学功能(molecular function,MF)、生物学过程(biological process,BP)和细胞组分(cellular component,CC)三大类,主要用于描述基因产物的功能[35,36];KEGG 是一个综合数据库,是日本京都大学生物信息学中心的Kanehisa 实验室在1995年建立的,它是一个综合数据库,大致分为系统信息、基因组信息、化学信息和健康信息4 大类,共包含了18 个主要的数据库。其中的Pathway 数据库是一个代谢通路集合的数据库,包含新陈代谢、遗传信息加工、药物开发等7个方面的分子间相互作用和反应网络[31]。通过对网络重要节点的GO 和KEGG 富集分析,我们可以将重要节点显著富集的通路认为是受调控的通路,将重要节点显著富集的GO terms 认为是其参与的生物学过程[18]。
2.2 网络生物学适用于中医证候研究
2.2.1 网络生物学的整合性、复杂性特点与中医证候相适应
证候是一个非线性的“内实外虚”“动态时空”和“多维界面”的复杂巨系统[6],想要揭示其证候的内涵,需要采用与证候复杂性相适应的复杂性科学理论及思维方法。而网络生物学具有从整体和系统出发研究复杂体系的特征,它可以整合多种组学信息,实现从基因到细胞、组织、个体的多方向、多层次的研究,解析生命过程的复杂性,最终揭示生命活动的本质规律[37]。网络生物学方法的引入为科学、合理地阐明证候实质提供了便利,促进证候的客观化、定量化,从何推动中医现代化研究的进程。目前,证候与网络生物学的结合已经取得了初步成果,如李稍等[38]提出了“证候生物分子网络标志”的构想,建立了可以更好地理解病证方关系的“表型网络-生物分子网络-药物网络”研究框架,并且以寒证和热证为案例研究,为系统生物学方法与中医药的结合开辟了一条新路。
2.2.2 中医学的“证”与现代医学的“表型”具有一定的共通性
表型是现代医学概念,它是指有机体的某一特定的物理外观或成分。从疾病角度而言,它能够反映不同患者间差异,与临床预后相关。表型是基因型和环境共同作用的结果。机体内存在的许多分子生物过程、机体所处的环境改变均会影响疾病的表型;部分基因结构的改变也能引起复杂疾病、影响疾病表型的改变。且具有同种基因型的生物在不同环境下可表现出不同的表型,具有相同基因型的生物可因基因表达谱和表达程度不同而呈现不同表型[39]。中医学理论亦十分重视环境、先天体质等因素对疾病的影响。即使是同一疾病,当表现为不同证候时,它对人体造成的损伤可能是不同的。不仅如此,证候时一个动态演变的过程,随着环境等因素的变化,证候表现也会不断发生改变。在现代医学中,对临床表型的研究是为了发现具有个性化特征的患者组别,为个体化治疗提供有力的支撑,这与中医学辨证的目的也存在一致性。因此从某种程度上看,现代医学的表型概念与中医学的证的概念存在共通之处,表型的复杂性和个体化特征与中医辨证论治的诊疗特色相契合。这提示我们或许可以从现代医学的表型概念入手,透过复杂生命和疾病体系的外在表型,揭示证候的内在本质。而网络生物学可以通过基因组学、转录组学、蛋白质组学、代谢组学等技术开展大规模的表型分析,提取反映人体系统特性的各类生物信息,有效地追踪基因型、环境因素和表型之间的联系[40],将为我们的表型和证候研究提供有力的工具。
2.2.3 网络生物学的整体性特点有利于组学数据的整合分析
近些年来研究者们已利用组学技术进行了一系列挖掘中医证候本质的实验研究,发现了一些与特定证候相关的生物标记物。但是,这些研究大多采用的是单一的组学技术,对生物标记物的分析也是孤立的。而证是一个复杂的巨系统,由多种要素构成,单一的生理、生化指标无法全面地揭示其科学内涵。数据分析未融入到整体代谢中,对人体病例变化的反映是片面的,也就难以全面深入地解析中医证候的整体性特征和系统机制[41]。
而根据网络生物学的思想,人体可以看作一个连通的网络,基因、RNAs、蛋白质以及代谢物等生物分子相互联系,以网络为框架,构建生命有机体[18]。网络生物学技术能够通过检测某一病证患者不同时间点的代谢组和蛋白质组成分,获取生物标记物及相关通路,从网络中获得特定模块和关键节点,揭示病变过程中体内物质的代谢状况,从而从整体角度辨析证候的个体特征与变化规律[16]。同时,将网络生物学技术与大数据结合,还可以很好地整合多种组学技术所产出的海量数据,建立有效的分析平台,促进数据分析向更加系统化的方向发展。
3 中风病证候未来研究方向展望
3.1 继续开展中风证候的组学研究
组学技术是网络生物学方法的重要组成部分,它可以在某个特定时间对机体各个层面生命活动物质进行定性、定量分析,发现其中的特性与规律,从整体上评价由各种因素所致的生命体功能变化[42]。因此,利用以高通量系统论为指导的组学方法探索中风病证候实质,寻找证候及其分型的物质基础,实现宏观、微观层面的证候分型仍是今后中风病证候研究的重要方向。尤其是近年来新兴的代谢组学,它具有“终点放大”的特征,在中医药关键科学问题研究中具有突出优势。与蛋白组、基因组相比,代谢组包含的信息量更大,能够更正确地反映细胞的功能水平[43]。未来我们将通过这些组学技术,挖掘中风病证相关的特定共性组分,对证候加以量化,做到证候与生物标记物的结合,从而促进证候的定量化和客观化。
3.2 构建中风病证候网络模型
证候网络模型的建立是深入探索证候本质的重要手段,是对传统中医理论和现代实验生物学研究的补充,它不仅可以用来预测中医证候的基因型到临床的表型的过程,还可预测病证的演变[37]。从组学研究的角度来看,基因组学、转录组学、代谢组学等在研究内容和方法上均存在差异,因此需要各种组学信息进行整合分析,并利用统计学方法构建科学可靠的证候网络模型,通过计算模型获得规律性认识,从而能够预测中风证候的形成过程,揭示中风证候的本质。
3.3 建立生物信息数据库和网络分析平台
随着二代测序、三代测序的快速发展,如何整合多种组学技术所产出的海量数据,建立有效的网络分析平台是我们亟需解决的问题[18]。未来我们将利用网络生物学对中风病证研究中不同来源、不同性质的数据进行整合,并结合数据挖掘技术进行病证数据的挖掘,构建现代生物学信息库。这一数据库除了具有信息管理和查询的基本职能外,还能够帮助进行数据分析和病证信息预测。并且今后随着信息技术的进步和网络生物学的深入研究,中医证候数据的整合也将朝着更加智能化的方向发展[37]。
3.4 优化中风病证候的动态演变研究
由于中风病起病急,变化快,研究中风证候的动态演变、把握患者的病情变化对于选方用药有重要意义。因此近年来,学者们致力于研究中风病病程中不同时点的证候动态演变规律,如2008年钟利群等[11]评估了中风急性期患者服用化瘀解毒汤后在入院后1-3天、4-7 天、8-10 天及11-14 天四个时相的证候量表分值变化,证实了中药化瘀解毒汤良好的临床疗效;王平平等[44]对缺血性中风患者发病3 天、14 天、28 天、90天4个时点的单证候动态演变与预后的关系进行了分析,发现不同时点不同单证候演变对中风的预后影响不同;皮立宏等[45]研究了经rt-PA 溶栓后的急性脑梗塞患者入院时、溶栓后24 h、溶栓后48 h 的3 个时间点的单证候动态演变,找到了溶栓后更具针对性的中医治疗策略。
上述研究均采用证候诊断量表,较好地解决了医师经验化辨证的主观性问题,对临床有很大的指导作用。但是,由于样本量和观察时间的限制,这些研究都只阐释了单证候的动态演变。而随着网络生物学技术的进步及大数据时代的到来,我们除了可以用数据挖掘技术代替传统的统计方法,使研究过程更加便利之外,或可将网络生物学方法应用其中,开展大样本、多中心、多证候、多时相的研究,使结果更客观、具有更广泛的指导意义。
3.5 结合临床科研信息共享平台,开展真实世界研究
不同于传统的RCT 研究,真实世界研究不局限于随机分组,而是提倡临床数据来源于真实的临床实践环境,具有大样本、多维度的优势,它将成为未来中医临床科研的必由之路[46]。而临床科研信息共享系统[47]将成为真实世界研究的一个重要平台,不仅使数据的来源更广泛、质量更可靠、管理更方便,而且能够使数据的处理更快捷、更规范。笔者所在团队利用临床科研信息共享系统,选取山东潍坊市中医院7170名缺血性中风病住院患者的中医临床电子病历(EMR)开展了一项真实世界研究。对诊断、症状及证候数据进行规范化处理后,我们构建了具有相同症状的患者相似性网络,使用高效的社区检测算法BGLL 确定患者亚群,然后对病例数量多的7 个亚群的中医证候进行了分析,最终发现了与疾病表型特征相一致的证候特征,如其中的M3 亚群证候以风证、火证为主,“火”性炎上、“风”为阳邪,易袭阳位,而这一亚群中的患者恰恰较多地合并甲状腺、眼科和耳鼻喉等病位偏上的疾病。以症状表型为基础划分患者亚群,得到证候与疾病表型相一致的结论,这在一定程度上证实了这种真实世界与复杂网络相结合的研究方法具有合理性。未来我们可以尝试将网络生物学方法应用到真实世界研究,从微观层面探索中风病证候的内在规律,为中风证候的客观化寻找证据支持。
3.6 中风证候研究的多学科介入
学科的交叉与融合是现代科学技术发展的重要形式,而中医证候又是一个多因素组成的复杂系统,因此,多学科的介入和合作将是中医证候研究发展的必然趋势[48]。除网络生物学外,未来我们还将把生物信息学、数理学、数据挖掘技术、计算机科学等学科的理论方法和研究模式也引入到中风证候研究中,利用这些先进的信息技术手段,推动大样本、多中心的研究,打破传统的证候研究方式,创新思维模式,从新的视角揭示证候的微观实质,为中风证候研究提供可靠的临床依据,实现中风病辨证分型的客观化,从而推动中医现代化进程(图1)。
图1 中风证候未来研究方向
在当今时代,传统的辨证方法仍适用于中医日常诊疗,但显然已难满足群体化研究的需要,故而将群体辨证引入中医现代化研究是大势所趋。网络生物学的产生和发展为群体辨证开辟了一条新路,使证候研究进入到大样本、数据化、系统化的时代。目前,网络生物学技术在中风的证候研究中已有应用,并且取得了不错的成果。未来随着高通量技术、组学技术、基因测序等的不断进步,生物基因信息库的不断完善,会有越来越多的新方法用于中风研究,推动研究走出传统的固有模式,逐步实现证候的客观化、科学化,加快中医药现代化进程。