代谢组学技术在糖尿病和糖尿病肾病研究中的应用
2014-03-21葛永纯综述刘志红审校
葛永纯 综述 刘志红 审校
随着“后基因组”时代的到来,系统生物学研究已成为发现用于疾病诊断、判断预后、指导药物研发和疗效分析的重要方法[1]。近年来,高通量检测技术的进步,使得与临床医学相关的“组学”研究领域迅速发展。如果能够谨慎运用“组学”手段,全面认识并克服其固有缺陷,将有可能从根本上改变我们对疾病的诊断和治疗。
1999年,Nicholson等[2]提出代谢组学的概念,是“组学”领域最新的进展之一,它是一种通过高通量检测技术,定性或定量分析组织或生物体液中全部代谢产物的方法。与基因组学、转录组学和蛋白质组学相比,代谢组学具有一定优势,作为基因和蛋白表达的下游代谢产物变化更易被检测,且代谢产物的种类和数量远小于基因和蛋白,所需要分析的数据量相对较少。此外,代谢产物的变化可真实地反映生物机体内已经发生的化学反应过程。
代谢组学检测能够在生物体液(如血液、尿液等)中轻易进行,因此在发现疾病相关生物标志物方面具有巨大潜能[3,4]。近年来,我国人群2型糖尿病及糖尿病肾病(DN)的患病率持续增长,已经成为严重威胁人口健康的流行性疾病[5,6]。而2型糖尿病的本质在于胰岛素抵抗及随之发生的各种营养物质代谢紊乱,代谢组学无疑可以成为糖尿病及其并发症研究的强有力的工具之一[7]。因此,本文将就代谢组学技术及其在糖尿病和DN研究中的应用进行综述。
代谢组学定义
所谓代谢组学,从广义上讲就是用定性和定量的高通量检测方法,非靶向性、全面、动态分析生物系统中所有的代谢产物(包括内源性和外源性),反映复杂生物个体在生理和病理生理状态下,机体发生的代谢反应变化情况[8]。代谢组学这一名词在后基因组时代逐渐出现。转录组学和基因组学描绘生物体新陈代谢的“蓝图”,蛋白质组学反映新陈代谢发生的具体方式,而代谢组学则实时反映生物体正在发生的新陈代谢反应(表1)。
表1 各种“组学”的特点概括[9]
生物体的新陈代谢包括一系列维持生命的复杂化学反应,涉及食物和营养物质(包括糖、氨基酸、有机酸、核苷酸和脂类)转换为能量、信号及分解清除有毒物质等。这些化学反应通过高度保守的跨物种和细胞类型的酶来实现,代谢产物的动态变化可以反映潜在的疾病状态。因此,狭义“代谢组”反映生物细胞、组织、器官或生物体内全部的小分子(<1 kD)代谢产物,是特定环境条件下细胞内酶促反应的终末产物。这一过程受到宿主基因的严格调控(初级代谢组),也可能受与宿主共生的微生物群的影响(次级代谢组)。
在过去十年中,代谢组学作为系统生物学的重要组成部分,其在医学领域研究中的应用越来越广泛,已经成为研究疾病状态下机体代谢产物改变的有效方法。代谢组学研究的快速发展很大程度上依赖分析化学技术的进步,使之能及时精确地描绘代谢产物矩阵;也依赖于数据分析技术的长足进步,运用计算和生物信息学工具整合代谢组学研究所产生的海量数据。
人类代谢组工程(HMP)的建立,是为了鉴别、定量分析和存储已经从人体组织或体液中发现的浓度>1 μmol/L的代谢产物,迄今为止,人类代谢组学数据库已鉴定出>8 500个代谢产物[10,11]。因为代谢组学研究并未受限于已知的病理生理通路或单一生物标志物检测,所以,它已经成为发现疾病生物标志物最有价值的方法之一[12]。
代谢组学研究方法
在生物医学研究领域,应用最广泛的代谢组学分析工具是核磁共振(NMR)色谱技术和质谱分析(MS)技术。后者通常需要采用液相色谱(LC)或气相色谱(GC)方法对生物标本内待分析化合物先行分离,即液相色谱-质谱(LC-MS)和气相色谱-质谱(GC-MS)。
NMR色谱技术依靠原子核的磁性自旋(顺磁)确定分子化学结构。最常用于分析的顺磁元素为H1、C13和P31。NMR的优点在于样品前期处理不需要分离技术,不破坏化合物的结构,能够提供代谢产物的确切分子结构信息。尽管如此,NMR受检测化学移位的磁场强度限制,灵敏度、分辨率不高,常常导致高丰度的化合物掩盖低丰度化合物。尽管延长数据采集时间能够增强敏感性,实际应用中为了快速分析,NMR所检测的浓度为100 nmol/L~1 μmol/L,甚至更高[13]。
与此不同,MS技术使用质荷比(m/z)区分不同的代谢产物[14]。与化合物分离方法联合使用,该技术能够高敏感性地分析庞大的代谢产物矩阵。具有代表性的化合物分离方法主要包括GC和LC,前者适用于挥发性、非极性代谢产物的分离,后者适用于溶液中非挥发性代谢产物的分离。除此以外,质谱色谱联用技术还包括毛细管电泳-质谱(CE-MS)、高效液相色谱-质谱(HPLC-MS)、超高液相色谱-质谱(UPLC-MS)等。MS技术适用于定量分析不同的代谢产物,主要基于这些化合物的疏水性和分子量,并且可根据质谱分析的类型选择不同的离子化方法。MS技术与NMR色谱技术相比,具有更强的敏感性,能够定量分析大量代谢产物。因此,LC-MS和GC-MS能够用于分析含量非常低(pmol/L范围)的代谢产物。
代谢组学研究数据分析
对于代谢组学研究所产生的庞大数据,如何处理分析尤为重要。本文以发现疾病诊断生物标志物为例,简述数据分析过程及方法[9]。(1)数据预处理:在数据分析之前,适当的数据预处理将有助于调整测量强度和组间比较。标准化可消除实验因素对数据的影响,是数据处理的第一步。(2)单变量分析:鉴别组间差异表达的每个化合物,适用于多重假说的验证,常用分析方法包括ANOVA、ttest,Logistic回归等。(3)多变量数据分析:多采用模式识别分析,分析数据的模式或聚类现象,常用的分析方法包括主成分分析(PCA)、聚类分析、线性判别式分析(LDA)、偏最小二乘法判别式分析(PLS-DA)等,其中PCA是一种非监督方法,反应数据的原始情况,可有效发现并剔除异常样本,当组间差异较小而组内差异较大时则难以得出正确结论。而PLS-DA为可监督方法,人为加入分组变量,可弥补PCA分析法的不足,强化组间差异。(4)数据验证:从统计学的角度鉴别代谢产物作为潜在生物标志物的可重复性,并在一个完全独立的样本中进行验证,常用方法为交叉-验证(Cross-Validation)。
代谢组学分析方法
经典的代谢组学试验流程包括准备样本、利用HPLC-MS、NMR或GC-MS分析生物体液或组织中的代谢产物、数据处理和鉴别组间有差异性的主要代谢产物。
代谢组学分析方法主要包括非靶向分析和靶向分析[15]。非靶向性分析指对所有代谢产物的原始数据进行整体分析,了解疾病相关代谢产物的分布模式,但不能分析具体化合物。该分析方法有助于发现疾病尚未被认识的新机制或提出新观点,开启诊断新思路。尽管如此,其在可重复性方面具有潜在缺点,因为代谢产物谱可能受到特定条件的影响,对分析结果带来干扰(依赖于标本的处理条件、待分析化合物的稳定性和可重复性等)。获取的数据有可能仅为“噪音”,而非真正的“信号”,不利于理解疾病的确切机制。此外,模式识别适用于疾病状态或疾病过程的认识,但可能忽视疾病的确切病因。
与此不同,靶向分析是一种目的性更强的分析方法,对预先设定的代谢产物数据进行分析,常被用于验证已经被发现的潜在生物标志物。如果已经发现某一代谢产物,并能够测定,此方法有助于了解疾病的确切发病机制,并且更具可重复性[16]。
除定量分析,代谢组学研究中产生的大量检测数据面临的主要挑战是建立可靠数据库的能力,这个数据库应该能够与疾病的表型相关联,并对组间数据分析采用合适的方法,以鉴别潜在的生物标志物。由于这些化合物中大部分并不是某一疾病过程所特有,这需要生物信息学专业的支持,并需要具有分析鉴别能力以发现已知(或未知)的代谢通路,并进一步阐明其与疾病的关联。
代谢组学技术在糖尿病研究领域中的应用
随着代谢组学技术应用的发展成熟,该技术已经能够运用到各种疾病的研究中,包括糖尿病、肥胖和代谢综合征等。
2型糖尿病以肝糖原输出异常、胰岛素抵抗和胰岛素产生受损为特点。目前,2型糖尿病是一种复杂因素所致的疾病[17],与肥胖、心血管疾病等其他多因素疾病密切相关。因此,寻找与代谢紊乱和糖尿病相关的敏感而特异的早期诊断标志物,对于确诊糖尿病的类型、选择治疗方案和疗效评价至关重要。患者血清和尿液代谢产物谱的早期改变能够作为生物标志物的潜在来源。利用传统检测方法,为了认识与糖代谢异常有关的病理生理学反应,需要利用靶向性检测方法检测单个代谢产物或几类小分子化合物,多种代谢产物和多条通路间的相互作用容易被忽视。因此,以整合的视角评估复杂疾病,对了解病因和改进疾病诊断非常重要。高通量代谢组学技术能够同时检测大量小分子代谢产物,将有助于发现和验证疾病相关的生物标志物。
代谢组学研究目的是检测、分析、鉴别尽可能多的代谢产物,以确定疾病相关的候选生物标志物。更为重要的是,这些被鉴定的代谢产物应该能够在疾病进展早期被检测到。上述三种技术(NMR、GC-MS、LC-MS)已经被用于该研究领域,已有研究通过观察2型糖尿病患者和动物模型,发现并验证疾病早期诊断和评价药物治疗作用的候选生物标志物[18,19]。
Salek等[20]利用NMR和多变量数据分析非靶向性的检测糖尿病模型小鼠、模型大鼠和患者的尿液代谢产物谱变化,发现三个物种尿液中代谢产物谱相似。除了能量代谢的改变外,核苷酸代谢变化明显,烟酸甲酯含量降低,N-甲基烟酰胺(NMN)和N-甲基-2羟基吡啶-5-咪唑羧酰胺(2PY)含量增加。NMN和2PY有可能成为判断2型糖尿病进展的新型生物标志物。Maher等[21]采用NMR谱技术研究发现糖尿病患者血糖和血清丙酮酸较对照组升高,肌酐和醋酸盐下降。Zhang等[22]通过NMR在1型糖尿病动物模型尿液中鉴定了17种代谢产物,其中葡萄糖、丙氨酸、乳酸、醋酸盐和延胡索酸明显升高,提示糖代谢和三羧酸循环紊乱。也有研究利用NMR谱的改变预测高脂饮食小鼠的饮食诱导胰岛素抵抗[23]。与对照组相比,高脂饮食组小鼠血清中赖氨酸、甘氨酸、柠檬酸、亮氨酸辛二酸和醋酸的表达存在差异,但该研究尚未确定胰岛素抵抗的严重程度与代谢产物谱变化的关系。
近年来,GC-MS和LC-MS在糖尿病研究领域的应用越来越广泛。有研究利用GC-MS代谢组学方法分析糖尿病患者血浆中代谢产物谱与健康对照组的差异发现,葡萄糖、2-羟基异丁酸、亚油酸、棕榈酸和磷酸盐五种代谢产物表达存在统计学差异,提示可能作为潜在的生物标志物[24]。
Wang等[18]利用LC-MS代谢组方法评价进展至糖尿病的风险,寻找预测疾病的生物标志物。该研究观察了2 422例血糖正常的受试者,随访12年,其中201例进展至糖尿病。对基线标本进行代谢组学分析,检测氨基酸、胺类和其他极性代谢产物。异亮氨酸、亮氨酸、缬氨酸、酪氨酸和苯丙氨酸五种支链氨基酸和芳香族氨基酸与糖尿病的发生具有非常显著的相关性。三种氨基酸(异亮氨酸、酪氨酸和苯丙氨酸)的组合能够预测未来发生糖尿病的风险(四分位高值人群的发病风险是低值人群的5倍以上)。实验结果经过独立的、前瞻性队列研究进行验证。这些研究强调了氨基酸代谢在糖尿病发病早期的重要作用,并且提示氨基酸代谢谱能够评价糖尿病的发生风险。
Yi等[25]采用GC-MS靶向性分析患者血浆饱和脂肪酸(EFAs)和不饱和脂肪酸(NEFAs),HPLC-MS分析患者血清磷脂,GC-MS分析患者尿液中的有机酸,2型糖尿病和健康对照组相比,血清中NEFAs和EFAs的性质几乎一致,但浓度不同。患者体内总NEFA升高,并且16∶0、18∶1n-9和18∶2n-6可能作为区分2型糖尿病和健康人群的候选标志物。血浆中某些磷脂能够作为区分糖尿病患者与健康对照的潜在生物标志物。这些磷脂包括两种磷脂酰乙醇胺(16∶0/22∶6 和18∶0/20∶4)和两种溶血磷脂酰胆碱(16∶0和18∶0)[26]。尿液中马来酸、氧基乙酸、4-氨基苯甲酸和2,5-二氧苯乙酸被确定为2型糖尿病的潜在生物标志物[27]。
代谢组学技术在DN研究领域中的应用
关于DN的发病机制目前知之甚少,除高血糖外,诸多遗传因素和环境因素参与DN的发生与发展。部分DN患者短期内进展至终末期肾病(ESRD),而部分患者病程较为隐匿,因此,DN被认为是一种异质性疾病。目前尚缺乏能够预测DN疾病进展的生物标志物。正因DN发病机制的复杂性,使代谢组学研究成为发现疾病进展新机制,并筛选和鉴定潜在生物标志物的理想手段。Zhang等[28]利用LC-TOF-MS技术观察了经过罗格列酮治疗10周的STZ糖尿病模型大鼠和DBA/2J大鼠的尿液。与对照组相比,糖尿病模型大鼠尿液中共有56个化合物出现大于2倍上调或下调,其中32个化合物被有效鉴定,9个化合物经罗格列酮治疗后恢复至基线水平。这些化合物可能是DN诊断、判断疗效和DN表型恢复的潜在生物标志物。利用METLIN数据库和HMDB数据库对上述化合物进行鉴别,发现其中包括辅酶Q和吲哚酚硫酸酯。这些分子可能参与引起DN的代谢通路,也可能在罗格列酮的保护效应中发挥作用。
近期Akiyoshi等[29]利用毛细管电泳-飞行时间-质谱(CE-TOF-MS)检测方法,在78例糖尿病患者中寻找DN诊断的高敏感性和特异性的血清标志物。经PLS-DA分析,从289个化合物中,在微量白蛋白尿的DN患者和糖尿病无白蛋白尿的患者中,鉴别出19个差异表达的代谢产物,其中包括肌酐、天门冬氨酸、γ-丁酰甜菜碱、瓜氨酸、对称二甲基精氨酸、犬尿氨酸、壬二酸、半乳糖二酸。上述化合物与尿白蛋白/肌酐具有明显相关性(P<0.009)。选取其中5个化合物(包括γ-丁酰甜菜碱、对称二甲基精氨酸、壬二酸和两种未知化合物)进行多元回归分析,整体数据中对于诊断DN的AUC值为0.927,在交叉验证分析中为0.880。
由于血清脂肪酸直接影响糖尿病的发生与发展,也有学者利用代谢组学技术靶向分析DN患者血浆脂肪酸的代谢特点。Han等[30]利用GC-MS方法,定量检测血浆饱和脂肪酸和不饱和脂肪酸的浓度。结果显示,血浆EFA和NEFA的浓度随着不同DN分期而波动,这一发现提示在DN病程进展过程中,机体动态调整脂肪酸的代谢平衡,最终失衡,进展至ESRD。
近年来,在糖尿病代谢组学研究方面,我们利用GC-TOF-MS平台,观察了不同周龄db/db小鼠与db/m小鼠的血清和尿液代谢产物的变化特点发现,与db/m组相比,db/db小鼠在6~8周的时间内,机体功能出现明显紊乱,糖酵解受阻导致TCA中间产物含量降低;支链氨基酸水平在10周明显提高,db/db小鼠赖氨酸水平在6周时显著升高,8周后出现显著下降,并持续维持在低水平,赖氨酸有可能作为DN早期诊断的潜在标志物[31]。与此同时,王旭方等[32]利用GC-TOF-MS和LC-TOF-MS方法,观察了DN患者血清和尿液代谢组学特点及临床意义发现,不同组别DN患者血清和尿液代谢产物水平呈现完全不同的分布,由此发现了早期诊断的候选生物标志物,包括血清棕榈酸、尿磷脂酰胆碱和十八烷二酸;DN进展的生物标志物有血清左旋肉碱、鞘磷脂、磷脂酰胆碱、二酰基甘油、尿嘧啶二磷酸和溶血磷脂酰胆碱,上述生物标志物还需要进一步通过独立样本验证。
前景展望
随着系统生物学的快速发展,整合系统生物学将成为该领域的发展趋势[33,34]。将代谢组学与转录组学、基因组学及蛋白质组学进行整合,将更利于揭示糖尿病及DN的发病机制,并从中获得更加准确的早期诊断、风险评估和判断预后的生物标志物。
1刘志红,黎磊石.系统生物学-推动肾脏病临床研究的新动力.肾脏病与透析肾移植杂志,2005,14(1): 1-3.
2Nicholson JK,Lindon JC,Holmes E.'Metabonomics’:understanding the metabolic responses of living systems to pathophysiological stimuli via multivariate statistical analysis of biological NMR spectroscopic data.Xenobiotica,1999,29(11):1181-1189.
3German JB,Hammock BD,Watkins SM.Metabolomics: building on a century of biochemistry to guide human health.Metabolomics,2005,1(1):3-9.
4Huang CF,Cheng ML,Fan CM,et al.Nicotinuric acid:a potential marker of metabolic syndrome through a metabolomics-based approach.Diabetes Care,2013,36(6):1729-1731.
5Yang W,Lu J,Weng J,et al.China National Diabetes and Metabolic Disorders Study Group.Prevalence of Diabetes among Men and Women in China.N Engl J Med,2010,362(12):1090-1101.
6金波,刘志红,葛永纯,等.肾活检患者中糖尿病肾病流行病学特点的变迁.肾脏病与透析肾移植杂志,2009,18(2):133-139.
7Milburn MV,Lawton KA.Application of metabolomics to diagnosis of insulin resistance.Annu Rev Med,2013,64:291-305.
8Nicholson JK,Lindon JC.Systems biology:Metabonomics.Nature,2008,455(7216):1054-1056.
9Weiss RH,Kim K.Metabolomics in the study of kidney diseases.Nat Rev Nephrol,2011,8(1):22-33.
10 Wishart DS,Tzur D,Knox C,et al.HMDB:the Human Metabolome Database.Nucleic Acids Res,2007,35 (Database issue):D521-D526.
11 Forsythe IJ,Wishart DS.Exploring human metabolites using the human metabolome database.Curr Protoc Bioinformatics,2009,Chapter 14:Unit14.8
12 Griffin JL,Atherton H,Shockcor J,et al.Metabolomics as a tool for cardiac research.Nat Rev Cardiol,2011,8(11):630-643.
13 Raamsdonk LM,Teusink B,Broadhurst D, et al. A functional genomics strategy that uses metabolome data to reveal the phenotype of silent mutations.Nat Biotechnol,2001,19(1):45-50.
14 Dettmer K,Aronov PA,Hammock BD.Mass spectrometry-based metabolomics.Mass Spectrom Rev,2007,26(1):51-78.
15 Senn T,Hazen SL,Tang WH.Translating metabolomics to cardiovascular biomarkers.Prog Cardiovasc Dis,2012,55(1):70-76.
16 Lewis GD,Asnani A,Gerszten RE:Application of metabolomics to cardiovascular biomarker and pathway discovery.J Am Coll Cardiol,2008,52(2):117-123.
17 Leahy JL.Pathogenesis of type 2 diabetes mellitus.Arch Med Res,2005,36(3):197-209.
18 Wang TJ,Larson MG,Vasan RS,et al.Metabolite profiles and the risk of developing diabetes.Nat Med,2011,17(4):448-453.
19 Floegel A,Stefan N,Yu Z,et al.Identification of serum metabolites associated with risk of type 2 diabetes using a targeted metabolomic approach.Diabetes,2013,62(2):639-648.
20 Salek RM,Maguire ML,Bentley E,et al.A metabolomic comparison of urinary changes in type 2 diabetes in mouse,rat,and human.Physiol Genomics,2007,29(2):99-108.
21 Maher AD,Crockford D,Toft H,et al.Optimization of human plasma 1H NMR spectroscopic data processing for high-throughput metabolic phenotyping studies and detection of insulin resistance related to type 2 diabetes.Anal Chem,2008,80(19):7354-7362.
22 Zhang H,Saha J,Byun J,et al.Rosiglitazone reduces renal and plasma markers of oxidative injury and reverses urinary metabolite abnormalities in the amelioration of diabetic nephropathy. Am J Physiol Renal Physiol, 2008,295(4):F1071-F1081.
23 Shearer J,Duggan G,Weljie A,et al.Metabolomic profiling of dietary-induced insulin resistance in the high fat-fed C57BL/6J mouse.Diabetes Obes Metab,2008,10(10):950-958.
24 Li X,Xu Z,Lu X,et al.Comprehensive two-dimensional gas chromatography/time-of-flight mass spectrometry for metabonomics:biomarker discovery for diabetes mellitus.Anal Chim Acta,2009,633(2):257-262.
25 Yi L, He J, Liang Y, et al. Simultaneously quantitative measurement of comprehensive profiles of esterified and nonesterified fatty acid in plasma of type 2 diabetic patients.Chem Phys Lipids,2007,150(2):204-216.
26 Kind T,Fiehn O.Metabolomic database annotations via query of elemental compositions:mass accuracy is insufficient even at less than 1 ppm.BMC Bioinformatics,2006,7:234.
27 Yuan K,Kong H,Guan Y,et al.A GC-based metabonomics investigation of type 2 diabetes by organic acids metabolic profile.J Chromatogr B Analyt Technol Biomed Life Sci,2007,850(1-2):236-240.
28 Zhang H, Saha J, Byun J, et al. Rosiglitazone reduces renal and plasma markers of oxidative injury and reverses urinary metabolite abnormalities in the amelioration of diabetic nephropathy. Am J Physiol Renal Physiol,2008,295(4):F1071-1081.
29 Hirayama A,Nakashima E,Sugimoto M,et al.Metabolic profiling reveals new serum biomarkers for differentiating diabetic nephropathy.Anal Bioanal Chem,2012,404(10):3101-3109.
30 Han LD,Xia JF,Liang QL,et al.Plasma esterified and non-esterified fatty acids metabolic profiling using gas chromatography-mass spectrometry and its application in the study of diabetic mellitus and diabetic nephropathy.Anal Chim Acta,2011,689(1):85-91.
31 Li M,Wang X,Aa J,et al.GC/TOFMS analysis of metabolites in serum and urine reveals metabolic perturbation of TCA cycle in db/db mice involved in diabetic nephropathy.Am J Physiol Renal Physiol,2013,304(11):F1317-1324.
32 王旭方,李梦婕,葛永纯,等.糖尿病肾病患者血清及尿液代谢组学特点及临床意义.肾脏病与透析肾移植杂志,2012,21(3):201-209.
33 Adamski J,Suhre K.Metabolomics platforms for genome wide association studies--linking the genome to the metabolome.Curr Opin Biotechnol,2013,24(1):39-47.
34 Lv H.Mass spectrometry-based metabolomics towards understanding of gene functions with a diversity of biological contexts.Mass Spectrom Rev,2013,32(2):118-128.