代谢组学研究方法及其在骨质疏松中的应用探析
2023-08-04李春燕薛培凤陆景坤
董 馨,李春燕,薛培凤,陆景坤,王 智,王 辰,渠 弼
(内蒙古医科大学药学院,内蒙古 呼和浩特 010059)
骨质疏松是一种病因复杂的常见的进行性骨骼疾病。其特征为单位面积内骨组织量低于正常标准(T 值介于-1 g/cm3和1 g/cm3之间),易造成疼痛、骨折及驼背等,且患者结构以老年人和绝经后妇女为主。近年来,全球骨质疏松患病率的激增给社会带来严重的经济危害,骨质疏松现已成为严峻的公共卫生问题。对骨质疏松生物标志物的研究有助于做到对疾病的早发现和早预防,对降低患病率有重大意义[1,2]。
骨质疏松是一种代谢性疾病,代谢组学被广泛用于骨质疏松的研究。代谢组学是继蛋白质组学和基因组学后新发展的一门学科,与其他组学的研究思想有相近之处,可通过对生物体液或机体各组织中存在的各种代谢物的识别来探究机体内代谢物转化的规律或机体在生理、病理刺激下的动态变化,为解释骨质疏松生理或病理机制提供另一种新的视角,成为骨质疏松的预防、诊断和治疗更简捷的工具[3]。
1 代谢组学的研究方法
1.1 样品采集和制备
1.1.1 样本采集 在代谢组学研究中,样本的选取和制备对代谢物的检测结果有较大的影响,制备方案应尽可能覆盖所有的代谢产物。骨质疏松代谢组学研究所选取的样本有血液、尿液、粪便、胆汁及全身各组织[4]。血液参与全身循环,包含大量的代谢物,能整体地反映机体的生理病理状态,通常作为代谢组学样本的首选。由于全血中同时包含细胞外液和细胞内液,基质的复杂性增加,在实际检测中多对血清和血浆进行分析[5]。粪便样本通常用来分析机体与肠道菌群之间相关作用。尿液样本中常含有药物和工业产物,通常用来反映药物代谢的最终状态。尿液和粪便具有采样便捷、可大量取样等优点,但由于样本浓度差异较大、代谢物种类与含量参差不齐,增加定量难度[6]。组织样本的选择具有明确的目标性,样本含有丰富的代谢物信息,但制备方法较为复杂。总之,不同种类的研究需要选择合适的样本,以达到分析的准确性和无偏向性。
1.1.2 样品制备方法 生物样品组成复杂,基质干扰性强,为了提升待测样品的分析准确性,在检测前都需经过前处理,将待检成分最大限度与基质分离。常见的样本前处理方法包括:直接稀释进样法、溶剂沉淀法、离心超滤法及固相萃取法等。溶剂沉淀法被广泛应用于血清、粪便、组织、细胞等样本,成本低,可用于高通量筛选,但操作复杂、准确性低,操作过程中对样品的稀释易致成分缺失[7,8]。直接稀释进样法适用于尿液样本,操作便捷,可降低溶剂对仪器分析的影响,减少被分析物的丢失。离心超滤法在处理各种生物样本时,无需加入沉淀蛋白剂便可除去基质中大部分高分子有机物质,操作简单、成本低廉,可保证检测结果的灵敏度[9]。固相萃取法被誉为最具前景的样本前处理方法,在处理生物样本时能够高效去蛋白,同时对样本进行浓缩,提升灵敏度和样本回收率,降低分析误差[10]。
1.2 高通量质谱在样品分析中的应用
其分析和检测主要依赖于高通量的质谱(mass spectrograph,MS)。MS具有较高的灵敏度,数据扫描范围广、速度快,对于热不稳定、易挥发、不易衍生化和相对分子质量较大的物质同样适用。而且近年来质谱的数据库和分析软件也得到了快速发展,这些优点使得MS 在代谢组学研究中使用更为广泛[11]。但是MS只能对化合物进行鉴定,实现高通量要先将成分进行高效分离,才能得到更好的分析效果。液相色谱质谱联用系统(liquid chromatograph mass spectrometer,LC-MS)作为体内成分分析的理想工具,可以同时对样品进行分离与检测,实现样品分析高效性[12,13]。
1.3 数据处理方法
代谢组学通过对生物体内代谢物的变化情况分析,可识别出数千个甚至更多的变量数据。将庞大的数据量进行空间模型拟合、理论计算、数据转换等过程是数据处理的一大难点,通常需要选择合理的数据处理方式。
1.3.1 主成分分析 主成分分析(principal component analysis,PCA)是一种通过降维的原理,把多变量的空间转化为几个主成分空间的重要统计方法之一,通过对整个数据进行分析和概览,揭示出各组数据的趋势和离群值并获得各变量之间的相似性和差异性信息[14]。数据信息通常需要拟合成各种直观的可视化图形表达信息,PCA 通常运用主成分得分图和主成分载荷图表达各变量的相似性和差异性。
1.3.2 偏最小二乘判别分析 偏最小二乘判别分析(partial least squares-discrimination analysis,PLS-DA)是一种有效的统计方法,其原理与PCA 相似,将各个样本分组分类,相较于PCA 更容易发现组间差异,尤其是对于样本组间差异较小的分析更适合采用PLS-DA分析。
1.3.3 正交偏最小二乘判别分析 正交偏最小二乘判别分析(orthogonal partial least squares-discrimination analysis,OPLS-DA)是一种多因变量对多自变量的回归建模方法。其最大的特点是可以去除变量X 中与变量Y 无关的数据变异,使分类信息主要集中在一个主成分中,从而使得模型相较于PLS-DA 更简单,其判别效果及主成分得分图的可视化效果更加明显[15]。OPLS-DA 可对两个组别的样本的数据进行解析和判别,可以很清楚地展现两组间变量的差异性。而这种差异性是通过S图直观地展示出来,在S图中,可以清楚地显示出各变量的差异程度,距离原点越远,表现差异性越高。这提示化合物更有可能成为生物标志物。
1.4 代谢组学数据处理平台
生物机体的代谢过程复杂,涉及的代谢物众多,且代谢组学运用到MS 和NMR 等高分辨率、高准确性的分析仪器,产生的数据量大,数据的处理过程复杂。近年随着代谢组学和液相色谱质谱联用的快速发展,相应的数据处理软件及平台也得到快速发展。目前被广泛使用的实验数据分析平台有XCMS、Compound Discover 以及Simca-P 等,且每个平台都有其独有的特点[16,17]。
XCMS是一个相对简便的代谢组学数据处理平台,有非常直观的图形界面来提供对质谱数据的峰值检测、保留时间矫正、峰对齐以及统计学分析等完整的工作流程。在数据处理完成后可以获得保留时间校准前的总离子色谱图、保留时间校正云图、多维缩放和主成分分析等直观的结果分析,接受大部分质谱数据格式,且识别的真实性较好,适合非靶标代谢组学的分析。
Compound Discover 是一款商用软件,拥有着强大的数据处理分析能力。利用MS/MS 库鉴定化合物,并用高分辨率的全质谱同位素和MS/MS 数据来测定元素组成。Compound Discover 还可以通过t检验、方差分析、主成分分析、PLS-DA、火山图、盒型图等进行统计和统计学分析,可以查看趋势图以显示峰值区域,每个组的平均峰值面积。虽然其数据处理能力较为强大,但由于其商用的性质,限制了多数科研人员的使用。
Simca-P 也是一种多元化数据分析软件,Simca-P提供了PCA、PLS-DA等模型的有效算法,可以方便的提取信息,在计算的同时给出了模型的各类统计量,提供了强大的辅助分析功能,保证了数据信息的有效性。Simca-P 通过简单地操作就可对质谱以及平台运算数据进行可视化处理,将其绘制成各种所需的图形,且操作具有高度自由性,可编辑成各种类型图表。
2 代谢组学在骨质疏松疾病机制研究中的应用
骨质疏松是以单位体积内骨组织量减少为特点的代谢性骨病。随着代谢组学研究的深入,越来越多与骨质疏松疾病机制有关的代谢物被相继发现,这些代谢物参与的生物学过程包括:能量代谢、脂质代谢、氨基酸代谢及微生物群代谢等。
2.1 能量代谢
相关研究显示,骨质疏松可能与能量代谢紊乱有关。成骨细胞分泌的非羧基化骨钙素能通过干预机体内的葡萄糖代谢进而影响能量代谢,而能量代谢也能通过下丘脑、交感神经调控骨生成和骨重塑。骨重塑过程中结晶磷酸钙或原纤维胶原蛋白的降解需要大量的能量,当能量代谢受到影响时,骨重塑也将受到影响[18]。柠檬酸是三羧酸循环中的一个中间产物,参与ATP 合成。琥珀酸作为电子传递链的电子供体,是三羧酸循环中的另一个中间产物。通过代谢组学实验测得骨质疏松大鼠模型血清的柠檬酸和琥珀酸水平均明显降低,三羧酸循环受损。这说明能量代谢紊乱可干扰骨组织健康水平。
2.2 脂质代谢
肥胖是诱导多种慢性疾病的因素之一。研究发现,骨质疏松与肥胖也有着密切的关系。现代临床研究显示,肥胖通过干扰成骨作用、破骨作用及骨代谢来诱导骨质疏松。Ye等[19]研究发现,Omega-3和Omega-6 等多不饱和脂肪酸对预防骨质疏松有积极的作用,可以影响钙平衡,改变细胞膜功能,减少炎症细胞因子或调节过氧化物酶体增殖物激活的受体γ 来减慢骨骼吸收并促进成骨细胞生成。LysoPC(18∶1)是甘油磷脂代谢中甘油磷脂酰胆碱的上游成分之一。研究显示,去势骨质疏松大鼠模型中LysoPC(18∶1)水平显著升高,说明脂质代谢紊乱会对正常骨代谢造成一定影响,从而干扰骨骼健康[20]。
2.3 氨基酸代谢
多种氨基酸,如精氨酸、赖氨酸和谷氨酸等,可以促进成骨细胞的生长和分化。氨基酸会影响骨密度(bone mineral density,BMD),促进骨骼健康[21]。丙氨酸在骨骼代谢中起着关键的作用,通过促进胰岛素样生长因子以及胶原蛋白和肌蛋白的合成来影响骨骼代谢。Yu 等[22]研究BMD 低的绝经后女性尿液发现丙氨酸含量显著增加,推断丙氨酸与骨质疏松有着密切的联系。Qi等[23]发现谷氨酸受体在成骨细胞、骨细胞和破骨细胞中广泛表达,且有证据显示谷氨酸的信号可调控骨的形成和吸收。
2.4 微生物群代谢
生物机体与体内微生物群相互共生,微生物群可作用于肠道上皮细胞和固有层细胞,调控机体的生理状态。研究表明[24],马尿酸被作为骨质疏松疾病的关键生物标志物,由肠道微生物将食物中的芳香化合物代谢为苯甲酸,随后结合甘氨酸形成。代谢组学分析发现糖皮质激素诱导的骨质疏松大鼠模型体液中的马尿酸水平显著降低。这提示糖皮质激素可能干扰了肠道微生物群导致骨质疏松。
3 代谢组学技术在骨质疏松疾病诊断中的应用
骨质疏松是一种代谢性疾病。随着疾病的发生,一些小分子代谢物的种类和数量也会随之改变,这些改变可能早于临床症状的出现。利用代谢组学技术监测骨质疏松相关生物标志物的动态水平,能够实现早期诊断。Takeshi 等[25]通过对绝经后妇女进行研究发现,低骨量人群的尿素、肌酸以及多种氨基酸与正常人相比都有显著的差异。Pontes等[26]通过对中国不同骨密度的女性进行代谢组学研究,最终确定了牛磺酸、乳酸以及多种氨基酸为骨质疏松的生物标记物。代谢组学从全局出发寻找与疾病相关的生物标志物,表征疾病所特有的代谢模式,样品易获取、技术高通量,在疾病早期诊断方面有很大的应用潜力。
4 展望
近年代谢组学凭借其高灵敏度、全面的特点逐渐兴起,为骨质疏松的研究打开了新的思路,并发现了多个与骨质疏松相关的生物标志物及其代谢途经,这些发现为临床上预防、诊断和治疗骨质疏松提供了新的方法。高分辨率质谱与多检测器联用也被用于疾病诊断,高通量和高灵敏度使得疾病诊断效率得到有效地提升。
尽管代谢组学已是广大科研人员认可的研究手段,但骨质疏松病因复杂,只从代谢维度研究整体致病机理具有片面性。近年兴起的基因组、转录组和蛋白质组技术可结合代谢组学从多个层面获得病理状态或药物治疗后的生理变化。将这些变化富集和追溯到最集中的通路和靶点,通过对基因、RNA、蛋白质以及体内小分子等整体变化物质进行综合分析,反映出组织器官功能和代谢状态,更加深入地对骨质疏松进行研究,实现更精准的诊断和治疗。但多组学整合技术尚未完全成熟,匹配临床信息的多组学研究结合多样本高通量分析仍是整合过程中的瓶颈,攻克多组学数据整合这道难题,并将之运用于骨质疏松的诊断和治疗当中是相关科研工作者的共同目标。