代谢组学在动物育种中的应用现状与前景展望
2022-11-19李文通严善英吴添文
李文通 , 严善英 , 吴添文
(1.中国农业科学院北京畜牧兽医研究所,北京 100193;2.中国农业科学院深圳农业基因组研究所,广东 深圳 518120)
代谢组学(metabonomics)是以分子量1 000以下的小分子代谢物为研究对象,采用高效液相色 谱(high performance liquid chromatography,HPLC)、质谱(mass spectrum, MS)、色谱质谱联用、核磁共振(nuclear magnetic resonance, NMR)等技术,与统计学方法相结合,通过分析图谱数据识别并定量生物体内源性和外源性代谢物的成分以及其代谢途径的变化过程,从而反映复杂生命体整体功能及状态的新技术[1-2],在疾病研究[3]、药物开发[4]、毒性评价[5]、环境科学[6]等领域已经得到较为广泛的应用。代谢组学研究可以在生物体的生命活动过程中快速、有效地捕捉到细微差异[7],填充了基因与表型之间的空缺,是后基因组学的重要组成之一。代谢组学在农用动物中的研究起步较晚,但其具有无创伤性、快速、灵敏、成本低等明显优势,已成为农用动物育种研究的重要工具。本文从遗传参数估计、品种(系)鉴定、重要经济性状鉴定、多组学关联分析、动物疾病模型中的应用5个方面介绍了代谢组学的研究进展及其应用前景,分析代谢组学研究中存在的问题,为后续的代谢组学在农用动物育种中的应用提供一些思路。
1 代谢组学的发展概况
早在 20 世纪 70年代初,Devaux 等[8]首次提出代谢轮廓分析,运用气相色谱技术(gas chromatography,GC)对患者的体液代谢物进行了定性、定量分析,进而完成疾病的临床诊断,这种通过代谢谱来分析、诊断疾病的方法至今仍在沿用。1983年,荷兰科学家 Van der Greef 等[9]首先使用核磁共振技术、色谱-质谱联用技术相结合的方法分析了大鼠尿液中的代谢指纹。同年,Nicholson 等[10]检测并发表了首个关于全血和血浆的核磁共振氢谱(1H nuclear magnetic resonance,1H-NMR)。直到 1997年,Oliver[11]正式提出了metabolome 的概念。1999年,Nicholson等[2]对代谢组学进行了定义,即在内因(病理、生理或基因修饰等)和外因的刺激下,定量测定生物体产生的代谢物质,这是个动态的过程,并将代谢组学称为 metabonomics。2003年,Fiehn 等[12]提出metabolomics 的概念,他们认为代谢组学是个静态的过程,也可以称之为代谢物组学,是对1个或几个特定时间和条件下的细胞、生物流体、组织或生物体等特定的生物样本中所有小分子代谢物进行定性、定量分析,同时把鉴定的代谢产物与基因功能相关联。此外,根据不同的研究目的,Fiehn 将代谢组学分为4个层次:①代谢物的靶标分析,即对生物体中1个或几个特定组分进行定性和定量分析;②代谢轮廓(谱)分析,即对特定代谢过程中一小部分结构或性质相关的预设代谢物,利用针对性的分析技术进行定性和半定量分析;③代谢指纹,即整体性地对样本多个代谢物进行定性分析,不进行单一成分的鉴定,代谢指纹常用于对样本的快速分类,如表型的快速鉴定;④代谢组分析,即对小分子代谢物进行定性和定量分析,其代谢物可以是生物体内1个组织中的,也可以是几个特定组织的,更为重要的是,其可以在外界干预或病理条件下进行相应的研究,例如代谢物与生理变化相对应的动态变化规律的研究[13]。代谢组学迅速发展,已经在药物筛选、疾病诊断等方面取得了重大的研究进展,并在畜禽等动物育种中有了初步的应用,并形成了metabonomics 和metabolomics 2个主要领域。
2 代谢组学在动物育种中的应用现状
体液是家畜代谢组学研究的主要样本,如牛主要以血液、精液和乳汁为研究对象,猪、山羊和绵羊主要以血液、胆汁、脑脊液、尿液等为研究对象,分析鉴定得到的小分子代谢物也较多;而组织样本研究相对较少,主要以肝脏、肌肉和脂肪为主。基于前期研究结果,Goldansaz 等[14]在LMDB(lightning memory-mapped database)数据库中收集1 070个小分子代谢物,其代谢物是在不同物种和不同样本中检测到的,数据库除了收集每个小分子代谢物的物理和化学性质外,还收集其他注释信息,例如一些特定样本中代谢小分子的标准化水平[15]。
动物育种领域的代谢组学研究主要集中在牛和猪的代谢物检测上,一般通过对乳或肉品质的代谢解析等研究来筛选出不同品种(系)的生物标记物和获得代谢分子遗传参数估计值。此外,代谢分子与重要经济性状的关系及全基因组的关联分析研究(genome-wide association studies with metaotypes,mGWAS)等方面也关注较多[15]。相对牛和猪而言,代谢组学技术在其他家畜物种的研究相对较少,而且多集中于非遗传学研究上,如疾病检测相关的生物标记物开发、食品/药品添加剂使用效果的检测、营养生理学的研究等。
2.1 动物代谢分子遗传参数估计
遗传参数估计在动物育种中具有十分重要的意义,例如育种方案的制定以及选种效果的评估都离不开遗传参数,外界环境和生活习惯都会影响生物体的代谢水平。因此,代谢组学图谱局限性很强,分析得到的代谢组学数据只能代表该生物样本在某一特定时间内的代谢状态[15]。当以代谢物作为中间性状来进行遗传学分析时,需要对代谢物的表达水平进行遗传参数估计。在家畜群体中,研究人员已经系统地估计了牛、猪和鸡的各类代谢小分子的遗传参数。
目前,代谢分子遗传参数估计在牛中的研究最多。Nazari 等[16]对伊朗水牛乳脂率及与270 d乳汁产量相关的遗传力进行评估,哺乳期PM1、PM2、PM3 的遗传力参数分别为 0.20~0.48、0.36~0.47 和 0.19~0.35。同时,Gebreyesus 等[17]从 21个群体中选择了650 头荷斯坦奶牛,估算了几种关键乳蛋白的遗传力,发现不同乳蛋白的遗传力分布较广,在0.05~0.78 之间不等。在针对猪的研究中,研究者们以猪肉品质性状为重点研究对象,分析了各种长链多不饱和脂肪酸的遗传力,发现其遗传力通常在0.50 以上[18-19]。此外,研究人员还在鸡上开展了相关研究,对血液生化指标相关的遗传参数进行了估计。Dong 等[20]比较了高低脂肉鸡的19 种血浆生化参数水平,其中11 种血浆生化指标(甘油三酸酯、总胆汁酸、极低密度脂蛋白、球蛋白、白蛋白/球蛋白、总蛋白、天冬氨酸转氨酶、γ-谷氨酰转肽酶、丙氨酸转氨酶、尿酸、肌酐)存在显著差异,遗传力估计值居中,在0.21~0.43 之间。Zhang 等[21]采集了 332 只正常进食和限制饮食条件下的广西黄鸡的血液,检测其生化指标和腹部脂肪的性状,发现总胆固醇、甘油三酯等血液生化指标在进食状态下具有较高的遗传力(0.26~0.60);而在禁食状态下,这些血液生化指标的遗传力(0.22~0.59)有所降低。
2.2 代谢分子在品种(系)鉴定中的应用
畜禽不同品种(系)、不同性别、不同组织或体液等生物样本中的小分子代谢物差别较大,可以筛选出一些小分子代谢物来作为标志物,用于区分畜禽的不同性别,甚至是不同的品种(系)。这为研究畜禽差异性状的表征提供了一定的理论依据。目前,已经报道各品种(系)间家养动物小分子代谢物表达水平具有显著差异。Foroutan等[22]利用 LC-MS/MS、NMR 和 ICP-MS(inductively coupled plasma massspectrometry)鉴定和定量了145 种牛的血清代谢物,筛选出甲酸盐、亮氨酸、丁酰肉碱和溶血磷脂胆碱(28: 0)等一批可用于区分不同品种(系)的代谢标志物,且成功确定了2 类可以对饲料利用率进行分类预测的重要候选生物标志物。Bovo 等[23]首次应用无标记液相色谱-质谱蛋白质组学方法对意大利杜洛克和大白猪肝脏的组织进行分析,捕获了501 种蛋白质,挖掘出25 种可用于区分意大利杜洛克猪和大白猪的蛋白质。Charoensin 等[24]采用核磁共振光谱法从泰国本土鸡(TNC,100%泰国本土)、泰国合成鸡(TSC,50%泰国本土)、泰国本土杂交鸡(TNC 杂交,25%泰国本土)与商用肉鸡(BR,0%泰国本土)的鸡胸肉中鉴定了7 种差异代谢产物,包括丙氨酸、肌醇一磷酸、肌苷、鹅肌肽/肌肽、乳酸、鹅肌肽和肌酸。TNC、TSC 和 TNC 杂交鸡胸腺中的鹅肌肽、鹅肌肽/肌肽比BR 显著更高(P<0.01)。Bovo 等[25]对母猪和去势公猪进行了相应研究,通过靶向代谢组学的方法对其血浆进行了检测,共检测出132 种小分子代谢物,其中85 种差异显著,去势公猪血浆中酰基肉碱、生物胺等与脂肪沉积相关的小分子代谢物的丰度较高。
2.3 动物重要经济性状相关的代谢分子鉴定
代谢组既是基因组、转录组与表型之间的桥梁,也是基因组、转录组下游的表达产物。因此,代谢物既是生物体的表型,也调控着生物体的一切生命活动。代谢组能够更直观、更有效地反映出生物体自身的生理状态。与表型数据相比,小分子代谢物检测标准更容易统一,更容易进行批量化的分析检测,检测数据更准确。因此,利用代谢组学方法筛选与重要经济性状相关的生物标志物成为研究的重点。
在动物群体中,主要通过差异分析来筛选生物标记物,此外通过代谢分子与重要经济性状进行关联分析也可筛选生物标记物,这种通过筛选生物标记物进行育种的方法可以提高育种过程中选择的准确性。Sun 等[26]对不同饲料饲养的泌乳奶牛体液进行了代谢物检测分析,在瘤胃液、血清、尿液、牛奶中分别发现了 55、28、31 和 8 种差异表达代谢物,这些差异代谢物主要集中在苏氨酸、丝氨酸、甘氨酸、酪氨酸代谢相关通路中,同时还可以作为生物标记物,用于提高乳蛋白质量及产奶量等。Shi等[27]通过超高效液相色谱-四极杆-静电场轨道阱高分辨质谱联用(UPLC-QOrbitrap HRMS)技术获得了地中海水牛、Murrah水牛和杂交水牛(Murrah 水牛×本地沼泽水牛)的牛奶代谢产物,鉴定出11 种差异显著的小分子代谢物,这些差异代谢物主要在聚集在脂质合成途径中。Rohart 等[28]通过核磁共振技术对长白、大白和皮特兰3个品种猪的血浆代谢物进行了检测,结果显示,乳酸、丙氨酸、β-丙氨酸、异亮氨酸、缬氨酸、柠檬酸、肌酸酐等代谢物指标与猪的瘦肉率密切相关,可以用作预测猪瘦肉率指标的标志物。Picone 等[29]检测分析了长白猪、大白猪、杜洛克的初乳代谢物,认为乳糖可以作为区分3个品种母猪的重要标志物,同时确定牛磺酸、醋酸盐、二甲胺、顺式-酸酯的水平与仔猪日增重和存活率密切相关。Welzenbach 等[30]对97 头杜洛克×皮特兰杂交猪的背最长肌样品进行代谢物和蛋白质谱分析,总共定量了126 和35 种已经注释的代谢物和蛋白质,鉴定出2 种与滴水损失强相关的代谢分子——磷酸甘油酸变位酶2 和甘氨酸。Stephane 等[31]利用氢核磁共振技术对高、低消化效率杂交鸡血清、回肠、盲肠代谢组进行分析,利用氮校正表观代谢能(apparent metabolisable energy corrected to zero nitrogen retention,AMEn)来评估鸡对饲料的消化效率,得出与AMEn 关联最强的代谢产物是血清中的脯氨酸、盲肠中的葡萄糖、回肠中的富马酸盐,这为鸡饲料消化率预测提供新的思路。
2.4 代谢组与其他组学联合分析研究应用
目前,“突变-基因-调控-表达-代谢-表型”网络在农艺植物性状研究中已经被广泛应用[32],而在农用动物复杂性状遗传机制中的研究则正在兴起。以小分子代谢物为表型数据,与基因组、转录组等进行关联分析,可以更加快速、准确地识别出与肉质、乳质、生长性能相关的生物遗传标记物或发现遗传规律,为农用动物的分子育种提供了理论和技术支持。Sasago 等[33]通过日本黑牛背最长肌 mGWAS 分 析 筛 选 出STT3B、SUV420H1、CPT1A、MRPL21和IGHMBP2等与丙氨酸代谢相关的重要候选基因。Wang 等[34]利用LC-MS 技术,通过比较108 头猪血浆(59 头杜洛克猪和49 头长白猪)筛选出45个代谢物,结合GWAS 关联分析,发现 152个全基因组重要的 SNPs(P值<1.06×10-6)与17 种代谢物相关联,其中 90 种重要的SNPs 注 释 到 52个 基 因 上 。 Viterbo 等[35]采 用Illumina Porcine 60K 芯片对480 头纯种杜洛克猪的背最长肌组织进行基因分型,同时使用混合模型和回归基因组控制法(GRAMMAR-GC)进行全基因组快速关联分析,筛选出GBF1、SCD、ABCC2、ELOVL3等一批与脂肪酸链合成长度相关的调控基因。Javanrouh-Aliabad 等[36]为了鉴定与代谢性状相关的基因座,使用伊朗Urmia 本土鸡和Arian 肉鸡杂交的F2群体进行了全基因组关联分析研究,记录了血浆甘油三酸酯、胆固醇、葡萄糖、总蛋白、白蛋白和球蛋白6个指标,鉴定出候选基因DOCK10和AP1S3。Shi等[37]为了寻找影响鸡腹水综合征的差异表达基因和标志代谢物,以腹水综合征鸡和抗腹水综合征鸡为研究对象,利用LC-MS 技术测定了血清代谢组,鉴定出15个生物标志代谢物,结合肝脏转录组学数据分析表明,甘油磷脂的代谢在抗腹水综合征肉鸡发育中起着重要作用。为了研究脂肪酸代谢在转录水平上的差异,Xi 等[38]选取青海八眉猪和甘肃黑猪为研究对象,利用GC-MS 技术检测了亚油酸、肉豆蔻酸、软脂酸和硬脂酸4 种脂肪酸的代谢水平,结合转录组学分析了与脂肪代谢相关基因的表达,然后进行共表达网络分析,发现在G1(ENSSSCG000000 24681)和G2(ENSSSCG000000-36883)基因的调控下,八眉猪亚油酸的代谢水平显著高于肉豆蔻酸、软脂酸和硬脂酸,从而影响猪肉的品质和口感。
2.5 代谢组学在动物医学模型中的应用
动物模型是动物医学研究领域不可或缺的工具,在人类疾病的研究中起着重要作用。由于在研究人类疾病时,必需经过大量的临床试验验证,又因为伦理道德的限制以及取材困难,无法在人体中直接开展,只能先依靠动物疾病模型进行试验和评估。因此,适宜的动物模型对研究人类疾病具有重大的意义。小鼠具有繁殖能力强、生长周期短、易于饲养等优点,在多种人类疾病研究中均有应用,而由于猪和人的生理状态和代谢特征都比较相似,在人类疾病模型研究中的优势日益凸显。Qiu等[39]通过超高效液相色谱-三重四极杆质谱法测量了不同处理组大鼠血清和肝组织中的胆汁酸(bile acids, BAs)和游离脂肪酸(free fatty acid,FFA)的代谢水平,通过生化分析得出黄芪汤剂和黄芪总苷可以通过改善胆汁酸转运蛋白、核激素受体和膜受体来恢复BAs 和FFA 的代谢,从而对胆汁淤积性肝损伤具有保护作用。Nielsen等[40]利用LC-MS 方法研究了6 头不同品种猪和15个人的血液代谢组,发现在饮食干预后,共检测到的26种血液代谢物,其中有21种代谢物变化趋势一致,这暗示着人和猪的营养代谢过程可能极为相似。Deng 等[41]通过代谢组学分析确定了7 种与睾丸激素缺乏引起的动脉粥样硬化相关的潜在生物标志物,它们在胆碱代谢、脂质代谢、炎症和氧化应激中起着重要作用,证明了睾丸激素缺乏症可能会加速高脂饮食诱导的小型猪的早期动脉粥样硬化的进展。Laserna 等[42]对创伤模型猪的代谢谱进行分析,NMR 分析显示了炎症的急性期激活因子低密度脂蛋白、极低密度脂蛋白、载脂蛋白和白蛋白水平降低,LC-MS 分析揭示了炎症反应相关代谢物半胱氨酸、蛋氨酸、精氨酸和几种甲基化代谢物的变化趋势。可见,在疾病研究中,代谢组学技术可以快速有效地进行评估。
3 结语
目前,代谢组学研究已广泛应用于疾病预测、药物设计、畜禽产品安全检测等领域。随着代谢组学技术的不断发展,此技术将更广泛地应用于猪、牛、羊等家养动物的选育中,比如通过指定生理状态标记的代谢小分子选育动物,或者通过某些代谢组学信息对动物潜在的遗传差异进行分析,这对阐明机体复杂的生物学机制非常有利。但是,代谢组学研究还有许多未解决的问题,比如外界环境因素的影响、技术的局限性、数据库的建立等。首先,影响生物体内代谢物变化的因素很多,如生理刺激、遗传因素、环境因素均对代谢物有很大的影响。因此,在代谢组学的研究中应充分考虑外界环境以及生物体内环境的变化是否会影响其研究结果;其次,代谢组学平台还不完善,存在仪器灵敏度低、检测覆盖范围小等局限性,只能检测出的一部分代谢分子,鉴定出的代谢物更少,仅代表少部分基因变异;另外,代谢组学分析过程中会产生大量的图谱数据,这需要结合多元统计、生物信息等各种技术提取图谱数据信息,但由于相关研究方法仍不够成熟,如何从复杂的代谢组学数据中提取出有效的信息、筛选出有价值的潜在生物标志物是研究的重点、难点。随着代谢组学技术的不断发展,多组学数据整合分析将成为未来研究的热点,代谢组学数据库的完善和发展也将有助于各种组学数据的整合分析。