APP下载

家牛全基因组遗传多样性与起源研究进展

2020-04-17李联萍陈宁博雷初朝

畜牧与兽医 2020年11期
关键词:基因组遗传测序

李联萍,陈宁博,雷初朝*

(1.青海省海西州动物疫病预防控制中心,青海 德令哈 817099;2.西北农林科技大学动物科技学院,陕西 杨凌 712100)

因不同的形态特征和生活习性,家牛分为无肩峰的普通牛(Bostaurus)和有肩峰的瘤牛(Bosindicus)两个牛种。普通牛主要分布在整个欧亚大陆、非洲北部和非洲西部;瘤牛主要分布在印度次大陆、东南亚和东亚南部,在中东和非洲南部及美洲也有分布。随着测序技术发展和测序成本的降低,全基因组遗传变异的检测主要经历了基因芯片和重测序两个阶段。目前在猪、牛、羊、马、鸡等畜禽进行了广泛系统的全基因组重测序研究,取得了许多令人瞩目的科研成果。本文将从通过基因芯片和重测序技术研究世界家牛的起源、遗传多样性以及原牛和近缘野牛对家牛的渐渗进行综述,以期为今后家牛重要经济性状相关功能基因的定位、家牛的起源和驯化研究提供参考。

1 基于基因芯片的家牛遗传多样性与起源研究进展

牛的基因芯片主要有50 K和770 K 2种,其中50 K的芯片应用最广泛。牛单倍型计划联盟(The Bovine HapMap Consortium)构建了牛的SNP数据库,定制了包含37 470个SNP的芯片,应用于19个品种共497头牛的遗传结构分析,使用InSTRUCT软件估计不同祖先群体的结果表明,不同牛品种的聚类结果与已知牛品种的驯化历史相似,普通牛和瘤牛分别在近东和印度次大陆独立驯化,非洲普通牛和欧洲普通牛可能在驯化早期或驯化前就已经分化[1]。Decker等[2]采用牛50 K SNP芯片对全世界134个品种1 543个个体的43 043个SNP位点进行分析,将全世界家牛划分为非洲普通牛、欧亚普通牛和亚洲瘤牛三大类群。普通牛和瘤牛在驯化后随着农业社会的扩张和人类的活动而迁徙。普通牛和瘤牛之间可以杂交并且没有生殖隔离,因此随着群体的扩散,不同的普通牛和瘤牛群体之间发生广泛的融合。在非洲,瘤牛血统的渗入,导致部分非洲牛为普通牛与瘤牛的杂种;在亚洲中部则发现明显的欧亚普通牛和印度瘤牛的杂交群体;在欧洲,短角牛对欧洲牛的品种形成具有一定的影响;欧洲南部的意大利和西班牙普通牛拥有非洲普通牛和瘤牛的血统,表明罗马人将近东具有混合血统的家牛带入欧洲南部;在亚洲,牛的近缘亚种对瘤牛有较大的影响,如巴厘牛对中国南方的海南牛有明显的渗入。Gautier等[3]通过50 K芯片对法国牛的分析也得出相同的结论。尽管非洲普通牛和欧亚大陆的普通牛分化程度非常高,但是泛基因组SNP研究结果显示,三个大陆的普通牛都来自于一个唯一的祖先,证实普通牛在中东独立驯化。随着农业的扩张,中东驯化的普通牛在向非洲和东亚迁移的过程中可能吸收了少量的当地原牛,使原牛的基因组进入了现代家牛的基因池中。McTavish等[4]研究发现,美洲新大陆的家牛属于1493年西班牙人带来的欧洲普通牛的后代,这些普通牛在引入美洲前,已经含有非洲普通牛的血统。随后美洲又从印度引进了更加适应南美气候的瘤牛,故美洲家牛为欧洲普通牛、非洲普通牛和瘤牛的混合起源,具有丰富的遗传多样性。Yurchenko等[5]通过比较俄罗斯18个牛品种和世界上135个品种的遗传多样性,研究了俄罗斯当地牛的祖先和历史。发现大部分俄罗斯牛品种和欧洲普通牛品种拥有共同的祖先,只有少量品种和亚洲普通牛共享祖先,其中雅库特牛属于一个高度分化的品种。Gao等[6]对中国20个地方牛品种进行50 K芯片分析,发现中国地方黄牛品种拥有普通牛和瘤牛的祖先成分,北方黄牛含有10% 以下的瘤牛血统,西南地区的黄牛含有90% 的瘤牛血统;且发现中国南方黄牛均有不同程度的爪哇牛和大额牛的渗入,西藏牛则有零星的牦牛基因组渗入。Chen等[7]利用77 K芯片对秦川牛的起源进行分析,发现秦川牛属于瘤牛和普通牛的混合起源,并伴有少量的爪哇牛血统。由于牛的基因芯片是基于欧洲普通牛参考基因组设计的,具有很大的偏向性,并不适于研究其他地域家牛的遗传多样性和起源。例如印度瘤牛和中国瘤牛。而利用全基因组数据可以获得更多的基因组信息,从而更加精确地阐述家牛的遗传多样性和起源。

2 基于重测序数据的家牛遗传多样性与起源研究进展

2003年9月,“牛基因组工程”正式启动,历时6年,牛的基因组序列终于呈现在世人面前[8]。牛基因组包含22 000个基因,通过比对基因同义突变和非同义突变的比例,发现在多个免疫基因上存在选择信号。Gibbs等[9]利用这个参考基因组设计了牛的SNP芯片,对19个牛品种进行SNP分型,发现驯化和人工选择导致普通牛的有效群体大小不断下降。自2003年牛基因组测序计划实施以来,先后公布了多个版本的参考基因组,分别为:2018年新组装和注释的ARS-UCD1.2,2014年的UMD 3.1.1和Bostaurus5.0,可以在多个公共数据库查询。UMD 3.1.1版本的基因组包含85 046个蛋白,26 410个基因和10 047个假基因[10]。为了更快地提高家牛的遗传进展,欧美发达国家牵头实施了“千牛基因组”计划,现已进行到第7轮。“千牛基因组”计划旨在提供一个基因组变异数据库,对用于全基因组关联分析和基因组选育的数据进行填充。自从2012年“千牛基因组”计划实施以来,其测序的样本数已经从第1轮的3个品种234头种公牛鉴定出28.3 M SNPs 到第6轮的2 700头(大于100个普通牛和瘤牛品种),鉴定出大于88 M 高质量的 SNPs,该计划已经收集了涵盖全世界不同区域家牛的全基因组数据。2014 年,“千牛基因组”计划组织者通过分析荷斯坦牛、弗莱维赫牛、娟珊牛和安格斯牛种公牛的重测序数据,共发现28.3 M的SNPs,其中每1 kb杂合位点为1.44。利用重测序数据找到一个隐性胚胎致死的突变,一个导致软骨发育异常的显性突变,同时也对几个复杂性状如产奶量和卷毛性状进行了全基因组关联分析,并找到其因果突变位点[11]。紧接着全世界科学家对各自国家的牛品种,如:日本见岛牛[12]、口之岛牛[13]、韩国斑纹牛[14]、韩国韩牛[15]、中国南阳牛[16]、中国延边牛[14]、非洲5个牛品种[17]、美洲瘤牛[18-19]、伊比利亚牛[20]、北欧牛[21]等肉牛品种进行了全基因组重测序分析。阿尔伯塔大学的加拿大肉牛基因组计划[22],对397头普通牛(包括肉用和乳用品种)进行了全基因组测序,这些结果将为肉牛的基因组选育提供重要数据。Lee等[15]对1头韩牛公牛进行全基因组分析,发现大量SNPs和Indels位点。Kawahara-Miki等[13]对1头日本地方牛公牛进行全基因组分析,发现6.3 M的SNPs,其中5.5 M是新的SNPs,表明该品种与欧洲家牛完全不同。Tsuda等[12]对日本和牛的原始牛种见岛牛进行重测序,发现 6.54 M的SNPs,并在313个基因中发现400个见岛牛特异的错义突变。Choi等[14]分别对10头韩牛和10头延边牛进行全基因组比较分析,发现17 M的SNPs,其中22.3% 是新的SNPs,并发现PPP1R12A是一个潜在的影响牛肌内脂肪含量的基因。Rosse等[18]对1头巴西的Guzera牛进行全基因组测序,发现纯合的2 M SNPs和463 158 个InDels,共发现1 069个新的非同义突变、剪切突变和编码区插入缺失,这些变异位于935个基因内,参与细胞信号、环境适应、感官和免疫系统相关信号通路。Kim等[17]对非洲大陆5个地方群体48头家牛的全基因组进行重测序,发现非洲瘤牛具有很高的遗传多样性,找到非洲牛受选择的基因组区域,为了解非洲牛广泛的适应性提供了全基因组水平的证据,对非洲大陆家牛可持续发展提供了遗传学依据。Liao等[19]对瘤牛品种Gir牛3头种公牛的全基因组变异进行分析,发现9.99 M的SNPs和604 308个InDels;并检测到79个受选择信号,这些信号区域包含一些重要的抗病基因家族;另外一些区域包含促分裂原激活蛋白激酶,该酶直接参与渗透压和热应激引起的反应,与瘤牛的耐热性相关。Mei等[23]对中国6个地方黄牛品种(37头秦川牛,2头南阳牛,2头鲁西牛,1头延边牛,2头雷琼牛,2头云南牛)共46个个体进行全基因组分析,表明中国黄牛属于瘤牛和普通牛的混合起源;但由于该文主要研究秦川牛的遗传多样性和受选择信号,找到一些与毛色及产肉性状相关的受选择基因。Weldenegodguad等[21]对俄罗斯最北部的三个品种进行测序,共发现17.45 M的SNPs,说明雅库特牛比欧洲普通牛拥有更多的品种特异性变异和遗传多样性,并发现一些与亚北极环境适应相关的受选择基因。Chen等[24]通过全基因组测序,首次证明全世界家牛至少可以分为5个类群,即:欧洲普通牛、欧亚普通牛、东亚普通牛、中国瘤牛和印度瘤牛。欧洲普通牛血统主要分布在欧洲西部的牛种中;欧亚普通牛血统,主要分布在欧亚大陆;地理位置相分离的西藏和亚洲东北部的品种形成了一个独特的东亚普通牛;瘤牛分为中国瘤牛和印度瘤牛两个类群。中国地方黄牛品种主要来源于3个祖先血统:东亚普通牛、欧亚普通牛和中国瘤牛。家牛的祖先原牛在史前广泛的分布在整个欧亚大陆,并且形成不同的群体。除了家牛之外,还有其他牛亚科动物也与家牛的栖息地相互重叠,并且都可以与普通牛和瘤牛杂交,因此牛亚科的其他动物对家牛的遗传多样性有独特的贡献。

3 原牛与野牛对家牛的基因渗入的研究进展

通过对线粒体基因组的研究,已经证明现代和古代普通牛中发现少量欧洲原牛的线粒体单倍型P,说明欧洲北部、中部或东部的原牛对驯化的家牛有基因渗入[25]。随着全基因组测序技术的发展,科学家希望能复原更多古代原牛的DNA,并与现代牛的参考基因组进行比对。2015年,Park等[26]对一头距今6 750年的英国欧洲原牛样本进行了重测序。通过分析这头原牛的基因组数据,并将其与73头现代牛的基因组数据相比较,发现这头欧洲原牛对现代欧洲普通牛具有明显的基因渗入。英国的Highland、Dexter、Kerry、Welsh Black和White Park牛品种都拥有该原牛的血统,而欧洲其他国家的牛种则没有受到该原牛的影响,表明古代不同地域的原牛会对当地牛品种产生影响。英国当地原牛的渗入事件证明,不同的原牛群体对古代驯化的家牛群体有基因贡献而且很好地保留在现代牛的基因组中。Upadhyay等[20]通过基因芯片技术进一步研究了英国原牛对欧洲现代普通牛的影响,证明欧洲原牛和爱尔兰当地原牛存在基因交流,同时也证明伊比利亚半岛上的家牛和原牛也有基因交流,表明欧洲原牛曾在欧洲有广泛分布。

家牛的遗传多样性主要来自于两个可杂交的牛种—普通牛和瘤牛。亚洲还驯化了其他牛亚科动物,包括在青藏高原及周边地区的牦牛、印度东北部、中国云南及缅甸的大额牛、印度尼西亚的爪哇牛,这些动物的栖息地都与瘤牛和普通牛的栖息地相互重叠,因为这三种动物都可以与普通牛和瘤牛杂交,因此亚洲地区的一些牛品种属于混合起源,对家牛的遗传资源有独特的贡献。有关家牛与近缘牛种的线粒体DNA结果已经证明亚洲家牛与牦牛和爪哇牛都曾杂交过;大量基于线粒体DNA、Y染色体、微卫星标记的研究证明爪哇牛与瘤牛之间存在基因渗入。Medugorac等[27]通过对2头蒙古牦牛的重测序数据和76头牦牛高密度芯片的基因分型,发现这76头家养牦牛在1 500年前受到黄牛的影响,基因组中大约保留了约1.3%的黄牛基因组,这些渗入区域包含大量与神经系统发育相关的基因,这对于选育脾性温和的牦牛具有重要作用。该研究还发现牦牛的无角性状来自蒙古牛。Hartat等[28]提出爪哇牛是瘤牛的部分祖先,从基因组水平证明印度尼西亚的Ongole牛是爪哇牛和瘤牛的杂交后代,并证明印尼现代牛中携带有非洲普通牛和瘤牛的基因组成分。Wangkumhang等[29]通过50K芯片分析发现,泰国牛中存在一些特异的SNPs,提出东南亚瘤牛特异的SNPs可能来自一个未知的或者已经灭绝的祖先。最新的研究结果表明,牛属不同牛种之间存在广泛的基因交流,这对于不同牛属动物适应不同生存环境具有重要作用[30]。研究发现瘤牛与大额牛、瘤牛与巴厘牛、普通牛与牦牛、普通牛与欧洲野牛之间存在广泛的基因组渗入。瘤牛到半野生的大额牛和巴厘牛的渗入基因中存在许多与神经和免疫系统相关的基因。通过与牦牛杂交,西藏牛获得部分牦牛基因,提高了西藏牛对青藏高原低氧环境的适应性[30]。Chen等[24]发现中国黄牛与近缘牛种存在广泛的基因交流,中国瘤牛基因组中保留了约2.93%的爪哇牛血统,西藏普通牛中保留了约1.2%的牦牛血统;富集分析表明爪哇牛对中国瘤牛的渗入区域主要富集在感官和免疫相关通路,牦牛对西藏牛的渗入片段主要富集在嗅觉、抗病和免疫等通路;在家牛从驯化中心扩散到其他地域的过程中,家牛不断吸收了当地原牛的血统和近缘野牛的渗入导致了不同地方品种独特的基因组遗传多样性;同时这些渗入事件使当地品种快速适应了当地的极端环境,说明基因交流是家牛适应环境的重要方式之一。

4 展望

随着二代测序成本的不断降低和三代测序技术的更新,利用全基因组重测序技术对于检测家牛全基因组中的序列变异和结构变异将更加全面和精确;除了商业品种和培育品种的重测序数据不断增加,世界各地当地家牛品种的基因组数据的不断公布将更有利于研究世界家牛的遗传多样性;同时随着动物考古学和古DNA处理和分析方法的不断进步,有助于更深入解析家牛起源和品种的形成。

猜你喜欢

基因组遗传测序
非遗传承
杰 Sir 带你认识宏基因二代测序(mNGS)
牛参考基因组中发现被忽视基因
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
基因捕获测序诊断血癌
单细胞测序技术研究进展
基因组DNA甲基化及组蛋白甲基化