马的基因组计划回顾
2018-01-19顾京晶
顾京晶
(1,湖南农业大学动物科技学院 410128;2,禽畜遗传改良湖南省重点实验室 410128)
马的基因组计划起源于20世纪90年代。1995年位于莱克星顿的肯塔基大学兽医研究所为了从基因水平上研究马的毛色基因及马遗传疾病发起此项研究。包括美国,法国,澳大利亚及英国等25个实验室,超过100名的科研人员国家参与了马基因图谱计划。随着这项计划的进行,美国国家人类基因组计划研究中心终于2006年在马的基因图谱计划后正式展开了马的参考基因组计划。
1 基因组测序价格高昂
科学家们通过借鉴人类基因组中的一些手段来进行预测和绘制草图。Bailey,Penedo,Caetano,Shiue,Swinburne,Raudsepp,Bowling,Lear,Milenkovic等学者在马的基因组草图的构建上做出巨大贡献。这些草图可以帮助后续研究者们将基因定位到染色体,定位基因之间的距离及鉴别基因的顺序。然后通过这些信息的整理和组装可以定位出马的染色体标记,通过这些标记可以和人类参考基因组进行比较。
2 马的基因组测序计划在麻省理工大学和哈佛大学联合生物研究中心进行
一匹位于纽约州名字叫做的Twilight的纯血母马是此项研究的目标。科学家们通过其血液的白细胞中提取DNA进行测序工作。2006年其测序数据被正式公开,到2009年其完整的注释信息和其中研究过程发表在Science杂志上[1]。其完全组装序列,基因注释信息及和其他物种的比较发布在了ENSEMBL,EBI和NCBI等数据库中。
3 马的参考基因组大概包含2.43亿DNA碱基对
马的基因表达信息很少,所以基因注释信息大多来自于其他物种,尤其是人类[2]。通过评估,马的蛋白编码基因有20449个。研究马基因组的一个重要目的是鉴定覆盖马所有染色体的遗传标记。在早期血液检测中发现了大约50个马的基因变异,而全基因组测序的好处是可以覆盖到更多信息,以提供标准化的参考供人们研究马的遗传信息。为此学者们另选取了其他七匹马进行部分测序,这7匹马分别是Akhal-Teke(汗血马),Andalusian(安达露西亚),Arabian(阿拉伯马),Icelandic horse(冰岛马),Quarter horse(夸特马),Standardbred(标准马)及Thoroughbred(纯血马),综合这些信息建立出SNP集。
4 马的参考基因组完成后被广泛的进行运用
比如毛色基因研究中的奶油稀释,香槟稀释,3种基础毛色,黑,栗,黑红色的表达都是由于基因中的SNP改变了构成蛋白质的氨基酸,而这些氨基酸的改变又会改变受体功能或影响酶的功能。通过参考基因组还可以研究序列的缺失,比如Lavender Foal Syndrome涉及到了蛋白编码的缺失[1],这些缺失导致神经系统的紊乱,使马匹死亡。此外还可以研究其他马匹中基因结构的变化,比如Sabino毛色的突变,这种突变会导致马毛色在某些区域产生特定白斑。这种突变发生在内含子和外显子之间的区域,其突变扰乱了下一个外显子加入到蛋白中的信号,虽然蛋白质仍然在运行,但改变了色素沉着功能,导致某些特定区域的白斑。另一研究是有关于Tobiano毛色基因的突变,这种突变主要是由于染色体重排造成的,将Tobiano毛色的马匹基因序列和参考基因组进行比较,研究者们发现,在这个基因附近有50M左右的基因序列与其他马匹相反,推测这种变化导致了Tobiano白色斑点的产生[2]。当然,马参考基因组也被运用于转录组学的研究中,有超过30种的RNA在细胞中执行功能,通过和参考基因组比较,我们可以研究其对基因表达和病毒抑制的机制。马参考基因组可以广泛运用于动物遗传育种、动物遗传疾病及动物营养学的研究中。