犬基因组学研究进展
2013-11-13马荆鄂邱峰芳徐振强刘清神
马荆鄂 杨 静 邱峰芳 徐振强 刘清神
犬属于脊椎动物门,哺乳纲,食肉目,犬科,犬属,又名狗,是自然界中种类遗传多样性最为丰富的物种之一。目前, 世界家犬品种已超过400 种, 总共约有4亿头,其中大部分为西方培育品种。犬基因组由38 对常染色体和1 对性染色体组成。性染色体都为双臂,X 染色体较大为亚中间着丝粒型,而Y 染色体是所有犬染色体中最小的,为中间着丝粒型;38 对常染色体都属于近端着丝粒类型,染色体形状和大小非常接近,难以区分。
在基因组计划启动之初,由于家犬并未作为基因组研究的模式动物,且犬不属于重要的农业经济动物,因此与人类、小鼠、猪和牛等动物相比,犬基因组相关研究开展相对滞后。20 世纪90年代末,科学家意识到犬作为人类疾病的动物模型,以及其基因组在研究哺乳动物生长、发育及进化的遗传本质上有重要的应用前景,近二十年来,犬基因组的研究越来越受研究人员的青睐。
一、犬的起源与进化
早在达尔文时期,人们对犬的起源产生了疑问,他们认为犬可能来源于野狼、北美小狼,或者是豺狼类动物。人们对物种起源研究的思路大多是对母系遗传进行研究,由于线粒体DNA 存在于细胞质中,在世代传递时呈母系遗传且不发生重组。因此,人们常常通过线粒体DNA 来研究物种起源。
哺乳动物线粒体基因组 (mtDNA)由37个基因和一段长度可变的非编码序列(又称控制区或D-loop)组成。37个基因中包括13个蛋白质基因,2个rRNA 基因和22个tRNA 基因。其中,13个蛋白质基因分别是细胞素C 氧化酶的三个亚基Ⅰ、Ⅱ、Ⅲ (COⅠ、CO Ⅱ和CO Ⅲ),细胞色素b 基因 (Cytb)、ATP 合成酶亚基ATPase6 和ATPase8 和NADH 脱氢酶七个亚基的基因NDl,ND2,ND3,ND4,ND4L,ND5,ND6 (图1)。
图1 动物mtDNA 基因组全序列结构示意图(www.shengwuxiu.com)
最初,人们认为犬是起源于100,000年前。1997年,Vila 等首次采用线粒体测序法对犬的起源进行了研究,作者选取了27个地区(欧洲、亚洲、北美等)的162 头狼,67个品种的140 头犬,以及其他犬科动物包括5个土狼品种 、2个金色背品种、2个黑色背品种、8个豺狼品种,对其线粒体DNA 的调控区域(261bp)进行测序。研究表明狼相对于其他品种,线粒体DNA 更接近于犬等基因组,进而推断狼可能是犬的祖先。2002年Savolainen 等对犬的起源进行了研究。文中选取来自不同区域的654 头犬的mtDNA 进行序列比对分析,结果显示犬的线粒体中大于95%的序列与狼的序列相似,进一步证明了犬的母系遗传起源于狼。文中先将不同品种的基因型进行分簇,筛选出品种间特有的单倍型,并计算出它们之间的遗传距离,研究结果表明犬起源于15000年前,其起源地是东亚。Leonard 等也于2002年采用线粒体测序法对拉丁美洲和阿拉斯加古代样本进行研究,发现现代的美洲犬种源于多个古老的支系,而这些支系都是伴随10000年前的人类穿越白令海峡进入美洲的。
已上的研究表明, 家犬在不同地区的群体间存在很大的基因交流, 如果采用中等进化速度的遗传标记是无法将地区间的群体区分开来,因此选用进化速度快的mtDNA 作为研究家犬进化的遗传标记比较适合。但是由于现代家犬品种形成的时间短,大多数犬品种形成单独的生殖隔离的时间小于400年,线粒体DNA分析法不能有效地区分不同地理的家犬品种和个体之间的亲缘关系。Neff 等选取了7个牧羊犬品种和2个猎犬品种进行研究,结果表明它们虽然来源于不同地理区域,但是带有同源的mdr1-1Δ 等位基因。由此可见,需要进一步分析基因组中标记基因之间的同源关系,来揭示家犬品种和个体之间的亲缘关系。
2003年,Koskinen 等利用细胞核的微卫星定位技术对犬品种进行溯源,得出它们之间的遗传距离。2010年,VonHoldt 等对来自于北美、欧洲、东亚和中东的912 头犬(代表85个品种)以及225 头野生灰狼的基因组进行了比较,使用了分子遗传技术,分析了所有实验动物基因组DNA 中的4.8 万多个遗传标记。研究发现,从法国的狮子犬到德国的牧羊犬,所有的家犬都是起源于中东,而非之前研究所认为的东亚。这些研究表明,微卫星DNA 技术结合数量遗传学的应用是分子水平上物种亲缘关系研究的一个有效工具。
二、犬品种之间的遗传变异
家犬形态各异,体长、体型、毛色、毛质均表现出多样性(图2),这种变异的遗传机制引起了研究人员的广泛关注。
图2 根据尺寸、腿长短、毛发、颜色、头型进行分类。A :苏俄牧羊犬; B:巴吉度猎犬(矮腿猎犬); C:吉娃娃 ; D:巨型雪纳瑞; E:卷毛比熊犬; F:柯利犬;G:法国牛头犬; H:达克斯猎犬; I:德国短毛指示猎犬; J:蝴蝶犬;K:拿破伦犬。
2003年,Kirkness 等开始对犬的核染色体进行研究。这项研究表明1.93 万个犬基因中,至少有18473个与人类已识别的基因同源,而小鼠基因组中只有18311个与人类同源的基因;人、犬基因组之间相似性比人和鼠以及鼠和犬基因组之间的相似性大。另外,通过基因比对分析发现,犬有360 多种遗传疾病与人类的遗传病相同。由此,科研人员计划对犬的基因组图谱进行绘制。2005年,Lindblad-Toh 等成功拼接得到了家犬的基因组序列。在分析了60 种不同品系的犬后,选择了基因组比较保守的拳师犬(boxer)为这次测序的目标动物,从而得到了最为可靠的基因组序列。
基因组测序完成以后,犬的基因组变异成为了研究的热点。2004年,Parker 等首先对犬的品种之间的遗传差异进行了研究,选择了85个纯种犬品系的414 头犬进行了分子标记遗传相关性检测。结果表明各个品系都具有相应的一套分子标记物,其序列在特定品系的不同个体之间的相似程度要明显高于不同品系个体之间的,而不同品系之间的差异可用于解释大约30%的遗传学变异。利用遗传分簇的方法证明了85个品种都有相似的地理起源、行为和形态特征。
2007年Parker 等对132个犬品种的眼部性状的遗传变异进行了研究,发现柯利犬眼部异常是一种遗传病。在患病的犬基因组中,37 号染色体上的NHEJ1 基因中存在7.8kb 的同源性缺失。之后,2012年Mellanby等选取了来自英国的13个犬品种,通过品种间遗传距离的分析,得出了两两品种之间的近交率,各个品种之间的差异显著(P<0.01)。实验结果表明:大多数品种表现出高度的纯合性,其中拳师犬和西部高地白犬的纯合度最高,近交率最低;而罗威纳犬和金毛猎犬之间的近交率最高,品种的多样性正在随岁月的流逝而逐渐减少。
这些结果表明:所有的犬都可以被认为是一个单一的群体,其观测杂合度是8×10–4,这与在人群体中发现的观测杂合度是一致的。然而,犬品种之间的遗传变异大于27%,单核苷酸多态的平均遗传距离是0.36。由于犬品种隔离制度, 不同品种犬之间已产生较大的遗传分化,遗传差异达30%,明显高于不同人种之间的差异(5%~10%),在家畜不同品种间的遗传差异是最高的。同时,品种之间的隔离导致了品种内的遗传分化率比较低(5%~10%),这与在人群体中报道的一致。
三、犬基因定位
自从“犬基因组计划”完成以后,犬的全部基因密码得以成功破解。近年来,分子遗传标记在犬的应用越来越广泛。一些分子生物学家、 遗传育种工作者致力于对家犬外貌特点和生理特性进行研究,对其相关的质量性状和数量性状进行了分子标记检测和分析。
家犬形态不一,大小各异,是研究遗传变异的良好动物模型。2007年,Karlsson 等通过全基因组关联分析(GWAS)对服从简单孟德尔的遗传性状进行了定位。同年,Sutter 等分别选取了小型犬(<9kg)和大型犬(>30kg),通过全基因组扫描的方法将影响体型大小的主效数量性状基因座(QTL)定位到15 号染色体上,通过在QTL 附近15MB 的范围内筛查遗传变异位点,成功发现了IGF1 基因在控制小型犬的体型大小上发挥着重要的作用。2009年Cadieu 等选取了来自80个品种的1000 多头犬,通过全基因组关联分析,找到与犬表皮性状状相关的基因。2010年Danika 等采用交叉品种图谱法定位得出THBS2 基因和SMOC-2 基因是影响犬短头变异的主效基因。
在过去1.4 万年中,经过不断地驯化,产生了400多种犬。每一种都具有独特的体格、皮毛颜色以及习性。为了发现造成犬的特定性状的基因突变,2009年Akey等分析了10个品种共275 头家犬的基因组。此前的研究发现带来产生地特定特性的基因,诸如达克斯犬的短腿。他们分析了一系列品种的犬,从而确定数个世纪的选择性育种对于整个犬基因组的影响。这组作者扫描了将近300 头犬的遗传记录,包括小猎犬、博德牧羊犬、杰克罗素犬、沙皮犬以及标准贵妇犬,并确定了选择性育种如何影响了这些动物的基因组。作者发现了155个不同的遗传位置可能在产生纯种犬的特性方面起到了作用,并提出这些信息可能为找到产生特定品种形状的基因提供线索。例如,这组科学家提出不同版本的HAS2 基因可能为沙皮犬带来了它的独特的褶皱或光滑的外皮。相对于犬外貌特性的研究,生理特性的研究比较少。2012年Chen 等对犬和狼的嗅觉受体基因家族进行分类及测序分析,发现由于驯养导致的生殖隔离,犬和狼中嗅觉受体基因进化的方向不一致,中国乡村犬中嗅觉受体基因序列比较保守。
总之,随着犬基因组的顺利完成,遗传标记在犬的应用会越来越广泛。在分子生物学高度发展的今天,用以寻找与犬类生理生化、遗传疾病相关的特异性标记的分子技术也将不断发展、不断改善。这些研究结果也将成为世界各地研究人员用以了解犬的起源进化以及各种性状(包括全部的生理特性、遗传疾病以及诸如毛色这样的表型特征等)相关基因的重要工具。