CENPA基因在不同鸡种上的序列比较分析
2019-09-18郑圣晗陈国宏常国斌
郑圣晗,陈 颖,陈国宏,常国斌
(扬州大学动物科学与技术学院,扬州225009)
主要组织相容性复合体(Major histocompatibil-ity complex,MHC)是一组紧密连锁高度多态的染色体基因群,编码一组重要的与免疫相关的细胞膜糖蛋白,广泛存在于有颌脊椎动物中,与宿主的抗病性或免疫应答水平密切相关[1]。1961年Nordskog等[2]将鸡的B基因座定义为主要组织相容性复合体,分为2个区域,一个是含有典型MHC基因的BF/BL区域和决定红细胞抗原的BG区域,另一个是遗传不连锁的基因簇Y(Restriction fragment polymorphism-Y,Rfp-Y),Y区与核仁组织区(Nucleolus organizerregion,NOR)连接[3]。在92 kb的BF/BL核心区域共有19个基因,其中包括了CENPA(Centromere protein A,着丝粒蛋白A)基因[4]。
一直以来,疫情是限制养殖业发展的一个重要因素,现在控制疾病的主要手段就是进行疫苗免疫。但是随着病毒毒力不断增强,并不能完全保证免疫鸡群不会受到感染,因此人们开始转向抗病育种的研究。着丝粒是与细胞周期、细胞增殖检查点调控相关的重要结构,参与染色体的移动。组成着丝粒的蛋白种类较多,着丝粒蛋白A是最早被发现的着丝粒家族成员之一,现已成为肿瘤研究的热点。随着对CENPA研究的深入,发现CENPA在大多数肿瘤发生、发展过程中起着重要的作用[5-8]。CENPA的乙酰化通过影响CENPA八聚体结构的核小体来影响有丝分裂,但其详细机制尚不明确。研究还发现,CENPA与自然流产有关[9-10]。本研究利用目标区域捕获测序技术对CENPA基因进行序列测定,将25个鸡种的CENPA基因序列进行比对,统计其SNPs位点和InDel位点,探究不同鸡种CENPA等位基因与遗传抗病力的关系,为家禽的抗病育种研究提供参考。
1 材料与方法
1.1 试验材料
本研究选取的25个鸡种具体情况见表1。
表1 25个鸡品种的具体信息Table1 Specific information of 25 chicken breeds
1.2 测序流程
每个鸡种选取10个样本,翅静脉采血1mL,放入具有肝素钠的采血管中,然后加入Trizol保存在4℃冰箱中。采取苯酚抽提法提取血液中的DNA,DNA样品送至深圳华大基因股份有限公司进行目标序列捕获测序。鸡的MHC基因长约98 kb,位于16号染色体上,利用SureSelect Target Enrichment Kit Ion Proton Box 2定制试剂盒并按照Aglient(中国)公司的说明书通过基因组DNA与设计的RNA探针杂交完成目标区域捕获测序。运用Illumina HiSeq 2000测序,测序的流程为:首先对基因组DNA样本进行浓度及完整性的检测;质检合格后进行文库的构建,运用超声破碎技术将基因组打碎,回收长度约为500 bp的DNA片段,对两端进行修复以及加接头,桥式PCR完成文库的构建;库检合格后上机测序。针对目标捕获测序结果的初始数据,首先去除reads中的接头污染,然后将reads中超过50%的低质量碱基去除[quality value≤5(E)],确保分析数据的高质量。
1.3 数据分析
在NCBI网站上检索出Gallus gallus(GG)的CENPA基因序列,以Gallus_gallus-5.0(GCF_000002 315.4)作为参照,利用MEGA 6.06软件对25个鸡种的基因序列进行比对分析,统计SNPs位点及与之对应的氨基酸变化和InDel位点,选用Construct/Test Neighbor-Joining Tree(NJ)方法构建进化树,Bootstrap的值设置成1 000。
2 结果与分析
2.1 不同鸡种CENPA基因的SNPs位点和InDel位点分布
从表2中可以看出,CENPA全长共1 925 bp,位于鸡的16号染色体上,处于56 525—58 449的位置,包含了4个外显子和5个内含子。在25个不同鸡种中CENPA共有31个SNPs位点,4种缺失和6种插入。4个外显子上只有4个SNPs,没有插入缺失。5个内含子中只有3个内含子有SNP和InDel,共有27种SNPs,4种插入和6种缺失。由表3可以看出,在4个外显子上,25个鸡种累计只有8个SNPs。只有7个鸡种在外显子上有SNPs位点,其他鸡种上没有出现。Exon1和Exon4上的突变都属于同义突变,并没有引起氨基酸的改变。Exon2上的突变属于错义突变,突变为C57066T,该突变导致编码蛋白P变成了蛋白L。由此表明CENPA的外显子没有丰富的多态性,CENPA内含子的丰富多态性体主要现在Intron4上。在Exon3上所有的鸡种都没有SNPs位点和InDel位点,表明CENPA基因在Exon3具有保守性,在鸡的进化历史中稳定遗传。
表2 不同鸡种CENPA基因的外显子和内含子变化统计Table 2 The changes of exon and intron in CENPA gene of different chicken breeds
表3 不同鸡种CENPA基因上SNPs及对应氨基酸变化Table 3 The changes of SNPs and corresponding am ino acid in CENPA gene of different chicken breeds
2.2 CENPA基因的MEGA系统进化树分析
图1所示,25个鸡种大致可被分为4大类,太湖鸡(TH)、广西三黄鸡(GXH)、河南斗鸡(DJ)和白耳黄鸡(BE)聚为一类;罗斯鸡(RS)、溧阳鸡(LIY)、隐性白羽肉鸡(YXB)和藏鸡(ZJ)等聚为一类;雪山草鸡(XUS)、如皋黄鸡(RGH)、北京油鸡(BJY)和文昌鸡(WC)等聚为一类,狼山鸡(LS)、茶花鸡(CH)、安卡红鸡(AK)和仙居鸡(XJ)等聚为一类。说明中国地方鸡品种间的同源性较小,CENPA基因随着鸡的进化也逐渐多元进化,不同鸡种上CENPA基因具有丰富的遗传多样性。
图1 不同鸡种CENPA基因的NJ进化树Fig.1 The NJ tree of CENPA gene in different chicken breeds
3 讨论
遗传多样性一般是指种内不同群体之间或一个群体内不同个体之间遗传变异的总和,对家禽遗传多样性的研究有助于分析家禽的起源进化并为抗病育种提供理论依据。研究结果显示,CENPA在Exon2上有错义突变,且只发生在3个鸡种中,表明Exon2在CENPA基因中起到比较关键的作用。而Exon3在25个鸡种中完全保守,在进化中稳定遗传,可作为CENPA的标记外显子。Exon1和Exon4虽然有SNP,但属于同义突变,故Exon1和Exon4也是保守区域。CENPA不具有丰富的多态性,4个外显子中有3个是保守区域,推测CENPA编码的是鸡的基础抗病基因。雪山草鸡是利用中国优质地方良种藏鸡、茶花鸡经杂交选育而成的草鸡新品种。茶花鸡是由野生红色原鸡经长期驯化选育而成的,是中国不可多得的原始鸡种。雪山草鸡具有红色原鸡的血统,但是两者并不聚在一类。雪山草鸡和红色原鸡在Exon2上有相同的SNPs位点,两者都具有较高的抗病性,表明该SNP位点与鸡的优良抗病性有一定关系。
本研究选择的是普遍使用的NJ树,通过Bootstrap处理使其能够很直观地看出不同鸡种间的起源关系。有研究发现,中国地方鸡种的杂合度值要明显高于其他蛋鸡、肉鸡等商业品系及欧洲地区的部分地方品种,同时有研究发现我国许多地方家禽品种拥有较强的抗病能力和免疫能力[11-15]。罗斯鸡、隐性白羽肉鸡、来航鸡和安卡红鸡属于国外鸡品种,为观察国外鸡种与国内鸡种的差别,对国外鸡种的聚类情况进行了分析。结果发现,罗斯鸡和隐性白羽肉鸡聚为一类,来航鸡和安卡红鸡各聚在一大类。罗斯鸡和隐性白羽肉鸡属于快大型白羽肉鸡,安卡红鸡属于速生型黄羽肉鸡,它们的生长速度都很快,但和我国地方黄鸡相比,适应性和抗病性都更低。在4个国外鸡品种中只有罗斯鸡在Exon4上的出现同义突变,大部分鸡种在Exon4上没有SNP和InDel,表明CENPA的Exon4上的SNPs位点无法确定与抗病性是否有关。我国地方鸡种普遍具有较强的适应性和抗病性,且分布区域广泛,狼山鸡、鹿苑鸡、溧阳鸡、太湖鸡和如皋黄鸡都是江苏省内的地方鸡种,这5个鸡种被分为了4个大类,表明这5个鸡种之间的同源性较低。其他区域的鸡种也是分类广泛,表明我国的地方鸡品种资源丰富,且之间的同源性较低,大部分鸡种拥有较强的抗病性,可为抗病育种的研究提供丰富的样本。本研究筛选出的CENPA的内含子具有丰富的多态性,而外显子上的SNPs位点是否与抗病有关,CENPA基因具体怎么对抗病性产生影响,还有待进一步研究。