基于重测序的民猪与大白猪SLAⅠ类基因多态性及抗病潜能差异分析
2021-07-26李婧娜吴俊超王立刚王立贤
李婧娜,疏 泽,吴俊超,程 锋,王立刚,王立贤
(中国农业科学院北京畜牧兽医研究所,北京 100193)
养猪业在我国畜牧业,甚至整个国民经济中都占着举足轻重的地位。经过长期发展,我国养猪业规模化程度越来越高,但是随着饲养密度增大,猪群的健康开始恶化,严重限制了生产效率,降低了猪场收益[1]。研究发现,中外猪种对疾病的抗性以及敏感性不同[2-3]。因此,通过对我国地方猪抗病机理的研究,可以提高猪的免疫能力、生活力及生产力[1]。
动物的免疫识别、对疾病的抵抗能力以及免疫系统的调节一定程度上依赖于主要组织相容性复合体(major histocompatibility complex,MHC,在猪中称为猪白细胞抗原(swine leukocyte antigen,SLA))[4-5]。SLA对感染疾病后的免疫反应以及对病毒的识别和清除具有很重要的作用[6-7]。SLA基因位于猪7号染色体着丝粒两端,分为Ⅰ、Ⅱ、Ⅲ类[8-9],具有高度多态性、单倍型遗传、连锁不平衡等特征[10]。SLAⅠ类基因主要分为3类:Ⅰa、Ⅰb和Ⅰc。Ⅰa包括SLA-1、SLA-2、SLA-3、SLA-4、SLA-5、SLA-9、SLA-11;Ⅰb包括SLA-6、SLA-7、SLA-8;Ⅰc包括MIC1和MIC2[11]。Ⅰa类基因中只有SLA-1、SLA-2、SLA-3具有完整的Ⅰ类基因结构,可编码SLAⅠ类分子。经典SLAⅠ类基因包含8个 外显子,其中前导多肽链是由外显子1编码,α1-3功能区域分别由外显子2~4编码,跨膜区由外显子5编码,胞质区由外显子6~8编码。SLAⅠ类分子由重链和轻链(β2 m)组成,重链分为3个区,为胞浆区、跨膜区、胞外区。胞外区包含α1、α2和α3三个结构域,多态性主要集中在α1、α2[12]。α1、α2形成抗原肽结合槽,α1和α2功能区的α螺旋结构为该槽的两侧壁,底部为与α螺旋呈直角排列的8条反平行β片层链。肽结合槽底部有6个不同的口袋,决定了T淋巴细胞表位结合的特异性,不同的等位基因与不同类型的T细胞表位结合是由锚定残基和氨基酸共同决定的[13]。SLAⅠ类分子多态性位点与HLAⅠ类分子多态性位点几乎完全重叠,这些氨基酸多态性位点在HLAⅠ类分子中参与抗原肽递呈或与T细胞受体结合[14]。在MHC分子中,与抗原肽结合起递呈作用的主要是抗原识别位点(ARSs)。在人类MHC(HLA)Ⅰ类分子中,ARSs由57个氨基酸组成,分为3部分,即抗原结合槽、T细胞受体结合区、外侧的氨基酸残基,其侧链远离抗原结合槽及TCR。MHCⅠ类分子在疾病发生中的作用研究除了人和其他哺乳动物以及禽类,同样对鱼类、两栖类、鸟类、哺乳类的MHC的研究也有很多[15-23]。
我国地方猪资源丰富,高抗病力是地方猪种的重要特性。研究发现,在感染不同的病原体之后,中国地方猪种对疾病的敏感性比其他引入品种要强,具有较为明显的抗病力,其症状和病变也相对较轻[24-26]。一些中国地方猪种,如中国合作猪的SLAⅠ类分子的多态性要高于商品化白猪,这与合作猪对周围环境高度的适应性、耐粗饲、抗病性强等特点一致[27]。民猪是分布在中国东北地区的优良品种,具有免疫力较高、抗病性强等特征。为找出该猪种与大白猪经典SLAⅠ类基因及其编码蛋白的差异,为地方猪抗病力的研究提供分子基础,本研究选取了具有高抗病能力的地方猪种——民猪,与大白猪进行基因组重测序,拟分析不同品种经典SLAⅠ类基因的遗传多态性及对抗病潜能的影响,旨在为阐明民猪的抗病机理提供参考。
1 材料与方法
1.1 试验材料
本研究所使用的样本均来自于中国农业科学院北京畜牧兽医研究所昌平种猪场,饲养条件、饲喂方式和饲料等均始终保持一致。试验样本包括8头民猪和4头大白猪的耳组织。
1.2 组织DNA提取及测序
对大白猪和民猪的耳组织采用常规的酚仿法提取DNA,利用NanoDrop 1000 (Thermo Scientific,USA)测定DNA的浓度与质量。将质检合格的样品利用Illumina Hi-seq2500进行双末端测序,测序深度为5×~7×。
1.3 测序数据的质量控制与多态位点的检测和注释
获得原始测序序列后,利用GATK软件中的Base Recalibration进行质控,对reads的碱基质量值进行校正。对接头序列及poly N,poly A等序列进行删除,将过滤后的reads数通过BWA比对到猪参考基因组(Susscrofa11.1),并进行SNP calling,进一步质控得到可用于后续分析的SNP,在ENSEMBL的VEP工具中导入SNP,使用Gene symbol、Transcript version、Transcript biotype、Transcript support level、APPRIS、MANE参数进行注释,并统计突变类型和数量。
1.4 SLAⅠ类基因单倍型块分析
使用VCFtools中的-vcf、-out、-chr、-from-bp、-to-bp 参数提取SNP后利用GEVALT[28]软件Gerbil模块中的-pedfile、-blockputput参数对SNP进行单倍型块分析[29]。利用R(R version 3.6.1)包的circlize进行单倍型图谱构建,进一步统计单倍型长度和数目作为单倍型结构的指标。
1.5 经典SLAⅠ类基因核苷酸序列比对和核苷酸多态性分析
在Mega 7[30]软件中利用Clustal W进行分析,得到核苷酸以及氨基酸序列的比对结果。利用DnaSP 6.12[31]统计序列的核苷酸多态性。
1.6 经典SLAⅠ类基因编码蛋白质一般特性分析
运用Expasy服务器上的ProtParam工具(https://web.expasy.org/protparam)对经典SLAⅠ类基因所编码蛋白质的理化性质进行预测和分析,同时利用Expasy服务器上的Protscale程序(https://web.expasy.org/protscale)进行疏水性、亲水性预测,分析不同突变对经典SLAⅠ类基因所编码蛋白质性质的影响。
2 结 果
2.1 民猪和大白猪SLAⅠ类基因的SNP和单倍型比较分析
本研究使用单倍型块长度作为单倍型结构多样性的指标。本试验对民猪和大白猪的SLAⅠ类基因进行SNP和单倍型块的分析,其中单倍型块的长度越短、数量越多代表其多样性越高。表1显示,民猪SLAⅠ类基因的SNP数量要多于大白猪。通过对两猪种SNP突变类型所占比例的分析发现,民猪中错义突变共248个占比为2%,内含子变异共8 069个占比65%(图1A);大白猪共有196个SNP为错义突变占比2%,内含子变异共6 266个 占比64%(图1B)。通过对不同品种的单倍型长度及每一个单倍型块中单倍型个数的分析发现,民猪的SLAⅠ类基因平均单倍型个数(4.107)要多于大白猪的SLAⅠ类基因平均单倍型个数(3.547)(图2A)。民猪中长度较短的单倍型所占比例(>60%,图2B)要大于大白猪的占比(>50%,图2C)。
表1 东北民猪和大白猪SLAⅠ类基因单核苷酸多态性分布表Table 1 Single nucleotide polymorphism distribution of SLA class I genes of the Min pigs and Large White pigs 个
A.民猪碱基突变类型所占比例;B.大白猪碱基突变类型所占比例A.Proportion of base mutation types in Min pigs;B.Proportion of base mutation types in Large White pigs图1 民猪和大白猪SLAⅠ类基因突变类型统计图Fig.1 Statistics of mutation types of SLAⅠ gene in Min pigs and Large White pigs
2.2 民猪和大白猪经典SLAⅠ类基因的等位基因多样性
本研究对基因SLA-1、SLA-2和SLA-3等位基因序列进行分析,并计算核苷酸多样性(Pi),其结果如表2所示。对于3个经典SLAⅠ类基因,民猪的核苷酸多样性都要高于大白猪,说明民猪的遗传多样性高于大白猪。
表2 SLA-1、SLA-2、SLA-3基因的核苷酸多态性Table 2 Nucleotide polymorphisms of SLA-1,SLA-2 and SLA-3 genes
2.3 民猪和大白猪经典SLAⅠ类基因及编码氨基酸多态性比较分析
对民猪和大白猪12个样本所测得的SLA-1、SLA-2、SLA-3的第2和3外显子的核苷酸序列与杜洛克猪基因序列进行多态性比较分析。结果表明,在3个基因中民猪的碱基突变及位于抗原结合位点的氨基酸突变数量都要多于大白猪的数量。
2.3.1 两猪种SLA-1基因及氨基酸多态性比较 在SLA-1基因中共发现了2种等位基因。民猪中共有39个碱基发生突变,共导致10个氨基酸发生改变,其中有4个位于抗原结合位点上;大白猪中共有14个碱基发生突变,共有3个氨基酸发生改变,并无氨基酸位于抗原结合位点上(图3和图4)。SLA-1基因所编码的20种氨基酸中,精氨酸(Arg)数目最多,在民猪中占整个氨基酸组成的18.9%,在大白猪中占18.4%。民猪负电荷残基总数(Asp+Glu)为20,正电荷残基总数(Arg+Lys)为34,大白猪分别为20和33,民猪和大白猪中编码产物的不稳定指数分别为76.24和80.37,不稳定指数大于40,则两品种猪SLA-1基因编码产物都是不稳定的。氨基酸序列亲水性/疏水性预测结果如图5A和5B所示,民猪第73位的苏氨酸和第74位的丙氨酸分值最低(-2.989),亲水性最强,第161位的丝氨酸疏水性最强(1.211);大白猪中第26位的半胱氨酸亲水性最强(-2.833),第160位的丝氨酸疏水性最强(1.211)。在整条氨基酸肽链中,民猪的总平均亲水性为-0.931,大白猪的总平均亲水性为-0.901,二者都表现为亲水性。
A.民猪和大白猪单倍型分布;B.民猪不同单倍型块长度所占比例;C.大白猪不同单倍型块长度所占比例A.Haplotype distribution of Min pigs and Large White pigs;B.Proportion of different haplotype blocks length of Min pigs;C.Proportion of different haplotype blocks length of Large White pigs图2 民猪和大白猪SLAⅠ类基因的单倍型及单倍型块长度百分比Fig.2 The percentage of haplotypes and haplotype blocks length of the SLA classⅠ genes of Min pigs and Large White pigs
2.3.2 两猪种SLA-2基因及氨基酸多态性比较 在SLA-2基因中共发现了2种等位基因。民猪中共有25个碱基发生突变,共导致18个氨基酸发生改变,其中有3个位于抗原结合位点上;大白猪中共有17个碱基发生突变,共有13个氨基酸发生改变,并无氨基酸位于抗原结合位点上(图3和图4)。SLA-2基因所编码的20种氨基酸中,丙氨酸在民猪中占比最多为9.4%,精氨酸在大白猪中占比最多为9.4%,半胱氨酸占比最低,在两种猪中均为1.1%,民猪负电荷残基总数(Asp+Glu)为24,正电荷残基总数(Arg+Lys)为22,大白猪分别为26和22,民猪和大白猪的氨基酸理论等电点(PI)分别为5.97和5.27,编码产物的不稳定指数分别为24.88和32.02,不稳定指数小于40,则两品种猪SLA-2基因编码产物都是稳定的。氨基酸序列亲水性/疏水性预测结果如图5C和图5D所示,民猪第16位的丙氨酸分值最低(-2.811),亲水性最强,第23位的甘氨酸疏水性最强(1.078)。大白猪第60位的亮氨酸亲水性最强(-2.878),同时第105位的亮氨酸疏水性最强(1.089)。在整条氨基酸肽链中,民猪的总平均亲水性为-0.835,大白猪的总平均亲水性为-0.823,二者都表现为亲水性。
2.3.3 两猪种SLA-3基因及氨基酸多态性比较 在SLA-3基因中共发现了2种等位基因。对于民猪,共有39个碱基发生突变,共导致9个氨基酸发生改变,其中有7个位于抗原结合位点上;对于大白猪,共有30个碱基发生突变,共有8个氨基酸发生改变,有2个氨基酸位于抗原结合位点上(图3和图4)。SLA-3基因所编码的20种氨基酸中,精氨酸(Arg)数目最多,在民猪中占整个氨基酸组成的19.6%,在大白猪中占19.00%。民猪负电荷残基总数(Asp+Glu)为18,正电荷残基总数(Arg+Lys)为36,大白猪分别为18和35,民猪和大白猪的氨基酸理论等电点(PI)分别为11.82和11.79,编码产物的不稳定指数分别为76.44和79.12,不稳定指数大于40,则两品种猪SLA-3基因编码产物都是不稳定的。氨基酸序列亲水性/疏水性预测结果如图5E和图5F所示,民猪和大白猪第121位的半胱氨酸和第122位的丝氨酸分值最低(-3.000),亲水性最强。民猪和大白猪第166位的甘氨酸疏水性最强(1.122)。在整条氨基酸肽链中,民猪的总平均亲水性为-1.000,大白猪的总平均亲水性为-0.965,二者都表现为亲水性。
圆点代表氨基酸相同,字母代表氨基酸发生改变,星号表示抗原结合位点Dots indicate the same amino acid as reference,letters show substitutions of amino acid,and the putative peptide-binding regions (PBR)are marked with asterisks图4 SLA-1、SLA-2、SLA-3基因第2、3外显子编码氨基酸序列比对Fig.4 Alignment of the SLA-1,SLA-2,SLA-3 amino acid sequences in exon 2 and 3
A.民猪SLA-1;B.大白猪SLA-1;C.民猪SLA-2;D.大白猪SLA-2;E.民猪 SLA-3;F.大白猪SLA-3A.SLA-1 of Min pigs;B.SLA-1 of Large White pigs;C.SLA-2 of Min pigs;D.SLA-2 of Large White pigs;E.SLA-3 of Min pigs;F.SLA-3 of Large White pigs图5 SLA-1、SLA-2、SLA-3蛋白的疏水性预测结果Fig.5 The hydrophobicity profile of SLA-1,SLA-2,SLA-3 analyzed by ProtScale program
3 讨 论
在2006年全国蓝耳病爆发期间,某项调查数据显示,莱芜猪、鲁莱黑猪、莱芜杂交二元母猪的死亡率较低,分别为0、0、0.6%,但是国外品种母猪的死亡率则高达54%,说明我国地方猪的抗病能力要高于外种猪,暗示中外猪种的免疫能力可能存在差异。民猪与莱芜黑猪同属黄淮海黑猪,是我国优良的地方品种,同样具有抗病力强的特点[32]。本试验从全局层面阐述了中外猪种不同SLAⅠ类基因多样性,对抗病力较强的地方猪——民猪和大白猪SLAⅠ类基因的SNP以及发生错义突变的SNP进行统计分析,发现民猪的数量都要高于大白猪,这可能使多肽链的氨基酸种类和序列发生改变。本试验还对单倍型进行分析,发现民猪具有更多长度较短的单倍型块,并且平均单倍型个数要高于大白猪,表明民猪的单倍型复杂程度更高,排列的方式更多,具有丰富的多样性[33]。
MHCⅠ类分子都含两条独立的多肽链,一条为MHC编码的α或重链,另一条为非MHC编码的β链。MHCⅠ类分子包含4个独立区:氨基末端细胞外肽结合区、细胞外免疫球蛋白样区、穿膜区和胞浆区。SLAⅠ类基因具有高度丰富的多态序列区域主要集中在编码区的第2和第3外显子[34],其主要编码SLAⅠ类分子的α1和α2区域[35](氨基末端细胞外肽结合区),而α3区域则是高度保守的。编码SLA抗原的基因具有丰富的多态性,多等位基因决定了多种SLA分子,其可结合不同的蛋白质抗原肽。刘建欣和郑昌学[36]的研究发现,MHC基因复合体多态性位点是由基因重复产生的。新的位点形成以后,不再受原功能限制,因而可以产生新的功能。Ando等[37-38]在SLA-1、SLA-2、SLA-3外显子1、2、3中发现了等位基因多样化,并且导致其编码的SLAⅠ类分子的α1和α2区的氨基酸呈现高度多态性。核苷酸多样性是衡量群体遗传多样性的重要指标,该值越高表示群体遗传变异程度越高,对不同的环境具有很强的适应能力[39]。刘德武等[40]对广东蓝塘猪、大花白猪及4个引入品种的群体遗传结构进行分析,结果发现,地方品种的群体内遗传变异要高于引入品种。本研究对民猪和大白猪SLA-1、SLA-2、SLA-3的核苷酸多样性进行分析,民猪3个基因的核苷酸多样性均高于大白猪。结果表明,民猪的遗传多样性优于大白猪。可能是因为不同猪种所生长的环境不同,从而具有不同的抵抗能力,导致具有不同的遗传多态性[41]。
MHC多态性明显表现出适应性意义,如抗病性和免疫应答能力增强,对环境适应性能力的提高等[27]。SLAⅠ类分子中参与抗原肽结合的主要是抗原识别位点(ARSs),由α1和α2区两个α螺旋结构及一个β片层结构构成。本试验中,民猪和大白猪经典SLAⅠ类基因在3个基因位点都高度杂合,SLA-1、SLA-2、SLA-3基因外显子2、3序列上的碱基突变表现出了多态性,具有极为丰富的变异。在民猪和大白猪中所检测到的SLA-1、SLA-2、SLA-3等位基因各有2个,表现出等位基因多样化,民猪碱基突变的数量均多于大白猪,编码的氨基酸位于抗原结合位点的数量也均多于大白猪,这可能是民猪的抗病力比大白猪强的原因之一。同样,这些变异位点也可以为猪抗病能力的分子标记辅助选择育种提供新的候选分子标记。
MHCⅠ类分子几乎表达于所有有核细胞表面[42],其多态性位点主要分布在与肽结合的区域,使得MHCⅠ类分子具有不同的抗原递呈特征。本研究对SLA-1、SLA-2、SLA-3基因编码产物氨基酸的组成、疏水性预测分析的结果对其蛋白质的稳定性、构象和功能的研究具有重要意义,是进一步研究该基因作为疾病候选基因可能性的基础。对于SLA-1、SLA-3基因,两个猪种编码产物均为不稳定蛋白,且大白猪的不稳定性要高于民猪;对于SLA-2,两个猪种编码产物均为稳定蛋白。两个猪种的SLA-1、SLA-2、SLA-3氨基酸均表现为亲水性,编码产物均为可溶性蛋白,并且民猪的SLA-1、SLA-2、SLA-3氨基酸亲水性都要比大白猪强,民猪3个 基因编码产物具有较高的亲水性可能是由于较高的氨基酸变异率造成的。
4 结 论
本研究通过对民猪和大白猪SLAⅠ类基因的研究,发现民猪具有更强的多态性。同时,本研究对经典SLAⅠ类基因的外显子2和3进行分析,发现民猪的碱基突变以及位于抗原结合位点上氨基酸突变的数量都要多于大白猪。结果表明,民猪的SLAⅠ类基因具有更加丰富的多态性。本研究结果为分析不同猪种SLAⅠ类基因的遗传多态性提供了理论基础。