动物遗传育种技术发展历程
2021-12-30薛星星许发芳王磊韩启春杨迎春张智德莫华山周桂花张陆德吴国芳
薛星星,许发芳,王磊,韩启春,杨迎春,张智德,莫华山,周桂花,张陆德,吴国芳
(1.青海大学畜牧兽医科学院 青海省高原家畜遗传资源保护与创新利用重点实验室,西宁810016;2.青海省互助八眉猪原种育繁场,海东810599;3.八眉猪养殖技术服务中心,海东810599)
中国是世界上畜禽遗传资源最丰富的国家之一,目前主要有猪、鸡、牛、羊等20个物种,共576个品种,其中地方品种约426个[1]。种业是畜牧业可持续发展的车头,动物遗传育种技术的变革是种业发展的加速剂。伴随着现代育种技术,如基因编辑技术的变革,基因组学、转录组学、代谢组学等新兴学科的飞速发展,家畜动物育种已经从传统的育种方法向快速改善动物基因型的分子水平方向发展,现代育种速率与传统育种相比提高了3倍之多,为我国自主动物种业的发展,突破国际种业壁垒,保障我国畜牧业迅猛奋战保驾护航。
1 动物常规育种
动物传统育种方法是以遗传学基本理论为基础的育种措施。通过表型值推断基因型或计算育种值,进而对性能做出总体评估,作为留种依据决定种畜的选择与淘汰。它将数量遗传学原理应用于育种实践,通过采用杂交改良、品系选育等技术,实现动物品种不断改良和杂种优势利用。常规育种包括性能测定、系谱测定、同胞测定、后裔测定。性能测定适用于遗传力高、能直接度量的性状,如畜禽日增重、饲料报酬等。性能测定时可分一次记录、多次记录和部分记录。同胞测定是根据同胞表型均值来对个体选留与淘汰,适用于遗传力低、难以度量或不可能度量的性状。猪、鸡等多胎畜禽适宜用该方法进行选择。后裔测定根据后裔综合表现来评定,多用于公畜。系谱测定通过分析各代祖先的生产性能推断其后代品质,多用于尚处于幼年或青年时期的种畜,单独使用系谱测定,对改良畜群的作用较小,应与其他方法结合起来使用[2]。
2 数量遗传学与动物育种
数量遗传学从表型方差中剖分出基因型方差,通过运用资料设计和统计模型估计有关的遗传参数,最终达到选种目的,是遗传学的重要分支。主要应用于估计遗传参数、通径分析和畜禽育种估计模型方法。1909年瑞典遗传学家尼克松—埃勒提出了多基因学说,上世纪二十年代,美国遗传学家赖特、英国统计学家和遗传学家费希尔、生理学家和遗传学家霍尔丹为数量遗传学奠定了理论基础。二十世纪五十年代以来,随着线性代数、概率论、多变量分析和随机过程等学科的进一步发展和应用,数量遗传学的内容有了进一步的丰富[3]。二十世纪六十年代,Henderson提出运用最佳线性无偏估计(Best linear unbiased prediction,BLUP)对动物个体进行育种值估计,BLUP技术作为畜禽遗传评定重要方法[4],其主要应用于种公畜的评定,以及对遗传趋势和配合力的估计。BLUP法的基本原理是线性统计模型方法论与数量遗传学相结合,该方法既能估计模型固定效应,又能预测随机的遗传效应,起到提高育种值估计准确性,加速畜禽重要经济性状遗传改良进程的作用。
3 动物分子育种技术
分子遗传标记的基础是个体间核苷酸序列的变异,它能够对个体DNA水平的遗传多态性进行直接反映。理想的分子标记应具备以下优点:高多态性、共显性遗传、遍布整个基因组且分布均匀[5]。目前,主要的分子遗传标记包括:数量性状基因座(Quantitative trait locus,QTL)、基于DNA的分子标记RFLP(Restriction fragment length polymorphism)、基于PCR的分子标记RAPD(Random amplified polymorphic DNA)和SSR(Eimple sequence repeats)、基于PCR与限制性酶切技术相结合的AFLP(Amplified fragment length polymorphism)以及基于单核苷酸多态性的SNP(Single nucleotide polymorphism)。RFLP作为第一代分子标记技术,能够直接在DNA水平上测定遗传变异[6]。
标记辅助选择对表型、系谱和遗传标记的信息进行了充分运用,而常规育种方法只利用了表型和系谱信息,所以标记辅助选择具备更大的信息量[7]。遗传标记在动物选育中的运用可显著加快动物育种的遗传进展。在畜禽生产中,很多重要的经济性状都是数量性状,而QTL是控制数量性状的基因在畜禽个体基因组中的位置。对遗传标记的选择通过MAS(Marker assisted selection)来实现,可以确定出影响该性状的基因效应值的大小及在染色体上的位置,从而更好的实现对该性状的调控[8]。
MAS在畜禽上的应用十分广泛,STIM1(Stromal interaction molecules 1)基因是影响繁殖性状的基因,孙华等[9]在法系大白猪上的研究表明,STIM1的NN基因型为优势基因型,能够提高母猪产仔数和产活仔数。视黄醇结合蛋白4(Retinol-binding protein 4,RBP4)对猪的产仔数有促进作用,是猪繁殖性能的候选基因[10]。翟腾蛟等[11]研究表明,RBP4的AA基因型大白猪产仔数、产活仔数及健仔数多。耿社民等[12]研究表明,前白蛋白-3(Prealbumin 3,PA-3)2-2型为绒山羊产绒量和体重两个经济性状的优势标记基因型。李志才等[13]在湘西黄牛上的研究发现,心型脂肪酸结合蛋白(Heart type-fatty acid binding protein,H-FABP)的AA基因型为优势基因型,与肌内脂肪含量和大理石花纹呈正相关。
4 基因组编辑技术
基因组编辑技术是一种新兴的利用限制性内切酶在特定DNA位点切割,诱导细胞产生非同源末端连接或同源重组修复机制,并对损伤DNA进行修复,从而实现对基因组定点修饰的技术,其可对目标基因实现定点突变、片段的敲除或敲入等[14]。代表性的有锌指蛋白核酸酶(Zinc finger nucleases,ZFN)技术[15,16]、转录激活样效应因子核酸酶(Transcription activator-like effector nucleases,TALEN)技术[17]、成簇规律的间隔短回文重复相关蛋白9核酸酶(Clustered regularly interspaced short palindromic repeats,CRISPR/CRISPR-associated protein 9,Cas9)技术。传统的基因修饰技术是通过胚胎干细胞的同源重组实现基因组的靶向修饰[18,19],只能切割短且简单的基因序列,与之相比基因组编辑技术打靶效率高、应用范围广、构建成本低[20,21]。
4.1 锌指核酸酶技术(ZFN)
锌指核酸酶是一种人工改造的核酸内切酶,由特异性识别DNA的锌指蛋白和非特异性核酸内切酶FokⅠ构成切割域两部分组成[22,23]。FokⅠ是来源于海床黄杆菌(Flavobacterium okeanokoites)的一种限制性内切核酸酶[24],切割结构域需要形成二聚体才能发挥活性,所以必须由一对ZFN结合在4~6个间隔的DNA双链上的靶序列上形成二聚体切割DNA[25,26]。常用的锌指(Zinc finger,ZF)由3~4个锌指蛋白组成,每个锌指能够识别连续的3个碱基,因此两个ZFN共可以识别18个或者24个碱基,可高度特异地识别基因组中的基因序列[25]。ZFN技术被应用于不同的物种,在细胞水平及整体水平上实现基因的定向修饰。Fatemeh Salabi[27]运用ZFN技术对绵羊肌卫星细胞上的肌肉生长抑制素(Myostatin,MSTN)基因进行敲除,结果提高了细胞周期蛋白依赖激酶2(Cyclin-dependent kinase 2,CDK2)和卵泡抑素(Follistatin,FST)的表达,而降低了p21(CDKI)(Cyclin-dependent kinas inhibitor)基因的表达,同时还发现MSTN基因敲除能显著增加细胞的增殖能力。赵宇航等[28]获得了MSTN(Myostatin)双等位基因突变的牛成纤维细胞株,将外源基因高效整合到牛MSTN基因位点,推动转基因技术的发展。崔文涛等[29]也利用ZFN技术在梅山猪胎儿成纤维细胞上敲除了MSTN基因,并结合体细胞核移植和胚胎移植技术,成功获得了国际首例MSTN基因编辑克隆梅山猪。虽然ZFN靶向结合效率高,但是它的设计对专业知识要求高,费时费力,同时它还会发生脱靶效应,产生错误酶切,目前的技术还无法让它实现对任意靶基因的切割[30]。
4.2 类转录激活因子核酸酶(TALEN)技术
转录激活子样效应因子(Transcription activatorlike effector,TALE)最初发现于黄单胞杆菌属。与ZFN技术类似,TALEN是由TALE蛋白的DNA结合域和Fok I核酸内切酶切割域组合而成。TALE蛋白由核定位信号、DNA特异性识别结合结构域和靶位点基因转录催化等部分组成[29,31-33]。其中的DNA特异性识别结合结构域由两部分组成,一部分是由1到33个长度为33~35个氨基酸残基的重复单位串联后形成,另一部分由一个含有20个氨基酸残基的半重复单位构成,两者共同组成此结合结构域[34],其中第12和13位的氨基酸为重复序列可变的双氨基酸残基(Repeat variable diresidues,RVD)[35,36],决 定 了TALENs的 识 别 功 能[37]。TALEN技术与ZFN相比,简化了筛选过程,通过简单的分子克隆就可以构建出高效的TALEN,并且与DNA序列结合更严格,对受体细胞的毒性低。TALEN技术目前主要应用在基因敲除方面,是否适合大片段基因的插入尚不明确。
TALEN与显微注射等技术相结合,被广泛应用到动植物育种等多个领域。宋绍征等[38]运用TALEN技术敲除山羊乳中致敏源β-乳球蛋白(Beta-lactoglobulin,BLG)基因,同时在BLG基因座定点整合人乳铁蛋白(Human lactoferrin,hLF)基因,在去除乳中过敏原的同时还增加了营养成分。唐成程等[39]利用TALEN技术在家兔CCR5(CC chemokine receptor 5)基因位点中定点敲入人的CD4(Cluster of differentiation 4)和CCR5基因,为建立艾滋病研究新动物模型奠定基础。吴彩霞等[40]对猪基因组内源性基因Tiki1(TraB domain containing protein 2A)进行定点修饰,成功且高效率地构建了猪内源性基因Tiki1敲除的大动物模型。张欢欢等[41]构建TXNIP(Thioredoxin interaction protein)基因TALENs载体,将mRNA通过显微注射到小鼠受精卵中,获得移码突变成功制备TXNIP基因敲除鼠。吴子环等[42]在小鼠Fndc5(Fibronectin type III domain-containing protein5)基因中进行了TALEN质粒对的构建,将其质粒对转录为mRNA后注射到小鼠受精卵中,共出生23只小鼠,再对出生两周的小鼠进行基因型分析和鉴定。最终获得了4种不同的Fndc5基因敲除小鼠品系,为进一步探究该基因在动物体内的功能作用提供了动物模型。
4.3 CRISPR/Cas系统
CRISPR/Cas技术作为第3代基因编辑技术,全称为成簇的、规律间隔的短回文重复序列。二十世纪八十年代,Ishino等[43]在大肠杆菌中发现了成簇的规律间隔的短回文重复序列。直到2002年,Jansen等[44]才 将 这 种 重 复 序 列 命 名 为CRISPR。CRISPR/Cas系统作为一种广泛存在于细菌和古细菌中的免疫保护机制,可以介导外源DNA的降解,进而抵御外来入侵[45,46]。目前,研究最多的是CRISPR/Cas9,它由Cas9蛋白与sgRNA(Singleguide RNA)构成,通过sgRNA与靶序列DNA的碱基配对,利用Cas9蛋白精准切断DNA双链,从而产生双链损伤,进而进行特异位点的基因编辑[47]。CRISPR/Cas9技术的效率非常高,大大缩短了转基因动物的制备时间。
目前,CRISPR/Cas9技术在提高家畜经济性状方面大放异彩。梁红宇等[48]利用CRISPR/Cas9技术对毛囊发育相关基因VEGF(Vascular endothelial growth factor)在CCR5位点定向敲入并获得阳性单细胞克隆,通过体细胞核移植技术和原核注射法制备VEGF基因定点整合绒山羊,为今后培育产绒量高的绒山羊新品种奠定了基础。梅珺琰[49]、Wang[50]、李光鹏等[51]利用CRISPR/Cas9技术,分别培育出MSTN基因突变山羊、猪和黄牛,大大提高了动物的产肉性能。Xiaolong W[46]、Li W R等[52]利用CRISPR/Cas9技术对在毛发生长环节中起负调节作用的FGF5(Fibroblast growth factor 5)基因进行敲除,提高了绒山羊、中国美利奴绵羊羊毛的产量和品质。Han X等[53]利用CRISPR/Cas9技术在酪蛋白α-s1 3’端特异性敲入乳铁蛋白基因,使转基因猪初乳及乳汁中乳铁蛋白可以持续高表达。Ma T等[54]利用CRISPR/Cas9技术成功构建了AANAT(Arylalkylamine N-acetyltransferase)和ASMT(Nacetyl-5-hydroxytryptaminemethyltransferase)转基因绵羊,利用乳腺反应器提高乳汁中褪黑激素的产量。
CRISPR/Cas技术要想实现对特定位点的突变,需要对gRNA进行设计和合成。由于PAM序列存在概率高,所以编辑位点的可选择性很高,最大的优势是其不仅能够对单个位点进行编辑,还能同时对多个位点进行编辑。虽然CRISPR/Cas优点突出,但也存在一些缺点,比如,核酸内切酶越大,转化难度也相对较大,脱靶效应严重,不同物种中编辑效率不同,就CRISPR/Cas9系统而言,仅需靠近PAM序列的12个碱基配对即可,对于远端的8个碱基并不需要严格配对,所以存在容错性,还需要进一步改进[55]。
5 GWAS在动物育种中的应用
近十几年来,基因组技术迅速发展趋于成熟,使得全基因组关联分析(Genome-wide associationstudy,GWAS)已成为经济性状候选基因的分析方法[56],借助全基因组范围的分子标记进行总体关联分析,然后通过基因分型比较复杂性状和对照组之间基因频率差异,进而统计它们与性状之间的关联性大小,选出最显著相关的遗传变异,最后采用验证的方法确立变异与目标性状之间的相关性[57-59]。GWAS也越来越多地应用于家畜重要性状的研究领域,在动物遗传育种中,通过对家畜基因组进行GWAS分析研究,找到控制家畜主要经济性状的重要SNPs,从而挖掘重要经济性状的候选基因。
5.1 猪
阮鹏等[60]利用GWAS技术对嵊县花猪、金华猪繁殖性能相关SNP位点进行分析,发现嵊县花猪的候选基因有6个,分别是SEMA4D(Semaphorin4D)、EYA4(Eye absent 4)、ZC3H12D(Znc finger CCCH domain-containing protein12d)、BANP(BTG3 associated nuclear protein)、DIP2B(Disco-interacting protein 2 homolog B)以及TUSC3(Tumor suppressor candidate 3);金华猪的候选基因有3个:SPINK14(Seeine protease inhitor Kazal type 14)、GRIP1(Glucocorticoid receptor-interacting protein1)和PPP3CA(Protein phosphatase 3 catalytic A)。赵杰[61]运用GWAS技术对正常猪、锁肛猪和基因携带猪进行分析,筛选出3个与肛门闭锁有关的候选基因:PTPRB(Protein tyrosine phosphatase,receptor type B)、BMP6(Bone morphogenetic protein 6)和ANKRD6(Ankyrin repeat domain protein 6),为猪肛门闭锁的遗传机制研究提供了一些思路。赵海燕等[62]通过GWAS技术在深县猪16号染色体上筛选出了4个与6月龄体重相关的候选基因:MTMR12(Myotubularin related protein 12)、NPR3(Natriuretic peptide receptor 3)、PDZD2(PDZ-domain containing-2)和TARS(Tyramine receptors)。谢健[63]发现与香猪产仔数性状显著关联的SNP位点25个(DIAS0001380、ALGA0004742等),潜在关联SNP位点7个(ASGA0020493、ALGA0012897等),同时还筛选到了可能与香猪产仔数性状有关的候选基因ZEB1(Zinc finger E-box binding homeobox 1)、PDIA4(Protein disulfide isomerase 4)、MARCKS(Myristoylated alanine-rich C kinase substrate)、HDAC2(Histone deacetylase 2)等。梁跃[64]采用混合线性模型对广东长白猪的仔猪出生重和7个基因的SNP进行了关联分析,发现其中4个基因:IGJ(Immunoglobulin J chain)和ABCF1(ATP-binding cassette subfamily F member 1)等的SNP基因型与仔猪出生重性状间存在显著差异。Wang等[65]利用GWAS技术对82头母猪的仔猪初生重进行了研究,在全基因组中共发现266个SNP基因型(ALGA0007307、DRGA0004275等)与仔猪初生重存在显著差异,它们大多集中分布在1、7、13、14、15和18号染色体上。Guo等[66]利用GWAS技术对仔猪数量和仔猪死亡率相关的QTL区域进行了分析,发现与窝产仔数和仔猪死亡率有关的QTL区域共15个,分布在1、2、3、6、7、9、13和14号染色体上。
5.2 牛
李俊[67]利用GWAS技术对可能影响水牛产奶性能和繁殖性能的候选基因进行筛选鉴定,最后鉴别到与繁殖性状相关的SNP有40个(AX-85104022、AX-85147160、AX-85066093等),相关候选基因28个:SESN3(Sestrin 3)、PRDM5(PRDIBF1 and RIZ domain-containing 5)、IQGAP3(IQ motif containing GTPase-activating protein 3)等,还获得与泌乳性状相关的10个SNP(AX-85111042、AX-85119569、AX-85061501等)、5个候选基因:PTPN11(Protein tyrosine phosphatase,non-receptor type 11)、COX18(Cytochrome c oxidase-assembly factor 18)和LRP2(Low density lipoprotein receptorrelated protein 2)等,同时还发现LRP2基因可作为水牛泌乳性能的候选基因。苗健[68]利用SWAG技术对可能影响西门塔尔牛骨重的性状进行了研究,共筛选出10个显著关联基因:CHSY1(Chondroitin sulfate synthase)、LAP3(Leucine aminopeptidase 3)和LARP4(La-related protein 4)等。Schopen等[69]对上千头荷斯坦奶牛进行基因分型,共筛选出50228个SNPs,进一步分析发现20号常染色体与乳蛋白的含量和组成有关联,同时发现与乳蛋白组成或蛋白质百分比相关的主要基因组区域分布在5、6、11和14号染色体。Sodeland等[70]通过GWAS鉴定影响乳腺炎易感性的多态性,在对2589头牛常染色体上的17349个SNPs的基因型进行分析后,在2、6以及20号染色体上发现了影响乳腺炎发生的QTL。
5.3 羊
He等[71]利用GWAS对阿勒泰羊、蒙古羊和泗水裘皮羊进行了分析,结果在2号染色体132.6~132.7 Mb区间发现了与绵羊多角性状相关的基因区段,此研究为羊角性状的选育提供了理论基础。狄江等[72]对365只新疆型中国美利奴羊进行了GWAS分析,结果发现3种基因:FIBIN(Fin bud initiation factor homolog)、HSD17B11(Hydroxysteroid 17-beta dehydrogenase 11)和PIAS1(Protein inhibitor of activated STAT1)参与了羊毛的生长发育过程。Demars等[73]用GWAS技术对法国Grivette羊和波兰Olkuska羊分析后发现BMP15(Bone morphogenetic protein 15)基因与控制产羔数呈密切关联。
6 总结
随着现代生物技术的迅速发展,动物遗传繁育技术研究的不断深入和产业化发展的需要,动物育种从以数量性状为主的传统育种方法向着快速改变基因型方向分子育种发展。BLUP、分子标记辅助选择、基因编辑、全基因组选择等技术,很大程度提高了动物育种速度和繁殖效率,使得动物育种工作形成一套完整、新兴、可持续、高效的产业体系。