牛印记基因的研究进展
2022-04-07王丁香赵红波
王丁香,赵红波
(1.西北农林科技大学动物科技学院,陕西 杨凌 712000;2.山东省农业科学院畜牧兽医研究所,济南 250000)
基因组印记是来自父方和母方的等位基因通过精子和卵子传递给子代时发生DNA甲基化和组蛋白乙酰化等修饰,使带有亲代印记的等位基因具有不同的表达特性,是一种不遵循孟德尔定律的遗传学现象。印记基因在染色体上呈簇状分布且高度保守。目前,印记基因的研究主要集中在人和小鼠中,被鉴定的印记基因超过200个,而牛上印记基因的研究相对较少。本研究概括了印记基因的特点及其对牛生长发育的影响,以期为牛的印记基因研究提供参考。
1 牛印记基因表达的特点
印记基因主要特点可以概括为:(1)单等位基因表达,相邻基因具有相反印记作用模式。(2)富含CpG岛,易于被高度甲基化修饰。(3)成簇排列,具有差异甲基化区。邻近的两个基因在印记簇中心往往交互印记。(4)大多通用,即在鼠中发现的印记基因大部分在其它哺乳动物也表现出印记特征。(5)与个体发育阶段密切相关。(6)具有组织特异性,即基因只在特定的组织表现出印记作用。(7)与胚胎生长发育及胎盘的功能有关,一般父源基因表达促进生长,母源基因表达抑制生长。因此,印记基因对动物的生长发育至关重要。
1.1 通过单等位基因的表达鉴定印记基因
当基因在组织中被检测到呈现单等位基因表达时,就可以确定该基因在组织中是印记基因,相反,当基因呈现非单等位基因表达时,则该基因为非印记基因。印记基因鉴定的主要方法就是核苷酸多态性(single nucleotide polymorphism,SNP)检测。Li等人发现环指蛋白3(makorinringfingerprotein3,MKRN3)、黑色素瘤抗原样基因2(melanomaantigen-likegene2,MAGEL2)和黑色素瘤抗原(Necdin,NDN)基因在牛的组织中呈单等位基因表达[1]。Dong等人发现重组人RWD域蛋白(impactRWDdomainprotein,IMPACT)和氧固醇结合蛋白样蛋白1A(oxysterolbindingprotein-like1A,OSBPL1A)基因在牛成年组织中均呈亚型特异性单等位基因表达[2]。Chen等人鉴定了牛Prader-Willi综合征区域的印迹基因(imprintedgeneinthePrader-Willisyndromeregion,IPW)的同源序列及其在多个组织的表达模式,发现IPW呈单等位基因表达[3]。杨文志通过反转录聚合酶链反应(reverse transcription-polymerase chain reaction,RT-PCR)克隆并分析了位于MEG8与MEG9基因间的2组表达序列—LINC24062和LINC24063在牛8个组织(心、肝、脾、肺、肾、骨骼肌、皮下脂肪和大脑)中的表达,发现LINC24062和LINC24063在牛被检测组织中均呈单等位基因表达[4]。以上研究结果为进一步研究印记基因的功能和分析基因表达调控的分子机理奠定基础。当基因在组织中被检测到呈现单等位基因表达时,就可以确定该基因在组织中是印记基因,相反,当基因呈现非单等位基因表达时,则该基因为非印记基因。王冠楠等人发现接头蛋白(Grb2-associatedbindingprotein1,GAB1)和蛋白编码基因(Scm-likewithfourmbtdomains2,SFMBT2)基因在被检测的7个组织中均呈双等位基因表达,表明这两个基因是非印记基因[5]。
1.2 印记基因的组织特异性
印记基因在不同组织中的表达状态可能存在差异。Xu等人发现了多个牛印记基因在不同组织中呈现不同的表达状态。受体酪氨酸激酶基因(Anexelekto,AXL)在4个成年牛组织(心脏、肝脏、脾脏和脂肪)中呈单等位表达,而在其他组织(如肺、肾、肌肉、脑和胎盘)中呈双等位表达[6]。而溶质载体家族38成员4(solutecarrierfamily38member4,SLC38A4)基因在成年牛心脏、肝脏、脾脏、肺、肾、肌肉、脂肪和大脑等8个组织中都没有印记,但SLC38A4在5个异质胎盘中呈多态性状态,其中3个呈父系单等位表达,2个呈双等位表达,除了DNA甲基化之外,还有其他表观遗传学特征在调节牛SLC38A4的印记表达[7]。
1.3 印记基因在不同动物间的比较研究
目前已有研究证明,印记基因在不同物种间可能表现出相同的印记状态,对物种间印记基因的比较分析有助于研究基因组印记的生物学意义和调控机制。赵姝君等人分析了含PH同源域蛋白家族A成员2(pleckstrinhomology-likedomainfamilyAmember2,PHLDA2)在成年牛组织中的表达状态,结果表明PHLDA2基因在牛的心、肝、脾、肺、肾、大脑、骨骼肌、皮下脂肪、卵巢和胎盘10个组织中均呈单等位基因表达[8]。这与人、鼠和猪中PHLDA2基因表达模式相同,即均是母源表达的印记基因。Khatib对神经内分泌蛋白(Neuroendocrinesecretoryprotein55,NESP55)基因多态性位点进行检测,发现了NESP55基因外显子在各组织中的转录本均呈单等位基因表达,这与小鼠、人类的表达模式相同[9]。另外Khatib基于多态性的方法对比研究蛋白酶抑制剂(proteaseinhibitor,PI)基因在人、羊和牛中的表达状态,发现该基因在各物种的组织均呈散在型的复杂表达模式,即在某些组织中优先表达单等位基因表达,在其他组织中优先双等位基因表达[10]。
1.4 印记基因在胚胎发育各阶段的特异性表达
印记基因在胚胎发育各阶段呈特异性表达。赵德超等人检测到黑色素瘤抗原基因2(melanomaantigen-likegene2,MAGEL2)、肌糖(sarcoglycanepsilon,SGCE)和小核内核糖核蛋白(Smallnuclearribonucleoprotein-associatedproteinN,SNRPN)这3个母源性基因在体外受精(In vitro Fertilization,IVF)各阶段的胚胎中都有表达,但MAGEL2基因在牛孤雌激活(Parthenogenetic Activation,PA)胚胎中不表达;SGCE基因在PA胚胎的2~4细胞阶段表达,在其他发育阶段均不表达;SNRPN基因在PA胚胎的2细胞和囊胚阶段的表达水平较低[11]。牛IGF2基因座是由5个启动子(P0、P1、P2、P3和P4)控制的具有不同转录本的基因组区域。转录调节可以影响mRNA的稳定性和翻译,从而影响随后的生物学效应。Willhelm等人评估了牛IGF2基因启动子特异性表达模式,结果表明,P0、P1和P2在早期阶段起次要作用,P3与后期的发育相关,P4是牛卵母细胞成熟和胚胎发育过程中IGF2表达的主要途径。因此,在胚胎生长和发育生物学研究中,P4是影响体外生长胚胎(In vitro production of embryos,IVP)的主要靶点[12]。
1.5 胚胎发育中印记基因的父系表达和母系表达
胚胎发育过程中印记基因有父系表达和母系表达两种表达方式。Gu等人检测了锌指蛋白597(ZincFingerProtein597,ZNF597)在成年牛胎盘组织和体细胞中的等位基因表达情况,结果发现ZNF597基因是在胎盘和包括大脑、心脏、肝脏、脾脏、肺、肾和肌肉的其他7个组织中均呈单等位表达的母系表达基因[13]。Liu等人研究发现胰岛素样生长因子Ⅱ受体(insulin-likegrowthfactorⅡreceptor,IGF2R)、反义RNA(antisenseRNA,AIR)和神经元外单胺转运蛋白成员3(extraneuronalmonoaminetransportermember3,SLC22A3)基因在牛心脏、肝脏、脾脏、肺、肾脏、肌肉、脂肪和大脑等8个组织中均呈单等位基因表达的;在胎盘中,IGF2R和SLC22A3基因呈母系表达,而AIR基因呈父系表达[14]。
2 印记基因的表达调控研究
2.1 基因印记位点的DNA甲基化与细胞重编程
DNA的异常甲基化会造成印记基因表达紊乱,从而影响器官的正常发育,这可能是导致克隆效率低下和克隆动物器官发育异常的主要原因之一。
2.1.1 甲基化参与印记基因的调控 DNA甲基化调节许多生物过程,如基因组印记、X染色体失活和转座子沉默。此外它在配子发生和胚胎发育中起着至关重要的作用。印记基因通常在染色体上呈簇状出现,并由涉及差异DNA甲基化修饰的顺式印记控制区进行调节。Wang等人发现印记基因抗体周期蛋白依赖激酶抑制因子1C抗原(cyclin-dependentkinaseinhibitor1C,CDKN1C)在牛的心脏、肝脏、脾脏、肺、肾脏、肌肉和皮下脂肪中呈单等位基因表达,另外在在肝、脾和肺3个组织中分析了差异甲基化区域(Differentially methylated region,DMR)—CDKN1CDMR和KVDMR1 DMR的特异性甲基化模式。结果表明,在CDKN1CDMR中,3个组织中2个亲本等位基因均未发生甲基化,而相同组织中KVDMR1 DMR,2个亲本等位基因的甲基化水平存在显著差异,证明该区域为KVDMR1的DMR,这表明在3个组织中,KVDMR1区域的DNA甲基化可能在调节牛的CDKN1C基因的印记表达方面发挥了重要作用[15]。Mendon?a等人研究发现,与完全体内产生的胚胎相比,体外胚胎中的IGF2基因DNA甲基化水平更高,且雄性体外胚胎中的DNA甲基化水平较雌性更高[16]。王巍的研究表明H19-IGF2基因簇呈父系印记,其印记控制区(imprinting control regions,ICRs)在父系染色体呈甲基化状态并且随父源基因组一起经历甲基化的消除和重建,因此该ICR区在早期胚胎发育过程中的甲基化变化情况能够间接的反映父系DNA的甲基化动态变化模式[17]。同理PWS/AS基因簇的ICR区(PWS-IC)呈母系印记状态,其ICR区在早期胚胎发育过程中的甲基化变化模式可以反映母系染色体的甲基化模式。Lafontaine等发现胰岛素样生长因子2(insulin-likegrowthfactor2,IGF2R)、小核核糖核蛋白多肽N(smallnuclearribonucleoproteinpolypeptideN,SNRPN)和肝癌父系高表达基因(paternallyexpressed10,PEG10)等印记基因的甲基化水平受培养条件和胎牛血清的影响,而且供卵细胞的年龄也影响编码缓慢激活延迟整流钾通道基因(KQT-likesubfamilymember1,KCNQ1)和多型性腺瘤基因样蛋白1(pleiomorphicadenomagene-like1,PLAGL1)的甲基化;同时不同的辅助生殖技术也会导致牛胚胎特异性表达印记基因的甲基化[18]。Smith等分析了牛印记基因SNRPN、H19和IGF2R的DMR,发现与体内观察到的甲基化模式(人工授精)相比,印记等位基因和体细胞核移植(somatic cell nuclear transfer,SCNT)胚胎的双等位基因表达普遍存在低甲基化[19]。这些结果表明,在早期发育时体细胞核的重编程过程中印记标记可能被擦除,而且这种表观遗传异常可能与克隆动物的死亡率和发病率高有关。
2.1.2 印记基因影响细胞核移植过程中供核细胞的表观重编程 表观遗传重编程在保证机体正常发育和克隆动物的细胞核全能性方面具有重要作用。SCNT已成功用于多种哺乳动物的克隆。马馨等人研究发现死亡克隆牛胎盘中印记基因H19及肝癌高表达基因抗原(Paternallyexpressedgene10,PEG10)出现超甲基化状态,推测体细胞核移植过程影响了供核细胞的表观重编程,并影响胎盘及内脏器官的正常发育[20]。Ma等人发现卵母细胞中转录共抑制因子TRIM28的敲除对H19基因的影响最大[21]。进一步的研究表明,TRIM28在卵母细胞成熟期间高度表达,并在2细胞期达到峰值水平;相比之下,这一阶段的SCNT胚胎中TRIM28的表达显著降低,表明在SCNT期间TRIM28转录本丢失,并可能导致克隆胚胎无法印记。已知10-11易位3(thatten-eleventranslocation3,TET3)负责牛着床前胚胎发育过程中的DNA去甲基化,Zhang等人在体外构建了过表达TET3的细胞系,发现利用这些成纤维细胞作为供体细胞的囊胚率比SCNT增加了约18%[22]。牛SCNT胚胎中TET3的过表达导致多能性基因NANOG和八聚体结合转录因子(Octamer-bindingtranscriptionfactor,OCT-4)的整体DNA甲基化水平的降低和转录活性的增加。尽管如此,SCNT胚胎中印记基因H19-IGF2 DMR的DNA甲基化仍然不受TET3过表达的影响,保持了亲本特异性活性以供进一步发育,该研究结果实现更高的克隆效率提供了一种有效的方法。
2.1.3 营养水平对印记基因甲基化的影响 孕期母体的营养水平是决定胎儿发育的重要因素,对胎儿印记基因的表达有影响,并可能诱发后代的长期表观遗传变化。Wang等人的研究表明孕期母体营养水平与肉牛后代肌肉中印迹基因和DNA甲基转移酶(DNA methyltransferase,DNMT)的差异表达有关[23]。Devos等人的研究结果表明,在安格斯肉牛中,不同的产前营养和RFI遗传潜力会导致出生后胰岛素样生长因子2(Insulin-likegrowthfactor2,IGF2)和IGF2R甲基化模式的组织特异性改变,而且这些模式也会随着年龄的变化而变化[24]。Graugnard等人发现对早期断奶的安格斯牛饲喂高淀粉会引起脂肪生成转录调控因子的代谢印记[25]。Paradis等人的研究表明,在妊娠后半期不同营养水平可以改变胎儿肌肉中生长基因,肌源性和脂肪原基因的表达,虽然不会在胎儿表型上产生明显差异,但这种影响因肌肉功能或纤维而异。另外IGF2甲基化水平的差异以及miRNA表达的差异可能是基因表达差异之前的功能机制,并可能导致跨代表观遗传编程[26]。
2.2 特殊基因的印记表达作用
近年来,长链非编码RNA(long noncoding RNA,lncRNA)研究领域发展迅速。已知反义lncRNA(antisenseclong non-coding RNAs,antisense lncRNAs)、基因间lncRNA(intergenetic lncRNAs,lincRNA)和增强子lncRNA(enhancer lncRNAs,eRNA)可以调节基因组印记,导致基因呈亲本来源特异性的单基因表达。然而,内含子lncRNA(intronic ncRNAs)在基因组印记中的功能尚不清楚。Yang等从MEG8基因的cDNA序列中鉴定出3种新的lncRNAs,分别命名为MEG8内含子RNA1(MEG8-it1)、MEG8内含子RNA 2(MEG8-it2)和MEG8内含子RNA 3(MEG8-it3),这3个lncRNA与MEG8的表达模式相似,在所有被测的8个牛组织中均呈单等位基因表达,表明它们在牛上是印记的[27]。Choo等人证实了哺乳动物父系表达基因3(paternallyexpressedgene3,PEG3)位点具有反义转录基因APEG3,并且呈父系等位基因特异性表达[28]。由于APEG3定位于PEG3基因的3'非翻译区(untranslated region,UTR),且APEG3转录本可以与PEG3转录本互补,因此APEG3更有可能参与PEG3的转录后调控,并且对印记区域的功能具有潜在作用。
2.3 基因的异常印记表达与印记障碍
印记基因的异常表达常引发伴有复杂突变和表型缺陷的多种疾病,例如使用辅助生殖技术(assisted reproductive technology,ART)孕育的后代通常会得大胎综合症(large offspring syndrome,LOS)从而导致牛胎儿过度生长[29]。目前证实ART诱导的LOS是一种印记丢失(loss of imprinting,LOI)的表观遗传综合征,基因印记模式的改变会引起甲基化的改变进而导致印记丢失,从而诱发综合征。Hori等人在患有LOS的胎儿颈部半透明组织厚度检查和体外授精(in vitro fertilization,IVF)小牛中研究发现KCNQ1反义转录物1(KCNQ1oppositestrand/antisensetranscript1,KCNQLOT1)/周期蛋白依赖激酶抑制因子1C(cyclin-dependentkinaseinhibitor1C,CDKN1C)基因结构域印记控制区域的异常低甲基化状态,即KCNQLOT1的双等位基因表达量增加而CDKN1C的表达量减少,表明牛KCNQLOT1/CDKN1C结构域的异常印记可能会产生ART技术孕育的LOS犊牛[30]。父本泛素蛋白连接酶E3A(ubiquitinproteinligaseE3A,UBE3A)等位基因的沉默被认为是由父本表达的UBE3A-ATS反义RNA转录引起的,UBE3A基因的异常印记表达与几种神经发育综合征和心理障碍有关[31]。目前已经在小鼠和猪中研究了UBE3A基因的异常印记表达,但在牛中还未有进一步研究。
3 问题与展望
印记基因分为父系印记基因和母系印记基因,它的表达具有组织和胚胎特异性,在胚胎期不同时间段的表达也有一定差异,为深入了解印记基因的调控机制奠定了基础。DNA甲基化在调控印记基因的表达中起重要作用,而且印记基因在细胞核移植过程影响了供核细胞的表观重编程,这种表观遗传异常可能在克隆动物的死亡率和发病率中起关键作用,但是具体机制仍需再研究。妊娠特定阶段的母体营养水平会导致胎儿和生后发育的重编程,并影响印记基因的甲基化水平,但关于母体饮食对肉牛印记基因表达的影响的现有数据有限。目前在牛中只发现极少印记基因的异常表达和印记障碍。随着基因组印记相关的表观遗传研究越来越深入,将为动物胚胎的生长发育和疾病的调控机制研究提供更多理论依据。