猪NTF3基因启动子的克隆及序列分析
2020-12-28罗琰高博董和蒙琦王继卿
罗琰,高博,董和,蒙琦,王继卿
(1.甘肃省畜牧兽医研究所,甘肃 平凉 744000;2.甘肃农业大学动物科学技术学院,甘肃 兰州 730070)
神经营养因子(neurotrophin,NTF)家族是由靶细胞分泌合成并经神经突起逆向转运至胞体而发挥作用的一类小分子蛋白,包括神经生长因子(nerve growth factor,NGF)、脑源性神经营养因子(brain-derived neurotrophic factor,BDNF)、神经营养因子3(neurotrophin 3,NTF3)和神经营养因子4(neurotrophin 4,NTF4)[1].1990年,Ernfors 等[2]首先用基因克隆扩增的方法发现了NTF3基因.研究表明其功能广泛,在哺乳动物神经系统的分化与增殖、生理功能调控及损伤修复等过程中发挥着重要作用[3].但也有研究报道NTF3基因可能与公猪性机能发育、性成熟、生精作用及雄性不育等生理过程密切相关.
近几年来人们对公猪繁殖性能的遗传机理研究越来越重视,已成为该领域的研究热点.Ding等[4]通过对不同日龄杜洛克和梅山公猪的睾丸组织进行转录组测序分析,发现NTF3基因在不同品种公猪以及同一品种公猪的不同时期之间均有差异表达.因此可以推测NTF3基因可能对雄性性机能发育和生精作用具有极其重要的调控功能.研究发现,NTF3基因可在支持细胞中表达,且是SRY诱导的前体支持细胞在雄性性别分化中从中肾细胞迁移至睾丸过程中的化学诱导剂[5],而这种细胞迁移是睾丸索形成早期形态学上的一个关键过程[5-6].Barrionuevo等[7]也认为NTF3基因的表观突变(甲基化)与少量精液参数或与雄性不育相关.然而目前关于NTF3基因相应的表达调控机制尚不清楚,对猪NTF3基因启动子的结构、功能和调控方面的研究还未见报道.
真核生物基因表达量受多个水平的调控,而转录水平的调控是最为重要的一步,其中关于启动子的研究最多.启动子是位于基因5′端上游的一段DNA序列,能特异性识别和结合RNA聚合酶并使之活化,从而起始转录[8-9].因此,对于启动子的深入研究有助于我们了解基因的结构、功能及其表达调控机制.本研究对猪NTF3基因的启动子区序列进行扩增克隆,并对其进行生物信息学预测分析,初步探索了猪NTF3基因启动子的结构,以期为下一步构建荧光素酶报告基因重组载体及检测猪NTF3基因启动子区的转录活性奠定基础,同时也为深入研究猪NTF3基因的转录调控机制提供理论依据.
1 材料与方法
1.1 试验样品
采集3头健康的杜洛克猪新鲜血液,加入抗凝剂,-20 ℃保存,用于DNA提取.
1.2 主要试剂
DL2000 DNA Marker、2×ES Taq Master Mix、胶回收试剂盒(天根生化科技有限公司);T4DNA Ligase、载体pMD18-T Vector(TaKaRa公司);菌株DH5α(transgene公司);DNA提取试剂盒、去内毒素质粒提取试剂盒(Endo-free Plasmid Mini KitⅡ)(Omega公司).
1.3 猪基因组DNA的提取
血液DNA提取参照DNA提取试剂盒(Omega公司)说明书进行.
1.4 引物设计及合成
根据NCBI(www.ncbi.nlm.nih.gov)基因数据库中猪NTF3基因(Gene ID:100144493)的参考序列,以5′UTR上游序列约1 730 bp为模板,利用Primer Premier 5.0软件设计引物(表1).引物合成由上海生工生物工程有限公司完成.
表1 启动子扩增引物
1.5 猪NTF3基因启动子的扩增和克隆
以杜洛克猪基因组DNA为模板,PCR扩增NTF3基因启动子序列.PCR扩增体系:模板DNA 1.0 μL,上、下游引物(10 μmol/L)各1.0 μL,2×ES Taq Master Mix 12.5 μL,无菌去离子水9.5 μL.PCR反应条件:94 ℃预变性5 min;94 ℃变性30 S,58 ℃退火30 S,72 ℃延伸2 min,32个循环;72 ℃延伸10 min.PCR产物用1.5%琼脂糖凝胶电泳检测,使用胶回收试剂盒回收目的片段,连接到pMDl8-T Vector载体上,构建重组质粒pMDl8-T-NTF3,然后转化至大肠杆菌DH5α中培养过夜,菌液PCR鉴定后筛选阳性克隆送至北京奥科鼎盛生物科技有限公司进行测序.利用DNAMAN软件对测序结果进行比对分析,鉴定序列的正确性.
1.6 生物信息学预测分析
利用生物信息学分析软件(表2)预测猪NTF3基因启动子区的调控元件(核心活性区域、转录起始位点、转录因子结合位点、CpG岛以及TATA-box、CAAT-box等),并将结果进行分析.
表2 生物信息学分析软件
2 结果与分析
2.1 猪NTF3基因启动子区序列的扩增和克隆
通过PCR扩增出猪NTF3基因启动子5′端上游约1 730 bp的片段,PCR产物经1.5%琼脂糖凝胶电泳检测,其结果与预期片段大小一致(图1).切胶回收PCR产物进行连接、转化、菌液PCR鉴定,菌液PCR扩增产物与之前片段大小相一致,表明重组克隆载体pMDl8-T-NTF3构建成功.
2.2 猪NTF3基因启动子区序列生物信息学分析
对测序结果进行比对分析发现,目的片段大小为1 745 bp,去除21 bp重叠序列后,剩余1 724 bp为本次试验获得的猪NTF3基因启动子序列,测序结果见图2.该序列中各碱基组成存在差别,GC含量相对较高,占52.49%,AT含量占47.51%,相差约5%(表3).通过生物信息学软件分析发现,猪NTF3基因启动子区5′端-439 bp和-750 bp处存在2个潜在的转录起始位点(TSS),并检测到1个TATA-box、1个CAAT-box、2个GC-box、3个GT-box和1个起始密码子(图2),且这些元件均位于起始密码子上游-1.4 kb范围内.
M:DNA相对分子质量标准;1~2:PCR产物.M:DNA marker;1~2:PCR products.图1 NTF3基因启动子PCR扩增结果Figure 1 PCR amplification of NTF3 gene promoter
运用启动子预测软件Neural Network Promoter Prediction进一步分析,可预测出猪NTF3基因启动子区潜在的核心活性区域(表4).一般认为CpG岛大于100 bp,且GC含量大于50%,本试验使用Methprimer软件预测分析,发现目的基因NTF3启动子区不存在CpG岛(图3).
表3 猪NTF3基因启动子区碱基组成
A:TATA框;B:CAAT框;C:GC框;D:GT框;E:转录起始位点(TSS);F:起始密码子.A:TATA-box;B:CAAT-box;C:GC-box;D:GT-box;E:Transcription start site;F:Initiation codon.图2 猪NTF3基因启动子区序列与结构Figure 2 Sequence and structure in the the promoter region of porcine NTF3 gene
表4 软件预测的猪NTF3基因启动子核心活性区域
通过在线软件TFSEARCH和AliBaba2.1预测分析发现,所获的猪NTF3基因启动子区存在多个转录因子作用元件,如GATA-1、GATA-2、SRY、Sp1、C/EBPβ、AmL-1a、NF-1、MZF1、NF-kappaB、AP-1、YY1和MyoD等识别位点,其中,GATA-1、SRY、Sp1家族蛋白和C/EBPβ的结合位点频率较高(表5).
图3 CpG岛预测结果Figure 3 CpG island prediction results NTF3 gene
表5 猪NTF3基因启动子区主要转录因子结合位点
3 讨论
研究报道,NTF3基因可能对公猪性机能发育、性成熟、生精调节、生殖细胞的增殖与存活以及雄性不育等方面具有重要的调控作用[10].胎儿支持细胞产生的生长因子NTF3对中肾细胞起作用,并控制它们迁移入性腺[11].Ding等[4]采用Western-blot检测了NTF3在不同日龄杜洛克和梅山公猪睾丸中的蛋白表达水平,发现NTF3的表达可能与公猪睾丸的成熟过程有关.Clement等[12]研究结果显示,在雄性性腺性别分化时,SRY可在体外刺激下结合到NTF3启动子上与之相互作用,而SRY能够启动睾丸发育的过程,这表明NTF3基因是SRY下游的一个直接靶基因.Cupp和Robinson等[13-14]研究也发现SRY和SOX9对NTF3基因有直接调节作用.基因表达调控中首要和重要的阶段是转录起始,而转录起始调控的实质是通过影响相应的转录因子与启动子和上游调控序列的相互作用来调控目的基因的表达.然而关于猪NTF3基因启动子的序列结构、功能和调控机理等尚未见报道.因此,本研究对猪NTF3基因启动子区的序列与结构进行生物信息学分析,有助于阐明其功能及转录调控机制,为进一步揭示公猪性机能发育和生精调节的分子机理与转录调控网络奠定理论基础.目前,准确率高的生物信息学分析软件不断涌现,在基因5′调控区启动子的分析和转录因子结合位点的预测等方面发挥重要作用.
真核生物启动子主要包括TATA-box、起始子、GC-box、CAAT-box等作用元件,其中TATA-box和起始子又称为核心启动子[15],与转录调控有内在的联系,并在转录的正确起始中发挥重要作用.本试验预测的猪NTF3基因启动子区序列的TATA-box(ATAAAA)位于-366 bp~-361 bp,并不符合真核生物启动子典型的5′-TATA[A/T]A[A/T]-3′序列模式,可见,猪NTF3基因的启动子和大多数哺乳动物的类似,都没有典型的TATA-box.TATA-box虽是构成真核生物典型的核心启动子元件之一,但TATA-box也并不总是存在于一个基因的启动子区域[16].对于没有TATA-box的启动子来说,则需要Sp1结合于GC-box来启动基因的转录[17].GC-box有2个拷贝(GGCGGG),位于CAAT框的两侧,是一个转录调节区,有激活转录的功能.约有47.3%的真核生物启动子序列中至少有1个GC-box[18].本试验预测的2个GC-box(GGCCC)分别位于-1 364 bp~-1 360 bp和-913 bp~-909 bp处,与典型的GC-box有较高的同源性,且正好分布于CAAT-box两侧.GC-box是转录因子Spl的经典结合位点,因此推断其可能激活NTF3基因的转录.CAAT-box是真核生物基因常有的调节区,多位于转录起始点上游约-80bp处,但其距离转录起始点的远近对其作用影响不大,也可能是RNA聚合酶的一个结合处,控制转录起始的频率,可增加启动子的强度[19].本试验获得的1个CAAT-box(CAATGG)位于-1 120 bp~-1 115 bp,距离转录起点较远,是否能够增强猪NTF3基因的转录效率,还有待进一步研究.CpG岛是表观调控的重要组成之一,在调控方面发挥重要作用.一般情况下,CpG岛主要位于基因的启动子和第一外显子区域,约有60%以上基因的启动子含有CpG岛.但王飞等[20]在‘大白猪’ATK3基因启动子中并未发现CpG岛,胡慧艳等[21]也发现猪StAR基因启动子中不含有CpG岛.可见不是所有基因启动子都存在CpG岛,本研究中NTF3基因启动子区未发现CpG岛,这一结果将为后续从甲基化水平调控基因表达和验证功能奠定基础.
本研究运用生物信息学软件预测的猪NTF3基因启动子区包含GATA-1、GATA-2、SRY、Sp1、C/EBPβ、AmL-1a、YY-1、NF-kappaB、NF-1和MZF1等多个转录因子结合位点.转录因子是基因表达调控过程中的关键调节因子,它与RNA聚合酶Ⅱ形成转录起始复合体,共同参与转录起始过程[22].SRY在睾丸中特异性表达[23],是睾丸中肾细胞迁移和精索形成的必需因素之一[11,24].GATA-1可通过与启动子中(A/T)GATA(A/G)模序结合后激活基因的转录,在细胞分化和增殖中起重要作用[25].Spl是哺乳动物基因转录活化的必须因子,可通过蛋白质C端的锌指结构识别启动子上的GC/GT-box发挥转录激活作用[26],其结合位点在转录激活的结构域中分布非常广泛[27-28].本研究在NTF3基因启动子区域发现多个Sp1的结合位点,这与前人的研究结果一致.此外,Spl对哺乳动物的大量基因具有调控作用[29],且TBP、YY1等多种转录因子可以参与Spl的转录活性调节[30].有研究报道,YYl和C/EBPβ参与调控哺乳动物卵泡的成熟、排卵及初情期启动等繁殖活动[31],且在初情期启动过程中,YYl可结合在表达上调基因的启动子上[32].C/EBP转录因子家族具有募集RNA聚合酶复合体并启动转录的能力[33].Masakiyo等[34]证实了C/EBPβ能够单独结合于HCE1A1基因启动子的相应反应元件上激活启动子并上调其活性.而Pitarque等[35]发现C/EBPβ可与CEBP结合位点结合并下调CYP2A6启动子的活性.由此可见,转录因子与启动子的结合能力也能够影响基因的表达水平.
4 结论
通过本研究结果可以初步认为,克隆出的长度为1 724 bp的猪NTF3基因5′侧翼序列是一个具有非典型的TATA-box、GC-box和CAAT-box的真核生物启动子,有2个潜在的转录起始位点,可能是通过GC-box对转录的激活以及CAAT-box控制转录起始的频率来起始转录过程.但本序列是否具有启动子活性、预测的转录因子结合位点是否正确以及本启动子区序列如何调控猪NTF3基因的转录等问题,仍需通过构建荧光素酶报告基因重组载体,定点突变、缺失及染色质免疫沉淀等方法进一步验证和深入研究.