绵羊Oct4基因启动子序列的克隆及其与猪和牛序列的比较分析
2016-10-27李昊郭虎王春生宋红卫朴善花安铁洙
李昊,郭虎,王春生,宋红卫,朴善花,安铁洙
绵羊基因启动子序列的克隆及其与猪和牛序列的比较分析
李昊,郭虎,王春生,宋红卫,朴善花,安铁洙*
(东北林业大学生命科学学院,黑龙江哈尔滨150040)
为探明绵羊基因启动子的结构特点,用PCR方法克隆获得了绵羊基因启动子,并对绵羊、牛和猪基因的上游调控序列进行对比分析。结果显示,成功扩增获得长度为2 951 bp的绵羊基因启动子;绵羊、牛和猪基因的上游调控序列均含有4个保守区域(CR1–CR4),且4个保守区域在3个物种间具有高度同源性;CR1区域富含GC碱基对,且序列上的Sp1/Sp3位点与激素反应元件HRE在3个物种中具有100%的同源性;绵羊和牛、猪的上游调控序列富含GC,并存在大量的CCC(A/T)CCC位点。
绵羊;牛;猪;基因启动子;序列分析
Oct4(POU5f1)是动物种系之间具有高度保守性的POU转录因子,是迄今发现的最早也是最重要的维持胚胎干细胞多潜能性和自我更新的关键因子。近年来,研究人员相继对小鼠、猪和牛等的基因进行了克隆,并对基因的调控序列进行了深入研究。研究结果显示,基因的转录调控涉及启动子和上游2个增强元件,即近端增强子(proximal enhancer,PE)和远端增强子(distal enhancer,DE)[1–2];基因在小鼠、人和牛这3物种间具有高度保守性[3–5],但迄今尚少见到有关绵羊基因的相关报道。笔者在扩增绵羊基因启动子的基础上对启动子序列进行了分析,并将绵羊基因启动子的序列与牛和猪的基因同源序列的上游区域进行比较,以探明绵羊基因启动子的结构特点,建立完善的绵羊iPS诱导方法,为研究家畜基因的表达提供参考依据。
1 材料与方法
1.1主要试剂和载体及菌株
全基因组DNA提取试剂盒(TAKARA公司)、pMD18–T载体及T4连接酶(TAKARA公司)、Trans5α型感受态细胞(TransGen公司)、小型质粒提取试剂盒(BioTeke公司)、胶回收试剂盒(OMEGA)、I酶、HI酶和LA Premix酶均购自大连宝生物(TAKARA)工程有限公司,其他试剂为国产或进口分析纯。
1.2方法
1.2.1绵羊基因组DNA的提取
取成年东北细毛羊肌肉组织,采用全基因组DNA提取试剂盒提取绵羊基因组DNA,并置于–20 ℃冰箱中保存,备用。
1.2.2启动子核心功能区的扩增
引物的设计及合成:在比对GenBank中的人、鼠、兔和牛的启动子的基础上,依据启动子序列在不同物种间的保守特性设计2对引物,即SPOct4–1(5–CATATGAAGGGTTGAGCACTTG TTT–3)、SPOct4–2(5–GGATCCCACTAGCCTTGA CCTCTGG–3)和SPOct4–3(5–CCAAGTAGCTCAA GCGATAA–3)、SPOct4–4(5–TAACCCTAAACAA GTGCTCAAC–3)。将设计的引物序列送宝生物(大连)有限公司进行合成。合成的引物稀释后–20 ℃保存,用于后续试验。
基因启动子扩增:以绵羊基因组为模板,分别以SPOct4–1/ SPOct4–2和 SPOct4–3/SPOct4–4为引物对绵羊基因启动子进行梯度PCR扩增。以SPOct4–1/SPOct4–2为引物的PCR扩增:PCR退火温度分别设定为51.9、54.0、56.3、58.3、59.9 ℃;PCR反应体系为25 μL,其中DNA模板2 μL,dNTP(2.5 mmol/L)4 μL,10× rBuffer 2.5 μL,引物SPOct4–1和SPOct4–2各1.5 μL,r酶0.3 μL,最后添加ddH2O至25 μL;PCR反应条件为94 ℃预变性5 min;94 ℃变性30 s,50~60 ℃退火45 s,72 ℃延伸90 s,35个循环;72 ℃延伸10 min。
以SPOct4–3/SPOct4–4为引物的PCR扩增:PCR退火温度分别设定为54.0、56.0、58.0、60.0、62.0、64.0 ℃;PCR反应体系25 μL,其中DNA模板2 μL(100 nmol/L),引物SPOct4–3和SPOct4–4各2 μL,LA Premix连接酶12.5 μL,ddH2O补齐至25 μL;PCR反应条件为94 ℃预变性5 min;98 ℃变性10 s,50~65 ℃退火30 s,72 ℃延伸125 s,30个循环;72 ℃延伸10 min。
1.2.3pMD18–T–SPOct4重组质粒的构建
将上述2组PCR产物经1%的琼脂糖凝胶电泳后,利用DNA片段胶回收试剂盒回收SPOct4–A和SPOct4–B基因片段,然后分别与pMD18–T载体在16 ℃条件下连接4 h(PCR产物7.5 μL,pMD18–T载体1 μL,Buffer 1.0 μL,T4连接酶0.5 μL)。取50 μL Trans5α型感受态细胞,加入5 μL连接产物转化并进行蓝白斑筛选。挑选白色克隆于含有氨苄西林(Amp)的LB培养液中过夜培养,采用质粒小提试剂盒提取质粒。
对提取的重组质粒进行PCR鉴定和I和HI双酶切鉴定。将经PCR鉴定和酶切鉴定正确的重组质粒送Invitrogen公司测序。
1.3序列对比分析
将获得的绵羊启动子与牛和猪的基因启动子序列进行比较,去除部分重叠序列后合并得到绵羊基因启动子序列;利用DNAman软件,将获得的绵羊基因启动子序列与GenBank中牛(序列号为AF022986)和猪(序列号为CT737281)的基因启动子上游序列进行对比,分析绵羊启动子的相关调控位点、启动子保守序列(CR)、启动子的功能域及GC碱基对含量。
2 结果与分析
2.1绵羊基因启动子的克隆
以SPOct4–1/SPOct4–2为引物,对绵羊基因片段SPOct4–A进行PCR扩增,经琼脂糖凝胶电泳后,在约1 200 bp处观察到目的条带(图1);以SPOct4–3/SPOct4–4为引物,对绵羊基因片段SPOct4–B进行PCR扩增,电泳后,在约1 850 bp处观察到目的条带(图2)。
1、2、4、5、6分别为退火温度51.9、54.0、56.3、58.3、59.9 ℃时的电泳结果;3 Marker III核酸标记物。
1 DL 2000核酸标记物;2、3、4、5、6、7分别为退火温度54.0、56.0、58.0、60.0、62.0、64.0 ℃时的电泳结果;8 阴性对照。
2.2绵羊基因启动子克隆载体的鉴定
1 阴性对照;2 PCR电泳条带;3 NdeI和BamHI双酶切产物电泳条带;4 Marker III核酸标记物。
1 DL 2 000核酸标记物;2 重组质粒PCR产物电泳条带;3 阴性对照。
1 DL 2 000核酸标记物;2 NdeI和BamHI双酶切产物电泳条带。
2.3绵羊启动子的相关调控位点分析
利用Primer 5.0对获得的绵羊基因启动子序列进行分析,结果显示,在克隆获得的绵羊基因启动子的804、1 181、1 959位点有3个CAAT box,但没有TATA box;在2 835位点含有1个GC_SP1序列或SP1序列。此外,序列中还包含一些其他与调控相关的功能区段(表1)。所获得的绵羊基因启动子与牛的基因启动子有92.46%的同源性。
表1 绵羊Oct4基因启动子上的调控位点信息
2.4绵羊、牛和猪的启动子保守区定位与同源性分析
将获得的绵羊基因启动子序列与牛和猪的基因启动子序列进行比较,分析结果显示:绵羊、牛和猪均含有4个保守区域,即CR1、CR2、CR3和CR4;CR1(基因启动子最近端保守区域)在绵羊、牛和猪的中均对应于上游序列–130/–1的核苷酸位置;CR2在绵羊、牛和猪上游序列上分别位于–1 467/–1 167、–1 455/–1 168和–1 229/–947,三者间具有高度的同源性(表2);绵羊、牛和猪的CR3分别位于上游区域–1 956/–1 852、–1 769/–1 663和–1 393/–1 289,三者间同样具有高度的同源性(表2);绵羊、牛和猪的启动子的CR4分别位于基因启动子5序列的–2 557/–2 426、–2 361/–2 229和–2 096/–1 966。绵羊和牛、牛和猪、绵羊和猪之间的同源性分别为94.03%、88.81%和93.28%(表2);图6结果显示,绵羊和牛的CR1、CR2、CR3区域与CR4区域接近重合,绵羊猪的CR1区域完全重合,CR2区域与CR4区域部分重合,而二者的CR3区域不重合。
表2 绵羊、牛和猪各保守区域的相同碱基数及同源性对比结果
图6 绵羊、牛和猪的Oct4基因5'上游保守区域(CR)示意图
2.5绵羊、牛和猪启动子保守区调控基序分析
对3个物种保守区域(CR)的调控基序进行比较,其结果显示,在绵羊、牛和猪的CR1中的Sp1/Sp3结合位点(5–GGGGGCGGGG–3)和与之重叠的HRE(5–GGGCCAGAGGTCAAGGCTA–3)具有100%的同源性,且5–GGGTGGG–3和5–GGGA GGG–3具有极高的保守性,并且有2个CCC(A/T) CCC序列定位在CR1上(图7);绵羊、牛和猪的CR2和CR3均位于GC富含区,其中,CR2含有1个保守的5–CCCTCCC–3序列(绵羊的是–1 205/–1 199) (图7);绵羊、牛和猪的CR4区域包含1个部分保守的5–CCCTCCC–3的序列(绵羊的是–2 351/– 2 344)和1个保守的5–GGGAGGG–3序列(绵羊的是–2 250/–2 244)(图7)。
图7 绵羊、牛和猪的保守区域(CR)序列对比
2.6绵羊、牛和猪5区域中GC碱基对含量的比较
当前基础工程建设的步伐逐渐加快,在电力系统运行管理中,电力电缆的铺设工作很重要,在日后电力电缆管理中,必须合理操作,减少异常影响。但是现阶段电力电缆铺设的过程中存在很多问题和弊端,操作人员可能存在失误,对各种问题缺少了解。此外在责任和态度上,施工人员对电力电缆进行预设的过程中,没有对图纸进行认真的分析和考量,仅是简单的进行处理。施工现场可能存在不同程度的隐患。如果摩擦现象严重,不能尽快处理,可能存在摩擦性的异常影响。由于破损面的扩散和物质侵蚀后,对电力电缆本身容易造成腐蚀,如果系统存在故障或者崩溃等现象,直接对应用效果,产生影响。
对所扩增的绵羊5区域的测序结果显示,绵羊5区域由2 951个核苷酸序列构成(牛和猪分别为2 955、2 734个),G+C碱基对的比例为56.5% (牛和猪的分别为56.35%和58.7%),其中,富含G+C碱基对的片段位于−3 063/−2 755、−2 632/−2 393、−2 184/ −1 907、−1 753/−1 116和−264/−1(G+C碱基对分别占63.6%、60.4%、60.1%、60.0%和64.0%;牛的富含G+C碱基对的片段位于–2 763/–2 546;–2 457/–2 198、–1 645/–1 302、–435/–1 G+C碱基对占相应片段碱基对的比率分别为59.2%、60.0%、64.0%和65.3%)。表3结果显示,绵羊、牛和猪的CR1、CR2、CR3、CR4中G+C碱基对所占比例非常接近。
表3 绵羊、牛和猪各保守区域中G+C的含量及其所占的比例
3 结论与讨论
自Yamanaka等[6]利用Sox2、Oct4、Klf4和c–Myc因子诱导小鼠纤维细胞成为多能干细胞iPS以来,已采用相同或相近的方法相继用小鼠神经干细胞[7]、小鼠胰腺β细胞[8]和人皮肤成纤维细胞[9]等多种体细胞诱导获得iPS细胞。在诱导iPS过程中,作为不可或缺的诱导因子而备受关注。在研究基因表达和调控的过程中,通常会对基因的启动子序列进行克隆并进行活性检测[10],还会利用生物信息学手段进行序列比对、同源性分析和对序列在不同物种间的保守性进行分析[11]。目前,小鼠、人和猪等的基因已被成功克隆,并已利用其因子相继建立获得iPS的方法。根据蛋白序列同源性、外显子组成以及主要组织相容性复合物的研究结果,基因启动子在小鼠、人和牛这3种物种间具有高度保守性[3–5],但迄今尚少见到有关绵羊基因的相关报道。以往,在诱导绵羊体细胞为iPS的研究过程中主要是利用来源于其他物种的等诱导因子[12–13]。本研究中,通过PCR技术扩增获得了绵羊基因启动子序列,在此基础上与牛和猪的启动子序列进行了比较,其结果表明,绵羊和牛的启动子序列的同源性达92.46%。此外,绵羊、牛和猪启动子保守区域CR1、CR2、CR3和CR4在上游序列中近乎在相近的核苷酸位置上,且具有高度的同源性。上述结果显示,绵羊基因启动子与牛和猪具有核苷酸序列的保守性,这种特性可能是异源诱导因子可诱导绵羊体细胞为iPS的基础。
有关小鼠基因的转录调控序列中的启动子序列、增强元件和转录调控机制已比较清楚[1,2,14–19]。现有研究已证实,小鼠与人和牛基因上游序列转录起始位点的上游区域均存在1个GC框,可以与Sp1转录因子结合,以调节未分化细胞中基因转录起始,与GC框重叠的是1个与视黄酸反应元件RARE相似的位点,被称为HRE位点。HRE位点在视黄酸(RA)诱导的下调过程中起重要作用[20]。作为反式阻遏蛋白的孤儿核激素受体虽然能与启动子结合,但由于其表达过晚而未能参与到RA诱导基因的下调过程[15–16]。在基因上游区域还存在一些CCCACCC, GGGTGGG, CCCTCCC和GGGAGGG序列,对此统称为CCC(A/T)CCC位点,基因印记分析结果表明,这些位点对于基因转录调节具有重要作用[19]。本研究中,对所获得的绵羊启动子序列的分析结果显示,基因 5端上游序列中保守区域CR1在绵羊、牛和猪的中均对应于上游序列–130/–1的核苷酸位置,其中,Sp1/Sp3结合位点(5–GGGGGCGGGG–3)和与之重叠的HRE(5–GGGCCAGAGGTCAAGGCTA–3)在3个物种中具有100%的同源性,在CR1上有2处CCC(A/T)CCC序列定位;此外,5–GGGTGGG–3和5–GGGAGGG–3在绵羊、牛和猪中均为保守。上述结果表明,绵羊基因表达可能具有与小鼠、人、牛和猪等相似的调控机制。
已有大量研究证实,某些基因中特异核苷酸发生甲基化或去甲基化是调控基因表达的重要机制,在此过程中,甲基化变化主要在GC富含区的胞嘧啶(C)。据Imamura等[21]的研究表明,在内细胞团细胞发生分化的过程中,其细胞的启动子序列发生广泛的甲基化。另据Okita等[22]的研究表明,在体细胞重编程为iPS过程中,其启动子的GC富含区发生广泛的去甲基化。上述结果表明,启动子GC富含区的甲基化状态是细胞维持亚全能性或分化的重要标志。为了了解绵羊启动子序列中是否可能发生甲基化变化区域,本研究中对所获得的绵羊启动子序列进行分析,结果显示,绵羊5区域的核苷酸量、G+C碱基对比例、富含G+C碱基对片段的位置及其4个启动子保守区域CR中的G+C碱基对含量具有极高的保守性。上述结果表明,绵羊基因表达调控过程中启动子甲基化的变化模式可能与牛和猪等物种的相似。
参考文献:
[1] Okazawa H,Okamoto K,Ishino F,et al.Thegene,a gene for an embryonic transcription factor,is controlled by a retinoic acid repressible enhancer[J].EMBO J,1991,10(10):2997–3005.
[2] Yeom Y I,Fuhrmann G,Ovitt C E,et al.Germline regulatory element ofspecific for the totipotent cycle of embryonal cells[J].Development,1996,122(3):881–894.
[3] Takeda J,Seino S,Bell G I.Humangene family:cDNA sequences,alternative splicing,gene organization,chromosomal location,and expression at low levels in adult tissues[J].Nucl Acids Res,1992,20(17):4613–4620.DOI:10.1093/nar/20.17.4613.
[4] Abdel-Rahman B,Fiddler M,Rappolee D,et al. Expression of transcription regulating genes in human preimplantation embryos[J].Hum Reprod,1995,10(10):2787–2792.DOI:10.1093/molehr/1.8.401.
[5] van Eijk M J,van Rooijen M A,Modina S,et al. Molecular cloning,genetic mapping,and developmental expression of bovine POU5F1[J].Biol Reprod,1999,60(5):1093–1103.DOI:10.1095/biolreprod60.5.1093.
[6] Takahashi K,Yamanaka S.Induction of pluripotent stem cells from mouse embryonic and adult fibroblast cultures by defined factors[J].Cell,2006,126(4):663–676. DOI:10.1016/j.cell.2006.07.024.
[7] Shi Y,Do J T,Desponts C,et al.A combined chemical and genetic approach for the generation of induced pluripotent stem cells[J].Cell Stem Cell,2008,2(6):525–528.DOI:10.1016/j.stem.2008.05.011.
[8] Lewitzky M,Yamanaka S.Reprogramming somatic cells towards pluripotency by defined factors[J].Curr Opin Biotechnol,2007,18(5):467–473.DOI:10.1016/j.copbio. 2007.09.007.
[9] Takahashi K,Tanabe K,Ohnuki M,et al.Induction of Pluripotent Stem Cells from Adult Human Fibroblasts by Defined Factors[J].Cell,2007,131(5):861–872.DOI:10. 1016/j.cell.2007.11.019.
[10] 黄真池,卢向阳,曾富华,等.受病原物诱导的植物启动子PPPs在转基因辣椒中的活性[J].湖南农业大学学报(自然科学版),2008,34(3):270–273.
[11] 张伟,方梅霞,聂庆华,等.猪TDRP1基因的电子克隆及生物信息学分析[J].湖南农业大学学报(自然科学版),2010,36(6):672–677.DOI:10.3724/SP.J.1238.2010. 00672.
[12] Bao L,He L,Chen J,et al.Reprogramming of ovine adult fibroblasts to pluripotency via drug-inducible expression of defined factors[J].Cell Res,2011,21(4):600–608.DOI:10.1038/cr.2011.6.
[13] Li Y,Cang M,Lee AS,et al.Reprogramming of sheep fibroblasts into pluripotency under a drug-inducible expression of mouse-derived defined factors[J].PLoS ONE,2011,6(1):e15947.DOI:10.1371/journal.pone. 0015947.
[14] Pikarsky E,Sharir H,Ben-Shushan E,et al.Retinoic acid represses–gene expression through several retinoic acid-responsive elements located in the promoter- enhancer region[J].Mol Cell Biol,1994,14(2):1026–1038.DOI:10.1128/mcb.14.2.1026.
[15] Schoorlemmer J,van Puijenbroek A,van Den Eijnden M,et al.Characterization of a negative retinoic acid response element in the murinepromoter[J].Mol Cell Biol,1994,14(2):1122–1136.DOI:10.1128/mcb. 14.2.1122.
[16] Sylvester I,Schöler H R.Regulation of thegene by nuclear receptors[J].Nucleic Acids Res,1994,22(6):901–911.DOI:10.1093/nar/22.6.901.
[17] Ben–Shushan E,Sharir H,Pikarsky E,et al.A dynamic balance between ARP–1/COUP–TFII,EAR–3/COUP– TFI,and retinoic acid receptor:retinoid X receptor heterodimers regulates–expression in embryonal carcinoma cells[J].Mol Cell Biol,1995,15(2):1034– 1048.DOI:10.1128/mcb.15.2.1034.
[18] Barnea E,Bergman Y.Synergy of SF1 and RAR in activation of–promoter[J].J Biol Chem,2000,275(9):6608–6619.DOI:10.1074/jbc.275.9.6608.
[19] Minucci S,Botquin V,Yeom Y I,et al.Retinoic acid-mediated down-regulation of Oct3/4 coincides with the loss of promoter occupancy in vivo[J].EMBO J,1996,15(4):888–899.
[20] Imamura M,Miura K,Iwabuchi K,et al.Transcriptional repression and DNA hypermethylation of a small set of ES cell marker genes in male germline stem cells[J].BMC Dev Biol,2006,6:34.DOI:10.1186/1471– 213X–6–34.
[21] Okita K,Ichisaka T,Yamanaka S.Generation of germline-competent induced pluripotent stem cells[J]. Nature,2007,448(7151):313–317.DOI:10.1038/nature 05934.
Cloning promoterfrom sheep and its sequence comparison with bovine and porcine upstream promoter sequences
Li Hao, Guo Hu, Wang Chunsheng, Song Hongwei, Piao Shanhua, An Tiezhu*
(College of Life Science, Northeast Forestry University, Harbin, Heilongjiang 150040, China)
To explore the structural characteristics of gene promoterwere cloned using PCR, and the comparative alignment analysis among sheep, cow and pig was conducted as well. The results showed that the promoter was 2 951 bp in length. There were four conserved regions (CR 1 to 4) in theupstream regulatory sequence of genesheep, cow and pig, and the four regions presented in high homology among the three species. A putative Sp1/Sp3 binding site and the overlapping hormone responsive element (HRE) in CR 1 region were identical to each other among the three species, moreover, there were rich in GC and a high number of CCC (A/T) CCC motifs in the upstream regions. The research could provide reference for futher understanding the geneand facilitate the relevant research on sheep.
sheep; cow; pig; gene promoter; sequence analysis
S826.1
A
1007-1032(2016)05-0511-07
2015–12–09
2016–04–07
中央高校基本科研业务费专项C类项目(2572016CA10);黑龙江省自然科学基金项目(C2016012)
李昊(1985—),男,辽宁锦州人,博士研究生,主要从事动物转基因研究,jayhaoli01@163.com;*通信作者,安铁洙,教授,博士,主要从事动物转基因技术研究,antiezhu@tom.com
投稿网址:http://xb.ijournal.cn
责任编辑:王赛群
英文编辑:王库