APP下载

昆虫JHE 基因结构及与甲基化相关的CpG O/E 值分析

2014-12-16周晓穗陈佳林梁士可李广宏王方海

环境昆虫学报 2014年5期
关键词:内含子果蝇外显子

张 梅,周晓穗,陈佳林,梁士可,李广宏,王方海

(中山大学生命科学学院昆虫学研究所/有害生物控制与资源利用国家重点实验室,广州 510275)

昆虫保幼激素酯酶(juvenile hormone esterase,JHE)是由昆虫脂肪体和上皮细胞合成和分泌(杨文佳等,2010)。在昆虫整个世代发育过程中,JHE 基因因受到许多因子的调控而能在不同龄期的不同组织中适时地表达,表现出很强的时间特异性,对调节昆虫保幼激素滴度水平和控制昆虫生长发育过程起着非常重要的作用(马兰等,2012)。

表观遗传乃是基因表达的重要调控方式之一,而DNA 甲基化是表观遗传修饰的主要形式,在昆虫中业已证明普遍存在(Field,2004)。DNA 甲基化并没有改变基因序列,而是通过抑制某些基因的活性,从而调控基因的表达,对调节昆虫的某些生物学功能以及适应其生存环境有着重要作用。DNA 甲基化主要发生在CpG 位点的胞嘧啶上,形成5-甲基胞嘧啶,故基因组序列中的CpG 位点与DNA 甲基化存在着一定的关联,研究发现CpG 二核苷酸在特定长度基因序列中的实际出现值与预测期望值之间的比值(即CpG O/E 值)是衡量或预测基因中CpG 位点甲基化水平的重要参数(Glastad et al.,2011)。

DNA 甲基化不仅发生在基因的5'端启动子区域,同时可能发生在基因的外显子或内含子区域中(Huang et al.,2006)。目前已经克隆出多种昆虫的JHE 基因,但多数报道的是保幼激素酯酶蛋白质编码序列,对该基因的外显子和内含子等序列结构进行进一步分析的则很少。本研究在NCBI数据库中下载了已公布的4种昆虫的全基因组序列和完整的JHE 基因序列,通过序列比对分析确定各JHE 基因的外显子和内含子等结构区域,然后对各个区域的CpG 位点进行统计并计算出CpG O/E 值,分析这些区域可能的甲基化情况,为进一步明确JHE 基因的完整结构和今后进行其甲基化和基因表达调控方面的研究提供参考。

1 材料和方法

1.1 确定已获得全基因组数据和完整保幼激素酯酶序列的物种

通过从NCBI 数据库中查找,筛选目前已经在数据库中公布基因组数据的昆虫类物种,再从这些物种中筛选出已公布完整的JHE 基因序列的物种,发现主要有西方蜜蜂Apis mellifera、黄翅菜叶峰Athalia rosae、烟草天蛾Manduca sexta、家蚕Bombyx mori、黑腹果蝇Drosophila melanogaster、致倦库蚊Culex quinquefasciatus、赤拟谷盗Tribolium castaneum 等7个物种。由于烟草天蛾、黄翅菜叶峰等虫种虽然已经在NCBI 数据库中提供了基因组数据,但该数据库中未提供将序列与全基因组序列比对的功能,因此,在本次研究中选择了西方蜜蜂、黑腹果蝇、致倦库蚊和家蚕四种昆虫来进行随后的JHE 基因结构和CpG O/E 值研究和分析。

1.2 基因组中JHE 各个结构的定义及获取

1.2.1 JHE 基因翻译起始位点的确定

从NCBI 数据库下载西方蜜蜂、黑腹果蝇、致倦库蚊和家蚕四种昆虫的JHE 序列以及全基因组序列。运用DNASTAR 软件查找黑腹果蝇、致倦库蚊和家蚕的JHE 基因序列中的开放阅读框并翻译成氨基酸序列,再将此序列与NCBI 中已公布的相应JHE 基因蛋白质序列比对,如果高度相似就可确定其翻译起始位点。而西方蜜蜂JHE 基因翻译起始位点的确定主要是参考已有的文献报道(Mackert et al.,2008)。

1.2.2 JHE 基因翻译起始前调控区域的确定

在本次研究中,使用三种软件预测JHE 基因的启动子序列,得到的结果不同,这三个软件分别是PromoterScan(http:∥www-bimas.cit.nih.gov/molbio/proscan/)、Neural Network Promoter Prediction(http:∥www.fruitfly.org/seq_tools/promoter.html)、Promoser(http:∥biowulf.bu.edu/zlab/PromoSer/)。本次研究为了也能够对JHE基因的上游调控区域进行CpG 位点和CpG O/E 值的统计分析,我们将JHE 基因翻译起始位点上游的2000 bp 区域全部截下来进行详细分析,因为这段区域基本覆盖了包括启动子和增强子等各类调控素(Scherf et al.,2000;Zemach et al.,2010)。同时将2000 bp 区域具体划分为四段,每段长度为500 bp,以最接近翻译起始位点的那一段命名为R4,依次将前面三段命名为R3、R2、R1,R1 区域距离翻译起始位点最远。

1.2.3 JHE 基因外显子、内含子序列的获取

运用NCBI 的Spidey 在线软件将各JHE 基因与其相应的基因组序列作比对,发现JHE 基因编码序列在全基因组序列中被很多非编码序列隔开,从基因翻译起始位点开始被隔开的编码序列即为外显子,插入编码序列中与编码序列相邻的非编码序列则为内含子,所得序列均以fasta 格式保存。

1.3 CpG 位点的统计方法及CpG O/E 值的定义

DNA 甲基化通常发生在基因中胞嘧啶的第5位碳原子上,形成5-甲基胞嘧啶,即在基因组序列中CpG 位点的C 上,因此,基因组序列中CpG位点相关信息的获得对DNA 甲基化研究具有重要意义。在本次研究中,使用在线软件softberry-CpGFinder 对基因组中JHE 基因序列的CpG 位点进行统计分析,计算出CpG 位点数在特定长度的基因序列中所占的比率(PCpG)以及C、G 位点各占的比率(PC、PG)。CpG O/E 值为CpG 二核苷酸在特定长度基因序列中的实际出现值与预测期望值之间的比值,计算公式为CPG O/E=是衡量或预测基因中CpG 位点的甲基化水平的重要参数(Elango et al.,2009)。

2 结果与分析

2.1 目前已公布基因组序列的昆虫

通过在NCBI 数据库中查找,目前已公布基因组序列的昆虫共70 余种;其中双翅目Diptera 昆虫有40 余种,膜翅目Hymenoptera 17种,鳞翅目Lepidoptera 5种,半翅目Hemiptera 2种,鞘翅目Coleoptera 2种,捻翅目Strepsiptera 2种,虱目Anoplura 1种,蜻蜓目Odonata 1种;双翅目中果蝇科和蚊科居多,有少数的毛蠓科,膜翅目中蚁科居多。而已公布完整的JHE 基因序列的物种也有7个。但在NCBI 数据库中能够提供JHE 基因序列与全基因组序列比对功能的则只有4个物种,分别为西方蜜蜂、黑腹果蝇、致倦库蚊和家蚕。

2.2 种昆虫JHE 基因大小及结构

4种昆虫JHE 基因在GenBank 的具体登记号和长度见表1,黑腹果蝇的序列长度为2326 bp,最短;家蚕的最长,达17998 bp;西方蜜蜂和致倦库蚊的序列长度则介于前2 者之间,分别为2805 bp、11048 bp。将这些昆虫的JHE 基因与其基因组序列比对后发现西方蜜蜂JHE 基因含有7个外显子和6个内含子,而其余三种昆虫的JHE基因均含有6个外显子和5个内含子,外显子的长度多数在150-400 bp 之间。西方蜜蜂和黑腹果蝇的JHE 基因内含子较短,多数短于100 bp,最长的也只有171 bp;家蚕JHE 基因的内含子长度较长,最短的也有436 bp,而最长的则达12050 bp;致倦库蚊的JHE 基因内含子长度不均,差异较大,最短的仅53 bp,最长的为7616 bp。

表1 四种昆虫JHE 基因及其外显子和内含子的结构组成Table 1 JHE genes from four species of insects and their composition of exons and introns

2.3 JHE 基因各个区域CpG 位点分析

通过对四种昆虫的JHE 基因序列各个区域进行统计分析得知,发现西方蜜蜂的第1、2、5、6内含子和致倦库蚊的第3 内含子区域没有CpG 位点(表2)。总体来看,JHE 基因上游2000 bp 区域(R1-R4)的CpG 位点数在四种昆虫中显示出一定的差异:西方蜜蜂的最少,总数为25;黑腹果蝇的最多,总数达94;致倦库蚊和家蚕的则介于两者之间,总数分别为61、87。此外,在西方蜜蜂和黑腹果蝇这两种昆虫中,JHE 基因的外显子区域所具有的CpG 位点数明显多于内含子区域所具有的,如蜜蜂7个外显子区域所具有的CpG位点总数为48,而6个内含子区域所具有的CpG位点总数只有3。

表2 JHE 基因各个区域CpG 位点数量Table 2 The quantity of CpG sites in JHE gene regions

2.4 JHE 基因各个区域CpG O/E 值分析

JHE 基因各个区域CpG O/E 值见表3,除了5个内含子区域因无CpG 位点而导致CpG O/E 值为零外,其余区域的CpG O/E 值最低为黑腹果蝇第一外显子的0.3849,最高为家蚕第一外显子的2.8571,无明显规律可言。但根据JHE 基因各个区域CpG O/E 值的平均值来看,则有一定的规律,见图1,第1 到第4 外显子的CpG O/E 平均值较低,只有0.8 左右,明显低于其它各个区域的CpG O/E 平均值。

图1 四种昆虫JHE 基因各区域CpG O/E 的平均值Fig.1 The average values of CpG O/E in every region of four insects JHE genes

表3 JHE 基因CpG O/E 值Table 3 The CpG O/E value of JHE gene

3 结论与讨论

对不同昆虫的JHE 基因结构分析表明,JHE基因均由较多的外显子和内含子相间组成,由于含有的内含子序列长度差异较大,致使不同昆虫JHE 基因的序列长度差异也较大,如黑腹果蝇的内含子较短,最长的内含子也仅有171 bp,故其JHE 基因较短,序列长度为2326 bp;而家蚕的内含子则较长,其中有一个内含子达到了12050 bp,导致其JHE 基因也相对较长,序列总长度达到了17998 bp(见表1)。

由于JHE 基因产物主要调控生长发育过程中起重要作用的保幼激素的滴度水平,故其产物表达水平并不是固定不变的,而是随着昆虫发育周期的变化而变化的,因此这就需要JHE 基因本身具有较高的表达调控能力,我们推测昆虫JHE 基因含有较多的内含子,可能与其转录表达调控有关,目前已有大量文献报道真核mRNA 内含子在真核生物基因表达调控中起着重要的作用(Wang et al.,2008)。

CpG O/E 值,即CpG 的实际值与期望值之间的比值,是预测基因组中CpG 位点甲基化水平的重要参数,如果CpG O/E 值较大,表明该区域的甲基化水平较低;CpG O/E 值较小,则表明该区域的甲基化水平较高(Elango et al.,2009;Glastad et al.,2011)。本次研究发现四种昆虫的JHE 基因各个区域的CpG O/E 平均值的大小依次为:基因上游2000 bp 区>内含子区>外显子区,R1-R4(涵盖基因上游2000bp 区)的CpG O/E平均值均大于1.0,而第1 到第4 外显子的CpG O/E 平均值均只有0.8 左右(图1)。这表明在昆虫JHE 基因中,若有CpG 甲基化位点存在,应主要发生在第1 到第4 外显子区域,而不是基因上游启动子区域或间隔外显子的内含子区域。这与Glastad 等人在有关昆虫甲基化综述中所提到的观念一致,即昆虫甲基化主要发生在基因主体上(Glastad et al.,2011)。同时通过全基因组测序,在西方蜜蜂和家蚕中,也已发现CpG 位点甲基化主要发生在各个基因主体的外显子中(Elango et al.,2009;Xiang et al.,2010)。

References)

Elango N,Hunt BG,Goodisman MA,et al.DNA methylation is widespread and associated with differential gene expression in castes of the honeybee,Apis mellifera[J].Proceedings of the National Academy of Sciences of the United States of America,2009,106(27):11206-11211.

Field LM.DNA methylation in insects[J].Insect Molecular Biology,2004,13(2):109-115.

Glastad KM,Hunt BG,Yi SV,et al.DNA methylation in insects:on the brink of the epigenomicera[J].Insect Molecular Biology,2011,20(5):553-565.

Huang Z,WenY,Shandilya R,et al.High throughput detection of M6P/IGF2R intronic hypermethylation and LOH in ovarian cancer[J].Nucleic Acids Research,2006,34(2):555-563.

Ma L,Liu N,Xin C.Research advances of biochemical and structural properties of juvenile hormone esterase[J].Shaanxi Journal of Agricultural Sciences,2012,4:108-112.[马兰,刘念,信超.保幼激素酯酶的生化及结构特性研究进展[J].陕西农业科学,2012,4:108-112]

Mackert A,do Nascimento AM,Bitondi MMG,et al.Identification of a juvenile hormone esterase-like gene in the honey bee,Apis mellifera L.—Expression analysis and functional assays[J].Comparative Biochemistry and Physiology,Part B,2008,150(1):33-44.

Scherf M,Klingenhoff A,Werner T.Highly specific localization of promoter regions in large genomic sequences by promoter inspector:a novel context analysis approach[J].Journal of Molecular Biology,2000,297(3):599-606.

Wang YB,Lang ZH,Huang DF.Effects of pre-mRNA introns on regulation of eukaryotic gene expression[J].Biotechnology Bulletin,2008,4:1-5.[王悦冰,郎志宏,黄大昉.内含子对真核基因表达调控的影响[J].生物技术通报,2008,4:1-5]

Xiang H,Zhu JD,Chen Q,et al.Single base-resolution methylome of the silkworm reveals a sparse epigenomic map[J].Nature Biotechnology,2010,28:516-520.

Yang WJ,Shen GM,Dou W,et al.Research progress of insect juvenile hormone esterase.In:Public Plant Protection and Green Prevention and Control-China Society of Plant Protection Annual Conference 2010 Conference Proceedings[C].2010,364-369.[杨文佳,申光茂,豆威,等.昆虫保幼激素酯酶的研究进展.见:公共植保与绿色防控-中国植物保护学会2010年学术年会会议论文集[C].2010,364-369]

Zemach A,Mcdaniel IE,Silva P,et al.Genome-wide evolutionary analysis of eukaryotic DNA methylation[J].Science,2010,328:916-919.

猜你喜欢

内含子果蝇外显子
外显子跳跃模式中组蛋白修饰的组合模式分析
果蝇遇到危险时会心跳加速
2021年大樱桃园果蝇的发生与防控
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
外显子组测序助力产前诊断胎儿骨骼发育不良
小果蝇助力治疗孤独症
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
更 正
基于改进果蝇神经网络的短期风电功率预测
外显子组测序助力产前诊断胎儿骨骼发育不良