菜粉蝶osiris基因家族鉴定与发育动态
2018-01-04赵磊,夏昊,钱强,徐圆,李凯
赵 磊,夏 昊,钱 强,徐 圆,李 凯
(东华大学化学化工与生物工程学院,上海 201620)
菜粉蝶osiris基因家族鉴定与发育动态
赵 磊,夏 昊,钱 强,徐 圆,李 凯*
(东华大学化学化工与生物工程学院,上海 201620)
osiris基因家族是昆虫特异性基因,迄今尚未在昆虫纲以外的物种中发现同源基因。本研究利用菜粉蝶转录组数据,鉴定了菜粉蝶16个osiris基因家族成员,分属11个亚家族。通过与菜粉蝶基因组比对,发现菜粉蝶osiris基因均为断裂基因,外显子数量为3-15个;通过结构域分析,发现菜粉蝶Osiris完整编码蛋白含有信号肽和一个未知功能结构域DUF1676,且多数Osiris蛋白含跨膜结构域。系统发育分析表明,osiris基因家族成员与其他昆虫种类相应成员更似直系同源,而非种内基因扩张,再次验证了osiris基因是在昆虫物种分化之前就已形成的多基因家族。发育转录组基因表达分析表明,osiris家族不同成员表达量在不同发育阶段趋势几乎完全一致,多在菜粉蝶1龄幼虫和5龄幼虫高表达,卵期、蛹期与成虫期低表达,预示着osiris基因家族不同成员转录调控机制的相似性与发育的相关性。
osiris基因家族;菜粉蝶;蛋白结构域;系统进化;发育
1972年,Sandler等(1972)在对黑腹果蝇Drosophilamelanogaster染色体片段非整倍体的研究中发现,三号染色体存在导致单倍体或三倍体致死的区段,并将其命名为三倍体致死基因座(Tpl)。2003年,Dorer等(2003)在Tpl区域发现了一个含有20个成员的基因家族,并对其命名为osiris家族。随着昆虫基因组测序的进展,陆续在柑橘凤蝶Papilioxuthus(Futahashietal., 2012),玉带凤蝶Papiliopolytes(Futahashietal., 2012),大红斑蝶Danausplexippus(Zhanetal., 2011)、家蚕Bombyxmori(Zhaoetal., 2010)、黑腹果蝇(Doreretal., 2003)、冬尺蛾Operophterabrumata(Derksetal., 2015),蝇蛹金小蜂Nasoniavitripennis(Werrenetal., 2010)等多个昆虫中发现osiris基因。在功能上,目前已知osiris基因家族与果蝇对辛酸的抗性(López, 2015),意大利蜜蜂Apismellifera的细菌免疫(Cornmanetal., 2013)、白蚁Termite的发育(Terraponetal., 2014)、家蚕性别与组织发育(Ganetal., 2012)等密切相关。
作为昆虫特异性基因,osiris基因家族成员表现出两个明显的特征:保守性与共线性。半变态与全变态昆虫中osiris基因都非常保守,均含信号肽与DUF1676结构域。如比较果蝇属中D.melanogaster与D.sechellia的Osiris蛋白,发现Osiris 6/7的编码区完全一致,Osiris 8中只有2个氨基酸的变化(López, 2015)。从osiris基因家族在染色体上的共线性来看,该家族所在位置是果蝇中最大的共线性区段。Shah等(2012)认为,在昆虫和其他节肢动物在进化上分离以后、昆虫种类分化之前,osiris基因家族在短时间内迅速的复制与功能化,osiris基因家族的序列和共线性应该在进化中受到强烈选择、并保留到现在。
本文利用菜粉蝶发育转录组数据,比对并鉴定16个菜粉蝶Osiris蛋白,描述了菜粉蝶Osiris蛋白家族的基本特征,重建昆虫Osiris蛋白的系统发育树,并对osiris基因在菜粉蝶不同生长发育阶段的表达模式作初步分析,为今后研究菜粉蝶osiris基因的生物学功能提供参考。
1 材料与方法
1.1 菜粉蝶转录组与基因组数据
菜粉蝶卵、1龄幼虫、3龄幼虫、5龄幼虫、蛹与成虫6个不同生长时期的转录组数据(Qietal., 2016)与成虫基因组数据为本实验室前期拼接而成。
1.2 菜粉蝶Osiris家族成员发现
在NCBI网站(http://www.ncbi.nlm.nih. gov/)上下载目前已确定的昆虫的Osiris蛋白序列,使用BLAST(Mount, 2007)程序将菜粉蝶的转录组序列与上述已知Osiris蛋白序列进行比对,取期望值E-value<1e-5,取最佳匹配结果并根据其序列为菜粉蝶的Osiris蛋白命名。
1.3 菜粉蝶Osiris家族结构域分析
用Transcode(Haasetal., 2013)软件预测编码osiris基因的ORF并翻译成氨基酸序列。用SMART在线软件(http://smart.embl-heidelberg.de/)进行信号肽与结构域预测。将osiris基因cDNA序列使用本地化BLAST的方法,将编码Osiris的mRNA比对到菜粉蝶基因组上,分析其外显子、内含子特征。
1.4 昆虫Osiris家族进化分析
Osiris蛋白使用clustalX软件(Larkinetal.,2007)进行多序列比对分析,用MEGA 6.0(Tamuraetal., 2013)采用Neighbor-joining(NJ)法进行系统进化树重构,Bootstrap重复设置为500。
1.5 菜粉蝶osiris家族RNA-seq表达量分析
osiris家族基因在菜粉蝶卵、1龄幼虫、3龄幼虫、5龄幼虫、蛹、成虫6个不同生长时期的表达量,利用Trinity(Haasetal., 2013)软件调用RSEM(Lietal., 2011)计算出对应的reads数目,然后再调用edgeR(Daietal., 2014)软件对其进行标准化,最后得到osiris基因在不同样本中的表达量。
2 结果与分析
2.1 菜粉蝶的Osiris蛋白家族
将菜粉蝶cDNA和已知Osiris蛋白序列比对,得到了16个菜粉蝶osiris基因家族成员。其中12个菜粉蝶osiris基因家族成员比对到鳞翅目的同源基因,另外4个菜粉蝶osiris家族基因比对到黑腹果蝇同源基因(表1)。在16条osiris基因序列中,ORF最短的编码160个氨基酸,ORF最长的编码613个氨基酸。通过对BLAST比对到菜粉蝶基因组上的位置,得到菜粉蝶osiris基因家族成员的外显子分布结构特征,发现菜粉蝶osiris基因的外显子数目至少为3个,其中外显子数目最多的是osiris17,含有15个外显子。分析内含子剪切位点,发现全部符合gt-ag规则。
表1 菜粉蝶osiris基因基本属性
2.2 菜粉蝶Osiris蛋白结构域分析
信号肽、DUF1676结构域与跨膜结构域是昆虫Osiris蛋白的三大重要特征。菜粉蝶Osiris家族蛋白中有15个含有信号肽,仅Osiris 17不含信号肽,该特征与黑腹果蝇中的同源蛋白Osiris 17一致(图1)。15个Osiris蛋白含有DUF1676结构域,且该结构域在不同成员之间较保守(图2)。Osiris 22没有DUF1676结构域但它与黑腹果蝇同源,黑腹果蝇Osiris 22蛋白亦不含有DUF1676结构域,但含有信号肽和两个跨膜结构域(Douglasetal., 2003)。13个Osiris蛋白含有跨膜结构域,仅Osiris 2、Osiris 23与Osiris 24蛋白不含跨膜结构域。Osiris序列中含有的信号肽和跨膜结构域表明其为分泌蛋白或跨膜蛋白。在菜粉蝶Osiris 17中还含有一个DM4_12结构域,该结构域是在黑腹果蝇中首次发现(Lachaiseetal., 1988),大约含有115个氨基酸并且含有4个高度保守的半胱酸残基,其具体生物学功能尚未解析。
图1 蛋白结构域预测分析Fig.1 Analysis of protein structure domain
2.3 昆虫Osiris家族进化分析
通过NCBI数据库搜索,得到127条已确定的昆虫Osiris家族序列,其中鳞翅目昆虫包含59条,并利用蛋白质序列构建系统发生树(图2)。结果可看出,Osiris各个亚族在进化树分支上存在明显分歧,同一亚族的成员多成簇存在且以单系群为主,显示Osiris家族是在昆虫物种分化前形成的多基因家族。对Osiris家族种内和种间的序列进行多序列比对,计算Osiris家族在种内和种间的差异度,结果显示同一个Osiris家族序列在种间的保守性比不同的Osiris家族序列在种内的保守性强。
为进一步证实单个Osiris蛋白在昆虫种类间的分化,随机选取菜粉蝶和其他昆虫中的Osiris 7和Osiris 19序列构建系统进化树,结果证实了在不同的物种之间Osiris家族序列是高度保守的,且菜粉蝶和大红斑蝶及冬尺蛾的Osiris家族亲缘关系相对较近(图3)。
2.4 菜粉蝶osiris基因家族在其发育过程中的表达模式
菜粉蝶osiris家族成员基因在不同生长时期的表达量如图4所示。可以看出osiris基因不同发育阶段的表达模式趋向一致。如在卵期,3龄幼虫期和成虫期表达量都很低甚至不表达,峰值一般出现在1龄或5龄幼虫期。其中osiris9B、osiris20、osiris2、osiris19、osiris18和osiris9D在1龄和5龄幼虫期表达量都很高,osiris9F、osiris9A、osiris9E、osiris9C、osiris7、osiris17、osiris22和osiris24在5龄幼虫期表达量最高。osiris基因在菜粉蝶不同生长时期表达量变化的相似趋势,提示osiris基因家族不同成员转录调控机制的相似性且可能与发育相关的,值得进一步深入挖掘其机制。
图2 Osiris家族DUF1676结构域多序列比对分析Fig.2 Multiple sequence alignment analysis of DUF1676
图3 各个物种的Oisris家族的系统进化分析Fig.3 Phylogenetic analysis of Osiris gene family注:P.x,柑橘凤蝶;P.p,玉带凤蝶;P.r,菜粉蝶;D.p,大红斑蝶;B.m,家蚕;O.b,冬尺蛾;C.q,致倦库蚊;A.d,达氏按蚊;D.me, 黑腹果蝇;D.si,拟果蝇;N.v,蝇蛹金小蜂;L.n,黑褐毛山蚁;A.p,豌豆蚜。Note: P.x, Papilio xuthus; P.p, Papilio polytes; P.r, Pieris rapae Linne; Danaus plexippus (D.p), B.m, Bombyx mori; O.b, Operophtera brumata; C.q, Culex quinquefasciatus; A.d, Anopheles darling; D.me, Drosophila melanogaster; D.si, Drosophila simulans; N.v, Nasonia vitripennis; L.n, Lasius niger; A.p, Acyrthosiphon pisum.
图4 各昆虫之间Osiris 7和Osiris 19的系统进化分析Fig.4 Phylogenetic analysis of Osiris 7 and Osiris 19注:P. xuthus,柑橘凤蝶Papilio Xuthus;P. polytes,玉带凤蝶Papilio polytes;P. rapae,菜粉蝶Pieris rapae Linne;D. plexippus,大红斑蝶Danaus plexippus;B. mori,家蚕Bombyx mori;O. brumata,冬尺蛾Operophtera brumata;C. quinquefasciatus,致倦库蚊Culex quinquefasciatus;A. darling,达氏按蚊Anopheles darling;D. melanogaster,黑腹果蝇Drosophila melanogaster;D. simulans,拟果蝇Drosophila simulans;N. vitripennis,蝇蛹金小蜂Nasonia vitripennis; L. niger,黑褐毛山蚁Lasius niger;A. pisum,豌豆蚜Acyrthosiphon pisum。
图5 菜粉蝶osiris基因表达模式图Fig.5 Gene expression profiles of the osiris gene family in Pieris rapae注:egg,卵期;L1,1龄幼虫期first larval stages;L3,3龄幼虫期third larval stages;L5,5龄幼虫期fifth larval stages;pupa,蛹期;adult,成虫期。
3 结论与讨论
osiris基因簇是昆虫最大的保守性基因家族。通过对菜粉蝶转录组和基因组的研究发现菜粉蝶中含有osiris家族基因16个。通过对其结构域的研究发现菜粉蝶Osiris蛋白家族中除Osiris 22之外都含有DUF1676结构域,有趣的是在最早发现该基因家族成簇存在的黑腹果蝇中,Osiris 22同样也不含有DUF1676结构域而其余Osiris蛋白均含有该结构域。DUF1676结构域在Osiris家族中的普遍存在可以预测其可能在Osiris家族中起着重要的作用,但其具体功能目前仍然未知(Doreretal., 2003)。在对黑腹果蝇的研究当中显示,黑腹果蝇的20条osiris基因均位于3号染色体上(Doreretal., 2003),对于其在菜粉蝶染色体中是否也具有类似的分布特征仍需进一步研究。
系统进化树重构显示,菜粉蝶Osiris蛋白在进化上与鳞翅目昆虫同源蛋白亲缘关系接近,且昆虫Osiris蛋白各亚家族成员在进化分支上的成簇存在也表明Osiris蛋白进化上的保守性。osiris家族基因如此保守,其中序列的同义突变率显著高于无义突变率(Doreretal., 2003),显示出强烈的功能选择与重要性。从昆虫的Osiris家族的系统进化分析可以看出,Osiris家族在不同物种的直系同源关系比较明显,因此可以推测出其是在昆虫物种分化之前就已经形成的多基因家族。在比较黑腹果蝇与冈比亚按蚊的Osiris蛋白同源性时,也未发现存在横向同源基因(Doreretal., 2003)。此外,果蝇Osiris家族在序列上和染色体分布上都存在明显的保守性(Doreretal., 2003),但由于目前菜粉蝶基因组研究还处于初级阶段,基因组拼接出的序列还不够长,因此不能得到Osiris家族在菜粉蝶染色体分布上的保守性,其在染色体上的位置信息还需进一步研究与发现。
除了早期的剂量敏感效应外,目前已发现与抗性(López., 2015),免疫(Cornmanetal., 2013)、白蚁发育(Terraponetal., 2014)或性别(Ganetal., 2012)等相关。如果蝇中的osiris基因第6/7/8外显子被敲除后,果蝇对辛酸的敏感度增加。对脂肪体和唾液腺进行组织特异性基因敲除后,反而会增加对辛酸的抗性(López, 2015)。而蜜蜂幼虫被腐臭病感染后,17个osiris基因均上调,其中11个基因差异显著(Cornmanetal., 2013)。在菜粉蝶中,通过对其不同生长时期的RNA-seq数据分析发现,菜粉蝶osiris基因在不同的生长时期的表达量发生了明显的变化,其中osiris基因上调主要发生在1龄和5龄幼虫时期,在卵期,3龄幼虫期,蛹期和成虫期表达量较低,预示着osiris基因家族可能在菜粉蝶不同生长发育时期发挥着不同的作用。类似的上调表达聚集在某些发育阶段的现象,也存在与白蚁发育中(Terraponetal., 2014),但具体功能均需进一步实验验证。此外,不同的osiris基因表达量随发育变化趋势相对一致,预测菜粉蝶osiris基因受相似的调控机制调节。随着基因组信息的进一步完善,调控元件的分析有助于证实这一猜测。
通过对菜粉蝶osiris基因家族的研究,可以充实对昆虫osiris家族的认识,为今后人们研究和发现osiris家族的功能提供了参考。osiris家族可能作为新型生物杀虫剂的良好靶位点,通过对菜粉蝶osiris家族的研究,对未来菜青虫以及其他害虫的生物防治、农药开发与综合防治提供了新的思路,其实践意义重大。
)
Cornman RS, Lopez D, Evans JD. Transcriptional response of honey bee larvae infected with the bacterial pathogenPaenibacilluslarvae [J].PLoSONE, 2013, 8 (6): e65424.
Dai ZY, Sheridan JM, Gearing LJ,etal. edgeR: A versatile tool for the analysis of shRNA-seq and CRISPR-Cas9 genetic screens [J].F1000Research, 2014, 3: 95.
Derks MF, Smit S, Salis L,etal. The genome of winter moth (Operophterabrumata) provides a genomic perspective on sexual dimorphism and phenology [J].GenomeBiologyandEvolution, 2015, 7 (8): 2321-2332.
Dorer DR, Rudnick JA, Moriyama EN,etal. A Family of genes clustered at the Triplo-lethal Locus ofDrosophilamelanogasterhas an unusual evolutionary history and significant synteny withAnophelesgambiae[J].Genetics, 2003, 165 (2): 613-621.
Futahashi R, Shirataki H, Narita T,etal. Comprehensive microarray-based analysis for stage-specific larval camouflage pattern-associated genes in the swallowtail butterfly,Papilioxuthus[J].BMCBiology, 2012, 10: 46.
Gan LP, Wang Y, Xi J,etal. Long SAGE analysis of genes differentially expressed in the midgut and silk gland between the sexes of the silkwormBombyxmori[J].AfricanJournalofBiotechnology, 2012, 11 (49).
Haas BJ, Papanicolaou A, Yassour M,etal. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis [J].NatureProtocols, 2013, 8 (8):1494-1512.
Lachaise D, Cariou ML, David JR,etal. Historical biogeography of theDrosophilamelanogasterspecies subgroup [J].EvolutionaryBiology, 1988, 22: 159-225.
Larkin MA, Blackshields G, Brown NP,etal. Clustal W and Clustal X version 2.0 [J].Bioinformatics, 2007, 23 (21): 2947-2948.
Li B, Dewey CN. RSEM: Accurate transcript quantification from RNA-Seq data with or without a reference genome [J].BMCBioinformatics, 2011, 12: 323.
López JMA, Lanno SM, Auerbach JM,etal. Genetic basis of octanoic acid resistance inDrosophilasechellia: Functional analysis of a fine-mapped region[J].MolecularEcology,2017,26(4):1148-1160.
Mount DW. Using the basic local alignment search tool (BLAST) [J].ColdSpringHarborProtocols, 2007, 14.
Qi LX, Fang Q, Zhao L,etal. De novo assembly and developmental transcriptome analysis of the small white butterflyPierisrapae[J].PLoSONE, 2016, 11 (7).
Sandler D. Segmental aneuploidy and the genetic gross structure of theDrosophilagenome [J].Genetics, 1972, 71 (1): 157-184.
Shah N, Dorer DR, Moriyama EN,etal. Evolution of a large, conserved, and syntenic gene family in insects[J].G3 (Bethesda), 2012, 2 (2): 313-319.
Tamura K, Stecher G, Peterson D,etal. MEGA6: Molecular evolutionary genetics analysis version 6.0 [J].MolecularBiologyandEvolution, 2013, 30 (12): 2725-2729.
Terrapon N, Li C, Robertson HM,etal. Molecular traces of alternative social organization in a termite genome [J].Nat.Communications, 2014, 5: 3636.
Werren JH, Richards S, Desjardins CA,etal. Functional and evolutionary insights from the genomes of three parasitoidNasoniaspecies [J].Science, 2010, 327 (5963): 343-348.
Zhan S, Merlin C, Boore JL,etal. The monarch butterfly genome yields insights into long-distance migration [J].Cell, 2011, 147 (5): 1171-1185.
Zhao P, Wang GH, Dong ZM,etal. Genome-wide identification and expression analysis of serine proteases and homologs in the silkwormBombyxmori[J].BMCGenomics, 2010, 11: 405.
IdentificationanddevelopmentalpatternofosirisgenefamilyinthecabbagebutterflyPierisrapae
ZHAO Lei, XIA Hao, QIAN Qiang, XU Yuan, LI Kai*
(College of Chemistry, Chemical Engineering & Biotechnology, Donghua University, Shanghai 201620, China)
osirisgene family are insect-specific genes, whose homologous genes are unavailable in any other species. In current study, 16osirisgenes were identified belong to 11 sub-families based on the developmental transcriptome ofPierisrapae. All these genes were found to be split genes with 3 to 15 exons by compared with theP.rapaegenome. Structural domain analysis revealed that each Osiris protein contained one signal peptide and one structure domain (DUF1676), while most of them have a trans-membrane domain. Phylogenetic analysis indicated thatosirisgene had been formed before insect speciation. Analysis of different developmental stage ofP.rapaetranscriptomes showed thatosirisgene members had similar expression pattern throughout the entire life-stage (high expression in the first and fifth larval stages and low expression in other growth stages). These results indicated that different members ofosirisgene family may be involved in similar mechanism of transcription regulation and related with development.
osirisgene family; protein structure domain; phylogenetic; development
赵磊,夏昊,钱强,等.菜粉蝶osiris基因家族鉴定与发育动态[J].环境昆虫学报,2017,39(6):1319-1325.
Q963;S433.4
A
1674-0858(2017)06-1319-07
国家自然科学基金(31171199);东华大学“励志计划”(B201308)
赵磊,男,1991年生,山东人,硕士,研究方向为昆虫发育与免疫,E-mail: zhaolei19911010@163.com
*通讯作者Author for correspondence, E-mail: likai@dhu.edu.cn
Received: 2016-09-06; 接受日期Accepted: 2016-11-05