菜粉蝶气味结合蛋白和化学感受蛋白生物信息学分析
2019-01-24朱宇,刘洋
朱 宇,刘 洋
(温州科技职业学院,浙江 温州 325006)
昆虫的气味识别系统在昆虫的取食、交配、生殖、躲避天敌等行为过程中都发挥着重要的作用。对于昆虫来说,气味结合蛋白(odorant-binding proteins,OBPs)和化学感受蛋白(chemosensory proteins,CSPs)大量存在于化学感器的淋巴液中,它们被认为是化学感受过程中信息素和气味的载体[1]。在气味识别的过程中,外界环境中的化学信号(信息素、气味等)与气味结合蛋白或化学感受蛋白相结合形成复合物,然后这些化学信号被转运和释放到突触膜,最后激活特异的气味受体[2]。气味受体对化学信号进行识别后,会将化学信号转变为动作电位,传递到昆虫的中枢神经系统,引发相应的行为反应[2-5]。气味结合蛋白和化学感受蛋白通常存在于昆虫的触角、口器等感觉器官中[6]。然而,在昆虫的其他部位,也发现了这些蛋白的存在,说明除了检测和传递化学刺激外,这两种气味结合蛋白还有一些其他的功能[6-11]。
OBPs通常由120~150个氨基酸组成,在N端有信号肽,是一类水溶性的球形蛋白,在无脊椎动物和脊椎动物中都存在,但昆虫的OBPs与脊椎动物的OBPs序列完全不同源[12]。依据蛋白序列的特征,昆虫的OBPs被分为4类,分别是Classical OBPs、Plus-C OBPs、Minus-C OBPs和Atypical OBPs[13-15]。Classic OBPs蛋白序列中包含一个由6个半胱氨酸组成的模式识别序列,这6个半胱氨酸能形成3对二硫键[16]。OBPs的第二大类为Plus-C OBPs,大多数都是在双翅目昆虫中被鉴定出,与Classical OBPs相比,Plus-C OBPs的模式识别序列中一般有8个半胱氨酸,能形成4对二硫键[13]。Minus-C OBPs从Classic OBPs演化而来,缺少C2-C5这对二硫键[17]。Atypical OBPs主要在吸血昆虫中被鉴定出,它的模式识别序列一般含有9~10个半胱氨酸[15]。昆虫CSPs的蛋白序列非常保守,典型的CSPs序列有3个共同特征:一般由100~120个氨基酸组成;在N端有一个信号肽;蛋白模式识别序列中包含有4个半胱氨酸[18]。
菜粉蝶属鳞翅目粉蝶科,是世界范围内为害严重的十字花科蔬菜害虫[19]。目前,菜粉蝶的防治方法以化学防治为主[20],化学防治的长期使用会导致菜粉蝶抗药性的产生以及农药残留等问题。因此,急需开发出绿色可持续的方法来防治菜粉蝶,如利用性信息素或气味诱集等。本文通过生物信息学方法在菜粉蝶基因组中找出了24个OBPs和38个CSPs基因序列。根据多序列比对、系统进化树构建、序列模式识别等方法对鉴定的OBPs和CSPs基因进行验证和亚型分类。通过对菜粉蝶基因组中OBPs和CSPs基因的查找鉴定,丰富了昆虫OBPs和CSPs基因数据库,也为菜粉蝶气味识别和化学感受相关实验和应用提供参考。
1 材料与方法
1.1 菜粉蝶OBPs和CSPs基因序列获取
在NCBI的BioProject数据库 (https://www.ncbi.nlm.nih.gov/bioproject/397594)中下载得到菜粉蝶基因组数据库。从NCBI数据库中获得鳞翅目和双翅目的OBPs和CSPs蛋白序列318条作为查询序列,对菜粉蝶基因组数据库进行本地BLAST(e值为10-5)搜索,得到推测的OBPs和CSPs蛋白序列。然后,通过SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)来预测OBPs和CSPs蛋白N端是否含有信号肽[21]。通过Hmmer(https://www.ebi.ac.uk/Tools/hmmer/)来预测OBPs和CSPs基因所属的蛋白家族,筛选出真正的OBPs和CSPs蛋白序列[22]。
1.2 保守序列分析
利用在线网站ScanProsite(https://prosite.expasy.org/scanprosite/)对OBPs和CSPs蛋白序列进行模式识别分析[23]。
1.3 多序列比对和系统进化树构建
利用Kyoto University Bioinformatics Center在线程序clustalw(http://www.genome.jp/tools-bin/clustalw)对蛋白序列进行多序列比对分析,之后利用在线程序ESPript3.0(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)绘制多序列比对图[24-25]。使用MEGA5.10软件中的邻位相邻(neighbor-joining)算法构建系统进化树[26]。具体设置为:程序重复次数为1 000,替换方法Jones-Taylor-Thornton (JTT) model,空缺数据的处理方法为95%部分删除,其他参数选择默认设置[26]。
2 结果与分析
2.1 菜粉蝶OBPs和CSPs基因的鉴定
通过对菜粉蝶基因组数据库的本地BLAST搜索和Hmmer在线蛋白家族预测软件分析,我们得到了24个OBPs基因蛋白序列(表1),我们对这24个蛋白依次命名为PrOBP1-PrOBP24。除PrOBP18缺失N端外,其余OBPs都为全长。PrOBPs的氨基酸大小差异很大,最短的有113个氨基酸,最长的有168个氨基酸,平均长度为141个氨基酸。通过SignalP 4.1在线网站预测我们发现,除了PrOBP1、PrOBP2、PrOBP3、PrOBP5、PrOBP6、PrOBP14、PrOBP15、PrOBP16外,其他PrOBPs的N端都有信号肽。利用与OBPs相同的搜索方法,我们在菜粉蝶的基因组数据库中得到了38个CSPs基因蛋白序列全长(表1)。我们对这38个蛋白依次命名为PrCSP1-PrCSP38。昆虫CSPs的序列比较保守,蛋白序列长度相差不大。PrCSPs蛋白氨基酸的平均长度为121个。
通过SignalP 4.1在线网站预测发现,所有鉴定出的PrCSPs在N端都有信号肽。
2.2 菜粉蝶OBPs和CSPs基因的保守序列分析
通过在线网站ScanProsite筛选和多序列比对分析可知(图1),鉴定出的24个PrOBPs都具有昆虫OBPs的半胱氨酸模式识别序列。PrOBP1-PrOBP14、PrOBP16、PrOBP17这16个OBPs属于Classic OBPs蛋白家族,它们的半胱氨酸模式识别序列为C1-X25-30-C2-X3-C3-X36-42-C4-X8-14-C5-X8-C6(C为半胱氨酸,X为任意氨基酸),与其他鳞翅目Classic OBPs蛋白家族相同[27]。PrOBP15也属于Classic OBPs蛋白家族,但PrOBP15在C1-C2之间只有19个氨基酸。PrOBP19-PrOBP24这6个OBPs属于Minus-C OBPs蛋白家族,它们的蛋白序列中缺少C2和C5这两个半胱氨酸。通过与OBPs相同的分析方法,我们发现鉴定出的38个PrCSPs的半胱氨酸模式识别序列为C1-X6-C2-X11-19-C3-X2-C4(C为半胱氨酸,X为任意氨基酸),与其他鳞翅目CSPs蛋白家族相同[28](图2)。
表1菜粉蝶基因组中鉴定得到的气味结合蛋白和化学感受蛋白
Table1PrOBPs and PrCSPs identified from thePierisrapaegenome database
名称NameNCBI登录号NCBI accessionnumber氨基酸长度Amino acidlength信号肽Signal peptide名称NameNCBI登录号NCBI accessionnumber氨基酸长度Amino acidlength信号肽SignalpeptidePrOBP1XP_022112383.1121无NonePrCSP8XP_022112605.11251-17PrOBP2XP_022112385.1133无NonePrCSP9XP_022112610.11231-16PrOBP3XP_022112386.1121无NonePrCSP10XP_022112612.11161-15PrOBP4XP_022112391.11471-20PrCSP11XP_022112616.11261-17PrOBP5XP_022112400.1132无NonePrCSP12XP_022112772.11241-15PrOBP6XP_022112402.1121无NonePrCSP13XP_022121499.11231-16PrOBP7XP_022112420.11511-21PrCSP14XP_022121500.11221-15PrOBP8XP_022116327.11301-15PrCSP15XP_022121509.11221-17PrOBP9XP_022117504.11401-17PrCSP16XP_022121511.11231-16PrOBP10XP_022118412.11631-22PrCSP17XP_022121516.11221-15PrOBP11XP_022118413.11611-19PrCSP18XP_022121543.11381-31PrOBP12XP_022118416.11661-24PrCSP19XP_022127763.11221-15PrOBP13XP_022118428.11661-22PrCSP20XP_022127765.11201-17PrOBP14XP_022120389.1147无NonePrCSP21XP_022127766.11081-21PrOBP15XP_022120900.1113无NonePrCSP22XP_022127768.11191-15PrOBP16XP_022120910.1168无NonePrCSP23XP_022127769.11111-15PrOBP17XP_022122749.11581-19PrCSP24XP_022127771.11111-15PrOBP18XP_022123129.1106N端缺失N terminal deletionPrCSP25XP_022127772.11411-36PrOBP19XP_022117197.11331-16PrCSP26XP_022127773.11221-17PrOBP20XP_022117198.11331-16PrCSP27XP_022127774.11221-16PrOBP21XP_022117217.11531-18PrCSP28XP_022128475.11201-16PrOBP22XP_022117531.11381-18PrCSP29XP_022128499.11231-16PrOBP23XP_022118695.11491-17PrCSP30XP_022128501.11221-15PrOBP24XP_022120594.11391-17PrCSP31XP_022128502.11221-15PrCSP1XP_022112576.11251-19PrCSP32XP_022128507.11241-16PrCSP2XP_022112586.11261-17PrCSP33XP_022128510.11211-15PrCSP3XP_022112593.11311-16PrCSP34XP_022128541.11221-15PrCSP4XP_022112596.11251-15PrCSP35XP_022128562.11221-19PrCSP5XP_022112597.11241-18PrCSP36XP_022128573.11281-21PrCSP6XP_022112599.11231-15PrCSP37XP_022131150.11071-18PrCSP7XP_022112601.11211-16PrCSP38XP_022131152.11001-16
“无”表示没有预测到信号肽。
“None” indicated that no signal peptide was predicted.
2.3 菜粉蝶OBPs和CSPs基因的系统进化分析
我们利用邻位相邻算法分别将菜粉蝶OBPs和CSPs与其他报道的鳞翅目昆虫OBPs和CSPs一起构建了系统发育树。从菜粉蝶OBPs的系统发育树来看(图3),PrOBPs散落在各个分支上,PrOBP 4和PrOBP17属于ABPⅠ亚家族;PrOBP1-3,PrOBP5-6和PrOBP8-9属于ABPⅡ亚家族;PrOBP10-13属于PBP/GOBP亚家族;PrOBP7、PrOBP14-16和PrOBP18属于CRLBP亚家族;PrOBP19-24属于Minus-C OBP家族。总体来说,菜粉蝶OBPs的同源性较低,分化程度较高。从菜粉蝶CSP的系统发育树来看(图4),PrCSP13-19、PrCSP 22-24、PrCSP 29-31和PrCSP 33-36这17个PrCSP聚类到一起,另外21个PrCSP聚类到其他鳞翅目CSPs的分支上。
图1 PrOBPs的多序列比对Fig.1 Alignment of the identified Pieris rapae OBPs
图2 PrCSPs的多序列比对Fig.2 Alignment of the identified Pieris rapae CSPs
3 结论与讨论
通过菜粉蝶基因组数据的分析,我们得到了24个菜粉蝶OBPs基因,其数目少于黑腹果蝇Drosophilamelanogaster(51个OBPs)[29]、冈比亚按蚊Anophelesgambiae(57个OBPs)[15]、家蚕Bombyxmori(44个OBPs)[30]、埃及伊蚊Aedesaegypti(66个OBPs)[31]、丽蝇蛹集金小蜂Nasoniavitripennis(90个OBPs)[32]、致倦库蚊Culexpipiensquinquefasciatus(53个OBPs)[33]。OBP蛋白序列的结构很保守:在蛋白的N端有一信号肽,后面连接着一段含有多个半胱氨酸的结构域序列[12]。通过信号肽预测,发现PrOBP1-3、PrOBP5-6、PrOBP14-16这8个OBPs的N端不含有信号肽,说明它们N端序列缺失,不是全长序列。通过半胱氨酸序列的模式识别分析,我们发现菜粉蝶OBPs主要分布在两个亚家族:Classic OBPs和Minus-C OBPs,这与其他鳞翅目昆虫OBPs的分布情况相同[30, 34-35]。从多序列比对结果来看,菜粉蝶OBPs分子结构变异较大,说明这些从菜粉蝶基因组中,我们鉴定得到38个菜粉蝶CSPs基因,其数目高于家蚕(24个CSPs)[30]、烟粉虱Bemisiatabaci(19个CSPs)[36],意大利蜜蜂Apismellifera(6个CSPs)[37]、蚜虫Acyrthosiphonpisum(13个CSPs)[16]。CSPs除了在昆虫的触角中表达外,在昆虫的腿、口器、腹部等部位均有表达[10, 38-39]。在菜粉蝶蛹的转录组数据中(未发表的数据),我们检测到PrCSP2、PrCSP5、PrCSP19、PrCSP30、PrCSP37、PrCSP38的表达,说明PrCSPs除了气味识别外,还有一些其他的功能。通过菜粉蝶CSPs进化发育树可知,PrCSPs散落在各个分支上,说明菜粉蝶CSPs和其他鳞翅目CSPs有着共同的祖先和相似的功能。PrCSP13-19,PrCSP22-24,PrCSP29-31和PrCSP33-36这17个PrCSP聚类到一起,说明这17个CSPs可能有着相似的起源。
Msex,烟草天峨;Hvir,烟蚜夜蛾;Bmor,家蚕;Harm,棉铃虫;Hass,烟青虫。CRLBP,化学感受性亲脂性配体结合蛋白;PBP,信息素结合蛋白,GOBP,一般气味结合蛋白;ABP,触角结合蛋白。Msex, Manduca sexta; Hvir, Hdiothis virescens; Bmor, Bombyx mori; Harm, Helicoverpa armigera; Hass, Heliothis assulta. CRLBP, Chemical sense-related lipophilic ligand-binding protein; PBP, Pheromone-binding protein; GOBP, General odorant-binding proteins; ABP, Antennal-binding protein.图3 PrOBPs的进化发育树Fig.3 Phylogenetic analysis of PrOBPs
Aips,小地老虎;Bmor,家蚕;Adis,双委夜蛾;Cmed,稻纵卷叶螟;Harm,棉铃虫;Cpun,桃蛀螟;Sexi,甜菜夜蛾。Aips, Agrotis ipsilon; Bmor, Bombyx mori; Adis, Athetis dissimilis; Cmed, Cnaphalocrocis medinalis Giienee; Harm, Helicoverpa armigera; Cpun, Conogethes punctiferalis; Sexi, Spodoptem exigu.图4 PrCSPs的进化发育树Fig.4 Phylogenetic analysis of PrCSPs
OBPs可能发挥着不同的生物功能。
昆虫OBP和CSP在植物挥发物、昆虫信息素等气味的识别过程中发挥着关键作用[2]。本文利用生物信息学方法,对菜粉蝶基因组中的OBPs和CSPs蛋白家族进行了鉴定,发现PrOBPs和PrCSPs都具有较高的多样性。未来,这些鉴定出的PrOBPs和PrCSPs有望用于筛选能与这些气味结合蛋白相结合的化合物,通过化学合成等技术开发出环境友好的性诱剂或气味引诱剂来消灭菜粉蝶。同时,也可以通过转基因技术[40]或CRISPR/Cas9基因编辑技术[41]来敲除菜粉蝶OBPs和CSPs,通过释放这些转基因昆虫到自然界,达到防治菜粉蝶的目的。