感染柞蚕微孢子虫后柞蚕蛹的差异表达蛋白筛选
2022-01-22刘中文周其明张永君张耀亭朱绪伟
徐 欣 刘中文 周其明 张永君 张耀亭 朱绪伟
(河南省蚕业科学研究院,河南郑州 450008)
柞蚕微孢子虫引发柞蚕微粒子病,是重要的病害检疫对象。蛋白质组学是一个大规模、高通量地研究全套蛋白质的学科,而质谱技术的发展为挖掘有价值的蛋白提供了一个更便捷的方法,成为重要的差异蛋白筛选技术。这一技术也被应用在柞蚕微孢子虫免疫反应研究之中,研究者们基于其水平传播过程始于柞蚕中肠[1],得到了柞蚕中肠的差异基因和差异蛋白[2],后续研究中也发现了感染后表达量显著上调的差异表达基因[3]。但是,关于柞蚕微孢子虫侵染后柞蚕蛹的一些与免疫相关的蛋白种类与差异表达情况尚未见报道。柞蚕蛹是柞蚕羽化前的重要发育阶段,蛹体内剧烈地进行着组织溶解和组织发生两个过程,其中有可能还参与柞蚕微孢子虫的垂直传播过程。本试验运用质谱手段检测柞蚕蛹侵染前后蛋白质组成,并通过谱图计数法比较不同样品中的蛋白质差异,以期筛选到在垂直传播的关键时期与柞蚕免疫相关的蛋白,为蛋白质组学应用于柞蚕微孢子虫侵染后柞蚕免疫反应奠定基础。
1 材料与方法
1.1 供试柞蚕品种
供试材料为一化性柞蚕品种“豫大一号”的蚕蛹,由河南省蚕业科学研究院柞蚕育种研究室提供。同一批柞蚕蛹,经过镜检后取出柞蚕微孢子虫感染蛹10个(雌雄各5个),正常蛹10个(雌雄各5个),将柞蚕蛹用无菌水清洗后,放入-80 ℃冰箱保存备用。
1.2 柞蚕蛹组织蛋白提取
每个柞蚕蛹剪取部分腹部组织,转入2 mL离心管中,加两颗5 mm磁珠,加适量有SDSL3、终浓度含EDTA的1×Cocktail,置于冰上5 min,加入终浓度10 mmol/L DTT;加入Tissue lyser后4 ℃下12 000 r/min离心15 min,取上清;加终浓度为10 mmol/L的DTT,56 ℃中水浴1 h;加入终浓度55 mmol/L的IAM,暗室放置45 min;加5倍体积预冷丙酮,-20 ℃放置2 h,4 ℃12 000 r/min离心15 min后弃上清;风干沉淀,加入适量SDSL3,利用Tissue lyser 促进蛋白溶解;4 ℃12 000 r/min离心15 min后取上清,-80 ℃冰箱保存备用。此部分试验所用试剂购于Sigma公司。
1.3 柞蚕蛹蛋白质样品的SDS-PAGE检测
制备12%分离胶和5%浓缩胶,加入含有β-巯基乙醇的上样液,每孔10 μL上样样品。用考马斯亮蓝R250染色,再用脱色液(含30%甲醇,10%乙酸)脱色后采用凝胶成像系统(Bio-Rad公司)照相。此部分试验所用试剂购于生工生物工程(上海)股份有限公司。
1.4 质谱检测
使用高分辨串联质谱TripleTOF5600+LC/MS/MS系统(AB SCIEX公司)进行分析,样品通过微升流速的液相Eksigent microLC 415系统进行分离。肽段样品经过上样缓冲液溶解,由自动进样器吸入后结合至C18捕获柱(5 μm,300 A,300μm×5mm),接着被洗脱至分析柱(3 μm, 120 A, 300μm×15mm)进行分离。利用两个流动相(流动相A:3% DMSO,0.1% formic acid,97% H2O;流动相B:3% DMSO,0.1% formic acid,97% ACN)建立分析梯度。液相的流速设置为5 μL/min。质谱DDA模式分析时,每个扫描循环中包含一个MS全扫描(scan range 350-1 500 m/z,ion accumulation time 250 ms),以及随后的40个MS/MS扫描(scan range 100-1 500 m/z,ion accumulation time 50 ms)。信号超过120 cps的肽段离子(+2~+5)触发MS/MS扫描。MS/MS重复采集的排除时间设置为18 s。
1.5 数据分析
TripleTOF5600+LC/MS/MS系统产生的质谱数据通过ProteinPilot(V4.5)进行检索,采用的数据库检索算法是Paragon。检索使用的数据库是UniProt中Saturniidae的蛋白质组参考数据库。检索参数如下:Sample Type选Identification;Cys Alkylation选Iodoacetamide;Digestion选Trypsin;Search Effort设置为Rapid ID。检索结果以Unused≥1.3为标准进行筛选,删去反库中检索的条目和污染蛋白,余下的鉴定信息用作后续分析。
基于各蛋白谱图数,我们将筛选不同样品中差异显著的蛋白。综合不同样品中各蛋白定量差异及丰度,设置差异蛋白筛选边界线y=c/(x-xo)。
1.6 功能注释
运用NCBI blastp程序,从nr库中检索与提交蛋白序列相似的蛋白,进行功能注释。再从GO或KEGG数据库中得到提交蛋白序列对应的GO term和KEGG通路信息。得到质谱鉴定到的所有蛋白的注释信息后,提取其中差异表达蛋白的相关信息,统计类别和数目,通过超几何检验进行功能富集分析,即可筛选出与该试验相关的显著功能类别。
2 结果与分析
2.1 感染柞蚕微孢子虫前后柞蚕蛹SDS-PAGE电泳图谱
如图1所示,二者均能分辨出多条清晰蛋白质电泳带,分子质量 16~115 kD 范围内,45 kD 附近均有高丰度表达蛋白。感染柞蚕微孢子虫柞蚕蛹内15 kD的蛋白质比正常柞蚕蛹表达量高。
ZC-正常柞蚕蛹
2.2 质量控制
统计所鉴定到肽段的质量偏差。如图2所示,横坐标表示各鉴定肽段质量偏差,即质谱检测质量与肽段理论质量的偏差。纵坐标为肽段总数目。各肽段质量偏差分布位于±20(ppm)之间,表明各肽段质量偏差小于百万分之二十,质谱检测精度良好。
图2 肽段质量偏差分布
试验中所用仪器检测质荷比范围为350~1350 m/z,肽段离子化后大部分电荷数为2或3,结果符合质谱检测标准。
2.2 质谱检测结果
样品经质谱检测,根据图3和表1所示的鉴定结果中部分蛋白信息来看,感染蛹和正常蛹的鉴定蛋白质种类相近,鉴定出的蛋白质种类分别为25个和106个,且感染蛹鉴定出的25种蛋白质在正常蛹中均能对应。但相应肽段数量差别较大,可能与感染柞蚕微孢子虫后柞蚕蛹的氨基酸缺失(低酸血症)[5]有关,后期需要对筛选出的差异蛋白进行功能鉴定,再结合质谱结果进一步分析。
图3 样品概览图
表1 蛋白鉴定部分结果展示
2.3 差异表达蛋白筛选
计算不同样品组间各蛋白谱图数比值(ratio)和谱图数平均值(MeanSP)。如图4所示,以log2ratio为横坐标,log2MeanSP为纵坐标绘制散点图。设置差异蛋白筛选边界线,根据各蛋白散点分布标注差异显著性。
图4 差异表达蛋白筛选散点图
根据log2ratio以及log2MeanSP筛选各组样品间差异蛋白并标注差异显著性。感染蛹和正常蛹的差异表达蛋白统计数量结果,筛选出显著上调的蛋白1种,下调的蛋白3种,显著下调的蛋白有37种,共筛选出41个差异蛋白,无差异蛋白67种。在筛选过程中,由于鉴定出的感染蛹蛋白质种类较少,在进行差异蛋白分析时,为了避免一些蛋白的表达量为0,无法处理的情况,采用在所有蛋白的表达量上加一个“背景表达量”,这个值设置为1,然后进行log2(W/ZC)以及log2MeanSP进行筛选。部分差异表达蛋白结果见表2。
表2 部分差异表达蛋白列表
2.4 GO功能分析及富集结果
基因本体(Gene Ontology)是一个标准化的基因功能分类体系,提供了一套动态更新的标准化词汇表,并以此从三个方面描述生物体中基因和基因产物的属性:参与的生物过程(BiologicalProcess),分子功能(Molecular Function)和细胞组分(Cellular Component)。
对所筛选出来的41个差异蛋白进行GO功能分析,聚类到最多的生物过程是:细胞过程(cellular process)、应激反应(response to stimulus)、代谢过程(metabolic process)、多细胞生物过程(multicellular organismal process)、发展过程(developmental process),见图5(A),所涉及的生物过程除了细胞基础及代谢功能外,参与应激反应的蛋白质种类较多,这部分蛋白与柞蚕蛹免疫柞蚕微孢子虫的反应关系密切。所处的细胞组分的聚类分析中包含以下4个:细胞解剖实体(cellular anatomical entity)、细胞内(intracellular)、细胞(cell)、含蛋白质复合物(protein-containing complex),见图5(B),其中细胞解剖部分最多,占到42.37%。同时富集的分子功能中结合功能(binding)、催化活性(catalytic activity)、结构分子活性(structural molecule activity)、抗氧化活性(antioxidant activity)、转运活性(transporter activity)这几个方面的数量最多,见图5(C),这与柞蚕蛹在侵染后应激反应的一些酶类活性变化有关。
(A)
2.5 KEGG Pathway分析及富集结果
在对这些差异蛋白进行KEGG分析后显示,军团菌病(Legionellosis)、流体剪切应力与动脉粥样硬化(Fluid shear stress and atherosclerosis)、内质网中的蛋白质加工(Protein processing in endoplasmicreticulum)、甲型流感(Influenza A)、雌激素信号通路(Estrogen signaling pathway)几条通路与柞蚕蛹免疫柞蚕微孢子虫相关,见图6。图6中Bar后的数字表示富集分析的P值,该图展示KEGG富集结果的前15个条目。内质网中的蛋白质加工的KEGG信号通路图如图7所示,发现下调的蛋白有5个:蛋白二硫化物异构酶A3(ERp57)、葡萄糖调节蛋白(GRP94)、热休克蛋白(Hsp70、Hsp90)、晶状体蛋白(sHSF)。
图6 KEGG注释和富集分析
图7 内质网中的蛋白质加工的KEGG通路图
3 讨 论
柞蚕微孢子虫的传播途径有两种[6],经口传染和胚种传染。经口传染即水平传播,有研究结果发现柞蚕中肠是柞蚕微孢子虫水平传播侵染的第 1 个组织也是重要组织[7],在侵染后中肠相关酶活性下降,起到免疫作用[8],还发现了幼虫和蛹氨基酸缺乏症[9]。本研究在建立柞蚕蛹侵染柞蚕微孢子虫后的蛋白文库时发现,侵染组的蛋白质种类总量较正常组有较大降低,这一点符合前人研究结果,同时显著下调的蛋白也已经筛选出来37种,为下一步分析蛋白功能提供方向。
41个差异蛋白的GO功能分析中,发现聚类到最多的生物过程是细胞过程、应激反应、代谢过程;分子功能中结合、催化活性、结构分子活性这3个方面的数量最多。所处的细胞组分的聚类分析中包含细胞解剖实体、细胞内、细胞、含蛋白质复合物,其中细胞解剖部分最多。这些蛋白与柞蚕蛹在侵染后应激反应的一些酶类活性变化有关,参与免疫微粒子病的相关反应。同时KEGG 通路富集分析结果中,发现内质网中的蛋白质加工通路中的EPR57、GRP94、Hsp70、Hsp90、sHSF这5种蛋白下调,初步预测为免疫蛋白,后期将进行功能鉴定。