APP下载

福鼎大白茶蛋白质相互作用网络研究

2022-08-03王芬潘发莲杨秀韦永欢裴会敏

生物技术进展 2022年4期
关键词:差异基因功能模块激酶

王芬, 潘发莲, 杨秀, 韦永欢, 裴会敏

黔南民族师范学院生物科学与农学院,贵州 都匀 558000

蛋白质相互作用是指互相物理接触或者在功 能上有关的蛋白质通过复杂多样的相互作用连接形成网络。蛋白质相互作用是探索生物学功能的基础,研究蛋白质相互作用对理解和分析茶树生物功能有着极其重要的意义。蛋白质相互作用在蛋白功能预测、疾病的研究和预防、药物候选研究等方面已得到广泛应用[1-3]。已有研究基于基因表达谱和核心连接方法从蛋白质相互作用网络中识别蛋白质复合物,研究结果在帮助了解细胞过程机制方面具有重要的生物学意义[4]。刘家俊等[5]通过蛋白质相互作用网络挖掘出了7个可能与小麦赤霉病抗性相关的蛋白,这些蛋白可能在响应赤霉病中具有重要作用。Seong等[6]利用蛋白质相互作用网络分析了松仁油的脂肪调控机制,结果表明给小鼠口服松仁油可降低组织中的脂肪含量。崔红梅[7]发现,研究在表观遗传修饰领域环境应答基因孕烷受体参与的蛋白质相互作用网络,有助于开展环境应答基因孕烷受体在细胞应激反应领域功能的探索。Adhami等[8]通过蛋白质相互作用网络的方法重新筛选新冠病毒的治疗候选药物,发现CARBOPLATIN、CRIZOTINIB和CYTARABINE药物是潜在的新型冠状病毒肺炎治疗药物。

茶树适应于降雨量多、湿度大和温度适中的地带,具有适应性广、综合性状优良的特性[9-10]。都匀毛尖茶是中国十大名茶之一[11],福鼎大白茶是都匀毛尖茶的一个原料品种。茶树在转录组、蛋白质组和基因组等方面已有相关研究[12-15],但是茶的蛋白质相互作用网络方面研究较少。此外,茶树的大多数生命活动都与蛋白质相互作用密切相关。本研究利用三代Nanopore测序技术和同源比对的方法预测福鼎大白茶叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络,并对网络进行功能模块预测、拓扑属性分析、集群注释和聚类分析,以期为寻找关键蛋白、鉴定蛋白质的功能和选育福鼎大白茶优良品种等提供理论依据。

1 材料与方法

1.1 试剂与仪器

RNAprep Pure多糖多酚植物总RNA提取试剂盒(DP441),ONT SQK-LSK109试 剂 盒 ,Nanodrop2000,Agilent RNA 6000 Nano Kit,SuperscriptⅣ reverse transcriptase,数字3×32PCR仪,PromethⅠ-ON测序仪,Cytoscape3.3.0和Cytoscap3.8.2软件,ClusterViz软件,Blast2GO v2.5。

1.2 方法

1.2.1 取样 试验材料选取黔南民族师范学院基地扦插的福鼎大白茶,在本实验室培育的茶苗中选取培养条件相同、长势情况基本一致、没有被污染过的茶苗植株9株,分为3组,每组3株,每株取5片嫩叶分别放入离心管中并迅速放入液氮中,将9个样本放入-80℃冰箱保存备用。

1.2.2 差异表达分析 从-80℃冰箱取出福鼎大白茶的根茎叶共9个样品,送至北京百迈客生物科技有限公司进行三代Nanopore测序,并利用CPM[16]进行基因表达量的分析,再对叶与根、叶与茎、茎与根的差异表达基因进行分析,将差异基因与STRING v11.5[17]数据库进行同源比对得到叶与根、叶与茎、茎与根的差异基因蛋白质相互作用网络。这3个网络用Cytoscape3.3.0[18]软件进行可视化,最后对3个差异基因网络进行合并,得到根、茎、叶的差异基因蛋白质相互作用网络,并对网络进行功能模块预测、拓扑特性分析、集群注释和聚类分析。

2 结果与分析

2.1 关键蛋白质的筛选

利用Nanopore测序方法获得福鼎大白茶叶、根和茎的全长转录组,然后利用CPM分别计算出叶、根和茎中基因的表达量,筛选出叶与根、叶与茎、茎与根和根茎叶的差异表达基因,将差异表达基因与STRING数据库进行同源比对获得叶与根、叶与茎、茎与根以及根、茎、叶的差异基因蛋白质相互作用网络(图1)。4个网络分别有2 951、1 717、1 420、3 704个蛋白,33 131、12 939、8 092、49 545个互作。然后利用Cytoscape3.3.0软件筛选出4个网络中度最大的关键蛋白分别有53、39、42和53个(表1)。图1中V形、三角形、正方形、平行四边形、菱形和六边形节点代表关键蛋白。将4个网络中的蛋白与GO、Swiss-Prot和NR 3个数据库比对,预测出4个网络中的几个关键蛋白的功能。TEA003744存在于叶绿体膜上,具有蛋白质丝氨酸/苏氨酸激酶活性和ATP结合性,参与光合作用和蛋白质磷酸化过程。TEA026776具有蛋白激酶活性和ATP结合活性,参与蛋白质磷酸化过程。TEA019056具有RNA聚合酶Ⅱ羧基末端结构域激酶活性和ATP结合活性,参与蛋白质磷酸化过程。TEA005686具有激酶活性,参与磷酸化过程。TEA007967具有蛋白质丝氨酸/苏氨酸激酶活性、2烯醛还原酶活性和ATP结合活性,参与氧化还原和蛋白质磷酸化过程。TEA016315具有MAP激酶活性和ATP结合活性,参与MAPK级联反应。这些关键蛋白在茶树生长过程中具有重要作用。

图1 差异基因蛋白质相互作用网络Fig.1 Protein-protein interaction network of DEGs

表1 蛋白质相互作用网络的关键蛋白Table 1 The hub proteins in the PPIN

2.2 功能模块

利用Cytoscape3.3.0软件的插件MCODE预测叶与根、叶与茎、茎与根及根茎叶差异基因的蛋白质相互作用网络的功能模块,4个网络得分最高的功能模块分别为23.07,44个节点(蛋白)、496条边(互作);25.026,40个节点、488条边;17.846,27个节点、232条边;39.278,73个节点、1 414条边(图2)。将4个功能模块分别与GO、Swiss-Prot和NR进行比对,预测出4个功能模块的功能,叶与根差异基因蛋白质相互作用网络中得分最高的功能模块的功能可能为蛋白质丝氨酸/苏氨酸激酶活性、ATP结合活性、蛋白激酶活性、转移酶活性,可能参与蛋白质磷酸化等生物过程;叶与茎的功能模块可能为蛋白质丝氨酸/苏氨酸激酶活性、ATP结合活性、核苷酸结合活性、蛋白激酶活性,可能参与蛋白质磷酸化等生物过程;茎与根的功能模块可能为ATP结合活性、微管结合活性、ATP酶活性活性,可能参与基于微管的运动等生物过程;根茎叶功能模块可能为蛋白质丝氨酸/苏氨酸激酶活性、ATP结合活性、蛋白激酶活性等,可能参与蛋白质磷酸化等生物过程。通过功能模块可以得到各功能模块中的蛋白具有与功能模块相关的功能。

图2 4个网络得分最高的功能模块Fig.2 The four functional modules with the highest scores

2.3 拓扑属性

利用Cytoscape3.3.0软件对叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络进行拓扑特性分析[19]。度是指网络中的一个点与其他点的连接数,度分布指网络中度为k的节点出现的概率,本研究发现这4个网络的度分布服从幂律分布规律,叶与根差异基因蛋白质相互作用网络中 P(k)=725.42k-1.195,R2=0.708,相关性为 0.958;叶与茎 P(k)=544.77k-1.262,R2=0.790,相关性为 0.954;茎与根 P(k)=583.50k-1.388,R2=0.777,相关性为0.919;根茎叶 P(k)=867.73k-1.191,R2=0.714,相关性为0.953(图3A)。中介中心性指网络中两个节点经过其他为中介节点的最短路径的个数,其计算公式见式(1),值介于0和1之间(图3B)。

接近中心性是指网络中某个节点与其他点之间的接近程度[20],其计算公式见式(2)。

式中,L(j,i)是指从节点 j到i的最短路径,其值也介于0和1之间(图3C)。

聚合系数计算公式见式(3)。

式中,ka指节点a的全部邻居数;ea指全部邻居节点的连接边数(图3D)。

路径的长度是形成路径的边数,可能有多个路径连接两个给定节点。两个节点a和b之间的最短路径长度用L(a,b)表示(图3E)。拓扑系数是一个节点与其他节点共享邻居的程度的相对度量[21],拓扑系数计算公式见式(4)。

图3 根茎叶差异基因蛋白质相互作用网络拓扑属性Fig.3 Topological properties of the PPIN in root-stem-leaf

式中,J(a,b)是指所有节点a至少跟节点b共享一个邻居节点,它的值是节点a和b共享的邻居节点数(图3F)。

利用Cytoscape3.8.2软件中的插件CytoNCA对叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络进行分析,得出部分蛋白质的中心性值的排名,进一步分析可知,叶与根的差异基因 TEA026776、TEA019056、TEA003744的度中心性和特征向量中心性分别为389.0和0.14 099 002,排名第一;TEA026734的中介中心性为141 918.7,排名第一;叶与茎的差异基因TEA019056、TEA003744的度中心性、特征向量中心性分别为231.0、0.176 189 48,排名第一;TEA005686的中介中心性为92 430.77,排名第一。茎与根的差异基因TEA003744度中心性、特征向量中心性分别为199.0、0.215 793 98,排名第一;TEA024522的中介中心性为118 051.8,排名第一。根茎叶的差异基因TEA026776、TEA019056、TEA003744的度中心性、特征向量中心性分别为492.0、0.128 961 82,排名第一,TEA005686的中介中心性为215 518.08,排名第一。排名越靠前代表这个蛋白质越重要。通过对拓扑特性的分析表明这4个网络是可靠的,符合一般网络的特性。

2.4 集群注释和聚类分析

2.4.1 集群注释 通过Cytoscape3.8.2软件中的插件AutoAnnotate[9]对4个网络进行集群注释,叶与根有24个集群,叶与茎有19个集群,茎与根有13个集群,根茎叶有17个集群。集群根据所选属性的词频自动生成集群标签,这些集群突出了蛋白质的共享关系。每个集群折叠成一个“元节点”并将集群之间的边缘折叠成一个“元边缘”来创建一个简化的视图,有助于蛋白功能预测,即在一个集群中的蛋白质可能具有相似的功能。

2.4.2 聚类分析 聚类是将数据分成一簇或一类,在同一簇或一类比不同簇更具有相似性。通过 Cytoscape3.8.2 软件中的插件 ClusterViz[22]的典型FAG-EC算法对4个网络进行聚类分析,分别得到211、163、136、244个聚类簇,对节点数多的聚类簇进行分析(表2),通过聚类分析可帮助识别蛋白质功能模块和预测蛋白质功能[23]。

表2 4个网络节点数多的聚类簇Table 2 The clusters with a large number of nodes among the four networks

3 讨论

利用同源比对方法得到叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络。4 个网络分别有2 951、1 717、1 420、3 704个蛋白,33 131、12 939、8 092、49 545个互作。根据网络可以预测出关键蛋白和蛋白质的功能。预测出4网络中的关键蛋白分别有53、39、42和53个。通过对网络进行拓扑属性分析得出预测的网络较可靠;通过对网络进行功能模块分析,可以预测蛋白质的功能。研究结果为鉴定蛋白质的功能和选育福鼎大白茶优良品种等提供了理论依据。

本研究利用三代Nanopore测序技术对都匀福鼎大白茶根茎叶进行全长转录组测序,并利用同源比对方法得到叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络。使用Cytoscape3.3.0软件筛选出叶与根、叶与茎、茎与根和根茎叶的差异基因蛋白质相互作用网络中度最大的关键蛋白,分别为53、39、42和53个,并预测出关键蛋白的功能。结果表明叶与根、叶与茎、茎与根和根茎叶差异基因的蛋白质相互作用网络中关键蛋白相互作用最多的5个蛋白TEA003744、TEA026776、TEA019056、TEA007967、TEA016315的分子功能都具有ATP结合活性,TEA003744、TEA026776、TEA019056、TEA007967蛋白都与蛋白质磷酸化生物过程有关,TEA003744、TEA007967蛋白的分子功能都具有蛋白质丝氨酸/苏氨酸激酶活性,其他关键蛋白分子功能各异,例如,TEA003744具有光合作用、光反应的调节能力;TEA026776具有蛋白激酶活性;TEA019056具有RNA聚合酶Ⅱ羧基末端结构域激酶活性;TEA005686具有激酶活性、磷酸化功能;TEA007967具有2-烯醛还原酶[NAD(P)]活性、氧化还原过程;TEA016315具有MAPK级联反应、MAP激酶活性。以上结果表明,具有相同功能的关键蛋白表明在不同器官中具有相同的作用,是福鼎大白茶的生长发育过程中必不可少的蛋白。功能不同的关键蛋白在福鼎大白茶的不同部位发挥独特的作用以完成茶树的生命过程。TEA003744是蛋白质丝氨酸/苏氨酸激酶,具有ATP结合功能;TEA019056是RNA聚合酶Ⅱ羧基末端结构域激酶,具有ATP结合功能;TEA005686具有激酶活性的功能,都参与信号转导,该结果与二代转录组的结果[24]一致。

通过插件MCODE对网络进行功能模块分析,若一个功能模块的功能已知,其中所有的蛋白可能具有与之相关的功能,或者是根据功能模块中大部分蛋白的功能来推测功能模块的功能。在叶与根的蛋白质相互作用网络的功能模块中由 于 TEA005819、 TEA003983、 TEA009758、TEA012564、TEA016721、TEA018506具有ATP结合和转移酶活性,因此推测其他非特征蛋白TEA021959、TEA005388、TEA013868也可能具有ATP结合和转移酶活性等类似功能,通过这种方法可以预测出网络中其他非特征蛋白质的功能。本文预测出的功能模块与前人相关研究[25-26]的功能模块特征一致。因此,功能模块对于预测蛋白质的功能具有重要的作用,为培育优良茶苗奠定了理论基础。

通过拓扑属性分析,得出4个网络是比较可靠的,它符合网络的一般特性与Li[25]的网络特性一致。中心性排名越靠前则该蛋白越重要,说明以上蛋白质在网络中是核心蛋白,如果缺失或去掉,该网络则会瘫痪。集群注释和聚类分析的结果可为后期分子生物学分析提供一定的理论依据[27]。本研究为都匀福鼎大白茶关键蛋白及功能预测提供了一定的理论依据,并为选育优良品种等提供了参考。

猜你喜欢

差异基因功能模块激酶
ICR鼠肝和肾毒性损伤生物标志物的筛选
蚓激酶对UUO大鼠肾组织NOX4、FAK、Src的影响
蚓激酶的药理作用研究进展
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
基于ASP.NET标准的采购管理系统研究
输电线路附着物测算系统测算功能模块的研究
M市石油装备公服平台网站主要功能模块设计与实现
黏着斑激酶和踝蛋白在黏着斑合成代谢中的作用
功能模块的设计与应用研究
SSH技术在丝状真菌功能基因筛选中的应用