基于PPIN的都匀毛尖根茎叶分析
2021-08-19张龙芬郭治友崔宝禄
王 芬, 张龙芬, 木 仁, 马 媛, 郭治友, 崔宝禄, 李 静, 张 雯
(1.黔南民族师范学院生物科学与农学院, 贵州 都匀 558000;2.长顺县农业农村局, 贵州 长顺 550700)
茶产业是“一带一路”国家战略中的传统优势特色外向型产业,发展前景广阔。茶树是世界上最受欢迎的非酒精饮料作物之一[1],也是非常重要的商业化饮料作物[2];茶树是中国西南地区的特有种,目前种植在40多个国家[3-4]。贵州特有的喀斯特地貌气候呈立体结构,年均降水量1 500 mm,适宜的温度孕育了丰富多样的茶树资源[5],是茶树的发源地及茶叶经济的故乡[6]。截止2016年,贵州的茶叶种植面积达到4.4×105hm2,是茶叶种植面积最大的省份[7],主要品种为福鼎大白茶,具有繁殖力强、产量高、品质好、适应性广的特性。茶叶的流行不仅仅是因为特殊的风味,更是由于主要的次生代谢产物——茶多酚[9-10]。它对人体有益[11],可以抗菌[12],抗肿瘤,具有抗氧化活性[13-15],对心血管疾病、肥胖、糖尿病和代谢综合征都有疗效[16-17]。
蛋白质相互作用网络[18]是指一个物种内的所有蛋白质之间的相互作用关系,并从信号转导、生化等角度进行研究。揭示蛋白质相互作用关系,构建蛋白质相互作用网络图,已成为蛋白组学[19]研究的热点,也是后基因组时代的难题所在。蛋白质相互作用是生物体进行代谢活动的基础,因此,在所有生命活动中,都有蛋白质相互作用现象的发生。研究都匀毛尖的蛋白质相互作用网络可以对茶的整个生物过程有一个综合的理解。
以贵州省黔南州喀斯特山区优势茶叶品种福鼎大白种茶为材料,利用二代Illumina测序平台对其进行转录组测序,分析根茎叶的差异基因,构建差异基因蛋白质相互作用网络。挖掘都匀地区福鼎大白种茶参与类黄酮生物合成、萜类化合物生物合成等代谢途径的相关基因,揭示影响茶多酚代谢的关键因素,为培育更好的茶树品种探寻茶多酚代谢机理提供参考。
1 材料和方法
1.1 材 料
试验材料福鼎大白种茶树(Camelliasinensis(L.)O.Ktze),是2018年11月在黔南州都匀市红敏茶园剪取的枝叶扦插所得,在培育的茶苗中选取培养条件相同、长势情况基本一致、没有被污染的茶苗植株9盆,分为3组,分别取嫩根、嫩茎和嫩叶标为“根1重复、根2重复、根3重复,茎1重复、茎2重复、茎3重复、叶1重复、叶2重复、叶3重复”,放入液氮中再放入-80 ℃冰箱保存。
1.2 方 法
将二代Illumina测序得到的结果进行基因表达量分析,并进一步分析叶与茎、叶与根、茎与根的差异表达基因,运用同源比对的方法将差异基因与STRING 9.1数据库进行比对以及提取出差异表达分析结果与STRING 9.1数据库收录的互作关系,再利用Cytoscape 3.3.0将比对上的差异基因进行蛋白质相互作用网络的构建,分别构建出叶与茎、叶与根、茎与根的差异基因蛋白质相互作用网络并对网络进行合并。
2 结果与分析
2.1 差异基因蛋白质相互作用网络的构建
利用Illumina测序平台对福鼎大白种进行转录组测序,根据基因表达量筛选根、茎、叶的差异基因,通过同源比对的方法以及差异表达分析结果和STRING 9.1数据库收录的互作关系对,构建差异基因的蛋白质相互作用网络(表1)。
表1 差异基因蛋白质相互作用数目
2.2 差异基因蛋白质相互作用网络的拓扑属性
将叶与茎、叶与根、茎与根的差异基因蛋白质相互作用网络合并为一个大的综合差异基因互作网络,该网络共4 249个节点,66 342个互作。从聚合系数、直径、半径、最短路径、特征路径长度等方面对4个网络的特性进行比较,发现差异不显著,并且网络表现出小世界特性(表2),大部分节点不与彼此邻接,但是可以从任一其他点经少数几步就可到达。
表2 4个网络的全局特性
中介中心性的值介于0与1之间,是指网络中的节点充当其它两个节点之间最短路径的中介次数,次数越高,中介中心性就越大(图3 a)。蛋白i的度是与此蛋白相连节点数,即蛋白i的互作数目,i的度越高,说明蛋白i越重要。在叶和茎、叶和根、茎和根以及合并的网络中,发现节点的度符合幂律分布(图3 b),其中叶与根的差异基因蛋白互作网络中,P(x)≈854.28x-1.174,R2=0.738,相关性是0.959。叶与茎的网络中,P(x)≈509.82x-1.194,R2=0.747,相关性是0.955。茎与根的网络中,P(x)≈543.96x-1.281,R2=0.759,相关性是0.863。在合并的网络中,P(x)≈888.33x-1.15,R2=0.692,相关性是0.939。说明大多数蛋白的相互作用数较少,很少一部分蛋白质的连接度较高,是一种无尺度现象。接近中心性的值也介于0和1之间,是指网络中的一个节点与其它节点的接近程度,即一个节点到其它节点的平均最短路径的倒数(图3 c)。蛋白u的拓扑系数是Tu=avg(S(u,v))/nu。S(u,v)表示u和v共同的相邻蛋白数,nu表示u的邻居数(图3 d)。
2.3 蛋白质相互作用网络中功能模块分析
在叶与茎、叶与根、茎与根以及合并的差异基因蛋白质相互作用网络中,利用Cytoscape 3.3.0的插件MCODE分别预测出66、99、62个和110个功能模块(表3),参数设置为默认,对于蛋白质功能预测以及揭示各种生化反应过程的分子机理都有着极大的帮助。叶与根差异基因蛋白质相互作用网络中最大的功能模块(图2)得分为56.941,具有120个节点,3 388个互作,主要参与植物病原互作通路,植物激素信号转导通路等。
表3 差异基因蛋白质相互作用网络中的功能模块特性
2.4 蛋白质相互作用网络中蛋白质的功能与关键蛋白预测
利用差异基因蛋白质相互作用网络可以预测蛋白质的功能。在一个蛋白质相互作用网络中,如果已知某些蛋白质的功能,那么与之相连的其他蛋白可能具有类似的功能。叶与茎的差异基因蛋白相互作用网络中共15 764个互作,其中TEA 003744,TEA 019056,TEA 020779,TEA 005686,TEA 008246,TEA 000931,TEA 024511,TEA 033307是相互作用数最多的8个蛋白(表4),它们在功能上具有相似性。TEA003744是丝氨酸/苏氨酸蛋白激酶,具有ATP结合功能,参与信号转导,与其互作的蛋白有281个,由此可以推出这281个蛋白也可能具有类似的功能。
表4 叶与茎差异基因蛋白质相互作用网络关键蛋白
利用Cytoscape 3.3.0提取叶与茎差异基因蛋白质相互作用网络中最大的一个子网(图3),具有1 062个节点,13 726个边,红色的节点代表度最大的8个节点,与整体网络一致,通过子网也可以预测蛋白质的功能。
3 讨 论
利用STRING 9.1数据库和同源比对方法预测出叶与茎有15 764个蛋白质相互作用,叶与根有49 191个相互作用,茎与根11 406个互作,合并的网络共有66 342个相互作用。4个网络都符合幂律分布,即少部分蛋白具有高连接度,而大部分蛋白的连接度较低。叶与根的差异基因的蛋白质相互作用最多,可能由于叶与根差异基因较多导致。对四个网络的聚合系数、直径、半径、最短路径、特征路径长度等特性进行比较分析,差异不大,并且网络表现出小世界特性。
利用Cytoscape 3.3.0的插件MCODE分别预测出4个网络的功能模块,对于蛋白质功能预测意义重大。其中茶多酚相关功能模块打分为9.412,具有18个节点和80个互作(图3)。该18个蛋白主要是细胞色素P 450、香叶醇8-羟化酶、氧化酶、类吡喃二烯氧合物、类黄酮。全部参与茶多酚次生代谢产物的生物合成、运输和代谢,主要表现为油菜素类固醇生物合成、类黄酮生物合成、二萜生物合成、倍半萜和三萜生物合成、甲基赤藓糖4-磷酸途径。分子功能主要体现在氧化还原酶、金属离子结合、芳香化酶活性等。因此,推断18个蛋白均与茶多酚功能相关,为培养茶树新品种提供理论依据。
通过差异基因蛋白质相互作用网络可以预测蛋白质的功能。都匀毛尖福鼎大白茶富含茶多酚,具有提神醒脑、抑制动脉粥样硬化、抑菌抗癌等功能。都匀毛尖特有的芳香主要自类黄酮和萜类化合物等的代谢,通过差异蛋白质相互作用网络可以预测与类黄酮等物质相关的基因。本研究结果可为类黄酮等物质的代谢机理研究提供一定的理论依据,为培养良种茶树提供理论参考。