灵芝UDP-GlcDH基因的cDNA克隆及生物信息学分析
2022-08-12章鸿宇张燎原
章鸿宇,张燎原
(福建农林大学生命科学学院, 福建 福州 350002)
灵芝Ganodermalucidum属多孔菌科高等真菌,是我国传统药用真菌,具有补气安神,止咳平喘的功效。灵芝多糖是灵芝重要的活性成分,具有调节免疫作用、抗肿瘤作用、促进体内核酸与蛋白质的代谢、抗衰老作用、镇静作用等功能[1-2]。
尿苷二磷酸葡萄糖脱氢酶(UDPglucose dehydrogenase,UDP-GlcDH)广泛分布于微生物及动植物的组织中,是多糖合成中糖醛酸途径的限速酶,参与糖代谢,催化尿苷二磷酸葡萄糖(UDP-Glc)反应生成尿苷二磷酸葡萄糖醛酸(UDP-GlcUA),UDP-GlcUA是细胞生长代谢和形成结构多糖必不可少的前体物质[3]。
截至目前,灵芝UDP-GlcDH基因的cDNA序列尚未见报道。本研究利用灵芝表达序列标签数据库(EST)资源和生物信息学分析方法,电子克隆了灵芝UDP-GlcDH基因的cDNA,并对其表达的蛋白序列的理化性质、结构特征以及系统进化关系进行预测和分析,为进一步开展灵芝多糖生物合成机制等相关研究奠定基础。
1 材料与方法
1.1 试验菌种
灵芝GanodermalucidumCurtis:Fr.P.Karst 由福建农林大学菌物研究中心保藏。
1.2 试验方法
1.2.1灵芝UDP-GlcDH基因的电子克隆 以黄曲霉AspergillusflavusAF70的UDP-GlcDH蛋白序列(GenBank accession: KOC08495.1)作为探针,利用NCBI中的tBLASTn工具与灵芝Ganodermalucidam的EST数据库进行相似性搜索,选择与探针序列同源性较高的序列。利用BioEdit软件进行拼接,将拼接后的基因序列在NCBI的ORF finder进行开放阅读框查询,结合SmartBLAST分析,确认UDP-GlcDH基因。
1.2.2灵芝UDP-GlcDH基因序列的验证 按照北京鼎国昌盛生物技术有限责任公司的Trigol试剂提取灵芝细胞的RNA,再用反转录剂盒将mRNA反转录成cDNA。以电子克隆所得的基因序列为模板,用 Primer 5.0软件设计正向引物F:5′-ATGGCCCCCGTCAAGGTCTC-3′,反向引物R:5′-TCAAAGGCGGTCTCC ACGACCA-3′,预计产物大小为1 416 bp。以反转录的cDNA作为模板进行PCR反应,PCR条件为:95℃预变性5 min,循环35次(95℃、30 s,55℃、30 s,72℃、90 s),最后72℃充分延伸10 min,4℃保存。用1.0%琼脂糖凝胶电泳鉴定PCR产物,并将PCR产物交上海生工测序。
1.2.3生物信息学分析 利用生物信息学软件对所得的UDP-GlcDH基因序列进行分析,并对基因编码的蛋白质进行理化性质、亲/疏水性、跨膜区结构、信号肽、二级结构、活性中心及底物结合位点等生物信息学的分析和预测[4],具体分析内容和工具软件见表1。
表1 预测基因结构功能所用到的网站及软件
2 结果与分析
2.1 灵芝UDP-GlcDH基因的克隆与验证
经过相似性搜索、拼接、验证、延伸等电子克隆过程,获得1条全长为1 591 bp的基因序列,ORF finder分析显示,该序列从13~1 428 bp包含一个长度为1 416 bp的完整的开放阅读框,该序列编码471个氨基酸,起始密码子和终止密码子分别为ATG和TGA。电子克隆获得的灵芝UDP-GlcDH基因序列及其编码的氨基酸序列见图1。
图1 灵芝UDP-GlcDH基因cDNA序列及其编码的氨基酸序列
提取灵芝mRNA,经过RT-PCR验证,得到电泳图,从图2可知,电泳条带与预计的1 416 bp相符。将PCR产物进行测序,结果也与电子克隆得到的基因相序列符,确定所克隆的基因确实为灵芝UDP-GlcDH基因。
图2 RT-PCR电泳结果
2.2 蛋白质分析结果
2.2.1灵芝UDP-GlcDH蛋白的保守结构域预测与分析 利用NCBI中的conserved domain search 工具分析蛋白序列,结果见图3,可以看出该蛋白的Specfic hits为UDPG_MGDP_dh_N、UDPG_MGDP_dh、UDPG_MGDP_dh_C,分别属于F420_oxidored superfamily、UDPG_MGDP_dh和UDPG_MGDP_dh_C的超家族,是一个Multi domains蛋白,编号为PLN02353,是UDPglucose dehydrogenase。
图3 蛋白质的保守结构域预测结果
从上述结果可以得出,电子克隆出的序列所编码的蛋白确为UDP glucose dehydrogenase,说明电子克隆的结果是准确的。
2.2.2蛋白质理化性质预测与分析 利用Protparam软件对蛋白质的理化性质进行分析,得出该蛋白包含471个氨基酸,含有20种基本氨基酸,每种氨基酸的含量见表2。
表2 UDP-GlcDH蛋白的氨基酸含量
结果表明,该蛋白相对分子质量为51 764.4 Da,等电点为6.29。该蛋白中含量较高的氨基酸是Ala(A)11.0%和Val(V)9.1%,含量较低的是His(H)1.1%和Met(M)1.3%。另外,该蛋白含有55个带负电荷的残留物(天冬氨酸+谷氨酸),含有53个带正电荷的残留物(精氨酸+赖氨酸),其分子表达式为C2317H3683N627O685S15。
该蛋白质水溶液在280 nm处所有成对的半胱氨酸形成半胱氨酸吸光系数为59 400,吸光度为1.148,所有半胱氨酸藏残留减少吸光系数58 900,吸光度为1.138。估计其半衰期在哺乳动物体内为30 h。不稳定系数(II)为25.52,是稳定蛋白。脂肪指数高达96.31,蛋白质流动性好,平均亲水性为0.010,表明该蛋白总体上亲水性和疏水性比较平衡。
2.2.3蛋白质亲/疏水性预测与分析 利用ProtScale在线分析蛋白质亲/疏水性,结果见图4,可知波动在0上下,说明该蛋白质蛋白总体上亲水性和疏水性比较平衡。
图4 亲/疏水性分析结果
2.2.4蛋白质信号肽预测和分析 采用SignalP 4.1 Server软件预测灵芝UDP-GlcDH蛋白的信号肽,结果见图5,根据马尔可夫模型,由于C、S、Y峰值分别为0.166、0.157、0.288,均不达到0.5,没有发现信号肽的存在,所以基本可以推测此蛋白不是分泌蛋白。
图5 信号肽预测结果
2.2.5蛋白质亚细胞定位预测与分析 利用PSORT软件,对蛋白质的亚细胞定位进行预测与分析,结果见表3,该蛋白质的亚细胞定位在内质网膜的概率最大。
表3 亚细胞定位预测结果
2.2.6蛋白质跨膜区域结构预测与分析 使用TMHMM在线预测工具对蛋白质进行跨膜分析,结果见图6,在1.0处为细胞膜外分界线,0是细胞膜内,本试验的UD-PGlcDH蛋白在此范围内并无发现跨膜结构,其主要是胞内活动,与细胞质之外缺少关联,其结果表明灵芝UDP-GlcDH蛋白不存在跨膜区。
图6 跨膜区域预测结果
2.2.7蛋白质二级结构预测与分析 使用GOR secondary structure prediction method version IV(GOR4)软件对蛋白质二级结构进行预测与分析。
结果见图7,可知其中无规则卷曲(random coil)的比例最高,为42.25%,其次是α螺旋(Alpha helix),占41.83%,而延伸链(extended strand)则只占15.92%。
注:竖线从长到短依次为α螺旋、β折叠与转角、随机卷曲
2.2.8蛋白质三级结构预测与分析 采用SWISSMODEL 在线同源建模方法,对UDP-GlcDH蛋白进行分析,预测其三级结构,并利用3D Molecule Viewer 软件查看该三维立体分子结构[5],见图8,可知UDP-GlcDH蛋白的空间结构主要由无规则卷曲和α螺旋构成,延伸链数量比较少,这与二级结构所预测的结果相一致。
图8 灵芝UDP-GlcDH蛋白的空间构象
2.2.9蛋白质进化树分析 通过ORF finder数据库BLAST出来的结果(图9),选取同源性较高的15条序列,使用clustal X软件和MEGA软件进行灵芝UDP-GlcDH蛋白与15种高等真菌的系统进化树分析,从图9可知,本试验拼接的UDP-GlcDH基因是灵芝UDP-GlcDH基因的家族成员,与污叉丝孔菌和云芝等真菌中的UDP-GlcDH基因编码的氨基酸序列高度同源。
图9 灵芝UDP-GlcDH蛋白与16种真菌的系统进化关系
3 结论
与传统基因克隆方法相比,电子克隆具有高效、快速、针对性强、技术要求低等[6-7]。本研究使用的探针为黄曲霉的UDP-GlcDH序列,与灵芝的同源性较高,并且灵芝的ESTs序列比较丰富,目前已报道灵芝ESTs数量达到48 334条,本试验采用电子克隆的可行性是很高的。
利用NCBI丰富的EST数据库资源,以米黄霉的UDP-GlcDH蛋白质序列为探针,经BLAST相似性检索和Bioedit软件拼接得到灵芝UDP-GlcDH蛋白相应的基因序列,通过RT-PCR试验进行验证,其确实是灵芝的UDP-GlcDH序列。该cDNA序列长度为1 591 bp,其中包含能编码471个氨基酸的序列,分子量为51.8 kD,PI为6.29,存在于内质网膜中,不属于分泌蛋白,不存在跨膜区域,UDP-GlcDH蛋白的二级结构主要以无规则卷曲和α螺旋构成。系统进化树分析可知,灵芝UDP-GlcDH基因的家族成员,与污叉丝孔菌和云芝等真菌中的UDP-GlcDH基因编码的氨基酸序列高度同源,可见其在进化上相对比较保守,可能与该蛋白家族的功能有密切关系。本研究成功克隆了灵芝多糖合成途径中关键酶之一的UDP-GlcDH基因序列,这为今后继续研究灵芝多糖合成奠定了良好的基础。