乌药matK基因的生物信息学及多样性分析
2022-04-13袁莉霞王芙蓉楼天灵
袁莉霞,王芙蓉,刘 姝,孙 妍,楼天灵
(浙江医药高等专科学校,浙江 宁波 315100)
乌药[Lindera aggregate(Sims)Kosterm]为新“浙八味”之一,因产于浙江天台,故名台乌药,其块根有行气止痛、降脂、护肝等功效[1,2]。由于道地乌药的使用量日趋增多,且缺乏集中化保护,使得道地乌药蕴藏量日趋减少,因此集约化管理迫在眉睫。据《本草纲目》记载,“其直根者不堪用”[3],且其生长年份较长,因此在种质选取中存在较大难度。
DNA条形码技术已广泛用于各物种分类鉴定、亲缘性及多样性分析等。该技术不受形态和发育状态的影响,准确度高,分类依据可靠,在植物鉴定中已取得显著成效[4-6]。matK为植物DNA条形码的标准序列之一,能够有效对植物属间及属以上级别进行鉴定[7],对近缘性物种也有较好的分辨能力[8]。滕艳芬等[9]通过分析同属间5种石斛的叶绿体matK基因序列,成功将正品与混淆品区分开。刘静等[10]通过不同的石斛及密花石豆兰的matK序列分析发现,matK基因可用于种及变种之间的鉴别。郑辉等[11]以ITS2+matK序列对峨眉山区唇形科药用植物进行鉴定,发现ITS2+matK序列能够快速、准确鉴定并阐明物种之间的亲缘关系。Alaklabi等[12]利用叶绿体matK和质体rbcL基因进行研究发现,该基因序列可用于芦荟及其近缘物种的鉴定。王瑞娴等[13]利用matK序列对7份桑叶进行聚类分析,结果表明桑树品种间的遗传多样性低于其他植物。
目前,matK基因在乌药鉴定中的应用尚未见报道。本研究从生物信息学角度对乌药matK基因编码蛋白进行分析,并通过序列聚类方法,完成遗传进化及多样性分析,为乌药种质资源鉴别、分类及多样性研究提供参考。
1 材料方法
1.1 试验材料
从NCBI获取的11种山胡椒属matK基因序列为研究对象,这11个物种分别为乌药(Lindera aggregata),登 录 号:AB442057.1;桂 皮 钓 樟(Lindera benzoin),登录号:MG220997.1;香叶树(Lindera communis),登录号:AF244405.1;绿叶甘植(Lindera fruticosa),登录 号:AF244405.1;黑壳 楠(Lindera megaphylla),登录号:AF244404.1;滇粤山胡椒(Lindera metcalfiana),登录号:AF244403.1;三桠乌药(Lindera obtusiloba),登录号:AF244402.1;山橿(Lindera reflexa),登录号:AF244401.1;天全钓樟(Lindera tienchuanensis),登录号:AF244399.1;山胡椒(Lindera glauca),登录号:AB442056.1;三股筋香(Lindera thomsonii),登录号:AF244400.1。
1.2 数据分析
利用NCBI ORFfinder在线工具对乌药matK基因进行分析,通过DNAman软件和ProtParam(https://web.expasy.org/protparam/)预测编码氨基酸;利用Protscale(https://web.expasy.org/cgi-bin/protscale/protscale.pl?1)、SignalP4.1(http://www.cbs.dtu.dk/services/SignalP-4.1/)及TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)分析乌药matK蛋白的亲/疏水性、信号肽及跨膜结构域;利用GOR IV(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_gor4.pl)和SWISS-MODEL(http://www.swissmodel.expasy.org/)预测乌药matK蛋白的二、三级结构;运用MEGA7软件对乌药等11种matK基因序列构建进化树。
2 结果与分析
2.1 开放阅读框及氨基酸预测
利用NCBI ORFfinder对乌药matK基因的开放阅读框进行分析,结果如图1所示。乌药matK基因序列长度为1 628 bp,包含14个开放阅读框,其中ORF1的长度为1 545 bp,起始密码子位于1 bp的位置,终止密码子位于1 524 bp的位置。利用DNAman对matK基因编码的氨基酸序列进行预测,结果显示其所编码的氨基酸个数为507个(图2)。
图1 乌药matK基因的开放阅读框分析
图2 乌药matK基因及编码氨基酸序列
通过ProtParam分析发现,乌药matK的分子式为C2757H4209N743O735S12,相对分子质量为59 839,其中Leu占比最高,为12.23%(62/507);其次为Ser、Ile和Phe,分 别 为11.64%(59/507)、8.28%(42/507)和8.09%(41/507);Met和Cys占比最低,均为1.18%(6/507)(图3)。
图3 乌药matK的氨基酸组成
2.2 理化性质预测
乌药matK的一级结构分析发现存在极性氨基酸,这些氨基酸对高级结构一定有影响。利用Protscale对编码的氨基酸序列进行亲/疏水性分析,结果表明该蛋白的亲水指数为-0.200,为亲水蛋白(图4)。利用SignalP4.1对matK序列的信号肽预测分析发现,该蛋白第8号位上的氨基酸S值最大,为0.486;第21号位上Y值和C值均最大,分别为0.307和0.242;S值平均为0.385,小于0.5,这表明该蛋白不存在信号肽(图5)。通过对matK跨膜预测发现,该蛋白膜内外的比例为100∶1(图6),表明该蛋白不具备细胞间信号传递的能力。
图4 乌药matK的亲/疏水性
图5 乌药matK的信号肽预测
图6 乌药matK的跨膜结构预测
2.3 二、三级结构预测
通过GOR IV分析发现,在乌药matK的二级结构中,α-螺旋(H)为182个,占35.90%;延长线(E)为75个,占14.79%,随机线圈(C)为250,占49.31%(图7)。通过SWISS-MODEL对乌药matK三级结构预测发现,在三级结构中,随机线圈分布最多,其次为Alpha螺旋,这与二级结构的预测结果相一致(图8)。
图7 乌药matK的二级结构
图8 乌药matK的三维结构
2.4 系统进化树
以NCBI中获取的11种matK基因序列为对象,通过MEGA7软件构建进化树(图9),结果表明,该进化树主要分为3个类群,乌药(Lindera aggregata)与桠乌药(Lindera obtusiloba)、三股筋香(Linderathomsonii)在第2个类群,表明乌药与这2个物种间亲缘性较高;山胡椒(Lindera glauca)与乌药亲缘关系最远。
图9 乌药matK基因的系统进化树
3 小结与讨论
matK基因进化速度与rbcL基因相比较慢,而略快于ITS,是目前最常用的DNA条形码序列,已被广泛应用于中药鉴定[14-16]。林晓霞等[17]通过matK和rbcL序列对采集到的22份铁皮石斛进行了系统进化分析和种质的鉴定,结果发现matK分析得到的系统进化关系具有更高的遗传多样性;Asahina等[18]通过matK和rbcL序列对石斛进行鉴定,同样发现rbcL序列的鉴定能力不如matK序列。熊哲铭等[19]通过matK序列对5种阴地蕨属(Botrychium)药用植物进行了种间亲缘关系分析。目前,尚未见matK基因在乌药上的研究。
本研究发现,乌药matK基因所编码的蛋白开放阅读框大小为1 545 bp,编码的氨基酸有20种,共507个,其中占比最高的氨基酸为Leu,最低的为Met和Cys。该蛋白不稳定指数为52.66,亲水指数为-0.200,为亲水蛋白。该蛋白不存在信号肽,且不具备细胞间信号传递的能力。此外,通过11种山胡椒属matK基因的进化树结果发现,乌药与三股筋香的亲缘性最高,与山胡椒的亲缘性最远。该研究可为乌药的种质资源鉴别及系统进化分析提供参考依据。