大白菜ABCB/PGP基因家族的鉴定与分析
2021-05-29于晓丽陈超妍吴雪宁时云龙刘振宁
于晓丽,陈超妍,吴雪宁,时云龙,刘 超,刘振宁
(临沂大学农林科学学院,山东临沂 256000)
植物ABC 转运蛋白又称ATP 结合盒式转运蛋白(ATP-binding cassette transporters,ABC transporters),其广泛存在于真核生物和原核生物中,是目前已知功能多样、种类繁多的蛋白家族[1]。其中ABCB 蛋白为ABC 转运蛋白的一个亚家族,又称为多药物抗性蛋白(Multidrug Resistance,MDR)或p-糖蛋白(p-glycoprotein,PGP)。在植物中研究发现,ABCB/PGP 蛋白家族主要参与生长素的极性运输[2]。另有研究表明,ABCB/PGP蛋白参与了植物细胞的木质化进程以及铁的内稳态平衡[3-4]。目前,研究人员已经对拟南芥、水稻、玉米、高粱、杨树、桃、卷柏和小立碗藓等植物中的ABCB/PGP 基因家族进行了全基因组水平上的鉴定与分析。大白菜是我国的特色蔬菜之一,栽培面积和消费量在我国各类蔬菜中排行前列。大白菜全基因组测序的完成使得对大白菜相关基因家族的鉴定与分析成为可能。
本研究利用拟南芥ABCB/PGP 氨基酸序列作为种子序列在大白菜基因组中进行搜索比对,鉴定出大白菜中ABCB/PGP 基因家族成员,并结合系统进化树分析ABCB/PGP 基因家族的系统发育分类,以期为进一步研究大白菜ABCB/PGP 基因的生物学功能奠定一定的基础。
1 材料与方法
1.1 大白菜ABCB/PGP 基因家族的鉴定
以拟南芥ABCB/PGP 蛋白的氨基酸序列作为种子序列在大白菜基因组数据库(http://brassicadb.org/brad/)中通过BLAST P 进行第一次比对搜索,找出候选基因。为了防止候选基因存在遗漏,再在大白菜基因组数据库进行了二次BLAST P 比对搜索,保证最后数据的完整性。最后,利用Pfam 数据库、SMART 数据库和NCBI 的保守域数据库分析候选蛋白的结构域,根据其结构域的有无鉴定是否属于该基因家族。
1.2 大白菜ABCB/PGP 基因的基因组信息和染色体定位
通过大白菜基因组数据库获得大白菜ABCB/PGP 基因的序列和基因组信息,并根据每一个ABCB/PGP 基因在染色体上的精确位置和染色体的长度使用Photoshop 软件将ABCB/PGP 基因人工定位到对应的染色体上。大白菜ABCB/PGP 蛋白的分子量和等电点通过进行在线分析。
1.3 大白菜ABCB/PGP 基因的结构分析、保守域分析和进化树分析
ABCB/PGP 基因的外显子-内含子的结构图使用GSDS 在线软件绘制。关于进化树的构建,使用MEGA 5.0软件自带的Clustal W 应用对蛋白的氨基酸序列进行比对分析,空格罚分设置为10,空格扩展罚分设置为0.2。然后将比对好的序列利用MEGA 5.0 软件构建进化树,进化树使用邻接法构建,采用泊松校正,成对删除和1 000次重复等建树参数然后将比对好的序列构成进化树。
2 结果与分析
2.1 大白菜ABCB/PGP 基因家族的鉴定和注释
根据拟南芥ABCB/PGP 蛋白的氨基酸序列,在大白菜基因组数据库中搜索比对,在大白菜中鉴定到31 个ABCB/PGP 蛋白,同时参考拟南芥ABCB/PGP 基因命名的方法对大白菜ABCB/PGP 基因进行了命名,见表1。31个ABCB/PGP 基因的开放阅读框长度在442~4 249 bp,编码147~1 416 个氨基酸,相应的蛋白分子量在24.6~332.1 kDa,等 电 点 在4.76~9.48。大 部 分ABCB/PGP 基因都定位在细胞质膜上。对大白菜ABCB/PGP 基因染色体定位的分析表明,ABCB/PGP 基因在大白菜的10 条染色体上分布不是很均匀,其中第3、4、6、7 和9 号染色体上较多,而第1、2、5、8 和10 号染色体上的ABCB/PGP 基因则比较少,仅有一两个分布其上,如图1 所示。
表1 大白菜ABCB/PGP 基因家族成员基因组信息和蛋白特征分析
2.2 大白菜ABCB/PGP 基因的系统发育分析和分类
为分析大白菜ABCB/PGP 基因的系统发育和分类,选取了大白菜、拟南芥这两个代表性物种中ABCB/PGP蛋白的氨基酸序列,使用MEGA 5.0 软件构建了NJ 进化树并对ABCB/PGP 基因进行了聚类分析,结果如图2 所示。结果表明,这2 个物种中的52 个ABCB/PGP 基因被聚类成6 个分支,分支为Clade Ⅰ、Clade Ⅱ、Clade Ⅲ、Clade Ⅳ、Clade Ⅴ和Clade Ⅵ。从进化树中可以看出每个分支都含有拟南芥ABCB/PGP 基因与大白菜ABCB/PGP基因,分布比较均匀。其中CladeⅠ分支是基因分布最多的,在Clade Ⅰ分支中含有9 个大白菜ABCB/PGP 基因,分别为BrABCB1~BrABCB9,而拟南芥ABCB/PGP 基因含有8 个,分别为AtPGP3、AtPGP4、AtPGP5、AtPGP7、AtPGP9、AtPGP11、AtPGP12、AtPGP21;分 支Clade Ⅴ是分布最少的,其中大白菜ABCB/PGP 基因含有2 个,为BrABCB25 和BrABCB26,拟南芥ABCB/PGP 基因也含有2 个,分别为AtPGP13 和AtPGP14。其他的Clade Ⅱ分支含有大白菜ABCB/PGP 基因9 个,含有拟南芥ABCB/PGP基因4 个;Clade Ⅲ分支含有大白菜ABCB/PGP 基因3 个,而含有拟南芥ABCB/PGP 基因2 个;Clade Ⅳ分支中含有大白菜ABCB/PGP 基因4 个,拟南芥ABCB/PGP 基因2个;Clade Ⅵ分支含有大白菜ABCB/PGP 基因5 个,拟南芥ABCB/PGP 基因也是2 个。
为进一步研究大白菜ABCB/PGP 基因在植物中的进化模式,选用了大白菜、拟南芥、水稻、玉米、杨树、小立碗藓、卷柏和桃这8 个代表性物种中的ABCB/PGP蛋白的氨基酸序列使用MEGA5.0 软件构建了进化树并对各物种中ABCB/PGP 基因进行了聚类分析,结果如图3所示。结果表明,这8 个物种的ABCB/PGP 基因被聚类成7 个分支,多了一个分支Clade Ⅶ。其中Clade Ⅰ~Ⅵ每个分支都有分布各个物种的基因,而Clade Ⅶ分支上没有大白菜和拟南芥的基因分布。
图1 大白菜ABCB/PGP 基因染色体定位
图2 大白菜和拟南芥ABCB/PGP 基因的进化树
2.3 大白菜ABCB/PGP 基因的基因结构分析
为研究大白菜ABCB/PGP 基因的基因结构,根据大白菜基因组信息获取了每一个ABCB/PGP 基因的DNA和CDS 序列信息并构建了其基因结构图(图4),结果表明大部分ABCB/PGP 基因都有4~13 个不等的外显子且各分支分布相对比较均匀,只有其中部分小分支如BrABCB24、BrABCB31 分布较少只有1~2 个。同时,大部分ABCB/PGP 基因都含有3~12 个不等的内含子,其中BrABCB24 有1 个内含子,而BrABCB31 则没有内含子。
图3 陆生植物8 个物种中ABCB/PGP 基因的进化树
图4 大白菜ABCB/PGP 的基因结构图
3 讨论与结论
本研究在大白菜基因组数据库中鉴定到了31 个ABCB/PGP 基因家族成员,该家族是一个成员数目相对较多的家族。Gao 等通过大白菜基因组数据库对生长素运输相关的3 个蛋白家族成员(AUX/LAX、PIN 和ABCB/MDR/PGP)进行了鉴定,其中筛选到27 个ABCB/PGP 基因家族成员,比本研究中鉴定到的基因家族成员少4个,分别为Bra025328、Bra039056、Bra027825和Bra033064[5]。但是需要注意的是,Bra027825 和Bra033064 这两个基因的开放阅读框长度跟其他ABCB/PGP 基因家族成员相比较小,笔者推测这两个基因可能是假基因或者没有拼接出全长序列。
本研究首先选取了大白菜和拟南芥2 个物种的ABCB/PGP 蛋白的氨基酸序列构建系统进化树,52个ABCB/PGP基因被聚类成6个分支,即CladeⅠ~CladeⅥ,然后进一步选取了大白菜、拟南芥、水稻、玉米、杨树、小立碗藓、卷柏和桃8 个代表性物种中的ABCB/PGP 蛋白的氨基酸序列进行聚类分析,发现这8 个物种的ABCB/PGP 基因被聚类成7 个分支,多了一个分支Clade Ⅶ,而Clade Ⅶ分支上均没有大白菜和拟南芥的基因分布。大白菜ABCB/PGP 基因在Clade Ⅶ的缺失原因仍有待进一步研究。