亚麻COBRA基因家族的鉴定与生物信息学分析
2019-09-10齐燕妮李闻娟王利民赵玮党照谢亚萍张建平
齐燕妮 李闻娟 王利民 赵玮 党照 谢亚萍 张建平
摘要:COBRA基因编码糖基磷脂酰肌醇锚定蛋白,是次生壁加厚和纤维素含量的调节因子。亚麻纤维为韧皮纤维,纤维产量与次生壁中纤维素含量及次生壁加厚密切相关。通过BLASTP和Pfam分析,鉴定到24个亚麻COBRA家族成员,并对其进行基因结构、蛋白理化性质及系统进化等生物信息学分析。结果表明,有22个成员具有跨膜结构域,21个成员具有N-端信号肽,16个成员具有GPI锚定位点,所有蛋白均具有CCVS保守结构域而且都定位在细胞膜。基因结构和系统进化分析表明,亚麻COBRA基因家族分为2个亚家族:COBRA-I和COBRA-II,2个亚家族的基因结构具有明显的差异。
关键词:亚麻;纤维;COBRA基因家族;序列分析;系统进化分析
中图分类号:S565.9 文献标志码:A 文章编号:1001-1463(2019)09-0033-06
doi:10.3969/j.issn.1001-1463.2019.09.009
Abstract:The COBRA gene encodes the glycosylphosphatidylinositol anchoring protein, which is a regulator of secondary wall thickening and cellulose content. Flax fiber is bast fiber, and fiber yield is closely related to the content of cellulose in secondary wall and the thickening of secondary wall. Through BLASTP and Pfam analysis, 24 members of the COBRA family were identified in this study, and the gene structure, physicochemical properties of proteins, systematic evolution were conducted. The results showed that 22 members had transmembrane domain, 21 members had N-terminal signal peptide, 16 members had GPI anchor site, and all proteins had CCVS conserved domain and were located in cell membrane. The results of gene structure analysis and systematic evolution showed that the COBRA gene family was divided into two subfamilies, COBRA-I and COBRA-II, the gene structure of the two subfamilies were significantly different. This study laid a foundation for the in-depth study on the function of COBRA gene and the use of COBRA gene to increase the fiber yield.
Key words:Flax;Fiber;COBRA gene family;Sequence analysis;Phylogeny analysis
亞麻(Linum usitatissimum L.)是一年生自花授粉的植物,是亚麻科中唯一重要的农作物 [1 ]。亚麻根据其用途,分为油用、纤维用两种,也有油纤两用亚麻[2 ]。纤维亚麻株高可达到80~120 cm、分枝少、籽粒小,主要分布西欧、俄罗斯、中国[3 ]。亚麻纤维是纺织产品制造的原材料,中国亚麻纤维需求较大,而且是世界上最大的亚麻纤维出口国,黑龙江占亚麻纤维总产量的85%[4 ]。提高纤维产量是亚麻育种的主要目标之一,明确纤维合成及调控基因可以为纤维产量的提高提供理论基础。
COBRA基因编码糖基磷脂酰肌醇锚定蛋白(glycosyl-phosphatidyl inositol-anchored protein),一般具有N-端信号肽、碳水化合物结合模块(CBM)、高度保守的中心半胱氨酸富集区(CCVS)以及将蛋白靶向内质网的C-端GPI锚定位点和疏水尾巴[5 ]。COBRA蛋白是细胞定向生长和纤维素结晶度的关键调节因子,其突变会导致细胞次生壁厚度和纤维素含降量低[6 - 7 ]。已经在拟南芥、番茄、水稻及玉米中分别鉴定到12、17、11、9个COBRA基因家族成员,拟南芥中COBRA家族分为2个亚家族[8 - 11 ]。我们利用生物信息学方法,在亚麻全基因组中对COBRA基因家族进行鉴定,并对其序列及系统进化进行分析,以期为深入研究COBRA家族各成员功能,进而提高亚麻纤维产量提供依据。
1 材料与方法
1.1 亚麻COBRA基因家族的鉴定
从NCBI数据库中下载拟南芥COBRA基因家族各成员的蛋白序列。使用BlastP在亚麻全基因组蛋白数据库中进行搜索,阈值小于等于1E-5,得到候选序列后用Pfam对结构域进行确认。
1.2 COBRA基因家族的序列分析
利用Expasy在线分析蛋白质的分子量、等电点,采用SignalP-5.0对亚麻COBRA蛋白进行N-端信号肽预测。使用big-PI分析蛋白的C端疏水末端锚定位点,用SOSUI在线预测跨膜结构域,用MEME分析 COBRA蛋白的保守基序,使用Plant-mPloc进行亚细胞定位预测。利用IBS绘制基因结构图。
1.3 COBRA基因家族的进化分析
利用MEGA6.0软件中的ClustalW,采用默认参数,对拟南芥和亚麻COBRA蛋白的氨基酸序列进行多重比对,比对结果采用NJ(Neighbor-Joining)法构建系统进化树,Bootstrap校验值为1 000次。
2 结果与分析
2.1 亚麻COBRA基因家族的鉴定
利用12条拟南芥COBRA基因氨基酸序列在亚麻全基因组进行BLASTP搜索,获得亚麻COBRA蛋白的候选序列。用Pfam对候选序列进行注释,最终确定亚麻基因组COBRA家族含有24个成员,均含有COBRA家族的特有结构域COBRA,命名为LuCOBL1~LuCOBL24(表1)。
2.2 亚麻COBRA基因家族的序列和结构域特征
对亚麻COBRA基因家族进行系统进化分析,并对其外显子-内含子结构进行分析(图1,表1)。从进化树可以看出,亚麻COBRA蛋白与拟南芥类似,也被分为2个亚家族(COBRA-I和COBRA-II)。COBRA-I有18个成员,包括LuCOBL-3、LuCOBL- 4、LuCOBL-6~LuCOBL-16、LuCOBL-20~Lu COBL-24,蛋白质长度为375~616 aa,大部分成员的氨基酸数量在400多个,外显子数量为4~8个,内含子数量为3~7个;其中有14个基因均含有6个外显子,5个内含子,说明同一亚家族的基因具有相似的基因结构;COBRA-II包含LuCOBL-1、LuCOBL- 2、LuCOBL-5、LuCOBL-17~LuCOBL-19共6个基因,蛋白质长度范围在662~709 aa,外显子数量2~3个;其中有4个基因均含有2个外显子。从以上结果看出,亚麻COBRA-II亚家族的蛋白长度明显大于 COBRA-I,但外显子数量却比较少,2个亚家族具有明显的差异。
对亚麻24个COBRA蛋白的理化性质进行分析表明,不同亚家族之间,同一亚家族不同成员之间均有差异(表1)。分子量为41 648.89~77 575.57 Da,等电点为5.61~9.12,跨膜结构域为0~3,大部分蛋白含有2个跨膜结构域。信号肽预测结果表明,除COBRA-I亚家族的LuCOBL-8、LuCOBL-16和LuCOBL-3無N-端信号肽外,其余蛋白质均含有信号肽序列。COBRA-I亚家族除LuCOBL-9、LuCOBL-21、LuCOBL-22和LuCOBL-24外,其余成员都有GPI锚定位点,而COBRA-II只有2个成员具有GPI锚定位点(LuCOBRA-1和LuCOBRA-17)。对COBRA蛋白进行亚细胞定位预测,所有基因都定位在细胞膜。
亚麻COBRA蛋白多重序列比对结果表明,所有亚麻COBRA蛋白均具有保守结构域CCVS(图2)。利用MEME对亚麻COBRA蛋白进行Motif预测,所有蛋白都具有Motif1、Motif3和Motif5,说明这3个Motif为COBRA家族的特征性Motif。此外,有23个基因含有Motif2,有17~20个基因含有Motif4、Motif6、Motif15、 Motif20,说明这些Motif在COBRA蛋白中也相当保守(图3)。
2.3 亚麻COBRA基因家族的系统进化分析
选择模式植物拟南芥COBRA基因和亚麻COBRA基因,利用MEGA6.0以NJ法构建系统进化树(图4)。从进化树上可以看出,亚麻和拟南芥的COBRA基因都被聚类在两大支上,与单独用亚麻蛋白序列构建进化树的聚类结果一致。在COBRA-I亚家族中,AtCOBL4与LuCOBL7和LuCOBL20,AtCOB与LuCOBL10、LuCOBL13和LuCOBL15,AtCOBL3与LuCOBL6、LuCOBL11和LuCOBL24进化距离较近;在COBRA-I亚家族中,AtCOBL10、AtCOBL11与LuCOBL2和LuCOBL18,AtCOBL7、AtCOBL8、AtCOBL9与LuCOBL17和LuCOBL19遗传距离比较相近。
3 结论与讨论
共鉴定到24个亚麻COBRA基因家族成员。对其基因及蛋白序列进行分析发现,所有蛋白都具有CCVS结构域,有21个蛋白含有N-端信号肽,22个蛋白含有跨膜结构域,16个蛋白具有GPI锚定位点,这符合COBRA蛋白的主要特征[5 ]。LuCOBL2、LuCOBL8、 LuCOBL16等基因编码蛋白虽缺少信号肽或GPI锚定位点,但由于其含有COBRA家族特有结构域COBRA(PF0 4833.1012),亲缘关系与其他成员又比较接近,所以将其作为亚麻COBRA基因。从亚麻COBRA基因家族整体分析结果看,亚麻COBRA基因分为2个亚家族,与拟南芥分类结果相同,同一亚家族的基因具有相似的基因结构,蛋白长度,不同亚家族之间差异明显。
目前对COBRA基因家族的研究在拟南芥、水稻、番茄、玉米、杨树等植物中有过报道,也研究过其中一些成员的功能[8 - 12 ],亚麻COBRA基因家族的研究尚未有报道,因此本研究对亚麻COBRA基因家族的鉴定及一系列生物信息学分析,为进一步挖掘各成员的功能奠定了基础。然而,本研究只是初步鉴定了亚麻COBRA基因,对于无COBRA家族主要特征的个别成员需进行更深入的分析验证,同时需要利用CRISPR/Cas9、过表达、反义RNA、遗传转化等技术对各成员的具体功能进行研究,以便更好的利用COBRA基因进行亚麻育种。
参考文献:
[1] ZOHARY D. MONOPHYLETIC V S. Polyphyletic origin of the crops on which agriculture was founded in the near east[J]. Gen. Resour. Crop Evol.,1999(46):133-142.
[2] 张运晖,赵 瑛,罗俊杰. 甘肃胡麻产业发展浅议[J]. 甘肃农业科技,2013(7):54-55.
[3] GREEN A G,CHEN Y,SINGH S P,et al. Flax. In Compendium of transgenic crop plants[D]. Oxford:BlackwellPublishing Ltd,2008:199-226.
[4] WU J,ZHAO Q,ZHANG L,et al. QTL mapping of fiber-related traits based on a high-density genetic map in flax (Linum usitatissimum L.)[J]. Front. Plant. Sci.,2018(9):885.
[5] BORNER G H,LILLEY K S,STEVENS T J,et al. Identification of glycosyl phosphatidylinositol-anchored proteins in Arabidopsis,a proteomic and genomic analysis[J]. Plant Physiol,2003(132):568-577.
[6] BROWN, D M, ZEEF L A H, ELLIS J, et al. Identification of novel genes in Arabidopsis involved in secondary cell wall formation using expression profiling and reverse genetics[J]. Plant Cell, 2005(17):2281-2295.
[7] SATO K,SUZUKI R,NISHIKUBO N,et al. Isolation of a novel cell wall architecture mutant of rice with defective Arabidopsis COBL4 ortholog BC1 required for regulated deposition of secondary cell wall components[J]. Planta,2010(232):257-270.
[8] ROUDIER F,SCHINDELMAN G,DESALLE R,et al. The COBRA family of putative GPI-anchored proteins in Arabidopsis a new fellowship in expansion[J]. Plant Physiol.,2002(130):538-548.
[9] CAO Y,TANG X F, GIOVANNONI J,et al. Functional characterization of a tomato COBRA-like gene functioning in fruit development and ripening[J]. BMC Plant Biol.,2012(12):211.
[10] DAI X X,YOU C J,WANG L,et al. Molecular characterization,expression pattern,and function analysis of the OsBC1L family in rice[J]. Plant Mol. Biol.,2009(71):469-48119.
[11] BRADY S M,SONG S,DHUGGA K S,et al. Combining expression and comparative evolutionary analysis. The COBRA gene family[J]. Plant Physiol.,2007(143):172-187.
[12] YE X,KANG B G,OSBURN L D,et al. The COBRA gene family in populus and gene expression invegetative organs and in response to hormones and environmental stresses[J]. Plant Growth Regul.,2009(58):211-223.
(本文責编:陈 珩)