峨眉蔷薇Ro-DREB1C的克隆与生物信息学分析
2018-12-11周宁宁王俊云李淑斌王其刚
周宁宁,王俊云,李淑斌,陈 敏,张 颢,王其刚*
(1.云南省农业科学院花卉研究所,云南昆明 650200;2.国家观赏园艺工程技术研究中心,云南昆明 650200;3.云南省花卉技术培训推广中心,云南昆明 650000)
【研究意义】丰富耐寒性状相关的月季CBF基因的基础数据库。【前人研究进展】植物在经受非冰冻低温胁迫后,其抵御低温迫害的能力会得到提高,这一现象称为低温驯化[1]。在低温驯化过程中,通过信号转导途径激活相应转录因子与作用元件特异结合,调节下游抗逆基因的表达,可提高植物对低温胁迫的抗性[2]。DREB亚家族成员隶属于AP2/ERF家族,分为6个亚组(A-1亚组至A-6亚组),其中A-1亚组成员在植物低温应答过程中起着关键调控作用[3]。模式植物拟南芥基因组中A-1亚组含有4个DREB1/CBF和2个 DDF转录因子[4],其中CBF1、CBF2及CBF3在冷胁迫下能够被快速诱导激活[5],调控下游100多个基因的表达,同时CBFs之间又相互调控,致使其低温调控网络非常复杂[6]。近年来,DREB1/CBF转录因子在月季中的功能研究取得了一定的进展,如翟俊峰[7]等利用荧光定量PCR分析RhCBF在不同逆境胁迫下的表达情况,结果显示低温和盐胁迫均可以诱导Rh-CBF的表达,而干旱胁迫不能诱导其表达。王婷等[8]用半定量RT-PCR分析结果表明,Rh-DREB1A和Rh-DREB1B在月季花瓣中能够被失水胁迫强烈诱导,但是不受乙烯诱导。Chen等从苜蓿中克隆得到MtDREB1C基因,并分别在苜蓿(Medicago truncatula)和月季花(Rosa Chinensis Jacq.)植株中进行了功能验证,研究表明在苜蓿中过量表达MtDREB1C会抑制新梢生长和提高植株的耐寒能力,而将Mt-DREB1C转到月季中表现为转基因植株的耐寒力增强,且不会造成植株的畸形生长[9]。随后,Chen等利用MtDREB1C基因和RcXET基因构建了共表达载体,获得MtDREB1C和RcXET共表达的转基因月季植株,研究表明该转基因植株具有更强的耐寒和耐旱能力[10]。【本研究切入点】项目组前期结合野生资源原生地生境及植株生长情况的调查和冬季栽培的田间表现,选择了10个野生种,对其低温胁迫下叶片相对电导率、脯氨酸、丙二醛、可溶性糖及可溶性蛋白的含量进行了测定。研究表明10个野生种中,峨眉蔷薇原变种的耐寒性最强[11-12]。【拟解决的关键问题】本研究以峨眉蔷薇原变种为材料,克隆获得了与耐寒相关的转录因子Ro-DREB1C,借助相关生物信息学软件,分析该基因编码的氨基酸序列结构,对其蛋白质的理化性质、二级、三级结构等进行预测,并对Ro-DREB1C在拟南芥AP2基因家族各亚组基因成员中构建进化树,明确 Ro-DREB1C与其他月季CBF基因的关系,及其所隶属的基因家族,以期为后续月季DREB亚家族成员的功能研究奠定相应基础。
1 材料与方法
1.1 试验材料
峨眉蔷薇引种于昆明轿子雪山(北纬26°08'44″、东经 102°08'46″),海拔 2300 m[13],现种植于云南省农业科学院花卉研究所国家观赏园艺工程技术研究中心野生蔷薇资源圃。
1.2 主要试剂
RNA提取试剂盒EasyPure Plant RNA Kit(ER301)、RNA反转录试剂盒 TransScript II One-Step gDNA Removal and cDNA Synthesis Supermix、反转录引物 Anchored Oligo(dT)20Primer和 Random Primer(N9)、RNase-free Water、TransStart TopTaq DNA Polymerase(AP151)、克隆载体pEASY-T5 Zero Cloning Kit(CT501)等,购于北京全式金生物技术有限公司。
1.3 试验方法
1.3.1 峨眉蔷薇 cDNA的制备 按照 EasyPure Plant RNA Kit(ER301)说明书所示,提取峨眉蔷薇嫩茎组织 RNA,并用30 μl RNase-free Water洗脱。用1.5%的琼脂糖凝胶和Bio Drop Lite PC超微量可见-紫外分光光度计检测RNA质量和浓度。然后根据TransScript One-step gDNA Removal and cDNA Synthesis SuperMix试剂盒操作要求,分别利用引物Anchored Oligo(dT)20Primer和Random Primer(N9)反转录成2种cDNA后于-20℃保存备用。
1.3.2 Ro-DREB1C基因的克隆 根据GenBank中检索到的月季品种‘寒锦4号’RhCBF基因序列,利用Primer5.0软件设计上下游特异引物,尽量避免选择形成发夹结构与二聚体的引物,GC含量不超过46%,预计扩增大小为600~700 bp。引物序列:上游,5'-TATAAATCCCCATGCTCT-3';下游,5'-GGTCAACAATCCAAGTCA-3'。扩增引物由北京六合华大基因科技股份有限公司合成。
利用设计的上下游引物,以反转录得到的2种cDNA为模板进行PCR扩增。PCR反应体系50 μl:cDNA 模 板 3 μl,上 下 游 引 物 各 1 μl,TransStart TopTaq DNA Polymerase 1 μl,dNTP(2.5 mM)5 μl,ddH2O 39 μl。PCR反应程序:95℃预变性5 min,(95℃变性30s+45℃复性30s+72℃延伸60s)×40个循环,最后72℃延伸5 min,4℃保存。PCR产物用1.5%的琼脂糖凝胶电泳检测。
选择扩增效果较好的PCR产物4 μl和pEASYT5 Zero载体1 μl,PCR 仪中25 ℃连接30 min。连接产物全部转化Trans1-T1感受态细胞中,42℃热激30 s,冰上静置2 min,加入400 μl SOC 培养基中,37℃ 200 r/min摇菌1 h。摇好的菌液4 000 r/min离心1 min后弃上清,取100 μl涂于含氨苄青霉素(Amp+)抗性的LB平板上,37℃过夜培养。从平板上随机挑取白色单菌落,使用上下游引物进行菌落PCR鉴定,取PCR鉴定合格的菌悬液,加入1 mL含氨苄青霉素抗性的LB培养基中,37℃ 200 r/min摇菌过夜。次日送Invitrogen公司测序。
1.3.3 生物信息学分析 利用 Geneious 5.3.6软件对克隆的Ro-DREB1C全长序列进行基因注释,并对Ro-DREB1C和RhCBF进行序列比对分析;使用NCBI的 CD-search 工具(http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)搜索氨基酸保守结构域;选用MEGA7软件构建系统进化树;使用Prot-Param(http://web.expasy.org/protparam/)、Predict-Protein(http://www.predictprotein.org)、SWISSMODEL(http://swissmodel.expasy.org/)、Phyre2(http://www.sbg.bio.ic.ac.uk/~ phyre2/html/page.cgi?id=index)TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)、TMpred(http://www.ch.embnet.org/software/TMPRED_form.html)、SignalP(http://www.cbs.dtu.dk/services/SignalP/)等在线软件分析Ro-DREB1C蛋白的一级结构(理化性质)、信号肽及亚细胞定位、二级结构、三级结构预测[14]。
2 结果与分析
2.1 峨眉蔷薇总RNA质量检测
从峨眉蔷薇嫩茎组织提取的RNA用1.5%琼脂糖凝胶电泳检测,点样孔无异物、下部无DNA条带,表明该样品无蛋白质和DNA污染;得到带形完整的3条带,分别为28S、18S和5S rRNA,RNA完整性较好(图1)。紫外分光光度仪测定RNA浓度,以备后面实验所需。
2.2 峨眉蔷薇Ro-DREB1C基因目标片段的扩增与TA克隆
1~4号样本是以引物Anchored Oligo(dT)20反转录得到的cDNA为模板扩增的PCR产物,5~8号是以引物Random Primer(N9)反转录得到的cDNA为模板扩增得到的PCR产物。结果如图2左所示:1号和6号样本在600~750 bp扩增得到相同大小的条带。选择条带较亮的6号PCR产物进行载体构建,培养得到了理想的白色菌落。
图1 峨眉蔷薇嫩茎组织总RNA(5 μl)电泳图Fig.1 Electrophoresis of total RNA(5 μl)from young stem tissue in R.omeiensis Rolfe f.omeiensis
从平板上随机挑取了10个单菌落,进行PCR扩增,用1.5%琼脂糖凝胶电泳检测,Trans2K Plus Π DNA Marker和菌落PCR产物点样量均为5 μl。结果如图2右所示:7号样本在650~800 bp扩增到一条明显的片段,与预扩增片段大小一致,切胶回收条带清晰、效果良好,可用于测序。
2.3 Ro-DREB1C 序列分析
利用 Geneious5.6.3软件分析 Ro-DREB1C基因,包含一个长度为603 bp的开放阅读框(Open reading frame,ORF),编码200个氨基酸,数据已提交至 GenBank(登录号:KX397104)。Ro-DREB1C与RhCBF基因编码区的序列比对显示:2个基因编码区碱基序列相似度(Pairwise Identity)为96.5%,氨基酸序列相似度为95%,共检查到21个潜在SNP,其中8个为潜在同义SNP位点,13个为潜在非同义SNP位点,共导致10个差异氨基酸。
2.4 Ro-DREB1C蛋白的理化性质及一级结构分析
用ProtParam软件预测Ro-DREB1C蛋白质的理化性质。结果显示:此蛋白质分子式为C968H1539N263O299S11,分子量 21 998.1D,理论等电点(pI)为6.75,说明该蛋白为弱酸性蛋白质;氨基酸残基中丝氨酸 Ser(11.5%)、亮氨酸 Leu(11.0%)及丙氨酸Ala(9.5%)的频率较高(图4),正负电荷氨基酸残基数均为24;消光系数(M-1 cm-1 γ=280 nm)为29 575,其不稳定系数为53.88,大于40,属不稳定类蛋白质[15]。疏水指数为75.65,平均亲水性为 -0.354,属可溶性蛋白[16]。
图2 以cDNA为模板的PCR产物(左)和菌落PCR产物(右)电泳图Fig.2 Electrophoresis for PCR amplified fragment of cDNA template(left)and PCR amplified fragment of colony(right)
图3 Ro-DREB1C和RhCBF的序列比对图Fig.3 Sequence alignment between Ro-DREB1C and RhCBF
用ProtScale程序绘制Ro-DREB1C蛋白质的亲疏水性序列谱,窗口大小使用默认值9,图形输出显示(图5):该蛋白质存在4个高分值,分别分布在30、102、134、174氨基酸位点附近;而5个低分值峰值位于 17、47、120、152、183 氨基酸位点附近,这些区域属于亲水性。从ProtScale预测文本结果显示,疏水性氨基酸(Score>0)占38%,亲水性氨基酸(Score<0)占62%。
2.5 Ro-DREB1C亚细胞定位预测
利用PSORT II Prediction软件对Ro-DREB1C的亚细胞定位进行预测分析,结果显示,Ro-DREB1C在细胞核、线粒体、细胞质、细胞骨架和高尔基体的分布比例分别为 47.8%、21.7%、17.4%、8.7%和4.3%,在细胞核中的分布最多。利用TMHMM和TMpred在线工具对Ro-DREB1C蛋白进行跨膜区分析,结果均显示该蛋白无跨膜区。通过SignalP在线工具对信号肽分析显示,该基因编码的蛋白质无信号肽序列存在。
2.6 Ro-DREB1C二、三级结构分析
对蛋白质二级结构的预测分析有助于认识蛋白的空间结构。选择 PredictProtein软件预测 Ro-DREB1C 的二级结构,表明:α-螺旋占19.5%,β-折叠占9%,无规卷曲占71.5%。由于无规则卷曲所占比例超过50%,此蛋白不能被归入明确的二级结构如折叠片或螺旋的多肽区段[17]。
图4 氨基酸组成Fig.4 Amino acid composition
运用CD-search工具分析Ro-DREB1C基因编码蛋白的保守结构域(图6),分析认为该蛋白属于乙烯反应元件结合蛋白AP2/EREBP(ethylene responsive element binding protein),具有一个由61个氨基酸残基组成的DNA结合域,可与启动子区域中的GCC box特异结合。
结合同源建模软件SWISS-MODEL和线串法(Threading)Phyre2在线软件对Ro-DREB1C蛋白质综合建模,由建模输出的数据可知:同源建模软件SWISS-MODEL 在线搜索到模板1gcc.1.1,该模板和预测序列相似度为43%,建模位点范围59~118,覆盖率0.3,GMQE 值 0.19,偏低,代表此模型可信度低;线串法建模软件 Phyre2在线搜索模型为d1gcca,模板和预测序列相似度为52.4%,建模位点范围59~119,覆盖度30.5%,可信度(confidence值)为99.9%。综上所述,最终选用线串法分析结果,模型如图7。
图5 Ro-DREB1C氨基酸序列的疏/亲水性预测Fig.5 Predicted hydrophobicity/hydrophily of the deduced amino acid sequence of Ro-DREB1C
图6 Ro-DREB1C蛋白质结构域分析Fig.6 Analysis of conserved domain of Ro-DREB1C protein
图7 Ro-DREB1C的三级结构预测建模Fig.7 The tertiary structure of Ro-DREB1C by Phyre2
图8 月季CBF/DREB1蛋白相对于拟南芥DREB亚家族的进化分析Fig.8 Phylogenetic analysis of Ro-DREB1C among DREB subfamily in Arabidopsis thaliana
2.7 Ro-DREB1C的同源性分析
在拟南芥基因组数据库中(https://www.arabidopsis.org/),利用 BLAST 工具,对 Ro-DREB1C 的氨基酸序列进行BlastP分析,结果发现:匹配度最高的基因为DREB亚家族的CBF1/DREB1B和CBF2/DREB1C,Socre(bits)为120,E value分别为4×e-28、7×e-28。根据BlastP的搜索结果,选择了A-1亚组(CBF1、CBF2、CBF3、CBF4、DDF1、DDF2)和 A-2 亚 组 (AT3G11020、AT5G05410、AT1G75490、AT2G40340、AT2G40350)、A-4 亚组(AT2G36450、AT5G52020、AT1G01250、AT3G16280、AT5G25810)、A-5 压组 (AT4G06746、AT2G23340、AT4G36900、AT3G50260、AT5G67190)、A-6 亚组(AT1G22190、AT1G78080、AT1G36060、AT1G64380、AT4G13620)。此外,还选取了已在月季中进行诱导表达或转基因功能验证的基因 RhCBF[7]、Rh-DREB1A 和 Rh-DREB1B[8]、MtDREB1C[9]。利用 MEGA7 软件,选择邻位连接法(neighbor-joining,NJ),对以上31个基因构建进化树(如图8)。结果表明:拟南芥的各亚组成员分别聚为一类;Ro-DREB1C、Rh-DREB1A、Rh-DREB1B、RhCBF和MtDREB1C与拟南芥 A-1亚组成员聚为一类;A-1亚组中,Ro-DREB1C与RhCBF为同一个基因聚类在一起,Rh-DREB1A、Rh-DREB1B和MtDREB1C与拟南芥的DDF基因聚类在一起。
3 讨论
有效鉴定和利用野生种质资源的优良基因或等位基因,通过优良等位基因的累积提高植物育种的遗传增益,是现代分子育种的热点[18]。本研究利用克隆技术得到Ro-DREB1C基因,其同源性分析表明Ro-DREB1C属于AP2家族DREB亚家族中的A-1亚组成员。拟南芥A-1亚组共有6个基因,蔷薇或月季中A-1亚组的基因数还未知。分别对Rh-DREB1A、Rh-DREB1B、Ro-DREB1C 氨基酸序列进行比对,结果表明这3个基因之间的氨基酸序列相似度较低,在40% ~55%,结合系统发育树(图8)的结果,推测Ro-DREB1C、Rh-DREB1A、Rh-DREB1B 为旁系同源,故将从峨眉蔷薇克隆得到的DREB基因命名为Ro-DREB1C(‘Ro’为种的拉丁名缩写)。野生的峨眉蔷薇Ro-DREB1C与现代月季品种的Rh-CBF为直系同源,其CDS区的序列比对发现了21个SNP位点,无碱基的缺失或插入。其中有10个A/G、4个T/C之间发生转换(transition),3个A/C、2个A/T、1个G/C、1个C/T之间的颠换(transversion)。前人研究结果指出:从理论上分析,若单个碱基突变是随机的,则SNP位点中颠换所占比例应为转换的2倍,但实际上SNP位点的产生多由单个碱基的转换所引起[19],本研究的结果与此相符。现代月季品种形成过程中主要参与的野生种有8~10个[20],峨眉蔷薇不在其中,而Ro-DREB1C和RhCBF编码区存在丰富的单核苷酸多样性(SNP),说明峨眉蔷薇与现代月季品种间具有丰富的遗传多样性,因此认为峨眉蔷薇可作为月季耐寒育种材料进行保存利用。
通过生物信息学分析软件对Ro-DREB1C蛋白质进行结构分析,推测该蛋白质为弱酸性、不稳定类、亲水性蛋白,二级结构主要由无规则卷曲和α-螺旋构成,β-折叠散布于其中,与拟南芥CBF2分析结果一致[21]。
4 结论
克隆了峨眉蔷薇的一个CBF基因命名为Ro-DREB1C,分析了该基因编码蛋白的理化性质和二三级结构,确认了隶属于AP2家族DREB亚家族A-1亚组成员。此外,野生的峨眉蔷薇Ro-DREB1C与现代月季品种的RhCBF比较,编码区存在丰富的单核苷酸多态性(SNP),可作为优秀的月季耐寒育种材料加以保存和利用。