油莎豆乙酰乳酸合酶基因CeALS的克隆与分析
2022-06-09肖艳华邹智赵永国郭安平张丽
肖艳华 邹智 赵永国 郭安平 张丽
(1.中南民族大学生命科学学院 武陵山区特色资源植物种质保护与利用湖北省重点实验室,武汉 430074;2.中国热带农业科学院三亚研究院 热带生物技术研究所 海南省南繁生物安全与分子育种重点实验室,海口 571101;3.广东石油化工学院生物与食品工程学院,茂名 525000)
杂草是影响农作物生长与产量的重要限制因子。一直以来,杂草防除都是病虫草害防治过程中的重中之重。除草剂,又名除莠剂,是一类可使杂草彻底或选择性枯死的药剂。除草剂的发明及其在农业生产上的广泛应用为杂草的高效防除创造了条件。根据有效成分的化学结构,除草剂可分为氨基酸类、三嗪类、苯脲类、酰胺类等,其作用机制是通过干扰与抑制生理代谢而使杂草死亡,如影响光合作用、影响脂肪酸的合成、影响色素的合成、阻碍氨基酸的合成、干扰叶酸的形成、干扰激素平衡等[1]。植物中目前已确定的除草剂靶标约有10余种[2],其中,乙酰乳酸合酶(acetolactate synthase,ALS,EC2.2.1.6)或乙酰羟酸合酶(acetohydroxyacid synthase,AHAS)是合成缬氨酸、亮氨酸、异亮氨酸等支链氨基酸的关键酶,其在缬氨酸和亮氨酸的合成中催化2分子丙酮酸生成乙酰乳酸和二氧化碳,而在异亮氨酸的合成中催化1分子丙酮酸与1分子α-丁酮酸生成2-乙醛基-2-羟基丁酸和二氧化碳[3]。ALS基因广泛分布于各类植物以及真菌、细菌、古细菌和藻类中,在基因组中以单拷贝或小家族的形式存在[3]。目前己开发的ALS抑制剂有50多种,可归为磺酰脲(sulfonylurea,SU)、咪唑啉酮(imidazolinone,IMI)、三唑并嘧啶(triazolopyrimidine,TP)、嘧啶硫代苯甲酸酯(pyrimidinyl-thiobenzoate,PTB)和磺酰胺羰基三唑啉酮(sulfonyl-aminocarbonyltriazolinone,SCT)等5大类[4]。这些抑制剂通过与ALS结合而使其失活,进而造成支链氨基酸合成受阻、蛋白质合成停止、有丝分裂细胞停止在G1阶段的S期(DNA合成期)和G2阶段的M期,最终导致植物停止生长并失绿黄化死亡,具有高效、低毒、环境友好、选择性强等优点[2,4]。虽然如此,ALS抑制剂的广泛和长期应用极大加速了杂草的进化,至今报道的抗性杂草已超过160种[5]。抗性的分子基础主要源于ALS的点突变,如Ala122、Pro197、Ala205、Asp376、Arg377、Trp574、Ser653和 Gly654( 对 应于 AtALS 的相应位点)[4-5]。
油莎豆(Cyperus esculentus L.),又名油莎草、虎坚果、铁荸荠、黄色特格拉斯(yellow nutsedge)、地下板栗、地下核桃等,是一种优质、高产、综合利用前景广阔的集油、粮、草、饲于一体的经济作物[6]。与香附子(Cyperus rotundus)或紫色特格拉斯(purple nutsedge)一样,隶属于禾本目莎草科莎草属的油莎豆地上长草、地下结豆;不同的是,油莎豆的块茎积累高水平的油脂(24%-35%)[7]。相比其他油料作物,油莎豆具有生育期短(70-150 d)、生物量大(亩产鲜豆800-2 000 kg、鲜草2 000 kg以上)、每亩产油量高(超过100 kg)、适应性广(我国多数地区均可种植)、病虫害少、抗逆性强(耐旱、耐涝、耐高温、耐盐碱、耐贫瘠等)、发展潜力大、适合机械化等特点,便于在不挤占粮食和大豆生产面积的情况下增加我国的油脂和饲料原料供给,缓减对国外大豆的依赖程度,满足国家的战略需求[6,8]。但是,在我国华中、华南乃至华北地区大面积推广种植油莎豆存在一定的生态风险:首先,油莎豆的地下茎系统非常发达,其中匍匐茎和块茎均可繁殖,多数除草剂不能将其彻底清除,这也是为什么香附子成为世界恶性杂草的主要原因;其次,地里残留的油莎豆块茎萌发不整齐,且在上述区域可安全越冬,来年势必成为连茬作物的杂草;此外,ALS抑制剂抗性在莎草属的部分植物中已有发现,其中包括油莎豆[9-12]。为摸清我国油莎豆资源的遗传基础,本研究对油莎豆的ALS基因进行克隆,并基于现有的种质资源分析其遗传变异,揭示其序列特征、进化关系及表达特性,以期为今后的分子设计育种奠定基础。
1 材料与方法
1.1 材料
供试材料为种植于中国热带农业科学院热带生物技术研究所文昌试验基地(海南文昌)的圆粒型油莎豆热研1号及另外55份种质,早期初步发现其对ALS抑制剂无抗性。用于提取DNA的幼嫩叶片直接采集于试验地,而用于提取RNA的热研1号于采样前10 d移栽至温室(海南海口),具体培养条件和样品采集详见文献[8]。大肠杆菌DH5α感受态细胞和植物表达载体pCAMBIA1301由本实验室制备和保存;引物合成和常规DNA测序委托北京擎科生物技术有限公司完成;基因组测序委托武汉希望组生物科技有限公司完成;天根DNA Marker Ⅲ(货号MD103)、天根植物多糖多酚RNA提取试剂盒、赛默飞cDNA第一链合成试剂盒、Omega快速质粒小提试剂盒、Omega DNA纯化回收试剂盒、诺唯赞ClonExpress II One Step Cloning Kit(C112-02)试剂盒、Promega DNase I酶、宝生物高保真DNA聚合酶及各类分析纯生化试剂和实验耗材均购自相应的试剂公司。
1.2 方法
1.2.1 ALS基因的鉴定 拟南芥的ALS基因下载于Araport11(https://www.arabidopsis.org/),并以其蛋白序列作为种子tBLASTn检索研究组前期获得的油莎豆全长转录组[8]以及代表性植物的基因组[13-14]。
1.2.2 总RNA提取与cDNA第一链的合成 采用天根试剂盒单独提取幼嫩叶片、成熟叶片、衰老叶片、芽、芽茎、块茎等不同组织样本的总RNA,经纯度、浓度和完整性检测合格后用DNase I酶清除残存的DNA,并用反转录试剂盒合成cDNA第一链,然后置于-80℃冰箱保存备用。
1.2.3 基因克隆 基于上述转录组文库获得的CeALS转录本序列,采用PrimerPremier5.0软件设计基因克隆和同源重组引物对CeALSF(5′-TCC TCT CCA TTC CAT TCC ATT CG-3′)/CeALSR(5′-ACA ACA CCT GAG GGA ACC GC-3′)和 CeALSHF(5′-CAC GGG GGA CTC TTG ACC ATG GCT TCC TCT TCC TCC CTC-3′)/CeALSHR(5′-CTG GTC ACC TGT AAT TCA CAC CTA GTA CAC AGT CCG GCC ATC-3′)(下划线为可与pCAMBIA1301重组的同源臂)。基因克隆参照文献[15]进行,PCR产物采用1%琼脂糖凝胶电泳检测;为一步完成植物表达载体的构建,研究以稀释100倍的第一轮PCR产物作为模板,利用同源重组引物进行第二轮PCR,产物电泳检测后切胶回收目的条带;同时,用Nco I和Pml I 37℃酶切pCAMBIA1301 12 h,产物经0.8%琼脂糖凝胶电泳检测后回收目的条带;然后,将上述线性化载体和PCR胶回收产物按1∶2比例混合,并用Exnase II 37℃催化2 h,构建载体pCAMBIA1301-CeALS。重组质粒转化DH5α感受态后,参照文献[15]进行后续的菌落PCR、测序及质粒的提取。
1.2.4 基因组测序与分析 采用改良的CTAB法[16]分别提取56份叶片材料的基因组DNA,经纯度、浓度和完整性检测合格后等量混合,然后用全基因组鸟枪法构建二代400 bp的小片段DNA文库,并利用NovaSeq 6000进行150 bp双末端测序。序列比对和SNP分析分别采用 bwa-mem(v0.7-17)[17]和GATK(v3.8.1)[18]。
1.2.5 序列分析 参照文献[19],利用ProtParam(https://web.expasy.org/protparam/)分析蛋白的理化特性;利用Protscale(http://cn.expasy.org/tools/protscale.html)分析亲水 /疏水性;利用 TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM/)预测跨膜螺旋;利用ChloroP 1.1(http://www.cbs.dtu.dk/services/ChloroP/)预测亚细胞定位和叶绿体信号肽剪切位点;利用CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 和 SMART(http://smart.embl-heidelberg.de/) 分析保守结构域;利用InterPro(http://www.ebi.ac.uk/interpro/search/)预测生物学功能;利用MEGA6.0进行多序列比对及进化树的构建。
1.2.6 表达特性分析 荧光定量分析具体参照文献[20],以18S rRNA作为内参,引物对分别为18SF(5′-TGT GAT GCC CTT AGA TGT TCT GG-3′)/18SR(5′-GAC GTA GTC AAC GCG AGC TGA-3′)和 CeALSFq(5′-GCA GGT TTG GGT GCT ATG GG-3′)/CeALSRq(5′-TGG CCT TGA CAG GTA GGT TCT CTA T-3′),每样品至少3次生物学重复,基因相对表达值和方差分析分别用2ΔΔCt法和SPSS进行。
2 结果
2.1 CeALS基因的克隆
通过搜索实验室前期构建的油莎豆全长转录组文库,获得一条2 425 bp的转录本(图1),该序列包含1 938 bp的开放读码框(ORF),其序列长度与其他植物相近,将基因命名为CeALS。为实验克隆该基因,在其5′和3′转录非翻译区(UTR)分别设计引物CeALSF和CeALSR,目标扩增长度为2 161 bp;通过以热研1号反转录的cDNA作为模板进行PCR扩增,成功获得一条约2 000 bp的特异条带(图2-A);随后,以上述PCR产物作为模板、CeALSHF/HR作为引物进行第二轮PCR,成功扩增到一条约1 977 bp的清亮条带(图2-B)。将目标条带切胶回收后与线性化载体pCAMBIA1301混匀、孵育、转化大肠杆菌,菌落PCR后挑取阳性克隆进行测序分析。结果显示,研究分离到的序列与上述全长转录本的编码区(CDS)完全一致。
图1 CeALS的全长cDNA及其推测编码的氨基酸Fig.1 Full-length cDNA sequence of CeALS and its deduced coding amino acids
图2 油莎豆CeALS基因的PCR扩增Fig.2 PCR amplification of CeALS in C.esculentus
2.2 代表性植物中ALS基因的鉴定
为揭示油莎豆的分类学地位并探讨ALS基因在单子叶植物中的分布与进化特征,研究基于公共数据库中释放的全基因组序列对ALS基因进行了鉴定,从14种代表性的单子叶植物中共计鉴定到19个ALS基因;同时,研究还从4种无参考基因组的莎草科植物中检索获得7个包含完整编码区的ALS基因。如表1所示,ALS基因在这些植物中多以单拷贝的形式存在,而在康藏嵩草(Carex littledalei)、二穗短柄草(Brachypodium distachyon)、水稻(Oryza sativa)、玉米(Zea mays)和香蕉(Musa acuminata)中存在2个拷贝;基因在拟南芥和多数单子叶植物中无内含子,而在康藏嵩草、短叶水蜈蚣(Cyperus brevifolius)、 萤 蔺(Schoenoplectiella juncoides)、 猪毛草(Schoenoplectiella wallichii)和沼泽芦苇(Schoenoplectiella mucronata)等莎草科植物中存在一个内含子(表1)。
2.3 基因的生物信息学分析
2.3.1 CeALS编码蛋白的理化特性、亚细胞定位及保守结构域 序列分析显示,CeALS编码区的GC含量为55.01%,预测编码645个氨基酸(图1),其中含量较高的依次为Leu(9.30%)、Ala(9.30%)、Ser(8.37%)和Val(8.20%);强碱性、强酸性、极性和疏水氨基酸所占比例分别为9.61%、10.70%、24.19%和35.66%;蛋白的理论分子量(MW)为69.94 kD,等电点(pI)为6.10,pH 7.0时的带点荷数(ch)为-4.785,脂肪族指数(AI)为89.36,这与其他物种相近;与多数物种类似,CeALS的总平均疏水指数(GRAVY)<0,为-0.156,疏水性最高的为343位的Leu和345位的Phe(分值2.011)、亲水性最高的为473位的Tyr和474位的Lys(分值-2.822);CeALS的不稳定系数(II)与多数物种类似,为44.93,属于不稳定蛋白(表1)。TMHMM分析显示CeALS无跨膜螺旋;ChloroP分析显示蛋白叶绿体定位,其前端的54个氨基酸残基为信号肽;CDD分析显示蛋白的67-645为乙酰乳酸合酶结构域(PLN02470,E值0e+00);SMART分析进一步显示蛋白的72-240为硫胺素焦磷酸酶N端TPP结合结构域(TPP_enzyme_N,PF02776,E值4.4e-50)、264-397为硫胺素焦磷酸酶中央结构域(TPP_enzyme_M,PF00205,E值1.5e-42)、459-614为硫胺素焦磷酸酶C端TPP结合结构域(TPP_enzyme_C,E值 2.3e-45)(图2);InterPro分析显示 CeALS主要参与分支氨基酸的生物合成(GO:0009082),具有TPP结合(GO:0030976)、FAD结合(GO:0050660)、Mg2+结合(GO:0000287)、催化活性(GO:0003824)和乙酰乳酸合酶活性(GO:0003984)等分子功能。
表1 拟南芥和20种单子叶植物中ALS基因的结构及其编码蛋白的理化特性Table 1 Gene structure and physicochemical properties of ALS genes in Arabidopsis and 20 monocots
2.3.2 SNP分析 如图3所示,序列比对表明至今已报道可引起除草剂抗性改变的8个位点在CeALS与AtALS间完全一致。为进一步摸清研究组收集的其他种质是否存在相关抗性变异,我们对其进行了基因组重测序,并从中获得30个SNP(表2),深入分析显示他们仅造成了4个氨基酸的变异,即Lys211Gln、Leu538Val、Asp568Asn 和 Ser591Ala。
表2 SNP分布情况Table 2 Distribution of SNPs
图3 CeALS蛋白的多序列比对和序列特征Fig.3 Multiple sequence alignment and sequence features of CeALS protein
2.3.3 进化分析 同源分析显示,NCBI中至今仅报道了CeALS 716 bp的部分编码区序列(序列号KM624613.1);而CeALS与莎草科植物中同源蛋白的一致性都在90%以上,其中,与CbALS的一致性甚至高达94.92%。进一步的进化分析证实了这种结果,CeALS与CbALS聚在一起,接着是同属的CdALS以及同科物种来源的蛋白,其次才是同目的禾本科植物;双子叶植物拟南芥位于基部,棕榈目的油棕(Elaeis guineensis)和椰枣(Phoenix dactylifera)、芭蕉目的香蕉、微子目的小兰屿蝴蝶兰(Phalaenopsis equestris)和天南星目的紫萍(Spirodela polyrhiza)都形成独立的分支。有意思的是,除二穗短柄草和水稻外,其他来源于同一物种的旁系同源蛋白都聚在一起,暗示他们可能通过物种特异性的基因重复产生(图4)。OsALS1/OsALS2和BdALS1/BdALS2的一致性分别为75.70%和83.60%,但OsALS1/BdALS1和OsALS2/BdALS2的一致性分别为89.30%和76.60%,这表明这些重复基因在两物种分化之前就已产生。
图4 ALS蛋白的进化分析Fig.4 Phylogenetic analysis of ALS proteins
2.4 基因的表达特性分析
图5所示的组织表达特性分析显示,基因在成熟和衰老叶片中的表达丰度最高,显著高于幼嫩叶片;在块茎中的表达丰度与幼嫩叶片相当,显著高于芽和芽茎。
图5 CeALS在不同组织中的表达模式Fig.5 Expression pattern of CeALS in various tissues
3 讨论
作为支链氨基酸生物合成的关键酶,ALS是SU、IMI、TP、PTB和SCT等除草剂的作用靶标[3]。虽然绝大多数植物原本对这些除草剂高度敏感,但高选择压引起的ALS突变赋予了部分生态型的抗药性,并且有关抗药突变的报道与日俱增[5]。如以模式植物拟南芥的ALS作为标准分子,目前的抗性突变主要集中在Ala122等8个位点,他们对除草剂的种类和抗性程度均存在较大的差异:Ala122Thr突变可产生IMI抗性,但对SU和PTB敏感,对于TP而言则似乎存在物种差异;Ala122Val突变产生SU和IMI抗性,却对SCT、TP和PTB敏感;Ala122Asn突变则产生对SU、IMI、TP和PTB四类除草剂的抗性;Pro197和Trp574是目前报道变异最多的位点,Pro197突变主要引起SU抗性,而Trp574突变则可造成更为广谱的抗性(含上述5类除草剂);Ala205突变主要引起IMI和PTB抗性;Asp376突变可引起5类除草剂的抗性,但抗性程度物种差异较大;Asp376His突变可引起SU、TP和SCT抗性;Ser653突变主要引起IMI和SCT抗性;Gly654突变可引起SU、IMI和SCT抗性,但对PTB敏感[4-5]。在莎草科中,至今已有7种植物发现抗药性,即萤蔺、沼泽芦苇、短叶水蜈蚣、异花莎草(Cyperus difformis)、碎米莎草(Cyperus iria)、扁穗莎草(Cyperus compressus)和油莎豆[10-12,21-24]。萤蔺至少含有 2个 ALS基因,均含有一个内含子,其任一拷贝的Pro197His/Ser/Leu突变都可赋予SU抗性,而其对SU、IMI和PTB的抗性则为SjALS2的Trp574Leu突变引起[21];此外,SjALS2的Asp376Glu突变可引起高水平的SU和PTB抗性以及低水平的IMI抗性[23]。沼泽芦苇至少含有3个ALS基因,SmALS1和SmALS2包含1个内含子,而SmALS3则无内含子;作为主要表达的基因,SmALS1编码蛋白的Pro197His和Trp574Leu均可引起抗药性[22]。短叶水蜈蚣、异花莎草、扁穗莎草和碎米莎草可能仅编码一个ALS基因,其在短叶水蜈蚣中含有1个内含子,Pro197His/Ser/Ala突变是前3者抗药性产生的原因,而Trp574Leu突变则是碎米莎草抗药性产生的原因,这与油莎豆类似[10-12,24-25]。
研究基于实验室前期获得的油莎豆全长转录组,首次完成了CeALS全长cDNA的克隆。为便于进化和比较分析,研究同时还从14个已完成基因组测序的代表性单子叶植物中鉴定到19个同源基因,其中,基因以单拷贝居多,约占64.29%。在含有2个拷贝的5种植物中,康藏嵩草隶属于禾本目莎草科,二穗短柄草、水稻和玉米属于禾本目禾本科,香蕉属于芭蕉目;康藏嵩草的2个拷贝均含有1个内含子,这与其他莎草科的萤蔺、沼泽芦苇、猪毛草和短叶水蜈蚣一致,而另外4种植物的2个拷贝均无内含子,这与拟南芥和其他多数单子叶植物一致,暗示莎草科植物ALS基因的内含子可能是在科分化后获得,属于莎草科特异的,而无内含子的SmALS3可能通过逆转录产生[22]。事实上,将克隆到的CeALS转录本比对到油莎豆的基因组也证实该物种同样也含有1个内含子。与康藏嵩草、萤蔺、沼泽芦苇和猪毛草不同的是,油莎豆仅含有1个拷贝,暗示油莎豆在莎草科的分化过程没有经历多倍化事件或者基因加倍后又发生了丢失。
基于叶绿体基因的进化分析显示油莎豆可归为禾本目[26]。然而,前期的全长转录组测序与分析显示,在获得的57 849条高质量序列中,除将近30%的注释为禾本科植物外,另有约40%的被注释为油棕和椰枣[8]。为进一步揭示油莎豆的分类学地位,研究利用ALS蛋白构建了包括拟南芥在内的21种植物的无根进化树。与前期分类学一致的是,拟南芥位于进化树的基部,天南星目、微子目、芭蕉目、棕榈目和禾本目都形成独立的分支。隶属于粉状胚乳目的菠萝(Ananas comosus)虽然与禾本目聚在一支,但主要原因可能与低样本量有关,适当增加粉状胚乳目的物种数有望较好解决上述问题。在禾本目分支中,进化树明显支持莎草科与禾本科的姊妹科关系。
研究克隆到的CeALS编码645个氨基酸,其理论分子量为69.94 kD、等电点为6.10、脂肪族指数为89.36、总平均疏水指数为-0.156,属于叶绿体定位的亲水性蛋白,这与其他物种类似。CeALS蛋白含有乙酰乳酸合酶特有的PLN02470结构域,其中 包 含TPP_enzyme_N、TPP_enzyme_M和TPP_enzyme_C三个完整的功能域,可与TPP、FAD和Mg2+三种辅助因子结合。序列比对和SNP分析证实,热研1号及本团队收集的其他55份种质不存在抗药性突变,这与生产实践中ALS抑制剂可高效杀死这些种质是一致的。根据表达分析结果,CeALS的表达水平随着叶片的发育而显著增加;值得注意的是,CeALS在块茎中的表达丰度与幼嫩叶片相当,暗示其在该组织的分支氨基酸积累中可能起着重要的作用。
4 结论
完成了油莎豆参与支链氨基酸合成的CeALS基因的克隆、序列特征、进化及表达特性分析,较好地揭示了油莎豆的分类学地位,同时也证实团队收集的56份油莎豆种质不存在抗药性变异。