榅桲C4H基因的克隆、序列分析及表达
2020-07-01车玉红郭春苗刘晨曦木巴热克阿尤普吴津蓉
车玉红,杨 波,郭春苗,刘晨曦,木巴热克·阿尤普,吴津蓉,杜 鹃
(1.新疆农业职业技术学院,新疆 昌吉 831100;2.新疆农业科学院 园艺作物研究所,新疆 乌鲁木齐 830091; 3.新疆畜牧科学院 生物技术研究所,新疆 乌鲁木齐 830011)
榅桲Cydonia oblonga的英文名为Quince,是蔷薇科榅桲属落叶灌木或小乔木,作为世界上古老的树种之一,已有4 000年以上的栽培历史[1]。该树种在世界各国均有分布,我国主要分布于西北地区的新疆、陕西等省区,在东北地区也有少量的分布[2-3]。成熟后的榅桲果实也叫新疆木瓜,别名为比也、土木瓜、木梨。在榅桲栽培面积最大的新疆维吾尔自治区内,其分布主要集中在天山南部地区塔里木盆地边缘的绿洲上,特别是在喀什地区其栽植面积达200 多hm2[4-5]。目前对榅桲的研究偏向于其药用价值的挖掘和临床应用,已有研究者从榅桲果实中发现了鞣质类、氨基酸类、挥发油类、有机酸类及黄酮多种生理活性成分[6-7]。在食用方面,榅桲果实主要用于抓饭的辅助材料及制作果酱、罐头等产品,榅桲果实因其果肉高度木质化而鲜食口感欠佳[8]。
榅桲果实果肉的木质化与木质素的代谢紧密相关[9],而肉桂酸-4- 羟化酶(cinnamate 4-hydroxylase,C4H)是苯丙烷代谢途径中的关键酶之一,该酶的含量作为调节木质素、黄酮类化合物、芳香类化合物等下游产物的重要途径而成为近年来国内外学者研究的热点[10]。作为细胞色素氧化酶(cytochromeP450)家族CYP73亚家族的重要成员之一,C4H基因目前已从豌豆、芒果、青稞、番茄、独行菜、苦荞、绿豆、大豆、桂花等作物中克隆得到[11-16],相应的C4H基因的结构特点被进一步研究,该基因的表达量与果实重要品质形成之间的联系也得到了广泛的关注,如Millar 等[17]通过转基因技术抑制C4H基因的表达显著减少了番茄中的木质素含量。
目前,关于榅桲的研究主要集中在其营养成分[3]、香气[4]、果实药用价值[6-8]等方面,而关于其C4H基因的鉴定研究尚属空白。因此,以不同发育时期榅桲的果肉为研究对象,根据GeneBank数据库中已登录的C4H基因序列,针对高度同源性区域,采用Oligo 6.0 软件设计榅桲C4H基因序列的引物,以反转录获得的榅桲果实组织的cDNA为模板,利用高保真酶PrimeStar 进行榅桲C4H基因全长编码区扩增,以期得到榅桲果肉中C4H基因序列、结构等信息和该基因在榅桲果实发育过程中的表达规律,为进一步揭示榅桲果实木质化的分子机制奠定基础。
1 材料与方法
1.1 材 料
供试材料主要采自喀什地区莎车县伊什库里乡榅桲示范园,以大果榅桲为主,榅桲树龄达15 a,土肥管理一致。
1.1.1 样品的采集
分别采集落花后10(4月21日)、40(5月21日)、70(6月21 日)、100(7月21 日)、130(8月21 日)、160 d(9月21 日)的榅桲果实,测量所采样品的基础数据(结果见表1)后将其送至乌鲁木齐的实验室,于-80 ℃的超低温冰箱中保存。
表1 榅桲果实发育规律的测定结果Table 1 Determination result of fruit development rule in C.oblonga
1.1.2 试 剂
T4 DNA 连接酶、PrimerSTAR DNA 聚合酶和M-MLV 反转录酶,均由大连TaKaRa 公司提供;质粒提取试剂盒,由QIAGEN 公司提供;榅桲果肉总RNA 提取试剂盒和琼脂糖凝胶回收试剂盒,均由北京天根公司提供;其他化学试剂均为国产分析纯试剂。
1.2 方 法
1.2.1 总RNA 的提取和cDNA 的合成
首先取榅桲果实样品100 mg,用液氮低温研磨后参照植物多糖多酚总RNA 提取试剂盒中说明的操作流程提取榅桲总RNA[17-20],提取结束后,配置1%的琼脂糖凝胶以用于检测RNA 是否完整,并用紫外分光光度计测定提取后的RNA 浓度,根据琼脂糖凝胶与紫外分光光度计的检测结果,筛选出提取质量较高的RNA 样品,将其保存于-80 ℃ 的冰箱中。以得到的榅桲果实组织的总RNA 模板,反转录得到榅桲果实组织的cDNA。
1.2.2 基因克隆
根据GeneBank 数据库中已登录的C4H基因序列,选取以下5 个物种进行同源性比对, 选择甜樱桃(Prunus avium,XP_021806844.1)、山 杏(Prunus armeniaca,VVA16404.1)、 红莓 (Rubus coreanus,ABX74779.1)、玫瑰(Rosa rugosa,AKT71850.1)、麻风树(Jatropha curcas, XP_012078176.1)等5 个近源物种的序列,针对高度同源性区域,采用Oligo 6.0 软件设计了榅桲C4H基因序列的引物(C4H-senese:ATGGATCTCCTCCTTCTGGAAAAG;C4Hantisenese:CTTGTTGGTGAAGAAGGGGAC)。以反转录获得的榅桲果实组织的cDNA 为模板,利用高保真酶PrimeStar 进行榅桲C4H基因全长编码区扩增,反应体系如下:cDNA 2 μL,5×PS buffer 2.5 μL,dNTP (2.5 mmol/L) 2 μL,正反向引物 (10 mmol/L)各1 μL,Primer Star 酶(2.5 U/μL) 1 μL,用ddH2O 补充至25 μL。PCR 反应条件为:94 ℃、3 min,94 ℃、30 s,62 ℃、30 s,72 ℃、2 min,72 ℃、5 min,30 个循环。采用DNA 胶回收试剂盒回收PCR 产物,并将其连接至pMD-19T载体(TAKARA)上,最后将连接产物送至上海生物工程技术服务有限公司测序。
1.2.3 序列分析与结构预测
榅桲C4H基因编码蛋白的氨基酸残基数量与组成结构,其相应蛋白质的分子量、等电点、亲水/疏水特点,采用ExPASy ProtParam(http://cn.Expasy.org)与 ScanProsite 程序进行预测分析;蛋白质的二级结构,采用PredictProtein(https://www.predictprotein.org/getqueries)进行预测分析; 蛋白质的三级结构,采用Swiss-model(http://swissmodel.expasy.org/)进行预测分析。同源序列比对,采用DNAstar 软件完成;系统进化树的构建,采用MEGA 5 软件完成。
1.2.4 实时定量荧光PCR 检测
利用实时定量荧光PCR 对不同发育时期榅桲果实中C4H基因的表达情况进行了分析。使用液氮研磨处理榅桲不同发育时期的果实样品并提取总RNA,使用反转录试剂盒得到总RNA,将其作为模板反转录得到榅桲不同发育时期果实组织的cDNA。实时荧光定量检测,采用罗氏的Light Cycler 480 荧光定量PCR 仪进行。反应体系为:2×SYBR Premix Ex TaqTM 10 μL;正反向引物均为0.25 μL;cDNA 模板2 μL;加水补足至10 μL, 每个样品的检测各设3 次重复。实时PCR 扩增程序为两步法PCR 扩增标准程序。步骤1:预变性,95 ℃、30 s(20 ℃/s), 1 个循环。步骤2:PCR反应,95 ℃、5 s(20 ℃/s),60 ℃、20 s(20 ℃/s),40 个循环。步骤3:溶解曲线分析,95 ℃、0 s (20 ℃/s),65 ℃、15 s(20 ℃/s),95 ℃、0 s (0.1 ℃/s)。利用2-ΔΔCT 法对cDNA 中榅桲C4H基因的相对表达量进行统计分析。通过BestKeeper和GeNorm 软件分析,选择评分和稳定性较高的三磷酸甘油醛脱氢酶基因(GAPDH)作为内参基因进行数据分析。
2 结果与分析
2.1 榅桲C4H 基因的PCR 扩增
以榅桲果实cDNA 为模板进行PCR 扩增,结果如图1 所示。由图1 可知,产物条带大小约为 1 500 bp,与预期的大小相符。将PCR 产物与pMD-19T 载体进行连接,转化入感受态细胞后,提取质粒,利用HindIII 和BamH I 双酶切后,获得大小为1 500 bp 的产物,其与预期的大小一致。
图1 榅桲C4H 基因的PCR 扩增和鉴定电泳图Fig.1 Electrophoretogram of PCR amplification and identification of C4H gene in C.oblonga
2.2 榅桲C4H 基因的克隆
PCR 产物经回收、克隆和菌落PCR 鉴定后,对其阳性克隆进行测序,结果如图2 所示。图2表明,PCR 所得开放阅读框(ORF)的长度为 1 518 bp,编码505 个氨基酸,以ATG 为起始密码子,以TAG 为终止密码子。
图2 榅桲C4H 基因的核苷酸和氨基酸序列Fig.2 Nucleotide and amino sequences of C4H gene in C.oblonga
2.3 榅桲C4H 基因编码蛋白的生物信息学分析
2.3.1 榅桲C4H基因编码蛋白的氨基酸组成及理化性质分析
榅桲C4H 蛋白的氨基酸序列的预测结果见 表2。由表2 可知,Leu、Val、Arg、Glu、Ile 等氨基酸的使用频率均较高,Leu、Val、Arg、Glu、Ile的使用频率依次为11.88%、8.51%、8.32%、7.13%、6.73%。榅桲C4H 蛋白的分子质量为58.28 kD,其等电点为9.30,分子式为C2641H4217N729O718S19, 63 个带负电荷的氨基酸残基为(Asp+Glu),74 个 带正电荷的氨基酸残基为(Arg+Lys),不稳定系数为46.19,说明榅桲C4H 蛋白属于不稳定蛋白。
2.3.2 榅桲C4H基因编码蛋白亲水/疏水性的分析
榅桲C4H 蛋白疏水/亲水性分析结果如图3所示。图3 表明,在榅桲C4H 蛋白氨基酸中,第17 与第19 位氨基酸残基的疏水性均最强(分别为3.600 和3.578),第127 与第196 位氨基酸残基的亲水性均最强(分别为-3.067 和-2.722);另外,在该蛋白中亲水氨基酸的数量远高于疏水氨基酸的数量,由此推断,榅桲C4H 蛋白为亲水性蛋白。
表2 榅桲C4H 基因编码蛋白的氨基酸的组成Table 2 Composition of amino acids coded by C4H gene in C.oblonga
图3 C4H 基因编码蛋白亲水/疏水性的预测结果Fig.3 Prediction result of hydrophobicity/rophilicity of protein coded by C4H gene
2.3.3 榅桲C4H基因编码蛋白二级结构和三级结构的预测
榅桲C4H 蛋白二级结构的预测结果表明,该蛋白的主要结构为α 螺旋和无规卷曲,而其α 螺旋(Alpha helix)的占比最高,达47.52%;β 折叠(Extended strand)的占比最低,仅为7.33%;无规卷曲(Random coil)的占比为45.15%。
使用SWISS-MODEL 进行预测并构建榅桲C4H 蛋白的三级结构:将榅桲C4H 蛋白序列提交至SWISS-MODEL 后,通过对目标蛋白序列的相似性进行比对分析,可找到同源性最高的模板,模板氨基酸序列的一致性为34%,以第30 ~502位的氨基酸建模,模型覆盖率为92%,榅桲C4H蛋白的三级结构预测结果图4 所示。
2.3.4 榅桲C4H基因的同源性比对分析
通过DNAstar,将榅桲C4H基因全长编码区序列与NCBI 上公布的其他物种的氨基酸序列进行同源性比对分析,结果如图5 所示。图5 显示,榅桲的C4H基因序列与甜樱桃(Prunus avium,XP_021806844.1)、 山杏(Prunus armeniaca,VVA16404.1)海棠(Malus domestica,NP_001281035.1)、 红莓(Rubus coreanus,ABX74779.1)、 玫瑰(Rosa rugosa,AKT71850.1)、 木薯(Manihot esculenta,XP_021601102.1)等物种的C4H基因序列的相似度均较高,分别为92.87%、91.24%、87.25%、86.45%、85.29%、85.26%;而其与麻风树(Jatropha curcas,XP_012078176.1)、 巴豆(Croton stellatopilosus,AYM55654.1)、 独角金(Striga asiatica,GER54616.1)、大麻(Cannabis sativa,XP_030504384.1)、 橄榄(Canarium album,ACR10242.1)等物种的C4H基因序列的相似度均超过80%。
图4 C4H 蛋白三级结构的预测结果Fig.4 Prediction result of tertiary structure of C4H protein
2.3.5 榅桲C4H 蛋白的氨基酸组成及进化树分析
利用MAGA 5.0 软件,使用Neighbor-joining法中重复1 000 次抽样的方法,对同源比对的所有序列进行系统进化树分析,结果如图6 所示。图6显示,与榅桲C4H 蛋白亲缘关系最近的物种是甜樱桃,其次为山杏,三者的C4H蛋白属于同一分支;而红梅、海棠等物种的C4H 蛋白则与榅桲C4H 蛋白的亲缘关系均较远。
2.4 榅桲C4H 基因在果实发育时期表达的定量分析
为了进一步研究C4H基因与榅桲果实发育过程中木质素积累的相关性,分别对花后10、40、70、100、130、160 d 的榅桲果实的C4H基因表达进行了定量分析,结果如图7 所示。在榅桲果实发育过程中,C4H基因的相对表达量,在其果实发育早期最高,而后逐渐下降;花后10 d 时C4H基因的相对表达量最高,花后160 d 时C4H基因的相对表达量最低,仅约为花后10 d 时的1/3。
图5 榅桲C4H 基因同源性对比分析结果Fig.5 Homology analysis result of C4H gene in C.oblonga
图6 榅桲C4H 蛋白的进化树Fig.6 Cladogram of C4H protein in C.oblonga
图7 不同发育时期果实中C4H 基因的相对表达量Fig.7 Relative expression of C4H gene in fruit at different development stages
3 讨 论
在植物的生长发育成熟过程中,木质素单体通过聚合反应形成木质素的大分子物质,这类大分子物质沉积在细胞壁上表现出植物的木质化特征,而组织的木质化又是细胞次生壁形成的主要表现之一[21]。作为木质素合成代谢的重要限速酶之一[22-23]的植物C4H基因的研究范围较为广泛,而对榅桲C4H基因的研究尚属空白。本研究使用RT-PCR 方法克隆获得榅桲组织C4H基因的编码区全序列区,序列全长为1 518 bp,编码505 个氨基酸,该蛋白的相对分子质量为58.28 kD,理论等电点为9.30;榅桲C4H 蛋白中异亮氨酸、缬氨 酸、精氨酸、谷氨酸的含量均较高,为亲水性不稳定蛋白质;榅桲的C4H 蛋白属于混合型结构的蛋白质,其二级结构中以α-螺旋和无规卷曲结构为主;榅桲的C4H基因与甜樱桃(Prunus avium,XP_021806844.1)、 山 杏(Prunus armeniaca,VVA16404.1)等物种的C4H基因的相似性均达到了90%以上。
本课题组成员在前期研究中发现,榅桲果实木质素的积累主要在发育前期(落花后100 d 之前)完成,榅桲果实在发育过程中木质素呈现出逐渐降低的趋势。本研究结果表明,C4H基因的表达量与植物木质素的含量关系密切。C4H基因在欧芹木质素含量高的花梗中大量表达,而在其叶片内不表达[24];C4H基因在拟南芥中也是在木质素积累丰富的部位大量表达[25]。本研究在前期研究的基础上,初步探索了不同发育时期榅桲果实中C4H基因表达量的差异特点,结果表明,榅桲在果实发育成熟过程中,C4H基因的表达量随着果实的逐渐发育成熟而降低,说明榅桲果肉的发育成熟程度与C4H基因的表达量表现出负相关的关系。榅桲果实发育过程是一个果肉木质素的积累与果肉木质化的过程,本研究克隆了C4H基因,只对其木质化的分子机理进行了初步探讨,而对其C4H 蛋白表达与果肉木质化的关系等方面的研究尚待深入。
4 结 论
榅桲果肉中C4H基因的编码区序列全长为 1 518 bp,编码505 个氨基酸,其蛋白分子质量为58.28 kD。生物信息学分析结果表明,榅桲C4H蛋白为亲水性不稳定蛋白质,其二级结构以α-螺旋和无规卷曲结构为主。定量PCR 检测结果显示,随着榅桲果实的发育成熟,果肉中C4H基因的表达量逐渐减少,榅桲果肉的发育成熟程度与C4H基因的表达量之间呈负相关关系。