APP下载

陆地棉GhSAMDC基因家族的全基因组分析

2019-04-16梁其干熊显鹏李艳军张新宇

西北农业学报 2019年3期
关键词:黄萎病染色体基因组

梁其干,熊显鹏,李艳军,张新宇,孙 杰

(石河子大学 农学院,新疆生产建设兵团绿洲生态农业重点实验室,新疆石河子 832003)

棉花作为全球性的主要经济作物,在社会发展的多个产业中发挥着重要作用,如棉纤维可作为纺织工业原料,棉籽油可作为食用油等。陆地棉是目前世界上栽培面积最广的棉花,其产量占世界棉花总产量的90%以上[1]。然而,陆地棉在生长发育过程中常常受到病虫害的威胁,尤其是黄萎病,是对陆地棉产量和品质影响最大的病害之一。据估计,中国每年黄萎病的发生面积占全国植棉面积的一半,对农业造成巨大的经济损失[2]。目前,选育和种植抗黄萎病的棉花品种被认为是防治黄萎病的有效措施,抵抗黄萎病菌侵染已成为选育棉花新品种的重要目标性状[3]。由于陆地棉中缺乏抗黄萎病的资源,利用传统的育种手段难以选育出具有抗黄萎病性状的棉花品种[4]。基因工程技术为培育抗黄萎病新种质材料和培育抗病品种带来了希望,了解棉花抗黄萎病的分子机制以及挖掘棉花抗黄萎病相关基因是当前的主要任务[5]。

S-腺苷甲硫氨酸脱羧酶(S-adenosylmethioninedecarboxylase, SAMDC)是植物体多胺生物合成过程中的一个关键酶,它通过催化S-腺苷甲硫氨酸形成脱羧的SAM,提供氨丙基供体参与精胺和亚精胺的合成,维护植物体内多胺的动态平衡[6-7]。在GenBank中记录的SAMDC基因约有2 400个,其中植物中约有300个。原核生物和真核生物中的SAMDC蛋白没有序列相似性,而植物中的SAMDC具有较高的序列相似性[8]。目前已从番茄[9]、甘蔗[10]、油菜[11]、小麦[12]等多种植物中分离到SAMDC基因,发现SAMDC参与高盐、水分、低温等多种非生物胁迫和生物胁迫反应[13-15]。近期的研究发现将海岛棉SAMDC转化拟南芥,转基因拟南芥的黄萎病抗性得到提高,转基因植株中真菌DNA生物量显著降低,该研究表明SAMDC基因在抗黄萎病过程中发挥着重要作用[16]。陆地棉中仅克隆了4个SAMDC基因,研究主要集中于其在非生物胁迫中的表达模式及功能分析方面[17],SAMDC基因家族在陆地棉中究竟包含多少成员,是否都与棉花黄萎病抗性相关仍有待进一步研究。

陆地棉遗传的标准系TM-1的全基因组测序为GhSAMDC家族基因的鉴定提供了便利条件[18]。本研究以已报道的棉花SAMDC蛋白为探针序列,鉴定到14个GhSAMDC家族基因,对基因的序列以及染色体定位等情况进行分析,并对黄萎病菌胁迫下基因在不同抗感品种中的表达模式进行分析,为今后克隆及研究GhSAMDC基因在棉花抵抗黄萎病菌侵染过程中的功能奠定理论基础。

1 材料与方法

1.1 材料及处理

2个陆地棉品种‘中植棉2号’(耐黄萎病)和‘新陆早7号’(感黄萎病)均由石河子大学棉花研究所提供,大丽轮枝菌强致病菌系由石河子大学绿洲生态农业重点实验室保存。

1.1.1 棉苗培养 将‘新陆早7号’和‘中植棉2号’棉种在温水中浸泡8~12 h后,在28 ℃恒温培养箱中催芽,挑选发芽整齐一致的种子均匀种于水盒中,每盒种植的种子数量相同,置于人工气候室中培养,光照度6 000~7 000 lx,每天光照时间12 h,昼温27~28 ℃,夜温20~22 ℃,湿度40%~50%。待植株长出2片真叶时,将幼苗取出用于黄萎病菌胁迫处理。

1.1.2 大丽轮枝菌孢子液的制备 将4 ℃冷藏保存的大丽轮枝菌转移至PDA固体培养基上,25 ℃活化15 d后,接种至Czapeak’s液体培养基中,25 ℃黑暗振荡(120 r/min)培养10 d。菌液用灭菌的纱布过滤后制成孢子悬浮液,在显微镜下用血球计数板计数,调整孢子悬浮液至1.0×107个/mL。

1.1.3 棉苗处理与取样 采用蘸根法侵染棉花幼苗,具体操作如下:选取大小均匀一致,生长健壮的棉苗浸泡于大丽轮枝菌孢子悬浮液中,浸泡2 min后放入水中。黄萎病菌侵染0、12、24和48 h后收取棉花幼苗的根系,各时间点收取10株,液氮迅速冷冻后置于-80 ℃冰箱中保存,用于RNA的提取。

1.2 方 法

1.2.1GhSAMDC家族基因获取的鉴定 通过以已报道的棉花SAMDC蛋白(GenBank: JN020148)为探针序列,从Gossypiumhirsutum基因组数据库(http://www.cottongen.org)中利用BlastP序列比对搜索鉴定出所有GhSAMDC家族基因。用SMART(http://www.conttongen.org)和PFAM(http://pfam.sanger.ac.uk/)软件对候选基因的酶原剪切位点结构域(LSESSLF)和PEST(TIHVTPEDGFSYAS)结构域进行确认,去除非全长的短片段及冗余序列,获得GhSAMDC家族基因序列。从Gossypiumhirsutum基因组数据库获取GhSAMDC家族基因的cDNA序列,利用NCBI BLASTX分析基因的开放阅读框,利用ExPAsy(http://web.expasy.org/)在线工具分析基因的编码蛋白的残基数(aa)、分子质量(MW)和等电点(pI)。

1.2.2GhSAMDC家族基因的克隆 采用CTAB/酸酚法提取棉花根系中的总RNA[19]。用DNase I(Deoxyribonuclease I)处理后,采用NanoDrop 1000核酸浓度测定仪测定RNA的浓度值和OD260/OD280的比值,对RNA的浓度和纯度进行检验,用10 g/L琼脂糖凝胶电泳检测RNA的完整性。用Reverse Transcriptase M-MLV 反转录酶(大连宝生物)获得cDNA第1链,保存在-80 ℃冰箱中用于后续试验。根据GhSAMDC基因家族的电子序列,设计扩增ORF的引物(表1),利用RT-PCR技术从陆地棉根组织cDNA中扩增GhSAMDC家族基因。PCR反应体系:cDNA模板1 μL、dNTPs 0.8 μL、上游引物(10 μmol/L)0.25 μL、下游引物(10 μmol/L)0.25 μL、10×TaqBuffer 1 μL、EX-Taq DNA聚合酶0.2 μL,补ddH2O至10 μL。PCR反应条件为94 ℃ 3 min;94 ℃ 30 s,52~56 ℃ 30 s,72 ℃ 90 s,32个循环;72 ℃ 10 min。

1.2.3GhSAMDC家族基因多重序列比对及进化树的构建 利用DNAman软件将鉴定获得的所有SAMDC蛋白进行多重序列比对分析,其中设定选择强调的同源性水平≥50%,并且对其他的参数选择系统默认,在获得的结果中查找GhSAMDC家族基因的保守功能域。使用数据处理软件MEGA 4.0采取Neighbor-Joining(邻近相连算法)的方法构建SAMDC蛋白质的系统进化树,其中设定校验参数Bootstrap为1 000。

1.2.4GhSAMDC家族基因的染色体分布 从陆地棉基因组数据库中获取陆地棉A和D染色体组中各染色体的长度信息,同时获取GhSAMDC基因家族在染色体上的定位信息,用Map Inspect软件绘制出GhSAMDC基因家族的染色体物理分布图。

1.2.5 大丽轮枝菌侵染后GhSAMDC家族基因在棉花根系中的表达模式分析 在实验室的前期研究中,以大丽轮枝菌侵染0、12、24和48 h的‘中植棉2号’和‘新陆早7号’的根系为材料,用植物总RNA提取试剂盒(RNA Prep Pure Plant Kit,天根生化科技有限公司,北京,中国)提取根系中的总RNA,质量检测合格的RNA送至北京诺禾致源科技股份有限公司,采用Illumina 4000平台进行转录组测序。本试验中根据转录组测序结果,获取GhSAMDC家族各基因的表达量RPKM(Reads per kb per million)值,采用Heml软件对14个GhSAMDC基因的表达数据绘制热图。

随机选取5个GhSAMDC基因,根据它们的cDNA序列设计特异引物(表1),以陆地棉His 3为内参基因,以‘新陆早7号’和‘中植棉2号’大丽轮枝菌侵染后不同时间点的棉花幼苗的根系cDNA为模板,利用qRT-PCR技术对GhSAMDC基因家族的表达模式进行分析。qRT-PCR反应体系为:模板cDNA 1 μL,上游引物0.2 μL,下游引物0.2 μL,SYBRPrimix ExTaqTM(2×)5 μL补ddH2O至10 μL。反应条件如下:94 ℃预变性1 min;95 ℃变性15 s,55~57 ℃退火20 s,72 ℃延伸20 s,45个循环。重复3次,每次试验设3个技术重复,记录试验数据,利用Excel Version进行数据统计分析。

表1 陆地棉GhSAMDC家族基因的引物Table 1 Primers of GhSAMDC family genes in Gossypium hirsutum

2 结果与分析

2.1 GhSAMDC家族基因的鉴定及克隆

以棉花GhSAMDC基因为探针序列,在异源四倍体陆地棉基因组数据库中筛选出14条序列,分别命名为GhSAMDC1至GhSAMDC14(表2)。该家族基因成员的开放阅读框(ORF)核苷酸序列长度为1 029~1 176 bp,其对应的编码氨基酸序列长度为337~391 aa。通过对14个GhSAMDC蛋白做进化分析,发现它们在A基因组和D基因组上存在一一对应的关系,分为7对(图1)。每对中的2个成员均具有较高的序列相似性,难以进行区分,因此将它们视为基因的2个拷贝。设计扩增7个GhSAMDC基因ORF(open reading frame,开放阅读框)的引物(表1),以陆地棉根系cDNA为模板进行PCR扩增,7个基因分别为GhSAMDC1、GhSAMDC4、GhSAMDC6、GhSAMDC7、GhSAMDC9、GhSAMDC10和GhSAMDC14,PCR扩增结果如图2所示,扩增条带的大小与预期结果一致,测序后发现它们的序列与电子序列一致。

2.2 GhSAMDC家族基因多重序列比对

利用ClustalX和DNAman软件对7个SAMDC蛋白序列进行多重序列比对,7对基因中每对选取1个成员。对比结果发现7个蛋白序列的一致性为51.25%,序列中含有2个SAMDC蛋白特有的保守结构域,即酶原剪切位点结构域(LSESSLF)和PEST(TIHVTPEDGFSYAS)结构域,保守结构域外的序列具有较大差异(图3)。

表2 陆地棉GhSAMDC家族基因的基本信息Table 2 Basic information of GhSAMDC gene family in Gossypium hirsutum

图1 陆地棉GhSAMDC蛋白的系统进化树Fig.1 Phylogenetic tree of GhSAMDC proteins of Gossypium hirsutum

M.Mark 3;1:GhSAMDC1;2.GhSAMDC3;3.GhSAMDC5;4.GhSAMDC7;5.GhSAMDC10;6.GhSAMDC11;7.GhSAMDC13

图2GhSAMDC家族基因cDNA的PCR扩增电泳图
Fig.2PCRamplificationofGhSAMDCgenefamilycDNA

2.3 GhSAMDC基因染色体定位分析

14个陆地棉GhSAMDC基因在A和D亚基因组上呈现均匀分布,有7个成员在A亚组上,7个成员位于D亚组,无家族成员构成基因簇的现象(图4)。在A05、D05、A08、D08、A09、D09、A10、D10、A13和D13上分别含有1个GhSAMDC基因,这5对GhSAMDC基因在A、D亚组上一一对应,为平行进化的同源基因。在D02染色体上分布2个GhSAMDC基因,其中GhSAMDC2对应于A02染色体上的GhSAMDC1基因,GhSAMDC4在A02染色体上无相对应的平行进化的同源基因,对应于A03染色体上的GhSAMDC3基因。

灰色和黑色区域分别代表 75%以上和 100%的保守区 Grey and black regions represent the conversation region of over 75% and 100%, respectively

图3陆地棉GhSAMDC蛋白氨基酸多重序列比对
Fig.3MultipleaminoacidsequencealignmentofGhSAMDCproteinsinGossypiumhirsutum

图4 陆地棉染色体上 GhSAMDC 基因的分布Fig.4 Distribution of GhSAMDC gene on chromosome of Gossypium hirsutum

2.4 黄萎病菌侵染后GhSAMDC基因家族的表达模式分析

由转录组数据可见(图5),GhSAMDC家族基因在2种陆地棉根组织中均有表达。14个基因中,GhSAMDC4、GhSAMDC5、GhSAMDC6、GhSAMDC10、GhSAMDC12、GhSAMDC13和GhSAMDC14在感病棉花根系中的表达模式与抗病品种存在一定程度的相似性,其他基因在2个品种中的表达模式不同。GhSAMDC3、GhSAMDC9和GhSAMDC11在不同抗感品种中受黄萎病菌诱导后表达量均有明显变化,其高峰值在不同抗感品种中出现的时间点不同。GhSAMDC7和GhSAMDC8在抗病品种中受黄萎病菌诱导后表达量在12 h明显升高,然后下降;在感病品种中其表达量呈下降趋势。GhSAMDC1在抗病品种中表达量持续升高;在感病品种中其表达量呈下降趋势。由于GhSAMDC7、GhSAMDC8和GhSAMDC1在抗病品种中对黄萎病菌的侵染均有明显的响应,但在感病品种中未见明显的响应,暗示这3个基因可能参与棉花抵抗黄萎病菌的过程。另外,7对基因中的2个成员序列相似度较高,但表达模式不完全相同,GhSAMDC3/4、GhSAMDC7/8和GhSAMDC11/12在抗病品种中具有相似的表达模式,GhSAMDC5/6在抗感品种中均具有相似的表达模式,其他基因的表达模式均不同。为了验证转录组测序的结果,随机选取GhSAMDC3、GhSAMDC7、GhSAMDC10和GhSAMDC134个基因设计特异性引物,对其在抗病品种中的表达模式进行qPCR分析(图6),结果发现这些基因的表达模式与转录组数据基本符合,表明转录组数据能够准确反应基因的表达模式。

图5 差异表达基因的表达谱热图Fig.5 Expression profile heat of deferentially expressed genes

3 讨论与结论

S-腺苷甲硫氨酸脱羧酶(SAMDC)在多胺合成中具有关键的作用,在植物受到生物以及非生物胁迫时作出响应。目前,对SAMDC基因进行全基因组水平上的生物学信息分析仍未见报道。通过对陆地棉GhSAMDC家族基因的生物信息学分析,发现陆地棉GhSAMDC家族基因有14个成员,系统进化树分析发现该基因家族具有一一对应的关系,并可分为7对GhSAMDC基因。陆地棉属于AADD型基因组,在A、D亚组的基因具有很高的共线性特征[8-9],本研究中鉴定到的14个陆地棉GhSAMDC基因在A亚组和D亚组中的分布就很好地体现了这一特性,14个GhSAMDC基因均匀地分布在A、D亚组,并存在一定的对应关系。利用在GenBank中已报道的SAMDC基因编码序列的保守区域设计特异引物,选取十字花科植物,利用分子生物技术(PCR)得到SAMDC基因的同源序列,通过序列对比分析发现序列的同源性能达87%以上,所得氨基酸序列相似性可达90%以上[21-22]。而本研究中陆地棉GhSAMDC基因的14家族基因的氨基酸序列同源相似性仅为50%左右,这说明各基因家族成员除了显著一致的保守功能域之外的基因序列也有较大的差异。这为进一步深入研究棉花中GhSAMDC基因家族的功能奠定基础。

图6 GhSAMDC基因家族在‘中植棉2号’中的表达分析Fig.6 Expression analysis of GhSAMDC gene family in cotton ‘Zhongzhimian 2’

多胺在植物逆境胁迫响应和生长发育等过程中起重要作用[23]。S-腺苷蛋氨酸脱羧酶(SAMDC)是多胺合成途径中的关键酶之一,有助于植物维护体内多胺动态平衡[24]。因此,植物GhSAMDC基因主要是通过调控植物体内多胺含量影响植物应答环境胁迫,SAMDC基因在植物幼嫩或分裂活跃组织中表达水平较高,在老化或分裂能力较弱的组织中表达较低[25-26]。在棉花中的研究发现,SAMDC在不同组织中的表达水平也有差异[17]。拟南芥中过表达SAMDC基因可以增强植株清除活性氧自由基的能力,从而提高植株在干旱胁迫条件下的抗性[27]。而沉默烟草中的SAMDC基因在盐胁迫条件下植物生长活力减弱, 抗氧化能力以及光合能力下降[28]。前人研究大多数是从环境胁迫方面,如低温胁迫、盐胁迫、干旱胁迫等来研究GhSAMDC基因对逆境胁迫应答的作用。本研究则是从生物胁迫方面,对该基因家族在黄萎病菌胁迫下的表达特性进行了分析,为进一步研究GhSAMDC基因在棉花抗黄萎病过程中的功能奠定基础。本研究采用RT-PCR克隆技术从陆地棉根组织cDNA中克隆得到GhSAMDC基因家族, 利用转录组测序分析了该家族基因在黄萎病菌胁迫后的表达模式,并通过实时荧光定量分析了部分基因在抗病棉花品种中黄萎病菌胁迫下的表达模式。结果发现GhSAMDC1、GhSAMDC7和GhSAMDC8基因在抗病品种中对黄萎病菌的胁迫响应更强烈,推测这3个基因在棉花抵御黄萎病菌胁迫机制中发挥重要作用,但GhSAMDC基因家族的功能和抵御黄萎病菌胁迫的机制有待于进一步研究。

猜你喜欢

黄萎病染色体基因组
“植物界大熊猫”完整基因组图谱首次发布
棉花GhIQM1基因克隆及抗黄萎病功能分析
全球首个作物黄萎病菌资源和基因组数据库正式上线
牛参考基因组中发现被忽视基因
温室条件下中棉所96B 对新疆棉花黄萎病菌的抗性评价
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
棉花抗黄萎病的分子遗传结构揭示