水稻温敏型叶色突变体tsa58的变异检测及转录组分析
2023-08-01陈能刚鄢小青杨占烈吴荣菊
陈能刚, 鄢小青, 李 欢, 杨占烈, 吴荣菊, 陈 锋
(贵州省农业科学院农作物品种资源研究所, 贵阳 550006
水稻是重要的粮食作物,新种质的创制是提高水稻产量的重要前提,而60Co辐射诱变技术是种质创制的重要技术手段之一。60Co辐射诱变通过染色体数目、染色体结构或DNA的核苷酸变异而引起表型特征变化[1]。随着生物信息技术的高速发展,通过全基因组测序技术可以更高效率和低成本对辐射诱变获得的新种质进行全基因组的变异检测分析,从而发掘新的基因。
制约水稻产量的因素很多,其中光合作用是最重要的因素之一。叶绿体是光合作用的重要场所,其发育状态直接影响水稻叶片的光合作用。叶色突变体是研究叶绿体发育和光合色素合成降解机制的理想材料。水稻叶色突变性状也可作为标记性状,在杂交稻育种和高光效育种中具有重要应用价值。其中转绿型叶色突变体具有阶段性特异表达,转绿后对主要农艺性状影响较小等优点,因此可作为标记性状用于水稻杂交育种和种子生产中。进一步发掘和鉴定新的转绿型叶色突变基因,加强利用转绿型叶色标记不育系的选育,有助于揭示水稻叶色突变的分子机理和探讨转绿型叶色突变体在水稻生产实践中有效应用。目前已经克隆了参与光合色素合成的基因,这些基因突变均会引起叶色变化。如OsCAO1编码叶绿素a加氧酶,其突变体表现出淡绿叶的表型[2]。OsCHLH、OsCHLD和OsCHLI分别编码Mg-原卟啉IX螯合酶的3个亚基,突变植株均表现为叶片黄化[3-4]。YGL1编码叶绿素合酶,催化叶绿素酸酯a转化为叶绿素a,突变体表现为黄绿叶[5]。同时也克隆了很多影响叶绿体发育的基因,如WSL3编码一个质体RNA聚合酶的非核心亚基OsPAP1/OspTAC3,其突变体表现为白化致死[6]。OspTAC2编码一个含有10个PPR结构域的叶绿体蛋白,OspTAC2突变植株表现为白化致死,PEP活性严重受损[7]。这些基因从不同途径参与调控植株的光合色素合成和叶绿体发育。
本研究利用60Co辐射诱变贵州地方粳稻种质资源“桥港珍珠米”,在后代分离中获得的一个能够稳定遗传的温敏型叶色突变体tsa58。本研究结合变异检测和转录组分析确定tsa58的候选基因,为深入研究该基因的分子机制奠定基础。
1 材料与方法
1.1 材 料
本试验的材料是贵州地方粳稻种质资源“桥港珍珠米”通过60Co辐射诱变后获得的能够稳定遗传的温敏型叶色突变体,暂命名为tsa58[8]。
1.2 不同温度处理
分别在20 ℃和30 ℃光照培养箱中(12 h光照/12 h黑暗)培养,同时种植试验材料突变体tsa58及其野生型(WT),萌发20 d后,观察幼苗表型,并进行光合色素测定。
1.3 光合色素测定
选择在20 ℃和30 ℃条件下萌发后20 d的野生型和突变体tsa58幼苗的全展叶取样,分别称取新鲜叶片0.2 g进行光合色素含量测定,按鄢小青等[8]的方法计算叶片单位鲜重的叶绿素和胡萝卜素含量。
1.4 全基因组变异检测分析
全基因组变异检测分析由北京诺禾致源公司完成。1) 采用CTAB法分别提取突变体tsa58与野生型的DNA,DNA样品待检验合格后利用Covaris破碎机随机打断成长度为350 bp的片段。2) 采用TruSeq Library Construction Kit进行建库,文库构建完成后,使用Qubit 3.0软件进行初步定量,使用Q-PCR方法对文库的有效浓度进行准确定量,保证文库质量。3) 库检合格后进行illumina测序。测序获得的有效测序数据通过BWA软件比对到参考基因组,比对结果经SAMTOOLS法去除重复。4) 采用SAMTOOLS法进行个体SNP和长度小于50 bp的小片段插入与缺失检测分析(InDel)。5) 利用BreakDancer软件,检测样品与参考基因组间的插入(insertion,INS)、缺失(deletion,DEL)、倒置(inversion,INV)、染色体内部迁移(intra-chromosomal translocation,ITX)、染色体间的迁移(inter-chromosomal translocation,CTX),通过ANNOVAR软件对DEL、INS、INV进行变异注释。6) 利用CNVnator判断潜在的deletion和duplication,并通过ANNOVAR进行变异注释。
1.5 转录组分析
转录组分析由北京诺禾致源公司完成。1) 突变体tsa58和野生型幼叶的总RNA采用天根RNA提取试剂盒(RNA Prep Pure PlantKit)提取,分别用琼脂糖电泳和Nanodrop检测RNA的完整性和纯度,然后利用Qubit 2.0荧光定量仪对RNA浓度进行精确定量,采用Agilent 2100精确检测RNA的完整性,保证提取的RNA达到建库要求。2) RNA样品检测合格后进行建库,文库构建完成后,先使用Qubit 2.0进行初步定量,稀释文库,随后使用Agilent 2100对文库的插入片段大小进行检测,插入片段符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量,以保证文库质量。3) 文库检测合格后,按照有效浓度及目标下机数据量的需求将不同文库pooling至flowcell,cBOT成簇后使用Illumina高通量测序平台NovaSeq 6000进行测序。4) 待测序完成后进行基因表达量分析和差异表达分析,表达差异基因通过GO聚类分析,根据差异基因在分子功能、生物学过程和细胞组分上的分布,筛选不同的GO term进行分析。
2 结果与分析
2.1 不同温度条件下水稻温敏型叶色突变体tsa58的表型特征
试验中发现,在20 ℃和30 ℃的光照培养箱中萌发的20 d秧龄突变体tsa58的幼苗间存在叶色差异。在20 ℃条件下,tsa58叶片呈现完全白化(图1 A);在30 ℃条件下,tsa58叶色与野生型无明显差异(图1 B)。进一步对不同温度处理的野生型和tsa58的光合色素进行测定发现,与野生型相比,在20 ℃条件下,tsa58叶片的总叶绿素、叶绿素a、叶绿素b和类胡萝卜素含量降低幅度最大,均达到极显著差异水平,分别降至野生型的12.95%,12.69%,13.76%和18.27%(图1 C);在30 ℃条件下,与野生型相比,tsa58叶片的总叶绿素、叶绿素a、叶绿素b和类胡萝卜素含量均与野生型无显著差异(图1 D)。
注:“*”表示p<0.05差异显著。图1 野生型(WT)和突变体tsa58在20 ℃和30 ℃条件下的表型特征Fig.1 Phenotypic characteristics of the wild type (WT) and mutant tsa58 at 20 ℃ and 30 ℃
2.2 tsa58变异检测分析
2.2.1测序数据质量汇总
通过测序数据分析,本次测序共产生原始数据35.5 Gb,过滤后有效数据为35 Gb,GC含量在44.32%~44.52%之间。所有样本的数据量足够,测序质量合格,GC分布正常,建库测序成功。本研究以粳稻日本晴作为参考基因组,参考基因组大小为375 049 285 bp,所有样本的比对率在96.67%~99.16%之间,对参考基因组(排除N区)的平均覆盖深度在33.32 X~38.61 X之间,1 X覆盖度(至少有一个碱基的覆盖)在97.16%以上,可用于后续的变异检测及相关分析(表1)。
表1 野生型和突变体tsa58测序数据Table 1 Sequencing data of the wild type and mutant tsa58
2.2.2变异检测分析
SNP变异分析:采用SAMTOOLS进行个体SNP的检测。野生型和tsa58分别获得289 649个和295 492个SNPs,其中基因间的SNPs最多,分别为197 985个和202 215个。其次为内含子区域,分别为26 218个和26 624个。外显子区域分别为15 552个和15 792个,其中非同义突变为主(表2)。
表2 SNPs分布区间及数目Table 2 Distribution interval and number of SNPs
InDels变异分析:利用SAMTOOLs检测长度小于50 bp的小片段插入与缺失。结果显示,在野生型和tsa58分别获得60 268个和60 852个InDels,其中基因间区域最多,分别为35 989个和36 412个缺失片段。在外显子区域中,以非移码变异为主,其次是移码变异(表3)。
表3 InDels分布区间及数目统计Table 3 Distribution interval and number statistics of InDels
结构变异(SV)分析:结构变异是指基因组结构变异是水平上大片段的插入、缺失、倒置、易位变异。可利用BreakDancer[5]软件,基于pair-end reads比对到参考基因组上面的关系及实际大小检测样品与参考基因组间的插入、缺失、倒置、染色体内部迁移、染色体间的迁移。野生型和tsa58分别获得8 207个和7 971个结构变异,其中外显子区域分别获得897个和914个(表4)。
表4 结构变异分布区间及数目统计Table 4 Distribution interval and number statistics of structure variation
拷贝数变异(CNV)分析:拷贝数变异指基因组片段的拷贝数增加或者减少。通过CNVnator分析在野生型和tsa58中分别检测到4 722个和4 978个烤贝数变异。主要分布在基因间区域,分别为3 328个和3 463个。其次是外显子区域,分别为588个和649个。野生型拷贝数增加1 381个,减少3 341个,增加长度为10 066 000 bp,减少长度为19 394 800 bp。tsa58的拷贝数增加1 386个,减少3 592个,增加长度为10 292 100 bp,减少长度为19 784 100 bp(表5)。
表5 拷贝数变异分布区间及数目统计Table 5 Distribution interval and number statistics of copy number variation
2.2.3候选基因分析
本研究通过变异检测分析,发现位于2号染色体上的20878044~21473236间发生了倒置结构变异(表6),其位点21473236位于Os02g0565400(LOC_Os02g35750)的外显子上,导致该基因翻译提前终止(图2)。在20 ℃条件下转录组分析发现,该基因在野生型和突变体tsa58中的表达量无显著差异,但在该基因的可变剪接类型存在差异。在野生型中存在TSS、TTS、AE等3种剪接类型,同时存在5个不同的剪接位点,而突变体tsa58未检测到可变剪接(表7)。推测可能是由于该突变位点发生INV变异导致该基因的可变剪接类型发生变化,从而影响该基因的功能。
表6 在突变体tsa58中外显子区域发生INV变异的类型Table 6 Types of INV variation in exon region of the tsa58
表7 野生型中Os02g0565400(LOC_Os02g35750)的可变剪接类型Table 7 Variable splicing types of Os02g0565400 (LOC_Os02g35750) in wild type
注:红箭头为发生INV变异位点。图2 Os02g0565400(LOC_Os02g35750)结构图Fig.2 Structure diagram of Os02g0565400 (LOC_Os02g35750)
2.3 突变体tsa58与野生型在低温条件下转录组分析
2.3.1重复相关性评估和样品基因表达量总体分布
本研究在实验设计中20 ℃处理野生型(C 1)和突变体tsa58(T 1),每个样品设计3次生物学重复。如图3所示,样品两两之间相关性均大于0.9。说明本试验各重复样品间的误差率低,重复性较好,可用于后续分析研究。
图3 两个样品的表达量相关性Fig.3 Correlation of expression levels between the two samples
2.3.2突变体tsa58与野生型在不同温度下差异表达分析
对于有生物学重复的样本,DEseq 2适用于进行样品组间的差异表达分析,获得突变体与野生型之间的差异表达基因集。在差异表达基因检测过程中,将Fold Change≥2且FDR<0.01作为筛选标准。通过火山图(Volcano Plot)可以快速地查看基因在两个(组)样品中表达水平的差异,以及差异的统计学显著性。在20 ℃条件下,突变体tsa58与野生型间差异表达的基因有1 516个,其中上调的差异基因有980个,下调的差异基因有536个(图4)。
图4 差异表达火山图Fig.4 Differentially expressed volcano map
2.3.3差异表达基因KEGG通路富集分析
将差异基因进行GO功能分析,共有980个差异基因分布在生物过程、细胞组分和分子功能等三个层面上。在生物过程方面,461个差异基因富集在代谢过程,有438个差异基因富集在细胞过程。在细胞组分方面,有503个差异基因主要富集在细胞和细胞器等。在分子功能方面,有480个差异基因主要富集在绑定,有355个差异基因主要富集在催化活性等(图5)。
图5 突变体tsa58与野生型间差异表达的基因Fig.5 Differentially expressed genes between the tsa58 and wild type
为了准确分析突变体与野生型体内代谢通路发生的变化,对差异基因显著富集的20条KEGG生物通路进行统计分析。在20 ℃条件下差异基因显著富集的通路主要是核糖体、缬氨酸、亮氨酸和异亮氨酸降解、丙氨酸、天门冬氨酸和谷氨酸代谢、倍半萜和三萜生物合成、油菜素类固醇生物合成、光合作用、ABC转运蛋白、碱基切除修复、苯并恶嗪类生物合成、类胡萝卜素生物合成、半乳糖代谢、肌醇磷酸盐代谢、植物-病原菌互作、卟啉和叶绿素代谢、RNA降解、RNA聚合酶、牛磺酸和次牛磺酸代谢、硫胺素新陈代谢、色氨酸代谢和维生素B 6代谢(图6)。核糖体大小亚基差异基因为27个,由叶绿体基因组编码的rps7、rpl32、rpl20和rps16均显著下调。而在细胞核基因组编码的基因中除OsRPL44显著下调以外,其余基因均显著上调(图7)。
图6 突变体tsa58与野生型间差异表达基因的KEGG通路富集散点图Fig.6 Rich distribution site of KEGG pathway of differentially expressed gene between the tsa58 and wild type
图7 突变体tsa58与野生型间叶绿体核糖体亚基中差异表达的基因Fig.7 Expression of ribosome subunit differential gene in chloroplast between the tsa58 and wild type
3 结论与讨论
在本研究中,突变体tsa58在20 ℃条件下,幼苗叶片呈现完全白化,光合色素含量较野生型极显著降低;而在30 ℃条件下,幼苗叶色呈现正常绿色,光合色素含量与野生型无明显差异。研究结果表明tsa58为温敏型叶色突变体。本研究通过变异检测分析,发现在定位区间内的20878044~21473236间发生了倒置结构变异,其位点21473236位于Os02g0565400的外显子上,导致该基因翻译提前终止。结合野生型和突变体tsa58在20 ℃条件下转录组分析发现,该基因在野生型和突变体tsa58中的表达量无显著差异,但该基因的可变剪接方式存在差异。该基因在野生型中存在TSS、TTS、AE等3种剪接类型,并存在5个不同的剪接位点,而在突变体tsa58中未检测到可变剪接类型。因此可以推测tsa58为Os02g0565400(WSL4)的新等位突变体。
质体核糖体蛋白对质体蛋白的生物合成、核糖体的生物合成、早期叶绿体的发育及叶绿体的分化都非常重要。在20 ℃条件下的转录组分析结果表明,突变体tsa58在核糖体大小亚基差异基因为27个(图7),其中由叶绿体基因组编码的rps7、rpl32、rpl20和rps16均显著下调,而由细胞核基因组编码的基因中除OsRPL44显著下调以外,其余基因均显著上调。可以推测,tsa58基因突变导致叶绿体核糖体不能正常形成并组装,导致植物在低温条件下呈现出白化表型。tsa58(WSL4)为P类PPR蛋白成员主要参与RNA的剪接、稳定、切割和翻译过程。WSL4通过影响合酶成员的剪接和翻译,影响叶绿体中ATP的合成过程[9]。