APP下载

基于转录组测序芒果抗细菌性角斑病SNP/In Del分析

2024-03-28周思思王露露胡芳丽何红柳凤张国辉普金安张翠英沐云松

西北农业学报 2024年1期
关键词:单核苷酸多态性芒果

周思思 王露露 胡芳丽 何红 柳凤 张国辉 普金安 张翠英 沐云松

摘 要 旨在挖掘与芒果抗细菌性角斑病紧密联系的SNP/In Del位点,以进一步揭示芒果抗细菌性角斑病的遗传多样性和分子机理。试验材料为细菌性角斑病高抗品种‘热农1号和高感品种‘凯特,分别对两个品种接病菌后0 d、2 d、6 d的果皮进行转录组分析,以基因组‘红象牙作为参考,鉴定并分析芒果中SNP/In Del位点的特征。结果表明,‘凯特和‘热农1号分别获得32.77 Gb和36.83 Gb的数据量,每个样本过滤后的Q30均高于90%。将reads比对到芒果参考基因组上,两个品种共检测到1 213 112个SNP位点,62 888个In Del位点,主要分布在内含子区、外显子区、基因间区和基因上下游区域。SNP中转换位点和颠换位点分别为751 006个(61.91%)和462 106个(38.09%),其中转换型中A->G略多,而A->T在颠换型中占多数;In Del位点插入和缺失分别每个样本平均有18 769和25 015个。生物信息学分析表明,全部的SNP和In Del位点所在的差异基因,主要参与分子功能有代谢途径、应答刺激和生物学调控等过程。

关键词 芒果; 细菌性角斑病; 转录组测序; 单核苷酸多态性; 插入缺失标记

芒果(Mangifera indica Linn.)为漆树科芒果属常绿乔木,最初产于印度及马来西亚地带,有着悠久的栽培历史,是闻名的热带水果之一[1-2]。细菌性角斑病(Xanthomonas citri pv.mangiferaeindicae)是芒果生产中的主要病害[3-4],直接影响芒果的生长发育,轻者造成20%~50%的减产[5],重者造成失收。近年来有关芒果细菌性角斑病的研究,多集中在形态学、细胞学和生理生化学的分析上[6-7],对分子领域尤其开发抗病相关分子标记的研究甚少。挖掘芒果抗细菌性角斑病抗病相关位点,对选育抗病品种具有重要意义。传统的抗病育种选育大多为常规的实生选种、杂交育种等途径[8],育种周期长,选育限制众多[9]。近年来,随着高通量测序技术的出现与快速发展,转录组可以填补传统形态学进行分类的缺点,为芒果种质资源的分类提供更快速、更准确的新手段,加速种质筛选和鉴定工作[10],目前该技术主要关注在芒果开花期与果实大小等方面,而对以细菌性角斑病侵染芒果的转录组测序工作还鲜有报道。

转录组测序技术具有通量大、周期短、成本低等优点,能够对个体基因组进行快速筛选,找到变异基因,检测变异类型[11],基于突变SNP位点和In Del位点的分子标记开发,可以挖掘跟抗病紧密连锁的位点,可用于抗病品种的选育和遗传多样性的分析。利用SNP和In Del位点分布广泛和多态性好的特点,可以将差异的SNP或In Del位点用于某些功能基因的精细定位或遗传图谱的构建等[12]。刘小红[13]对玉米的耐高温和高温敏感两个品种进行转录组测序,得到的数据进行SNP和In Del位点分析,挖掘与耐高温有关的SNP和In Del标记;国钰环等[14]对三雌蕊小麦幼穗的3个生长阶段进行转录组测序,通过筛选开发出4个位于Pis1基因附近的SNP标记,丰富了小麦中的SNP标记资源;吴宇瑶[15]通过对10个烟草材料进行转录组测序,筛选出11个多态性SNP位点,成功构建了34份烟草种质的指纹图谱;但在芒果中对SNP和In Del标记相关研究却很少,尤其是芒果抗细菌性角斑病的SNP和In Del分子标记的开发研究还未见报道。

徐志豪等[16]通过全基因组重测序对‘热农1号和‘凯特两个品种间差异的SNP位点进行了分析,在此基础上为了挖掘与抗病紧密相关的位点,本研究利用转录组测序技术,继续以这两个品种为试验材料,通过RNA-Seq方法检测芒果在  0 d、2 d、6 d接种细菌性角斑病病菌后转录水平差异,系统比较细菌性角斑病病菌侵染芒果后不同时期SNP和In Del位点的不同差异信息及转录组表达特征,通过观察基因表达量的变化,筛选抗病相关位点,为构建芒果高密度遗传图谱、分子标记辅助选择育种和抗病相关的功能基因挖掘等提供数据,同时也为后期深入研究芒果与细菌性角斑病互作机理奠定基础。

1 材料与方法

1.1 试验材料

以高抗和高感细菌性角斑病的‘热农1号和‘凯特芒果为材料,分別从云南等地采集健康无病害芒果果实。用3号昆虫针自制直径为1 cm的7针头梅花针进行刺伤,使用LB培养液培养  2 d后的菌液进行接种,对接种后的果实进行100%湿度下28℃恒温黑暗培养。取接种后  0 d、2 d、  6 d以及接种LB培养液(CK)的果皮用于后续试验,共10个样品,分别命名为T1~T10。具体如下:T1为‘凯特无处理样品;T2和T4分别为‘凯特接种细菌性角斑病第2天和第6天的样品;T3和T5为接种LB培养液的样品;T6为‘热农1号无处理样品;T7和T9分别为‘热农1号接种细菌性角斑病第2天和第6天的样品;T8和T10为接种LB培养液的样品。

1.2 RNA-Seq测序

采集‘热农1号和‘凯特接菌后的2 d、6 d以及接种LB培养液0 d-CK、2 d-CK、6 d-CK的果皮,共10个样品,每个样品3个生物学重复(数据取交集展示)。提取组织总RNA,利用NanoDrop微量分光光度计进行RNA浓度和纯度精确定量;用1.5%琼脂糖凝胶电泳检测样品RNA完整性及是否存在DNA污染;Agilent 2100 bioanalyzer精确检测RNA完整性。转录组采用双末端测序,委托广州基迪奥生物科技有限公司  完成。

1.3 转录组文库构建及测序

提取总RNA,再进一步对接种细菌性角斑病菌后0 d、2 d和6 d两个品种的芒果,每个处理3个生物学重复的总RNA进行mRNA纯化、打断mRNA、cRNA的合成、上机测序等试验工作,该工作在广州基迪奥生物科技有限公司完成。

1.4 数据整理和过滤

为了保证数据质量,从碱基含量与错误率等方面对原始reads进行质量评估,以减少无效数据所来带的分析干扰。首先,对下机的raw reads数据,利用fastp[17]进行质控,过滤低质量数据,得到clean reads,过滤标准为去掉adapter的reads;去除含N比例大于10%的reads;去除全部都是A碱基的reads;除去平均质量分数小于Q20的Reads進行数据过滤。

1.5 SNP和In Del位点分析

病菌侵染后不同时期的样品存在RNA编辑,均可能产生不同的SNP和In Del变异的位点,针对过滤后的转录组数据,使用软件GATK进行SNP以及In Del的变异检测并最终进行数据统计,对SNP的位点进行过滤:(1)使用GATK软件在call SNP的同时已将低质量的SNP过滤;(2)对于In Del附近的SNP,已使用GATK软件进行矫正;(3)筛选基因不重叠的utr和exon端的SNP;(4)筛选参考reads>=2且突变reads>=3的位点;(5)筛选突变频率在0.1到0.9的SNP位点。

1.6 差异表达基因富集分析

将差异基因向GO数据库的各term映射,并计算每个term的差异基因数,得到具有某个GO功能的差异基因,列表差异基因数目并统计。应用超几何检验,找出在差异基因中显著富集的GO条目。corrected-pvalue≤0.05为阈值;基于KEGG公共数据库对差异表达基因进行Pathway分析,应用超几何检验,找出在差异表达蛋白中显著性富集的Pathway。通过Pathway显著性富集确定差异表达蛋白参与的最主要生化代谢途径和信号转导途径。Qvalue≤0.05为阈值。

2 结果与分析

2.1 数据质控和对比

转录组测序的原始数据经过质控和GC含量分析,‘凯特和‘热农1号各获得了32.77 Gb和36.83 Gb的数据量。每个样本的clean reads均在4 045万条以上,GC含量均在43%以上。Clean Data中每个样品的Q30均大于90%,Q20均大于96%,表明测序质量较好,可以支撑后续进一步分析。通过将测得的reads与芒果的参考基因组进行对比,每个样本中平均有48 547 865条reads对比到参考基因组上。其中,对比到参考基因组的唯一位置有86.02%~97.70%,可对比到参考基因组上的有90.01%~91.65%,比对到参考基因组的多个位置有3.91%~4.73%,比对结果正常,可用于后续的变异检测及相关分析。

2.2 SNP数量及杂合统计

分别对T1、T2、T3、T4、T5、T6、T7、T8、T9和T10共10个样品的SNP位点进行统计,平均每个样本的SNP位点数目约为843 282个,结果如表1所示。从表1还可以看出,‘凯特每个样本纯合突变的SNP至少有560 592个,杂合突变的有325 025个;‘热农1号每个样本纯合突变的SNP至少有542 741个,杂合突变的有  293 208个,且两个品种每个样品纯合位点的数量都大于杂合位点的数量。

2.3 SNP类型统计

根据突变类型种类统计转录组测序的10个样本中SNP基因突变型所占比,结果如图1所[CM(21]示,其中最少的为颠换C->G型,仅占3.96%,最多的为转换A->G型,占15.57%。转换类型(T<->C,A<->G)总数为751 006个,颠换类型(A<->C,A<->T,C<->G和G<->T)总数为462 106个,转换类型的数量比颠换类型的数量要多,转换和颠换的比值为1.6。

2.4 两两样品间SNP数目统计

利用软件进行样品间的分析,经筛选确定打分在30以上,且深度在10X~100X的多态位点作为最终的位点,两两样品间的数目统计矩阵见表2。分析发现两个品种在接菌后2 d、6 d与0 d的样品(CK)SNP数量都在减少,可用于后续筛选抗病位点的分子标记。

2.5 In Del统计分析

对10个样品的In Del位点进行统计,总共检测62 888个In Del位点(表3)。平均每个样本的In Del插入和缺失位点分别有18 769和25 015个,‘凯特的纯合突变与杂合突变比值为  1.23;‘热农1号的纯合突变与杂合突变比值为1.16,且杂合位点和纯合位点在这10个样品中数量变化也不呈现相关关系。

2.6 SNP/In Del功能元件上的分布统计分析

将10个样品材料中SNP/In Del变异位点的分布进行统计,其中内含子区分布最多,有  471 938个,占全部SNP/In Del位点数目的  38.61%;其次是外显子区、基因间区、基因上游、基因下游,分别占总量的24.54%、16.31%、  10.06%和9.02%;其余位点占总量的比例均低于5%。特别是剪切位点的SNP/In Del位点最少,统计数量为4 162个(图2)。

2.7 SNP/In Del功能统计分析

碱基的变异会影响基因的翻译,因而本试验对10个样品材料中SNP/In Del的各种类型密码子突变比例和总量进行统计(图3)。在每个样本中SNP/In Del造成非同义突变的数量都最多,共有160 296个,占53.48%;同义单核苷酸突变有136 391个,占44.50%;非移码替换突变仅有151个;而移码替换,无义突变,终止密码子突变较少,分别为812、1 755和381个。

2.8 基因功能注释分析

隨着接菌时间的延长,差异表达基因数目增多。两个品种2个侵染时期(接菌后2 d和6 d)‘凯特上调差异表达基因数量分别为3 623和  3 853个,‘热农1号上调差异表达基因数量分别为1 118和1 019个,‘凯特下调差异表达基因数量分别为1 653和3 226个,‘热农1号下调差异表达基因数量分别为927和2 024个(图4)。将全部的SNP和In Del位点所在的差异基因用GO和KEGG数据库进行富集分析显示,芒果果实响应细菌性角斑病不同时期的差异表达基因,主要参与分子功能有代谢、细胞、单生物等过程,显著富集到代谢途径、应答刺激、生物学调控等过程。基因功能注释到 RAR1、 SGT1、 HSP90在芒果接种细菌性角斑病后均表达。 RAR1、 SGT1基因在接病菌后2 d、6 d与0 d-CK对比发现在‘凯特中显著下调表达,‘热农1号随着病菌的侵染表达量无显著变化; HSP90基因在接病菌后2 d、6 d与0 d-CK,均显著下调,但‘热农1号表达量远大于‘凯特的表达量,可能与两芒果品种抗病性差异有关。

3 讨  论

目前,转录组的高通量测序主要是为了分析全局性基因表达变化,大量的差异SNP/In Del位点反映了侵染后不同时间段在基因组水平上DNA的多样性。从转录水平作为切入点研究SNP/In Del差异位点的方法被广泛使用[18],利用SNP和In Del位点分布广泛和多态性好的特点,可以将差异的SNP或In Del位点用于遗传多样性分析和某些功能基因的精细定位等[19],在桑葚、金佛山方竹、葡萄等常见作物中已有很多报道。王晖等[20]对桑葚果实颜色3个时期进行转录组测序获得大量SNP/In Del位点,通过将含有SNP/In Del位点的差基因通过GO、KOG/COG、KEGG数据库进行功能注释最终筛选出SNP/In Del标记的基因,为后续研究奠定基础;朱潇等[21]也通过转录组测序技术对金佛山方竹3个发育部位笋箨进行SNP和SSR分析,最终获得大量高质量的SNP位点,为后续开发分子标记、品种鉴定及遗传多样性分析等奠定了理论基础。对发现功能基因的SNP/In Del位点而言,转录组测序是一种高效且经济的方法[22]。本研究通过分别对两个品种接菌后0 d、2 d、6 d进行转录组测序,获得大量SNP/In Del位点信息,并对这些位点进行筛选和统计。大量的差异SNP/In Del位点可以通过基因功能注释,从植物与病原互作的途径、植物激素信号传导、对细菌的防御反应[23]、类黄酮生物合成等与抗病相关的途径中挖掘表达量高的基因,筛选出与芒果抗病性紧密关联的SNP/In Del位点进行验证,可为后期开发抗病相关的特异性分子标记,遗传多样性的分析,选育抗病品种等奠定基础。

SNP(Single nucleotide polymorphism)指在基因组水平上因单个碱基的突变引起的DNA序列多态性[24],关于SNP的突变类型,结果显示本试验中两个高抗和高感的芒果品种,转换/颠换达1.63,SNP的转换类型发生频率比颠换类型的SNP发生频率高,类似的结果在不少植物中都有体现,小果甜柿中转换/颠换达1.69[25],珠芽魔芋球茎中转换/颠换达1.84[26],主要可能是与结构有关,颠换是嘌呤换嘧啶,嘧啶换嘌呤,结构差异比较大,更为复杂,转换是嘌呤换嘌呤,嘧啶换嘧啶。而In Del(Insertion-Deletion)则是基因组小片段的插入或缺失所引起的变异。In Del位点每个样本平均有43 784个,一般而言SNP突变数目极显著大于In Del突变。In Del突变会带来更大影响,将会出现移码突变现象,造成插入和缺失位点后碱基的错位,由此后续将出现氨基酸序列的错乱排布,最终导致蛋白质失去原有功能。

本研究在基因功能注释分析中注释到的RAR1、 SGT1、 HSP90基因可以相互作用,构成分子伴侣复合物(HRS)[27],它们之间的相互作用在R基因介导的植物抗病过程中是必不可少的[28-29]。HSP90家族是一组高度保守的蛋白质,存在于几乎所有的生物物种中,维持信号传导蛋白功能[30];RAR1蛋白包含两个锌结合结构域,CHORD1和CHORD2[31-32],在多种植物对真菌、细菌和病毒的抗性中均是必要的信号分子;SGT1蛋白最初被确定为酵母着丝粒组装途径的重要组成部分[33]。并且RAR1、SGT1、HSP90在高抗和高感的两个品种中存在着47个非同义突变位点,可为后续的深入研究相关基因功能和开发抗病分子标记提供参考。

参考文献 Reference:

[1] MITRA S K.Mango production in the world-present situation and future prospect[J].Scientia Horticulturae,2016,1111:287-296.

[2] 李桂珍.芒果细菌性黑斑病防治技术[J].农村百事通,2017(15):34.

LI G ZH.Control technology of mango bacterial black spot disease[J].Nongcun Baishitong,2017(15):34.

[3] GAGNEVIN L,PRUVOST O.Epidemiology and control of mango bacterial black spot[J].Plant Disease,2001,85(9):928-935.

[4] DOIDGE E M.A bacterial disease of the mango Bacillus mangiferae n.sp[J].Annals of Applied Biology,1915,  2(1):1-45.

[27] MUSKETT P R,KAHN K,AUSTIN M J,et al.Arabidopsis RAR1 exerts rate-limiting control of R gene-mediated defenses against multiple pathogens[J].Plant Cell,2002,14:979-92.

[28] YUAN C.Genome-wide identification and characterization of HSP90-RAR1-SGT1-Complex members from Arachis genomes and their responses to biotic and abiotic stresses[J].Frontiers in Genetics,2021,12:689669.

[29] PEI H,SUN Q,HAO Q,et al.The HSP90-RAR1-SGT1 based protein interactome in barley and stripe rust[J].Physiological and Molecular Plant Pathology,2015,  91(7):11-19.

[30] AUSTIN M J,MUSKETT P,KAHN K,et al.Regulatory role of SGT1 in early R genemediated plant defenses[J].Science,2002,295:2077-2080.

[31] KADOTA Y,SHIRASU K.The HSP90 complex of plants[J].Biochim Biophys Acta,2012,1823(3):689e97.

[32] SHIRASU K,LAHAYE T,TAN M W,et al.A novel class of eukaryotic zinc-binding proteins is required for disease resistance signaling in barley and development in   C.elegans[J].Cell,1999,99:355e66.

[33] KITAGAWA K,SKOWYRA D,ELLEDGE S J,et al.SGT1 encodes an essential component of the yeast kinetochore assembly pathway and a novel subunit of the SCF ubiquitin ligase complex[J].Molecular Cell,1999,4:21e33.

SNP/In Del Analysis of Mango Bacterial Black Spot Disease Based on Transcriptome Sequencing

Abstract In order to explore the SNP/In Del loci closely associated with mango bacterial black spot disease,and further reveal the genetic diversity and molecular mechanism of mango bacterial black spot disease, the high resistance variety ‘Renong No.1 and the high susceptible variety ‘Keitt were used as experimental materials, the pericarp transcriptome of the two varieties at 0 d, 2 d, and 6 d  was analyzed after pathogen exposure, and the genome ‘Red Ivory was used as a reference to identify and analyze the characteristics of SNP/In Del loci in mango.The results showed that ‘Keitt and ‘Renong No.1 obtained 32.77 Gb and 36.83 Gb of data, respectively, and the filtered Q30 of each sample was higher than 90%.Reads were compared to the reference genome of mango.A total of   1 213 112 SNPS and 62 888 In Del loci were detected in the two cultivars, which were mainly distributed in the intronic region, exon region, intergene region and upstream and downstream region of the gene.There were 751 006 (61.91%) conversion sites and 462 106 (38.09%) inversion sites, respectively.A->G was slightly more in conversion type, while A->T was the majority in inversion type.There were 18 769 insertions and 25 015 deletions per sample, respectively.Bioinformatics analysis showed that all the SNPS and the differentially located genes in the In Del locus were mainly involved in the molecular functions which include metabolic pathways, response stimulation and biological regulation.

Key words Mango; Mango bacterial black spot disease; Transcriptome sequencing; Single nucleotide polymorphism; In Del markers

猜你喜欢

单核苷酸多态性芒果
我爱刷牙
我爱刷牙
我才不要穿
小洞会“咬”人
小洞会“咬”人
药用植物DNA标记辅助育种(一):三七抗病品种选育研究
肿瘤坏死因子超家族成员15与溃疡性结肠炎相关性的研究
人多巴胺D2基因启动子区—350A/G多态位点荧光素酶表达载体的构建与鉴定及活性检测
EPAS1基因SNPrs13419896多态性与HiHiLo低氧训练适应效果关联性研究
高灌蓝莓CBF基因的单核苷酸多态性分析