小麦抗病分子标记筛选及相关基因的生物信息学分析
2020-07-14史晨琳王长彪赵兴华任永康牛瑜琦唐朝晖
史晨琳,王长彪,赵兴华,刘 江,韩 斌,任永康,牛瑜琦,唐朝晖
(1.山西大学生物工程学院,山西太原030006;2.山西省农业科学院生物技术研究中心,山西太原030031;3.山西省农业科学院作物科学研究所,山西太原030031)
分子标记在小麦遗传育种中有着重要作用,主要体现在遗传图谱的构建、基因标记和定位、品种鉴定和指纹图谱绘制、物种亲缘关系和遗传多样性研究及分子标记辅助育种等方面[1]。分子标记包括两类,一类是基于非PCR 技术或者杂交技术,如RRFLP(限制片段长度多态性);二类是基于PCR技术的任意引物或序列非特异技术,如RAPD(随机扩增多态性DNA),AFLP(扩增片段长度多态性)和序列靶向PCR 技术(如SSR,SNPs)[2]。SSR 分子标记在遗传基础较窄的普通小麦基因组中随机分布,具有多位点、丰富的多态性、大部分位点有特异性,因此,在小麦的遗传育种研究中已广泛应用[3-4]。
SCHULER[5]于1997 年第一次提出电子PCR(Electronic PCR,e-PCR)的概念,被用于DNA 片段染色体定位和基因组辅助作图等方面[6]。电子克隆技术是指在已有的网络资源和数据库(EST、核苷酸数据库、基因组数据库等)中采用聚类、同源性检索、序列拼装等生物学方法,利用计算机技术来延伸EST 序列,从而得到部分或者全长cDNA 序列的技术[7],具有简单、快速、成本低等特点[8]。
随着小麦及其祖先种基因组测序工作的完成,产生了大量可分析数据[9]。多种基因预测软件被用于预测各种生物基因结构及功能[10],其中,Fgenesh可用于真核生物的预测,直接对某生物的cDNA 序列或蛋白质的相似性来预测,准确性极高[11]。Blast2go 是一种利用GO 功能注释和分析的相似性搜索工具,便于对大批量功能基因组学信息进行搜索[12]。通过大量的图形和分析工具来处理数据[13],对基因或蛋白质序列进行功能注释和分析,注释时对每个基因或基因产物生成一个与之相关的GO 术语列表[14]。KEGG(Kyoto Encyclopedia of Genes and Genomes)即京都基因和基因组百科全书[15]。KEGG通路图用图形将基因、酶和各种代谢网络信息相结合,每个代谢途径构成一个含有酶或EC 号的网络[16]。作为一个丰富的生物信息学资源库,KEGG 是基因功能预测、寻找基因涉及的代谢途径,挖掘代谢产物、基因、调节物质三者间关系的重要工具[17]。
本研究通过从已发表文献中寻找与小麦抗白粉病、抗锈病相关的特异性分子标记,并进行筛选,将其定位在六倍体中国春小麦和祖先种乌拉尔图小麦、粗山羊草的全基因组数据库中,对能够成功定位的序列进行功能预测、GO 功能注释以及KEGG 分析,获得与小麦白粉菌、锈菌互作过程中的基因表达信息,较全面认识基因在抗性反应网络中基因间的相互关系,为揭示小麦病害的发病机理、发掘和克隆抗病新基因和开发分子标记奠定基础。
1 材料和方法
1.1 试验材料
由山西省农业科学院作物科学研究所提供的34 份小麦材料:中国春、乌拉尔图小麦(Triticum urartu)、拟斯卑尔脱山羊草(Ae.Speltoides Tausch)、粗山羊草(Aogilops.tauschii)、野生一粒小麦(Triticum boeoticum Boiss)、Sy95-71、运旱618、运旱20410、铭贤169、晋麦47、晋麦66、98M71、Moro、先麦12、丰尤8 号、百农121、郑132、郑369、阜0608、良星99、济麦22、山农20、中麦247、良星66、宁麦5 号、舜麦1718、百农64、皖麦38、MY559、兰考906、石家庄8 号、中麦175、长6878、周麦28。
从已发表的相关文献中寻找与小麦抗白粉病、锈病的相关分子标记150 个。
1.2 试验方法
1.2.1 标记筛选 在Linux 平台上将小麦抗病标记在中国春及其祖先种乌拉尔图小麦(Triticum urartu)、粗山羊草(Aogilops.tauschii)中进行电子定位,确定其在染色体上的实际位置。再通过PAGE 筛选,筛选出41 个对小麦高感材料与高抗材料特异性的分子标记。
1.2.2 生物信息学分析 对能成功进行电子定位的位点,提取两翼各2 000 bp 的序列,进行了电子克隆。使用Fgenesh 对相关定位位点的两翼序列进行功能基因预测。为了深入的研究小麦相关抗病基因的分子机理和功能,使用Blast2go 软件对获得的功能基因进行基因的GO 功能注释及KEGG 的代谢途径分析。
2 结果与分析
2.1 电子定位分析
统计电子定位结果,其中分别定位在六倍体小麦的2B 染色体,乌拉尔图小麦(Triticum urartu)的2 号染色体,粗山羊草(Aogilops.tauschii)的2 号染色体上的最多。同一标记定位在不同染色体上,或者同一染色体不同位置。
2.2 与标记关联的基因预测
对能够成功定位位点的上游和下游分别提取2kb 的基因组序列,使用在线基因预测软件Fgenesh对提取到的基因组序列进行基因预测,共预测出96个功能基因。
2.3 基因功能注释
用B1ast2go 软件把预测到的96 个功能基因的DNA 序列进行GO 功能注释,其中,成功注释的有60 个序列,未成功注释的有36 个。注释结果共有58 条术语信息:参与生物学途径(P)的有24 条,占41.38%;细胞组件(C)的10 条,占17.24%;分子功能(F)的有24 条,占41.38%。功能基因二级水平的GO 注释如图1 所示。
2.3.1 分子功能(F)GO 术语分析 参与分子功能(F)的功能基因有54 个,分子功能二级水平包括结合、催化活性、营养库活性以及转运活性4 种反应类型,其中,参与结合(42.2%)和催化活性(35.6%)这2 种类型中的功能基因占多数,说明细胞内正常活动离不开包括催化活性、杂环化合物结合、有机环状化合物结合、离子结合、转移酶活性、核酸结合、催化活性,作用于蛋白质、营养库活性等。其具体结果如图2 所示。
2.3.2 生物学途径(P)GO 术语分析 参与生物学途径的共有51 个功能基因,生物学途径(P)二级水平中包括代谢过程、细胞反应、定位、细胞成分或生物发育、刺激反应、多生物反应、生物过程调控以及生物调控8 种途径类型。8 种途径中参与代谢过程(29.0%)、细胞过程(26.9%)的功能基因最多。代谢途径在植物与病原菌长期的共同进化过程中产生的复杂免疫系统中有着重要的作用,代谢过程中产生一系列产物,如水杨酸、植物凝集素以及次生代谢产物植保素、木质素、胼胝质,这些物质具有抵抗各种病原微生物入侵等提高植物抗病性的特点。这些基因参与细胞正常生命活动,在细胞增殖、分化、凋亡、迁移过程中起到重要的调控作用。其具体结果如图3 所示。
2.3.3 细胞组件(C)GO 术语分析 参与细胞组件的相关功能基因共有59 个。细胞组件二级水平包括细胞组分、细胞、细胞器、膜、膜组分、蛋白复合物以上6 种反应类型。其中,在细胞(24.5%)、细胞组分(24.5%)、细胞器(19.4%)参与的功能基因最多。植物细胞是其一系列生命活动的结构与功能的基本单位,从结构方面,可分为细胞壁、质膜、细胞核与细胞质。细胞核是遗传物质储存和复制的场所、对细胞整体代谢和发育起重要作用。植物细胞核中不同细胞器具有不同的作用,比如,叶绿体是植物细胞能进行光合作用最重要的细胞器,线粒体是细胞进行有氧呼吸的主要场所。这表明小麦功能基因的实现都是在细胞内发生,离不开细胞内各种细胞器和细胞组分的相互作用。其具体结果如图4 所示。
2.4 KEGG 代谢途径分析
用KEGG 数据库对得到的96 个功能基因进行代谢途径分析,代谢KO 结果及对应基因序列如表1 所示。
表1 代谢通路及基因序列
R35_chr2:c15247710-1524354 定义为乙醇脱氢酶(alcohol dehydrogenase,ADH,EC1.1.1.1),EC1.1.1.1 在原核生物、真菌、植物及动物中高度保守,可以将乙醇与乙醛相互转化,在抵御低氧、低温、涝害、干旱和盐胁迫等非生物胁迫过程中有着重要作用[18]。R56_Tu1:14506450-14510636-2 定义为过氧化物酶(peroxidase,EC:1.11.1.7),EC:1.11.1.7 功能多样,在植物抗逆、生长发育、遗传育种、木质素合成及其他生理过程中具有重要作用[19]。李华琴等[20]试验表明,小麦感病品种的过氧化物酶活性比抗病品种的显著增强,并且酶活性的增强与叶片症状相关联。R48_5A:c702503970-702499760-1 定义为木葡聚糖内糖基转移酶基因(XET),XET 通过改变木葡聚糖的结构引起细胞壁松弛,从而对植物生长发育产生影响[21]。R07_6D:455131969-455136142-2(R07_chr6:479075589-479079762-2)定义为SWEET基因(sugarswilleventuallybeexported transporter),SWEET 家族参与宿主-病原菌之间的互作,但只有部分与病原菌互作的机理得到阐述,而病原菌特异性识别SWEET 基因的途径是未知的[22]。植物进化出用以监控、抑制病原菌效应子的R 基因,宿主R 基因与病原物致病性的无毒基因(Avr)相互作用下产生抗性,是引发宿主免疫反应的前提。R60_5B:701460124-701464231 定义为RIN4,RIN4 在与植物病原菌相互作用中具有重要的作用,AvrRpm1 和AvrB 诱导RIN4 磷酸化,可能会增强RIN4 作为植物防御的负调节因子的活性,促进病原菌的生长[23]。代谢通路如图5 所示。
3 结论与讨论
本研究通过对筛选出的特异性分子标记,对提取到的基因组序列进行基因功能预测和注释,再使用Fgenesh 预测出96 个功能基因,对获得的基因序列进行GO 功能注释以及KEGG 代谢途径分析。在GO 注释结果中,生物学途径(P)与分子功能(F)的GO 术语数目较多。在生物学途径中,以代谢过程为主;细胞组件中,以在细胞和细胞器中起作用的为主;分子功能中,具有结合和催化活性功能的基因数目最多,说明获得的功能基因主要通过在细胞内,各种物质通过结合与催化功能进行代谢活动。KEGG 代谢通路分析得到了对应的KO 代谢途径及EC 编码等相关信息。
其中,R35_chr2:c15247710-15243542、R60_5B:701460124-701464231、R07_6D:455131969-455136 142-2(R07_chr6:479075589-479079762-2)可能与抗病相关联;S5_2A:729575149-729597382-2(S5_chr2:575741567-575745800、S5_2D:595544071-59 5548304)、R48_5A:c702503970-702499760-1、R56_Tu1:14506450-14510636-2、R51_7B:c718434553-718430309-1(R51_Tu7:698386587-698390868-1)、020_2D:595544128-595548276(020_2B:72344079 5-723444943、020_chr2:575741624-575745772)与植物抗逆性以及生长发育有关。
虽然通过生物信息手段预测到了和抗病相关的基因,但是这些基因在实际应用是否和抗病关联,还需要进一步进行功能验证,这为下一步进行小麦抗白粉病、锈病基因的定位及克隆、基因编辑和分子育种奠定了基础。