灰树花菌(Griflola frondosa)子实体原基转录组测序及分析
2022-11-21赵文君律凤霞
赵文君,律凤霞,艾 鑫
(牡丹江师范学院 生命科学与技术学院,黑龙江 牡丹江 157011)
灰树花(Griflola frondosa)又名栗蘑、莲花菌、贝页多孔菌等,素有“食药用菌王子”的美誉,分类学上隶属于真菌界、担子菌亚门、层菌纲、非褶菌目、多孔菌科,其子实体肉质,珊瑚状分枝层叠似菊,富含多种糖类、酚类和酸类等活性物质,具有抗氧化、抑病毒、抑肿瘤活性等生理作用,是一种食药兼用的珍稀食用菌.[1-4]近几年食用菌转录组测序研究内容大幅增加,但对灰树花子实体形成机制及酸性代谢物质在病原菌中的生物防治作用研究少见报导.[5-6]本研究提取灰树花菌原基总RNA,基于SBS(sequencing by synthesis)技术,用IIIumina Hiseq高通量平台对RNA进行转录组测序,对原始数据拼接、过滤、重建形成转录组Unigene数据,与5大数据库进行功能注释比对、分类,研究其酸性物质代谢路径,为灰树花在植物病害生物防治中的应用提供理论依据,为今后深入开展灰树花活性物质研究和种质资源的利用提供依据.[7-10]
1 材料与方法
1.1 材料与仪器
灰树花菌株牡丹江师范学院生命科学与技术学院食用菌研发中心提供.
仪器压力蒸汽灭菌器(DSX-280B),超净工作台,医用离心机(H1650R),电泳仪(DYY-6D),PCR扩增仪(PTC-100).
1.2 方法
试验材料制备母种培养基:马铃薯200 g,葡萄糖20 g,胰蛋白胨10 g,KH2PO41.5 g,定容至1 L,pH值4.5~5.栽培种培养基:木屑80%,麦麸9%,石膏粉1%,腐殖土10%;含水量60~65%,pH值5.5~6.5.灰树花子实体原基:灰树花液体培养后菌丝球接种到栽培菌袋内,24℃恒温培养至菌丝长满菌袋,覆土保湿栽培,待子实体拱出土面后采集.
RNA的提取Plant Total RNA Islation Ki(50T)试剂盒提取灰树花子实体总RNA,检测RNA的完整性和污染情况,合格的RNA保存用于后续测序.
转录组测序数据处理及分析过滤低质量数据,去除5’或3’末端质量值低于20或者含N的碱基,去除trim后reads长度低于75 bp的序列及接头序列.[11]采用组装软件Trinity(v2.2.0)对样品数据从头进行组装,得到长的非冗余的Unigene序列.[12,13]将Unigene序列与Nr,COG,SwissProt,KEGG,GO等数据库进行比对,获得Unigene的注释信息.
2 结果分析
2.1 Unigene组装
利用Trinity软件对测序获得的原始reads数据进行拼接,数据总碱基数达102348 417 bp(97.61 M),最短长度为25 bp,最长长度为21111 bp,平均长度为47.8 bp,N50为47 bp,GC碱基含量为54.29%.处理后重新获得38189个Unigene,总碱基数为48354 644 bp,平均长度为1266.19 bp,最短Unigene为201 bp,最长Unigene12658 bp,N50为2028 bp,GC碱基含量为52.76%.说明从头组装的数据质量较好.见图1.
图1 Unigene不同长度饼状分布图
图1显示,Unigene长度主要集中在200~500 bp之间,占比34.24%;500~1000 bp(20.01%)和大于2000 bp(20.38%)的Unigene数量相近.
通过BLAST程序将灰树花Unigene分别与Nr,Swissprot,KEGG,COG等数据库进行比对.由表1可以看出,共有31928个Unigene被有效注释,其中有1485个Unigene在四个数据库中共同注释,占总数的3.89%;有14192个Unigene在至少两个以上的数据库中共同比对,占总数的37.16%.在Nr数据库中被注释到的Unigene最多有31454个,占总数的82.36%;在KEGG数据库中被注释到的Unigene个数最少为1832个,占总数的4.8%.
表1 灰树花Unigene的功能注释不同数据库分布情况
2.2 UniGene的Nr数据库比对分析
灰树花Unigene序列与Nr数据库比对,有31454个(82.36%)Unigene被有效注释.在Nr数据库中,匹配序列相似度达到80%以上的Unigene有18893个(60.07%),匹配序列相似度在40%~80%的有12134个(38.58%),匹配序列相似度低于40%的有427个(1.36%).
灰树花Unigene在Nr数据库中同源匹配排序前10的物种有:灰树花菌(Griflola frondosa)24896个(79.15%),绣球菌(Sparassis crispa)1075个,小鳞多孔菌(Polyporus brumalis)966个,Obba rivulosa 878个,污叉丝孔菌(Dichomitus squalens)571个,红栓菌(Trametes cinnabarina)551个,绒毛栓菌(Trametes pubescens)805个,Fibroporia radiculosa 354个,离 心 射 脉 革 菌(Phlebia centrifuga)116个,赭 黄 齿 耳(Steccherinum ochraceum)104个,表明灰树花序列及基因功能研究在Nr数据库中公布的数量较多.
2.3 Swissprot数据库比对分析
Swissprot数据库中有被注释Unigene12357个,匹配同源序列相似度达到高于80%的Unigene有998个(8.08%),同源相似度在40%~80%有620个(50.16%),同源相似度小于40%的有516个(41.76%)
2.4 UniGene的GO数据库比对分析
共有12234个灰树花Unigene在GO数据库中被注释到.主要涉及分子学功能、生物途径和细胞组分3大主类60个亚分类.在分子功能中含有19个功能组,其中结合功能和催化活性功能的UniGene数量最多;细胞组分含有20个亚类组,参与细胞成分的Unigene数量最多;生物过程含有21个亚类组,参与细胞过程的Unigene数量最多.
2.5 UniGene的KEGG数据库比对分析
灰树花Unigene在KEGG数据库中1832个被有效注释,占总数的4.8%.KEGG数据库的生物通路分四大主类:细胞过程、环境信息处理、遗传信息处理和新陈代谢,内含20条二级亚类.其中12条与新陈代谢相关,涉及Unigene数量:碳水化合物代谢399个,氨基酸代谢190个,核苷酸代谢135个,糖的生物合成和代谢65个,萜类和聚酮类化合物代谢11个,辅助因子和维生素代谢63个,其他氨基酸代谢82个.其次,遗传信息处理有4条通路1067个基因,细胞过程有2条通路70个基因,环境信息处理有2条通路273个基因.
2.6 UniGene的COG数据库比对分析
灰树花UniGene在COG数据库中有12248个被注释.一般功能预测被注释的最多为1930个(占15.76%),其次是翻译后的修饰1279个(占10.44%)、信号转导机制1102个(占9%)、次生代谢产物的合成,运输和分解代谢1017个(占8.3%),细胞活力被注释的最少只有11个(占9%).
3 讨论与结论
研究采用Illumina测序平台对灰树花菌原基进行转录组测序,并获得了大量转录组信息.灰树花栽培诱导形成子实体原基,提取总RNA处理后转录组测序,获得38189个Unigene,平均长度1266.19 bp.Unigene与Nr数据库比对,与灰树花菌相似序列最多.袁卫东[14]和聂文强[15]等人在2012年和2017年采用高通量测序技术分别对灰树花子实体和菌丝体进行转录组测序,共获得63137个Unigene和18077个Unigene,与Nr数据库比对两人数据均与变色栓菌的相似序列最多.上述两人数据结果与本实验得出的数据结果不一致,推测可能是变色栓菌与灰树花菌同属于多孔菌科,两者的相似序列较多.近年来灰树花的研究不断深入,灰树花菌在公共数据库中的序列也更加完善,可以在数据库中直接比对大部分灰树花序列.
在Swissprot数据库中检测到蛋白序列同源12357条;与KEGG数据库比对,1832个Unigene分为20条生物通路,最多的是代谢通路,有12条,涉及2484个Unigene;与GO数据库比对,12234个Unigene,分为生物过程、分子功能、细胞组成3大类60个分支;与COG数据库比对,12248个Unigene.此外,还有6261个Unigene在数据库中未得到注释,推测可能是灰树花的特异性新基因、非编码RNA序列或目前公共基因数据库尚未完善.通过生物信息学分析,可为挖掘新功能基因、种质资源创新、遗传多样性分析、确定活性成分合成路径等提供新思路.