转录组和表达谱分析揭示PEBP基因家族成员参与调节滴水珠的珠芽发育
2018-07-13刘丹罗睿陈海丽夏丽莎高华霞
刘丹 罗睿 陈海丽 夏丽莎 高华霞
摘 要:为进一步揭示半夏属植物珠芽发育的分子机理,本文利用Illumina Hiseq平台对滴水珠进行转录组和表达谱测序。转录组测序获得6.68 Gb的数据,组装去冗余后得到66,907个Unigene,平均长度为893 bp。将Unigene比对到Nr、KOG、GO和KEGG数据库中,分别获得了34,947、27,886、9,149和27,006个注释信息。叶柄、珠芽和块茎表达谱测序分别获得24.08、24.02和24.06 Mb的数据库,其中6,961个Unigene的表达量在叶柄、珠芽与块茎之间同时存在差异(6,576和4,021个差异Unigene分别比对到GO和KEGG数据库)。转录组测序获得13个Unigene为PEBP基因家族成员相关序列,其中4个为差异表达。结果表明转录组和表达谱测序可用于筛选调控珠芽发育的候选基因,PEBP基因家族成员在珠芽发育调控中的作用值得进一步研究。
关键词:滴水珠;珠芽发育;转录组;表达谱;PEBP基因家族
中图分类号:Q943
文献标识码: A
滴水珠(Pinellia cordata N. E. Brown)是主要分布于我国安徽、福建、广东、广西、贵州、湖北、湖南等地区的天南星科植物[1],具有解毒消肿、散痰止痛等功效[2]。滴水珠的自然繁殖主要通过在叶柄下部和上部(叶片基部)形成珠芽进行。滴水珠及同属植物半夏的珠芽发育形态、解剖学已经报道[3-4],其发育特征除启动位置和后期成熟过程外与龙舌兰、台闽苣苔、山药和淡黄花百合等类似[5-7]。对于植物珠芽发育的分子调控机制研究而言,Wang 等[8]在台闽苣苔上发现GFLO基因与珠芽形成有关,珠芽形成过程中该基因的表达量呈现出下调趋势;Abraham-Juarez等[9]研究表明在龙舌兰中KNOX I基因表达量随着珠芽成熟而逐渐增加;Sandoval等[10]发现在龙舌兰珠芽形成过程中MADS1, 2, 4, 6, 7基因均呈现出表达量减少的相同模式。目前在珠芽发育的分子基础上研究报道少且不同植物珠芽发育的共同特性尚不明确。此外,磷脂酰乙醇胺结合蛋白基因(PEBP)家族包含FT、MFT和TFL三个亚家族,其不同家族成员可参与调节植物开花[11]、马铃薯块茎形成[12]和洋葱鳞茎形成[13]等有性和无性生殖发育过程。但是,目前尚未见报道PEBP基因家族成员参与调节珠芽发育。
转录组和表达谱测序可用于揭示植物器官发育过程中的调节基因,如程立宝等[14]发现了莲藕根状茎发生过程中的86个相关基因。转录组和表达谱测序也用于植物珠芽发育研究:彭斌[15]在山药的转录组测序中筛选出23个可能与珠芽发生有关的候选基因;姜福星等[16]在万年青的转录组测序中发现EMB基因、TATA结合蛋白基因和FKBP蛋白等基因在珠芽的形成過程中表达量发生了明显变化;叶德等[17]在半夏珠芽和叶柄的转录组测序中筛选出了19个与激素有关的差异基因,其中玉米素、茉莉酸、脱落酸4种激素合成代谢相关的基因在珠芽中的表达量高于茎中,赤霉素相反。但是,不同植物珠芽发育的转录组特征异同的揭示需要更多的转录组数据。
本研究以滴水珠为材料进行转录组和表达谱测序,分析珠芽发育过程中的表达谱宏观差异,并进一步分析PEBP家族成员的表达差异,为进一步研究半夏属植物的珠芽发育机制提供基础。
1 材料与方法
1.1 实验材料
滴水珠采集自浙江温州,盆栽于实验室备用。在植物的珠芽发育初期采集植株,纯水冲洗后在冰上进行取样:叶柄(pc1)、珠芽(≤3 mm, pc2)和块茎(pc3)。取得鲜样用液氮速冻后,放入-80 ℃冰箱保存。
1.2 总RNA的提取和文库的构建
CTAB法提取总RNA,DNase I处理去除DNA,然后用磁珠法富集mRNA。富集后mRNA等量分为两份:一份将三个组织鲜样的mRNA等量混合后进行转录组测序的相关分析;另一份将各组织mRNA进行单独表达谱分析。向获得的mRNA中加入打断试剂使得mRNA片段化,以mRNA片段为模板进行反转录生成cDNA。之后对cDNA的末端进行修复、并在3'末端加上“A”碱基并连接接头。之后对连接产物进行扩增并将PCR产物环化,最终文库构建成功。构建好的文库利用Agilent 2100 Bioanalyzer进行质检,合格后使用Illumina Hi Seq平台进行测序。
1.3 测序数据的加工、组装和注释
等量混合mRNA建库后测序得到的raw reads进行过滤处理获得Clean reads,再利用Trinity软件[18]对Clean reads进行de novo组装获得转录组序列。之后使用Tgicl软件[19]对转录本进行处理后获得Unigene。最后,将所有组装的Unigene利用BLAST[20]比对到non redundant protein database (Nr)、the Kyoto Encyclopedia of Genes and Genomes (KEGG)、clusters of eukaryotic Orthologous Groups(KOG)蛋白质数据库(E<10-5);利用Blast2GO[21]获得GO注释;利用InterProScan5[22]将Unigene注释到InterPro数据库。
1.4 差异基因的GO注释和KEGG注释
单独建库mRNA(1.2)表达谱测序后以de nevo组装、注释的转录组序列为参考并利用FPKM法(Fragments Per kb per Million fragments)计算各个样本Unigene表达量[23];利用FDR法[24]来进行差异表达的真实性(FDR≤0.001且倍数差异在2倍以上的基因被定义为差异基因)。利用Blast2GO[21]软件将差异基因进行GO功能注释,从而获得差异表达基因的GO注释和分类。利用BLAST[20]软件将差异基因比对到KEGG数据库中,进一步获得差异表达基因的Pathway的注释信息。
2 结果
2.1 转录组序列的de novo组装
去除质量较低、接头污染以及N含量过高的序列后,转录组测序共获得44.54 Mb高质量的Clean reads,Q20和Q30的百分比分别为98.86%和96.53%。Clean reads组装后获得180,862个Contigs,Contigs的序列长度范围是≥200 bp,序列的平均长度和N50的长度分别为547 bp和940 bp,GC%为48.73%。Contigs的片段大小分布:200-500 nt: 73.96%; 600-1000 nt: 12.36%; 1100-1500 nt: 5.61%; 1600-2000 nt: 3.46%; 2100-2500 nt: 1.96%; 2600-3000 nt: 1.04%; ≥3000: 1.60%。转录本进行聚类去冗余得到了66,907个Unigene,Unigene的平均长度和N50长度分别为893 bp和1,540 bp。Unigene的长度分布:300-500 nt: 50%; 600-1000 nt: 19.82%; 1100-1500 nt: 11.55%; 1600-2000 nt: 7.76%; 2100-2500 nt: 4.55%; 2600-3000 nt: 2.51%;≥3000: 3.80%。
2.2 转录组序列的KOG功能注释
利用BLAST将Unigene比对到Nr、Nt、Swiss-prot、KEGG、KOG、Interpro和GO 七个公共数据库中(E<10-5)。结果显示,有34,947(52.23%)个Unigene比对到Nr数据库中,22,133(33.08%)个Unigene比对到Nt数据库,23,915(35.74%)个Unigene比对到Swiss-Prot数据库,比对到KEGG、KOG、Interpro 和 GO数据库的Unigene数分别为:27,006(40.36%)、 27,886(41.68%)、 25,962(40.30%)和 9,149(13.67%)。
比对到KOG数据库中的共有27,886个Unigene根据功能划分属于25个功能类型(图1)。其中,“一般功能预测”的Unigene数最多,有8,669个Unigene,其次是“信号转导机制”,有5,022个Unigene,最少的是“细胞运动”,仅有43个。
2.3 转录组序列的GO功能注释和表达谱差异
比对到GO数据库的Unigene参与生物过程(Biological process)、细胞组成(Cellular component)和分子功能(Molecular function)3大类别55个小类。生物过程中:“代谢过程”的Unigene数最多(4,628个), “细胞进程”次之(4,445个),最少的是“细胞凋亡”和“移动”(分别仅有1个)。细胞组分中,“细胞”所含的Unigene数最多,有3,823个,其次是“细胞部分”,有3,787个Unigene,“细胞核”是Unigene数最少的类别,仅有11个。分子功能中,“催化活化”的Unigene数最多(4,389个)。其次是“结合”(3,985个),“蛋白标签”仅有1个Unigene,是分子功能中Unigene数最少的类别。
表达谱测序一共测了3个样品,叶柄、珠芽和块茎各获得24.08、24.02和24.06 Mb的数据,过滤后的reads数目占总raw reads的比例分别为99.78%、99.53%和99.70%。差异筛选获得6,961个表达量在叶柄与珠芽、珠芽与块茎之间同时存在差异的Unigene,其中有6,576个比对到了GO数据库:细胞组分2,680个、生物学过程2,556个、分子功能1,340個。而转录组序列GO数据库比对时分别有14,150、18,825和9,724个Unigene比对到生物学过程、细胞组分和分子功能三大类。转录组与表达谱差异基因GO比对结果都表现出“从细胞组分到生物学过程再到分子功能Unigene数量逐渐减少”的趋势。转录组注释中“代谢过程”(4,628个)所含的Unigene数是最多的,其次是“细胞进程”(4,445个),“细胞”(3,823个)和“细胞部分”(3,787个)。表达谱差异基因功能富集结果发现,所含Unigene数最多的是“催化活性”(666个),其次是“代谢过程”(646个),“细胞进程”(611个)和“细胞”(528个)。GO功能注释的单独类别中,转录组注释和表达谱差异基因注释的Unigene数存在不同(图2)。
2.4 转录组序列的KEGG功能注释和表达谱差异
从转录组的27,006个Unigene中发现了137条KEGG代谢通路。其中参与“全局路径”的Unigene最多(6,426个),其次是“翻译”途径(2,580个)、“糖代谢”(2,287个)、“折叠、分类和降解”(1,705个)和“信号转导”(1,423个),Unigene数最少的是“抗药性:抗菌剂”代谢途径(仅8个 Unigene)。表达谱差异筛选获得的6,961个在叶柄、珠芽、块茎之间同时存在差异的Unigene中有4,021个差异基因比对到了KEGG数据库中。其中参与“全局路径”的最多(1,044个),其次是“碳水化合物代谢”(369个)、“翻译”(353个)、“其他次生代谢”(216个)和“信号转导”(206个),最少的是“抗药性:抗菌剂”仅有1个Unigene。比对到KEGG数据库各代谢途径的转录组注释和表达谱筛选Unigene数量和比例存在差异(图3)。
2.5 PEBP家族差异基因筛选
转录组序列中含有13个Unigene属于PEBP基因家族成员,其中有10个Unigene属于FT亚家族,TFL亚家族有1个Unigene,MFT亚家族有2个Unigene。表达谱差异基因筛选结果表明4个PEBP基因家族的Unigene在不同组织样品中具有表达差异:其中属于FT亚家族的有2个,属于的MFT亚家族有2个,而没有属于TFL亚家族的成员(表1)。
3 讨论
滴水珠转录组测序获得了180,862个Contig和66,907个Unigene。其中有27,886(41.68%)个Unigene成功地比对到KOG数据库,GO数据库和KEGG数据库分别有9,149(13.67%)和27,006(40.36%)个Unigene比对上。叶德等[17]在半夏转录组测序时获得90,175个Unigene,KOG、GO和KEGG比对的Unigene数分别为46,237(51.27%)、31,622(35.07%)和22,961(25.46%)。与半夏转录组相比,滴水珠比对到KOG和GO数据库的Unigene数比半夏的多,但比对到KEGG数据库结果则相反,推测可能是因为物种特异性和测序量大小不同造成的。
滴水珠表达谱测序获得6,961个表达量在叶柄、珠芽、块茎之间同时存在差异表达的Unigene,数量低于转录测序差异筛选的半夏(15,484)和山药(7,647)[15,17]。差异Unigene数的不同可能由物种差异及测序量大小、比较的取样组织和差异筛选方法不同导致。滴水珠、半夏和山药的测序量分别是66,907、90,175和70,480个Unigene;三种植物比较的取样组织分别是叶柄vs珠芽vs块茎、叶柄vs珠芽和铁棍珠芽vs铁棍叶腋vs花籽叶腋及下表皮;而表达量定量方法分别是表达谱、转录组和转录组。
PEBP基因家族(包含有FT、TFL和MFT三个亚家族)广泛存在于动物、植物和微生物中[25]。PEBP基因家族参与植物的许多发育过程,如植物開花[11]、控制气孔的开放[26]、花序分生组织的稳定[27]等。虽然滴水珠、半夏的珠芽在结构上类似于块茎[3],淡黄花百合的珠芽在结构上类似于鳞茎[7],但是珠芽和块茎/鳞茎发育的共同分子基础目前尚无报道。滴水珠表达谱差异Unigene中具有4个PEBP家族同源序列(FT: 2; MFT: 2; TFL:0),结果显示珠芽和块茎/鳞茎发育具有共同分子基础,PEBP基因家族在其中的作用值得进一步研究。
参考文献:
[1]Li H., G.H. Zhu, P.C. Boyce, et al. Flora of China[C]. Vol 23, Beijing:Science press, 2010:3-79.
[2]宋立人, 洪恂. 丁绪亮,等.现代中药学大辞典[M]. 北京: 人民卫生出版社, 2001: 2354.
[3]罗睿, 杜禹珊, 孙莹莹, 等. 半夏珠芽发育过程的形态学和解剖学研究[J]. 西北植物学报, 2014, 34(9): 1776-1781.
[4]朱燕燕, 罗睿, 陈海丽, 等. 滴水珠珠芽发育过程研究[J]. 广西植物, 2018(2):225-232.
[5]谢德镕, 曹祥志, 张培源. 薯蓣零余子发育与形态学本质探讨[J]. 西北农业大学学报, 1993, 21(1): 77-80.
[6]余炳生, 张仪. 薯蓣地下块茎发生的解剖学研究[J]. 植物学报, 1994, 11: 52.
[7]李腾, 李少群, 罗睿. 淡黄花百合珠芽发育过程的形态学与解剖学研究[J]. 西北植物学报, 2012(1): 85-89.
[8]Wang, C.N.,M. Mller, Q.C.B. Cronk. Altered expression of GFLO, the Gesneriaceae homologue of Floricaula/Leafy, is associated with the transition to bulbil formation in Titanotrichum oldhamii[J]. Dev. Genes Evol., 2004, 214: 122-127.
[9]Abraham-Juarez, M.J., A. Martinez-Hernandez, M.A. Leyva-Gonzalez, et al. ClassI KNOX genes are associated with organogenesis during bulbil formation in Agave tequilana[J]. J. Exp. Bot., 2010, 61: 4055-4067.
[10]Sandoval, S.C.D., M.J. Abraham Juárez, J. Simpson. Agave tequilana MADS genes show novel expression patterns in meristems, developing bulbils and floral organs[J]. Sex. Plant Reprod, 2012, 25: 11-26.
[11]Li, C., Y.N. Zhang, K. Zhang, et al. Promoting owering, lateral shoot outgrowth, leaf development, and ower abscission in tobacco plants overexpressing cotton FLOWERINGLOCUS T (FT)-like gene Gh FT1[J]. Front. Plant Sci., 2015, 6: 454.
[12]González-Schain, N.D., M. Díaz-Mendoza, M. Zurczak, et al. Potato CONSTANS is involved in photoperiodic tuberizationin a graft-transmissible manner[J]. Plant J., 2012, 70: 678-90.
[13]Lee, R., S. Baldwin, F. Kenel, et al. FLOWERING LOCUS T genes control onion bulb formation and owering[J]. Nat Commun., 2013, 4: 2884.
[14]程立寶, 齐晓花, 髙学双, 等. 莲藕根状茎膨大相关基因的挖掘与表达分析[J]. 园艺学报, 2012, 39(3): 834-846.
[15]彭斌. 山药基源植物分子鉴别体系建立与珠芽相关基因的转录组分析[D]. 南京: 南京农业大学, 2016.
[16]姜福星, 魏丕伟, 吴生, 等. 白花虎眼万年青叶上珠芽的转录组分析[J]. 分子植物育种, 2017(2): 519-531.
[17]叶德, 杨支力, 李东海, 等. 基于高通量测序半夏珠芽转录组研究[J]. 浙江理工大学学报(自然科学版), 2017(2): 282-288.
[18]Grabherr, M.G., B.J. Haas, M. Yassour, et al. Trinity: reconstructing a full-length transcriptome without a genome from RNA-Seq data[J]. Nature Biotechnology, 2011, 29: 644-652.
[19]Pertea G., X.Q. Huang, F. Liang, et al.TIGR Gene Indices clustering tools(TGICL): a software system for fast clustering of large EST dataste[J]. Bioinformatics, 2003, 19(5): 651.
[20]Altschul S.F., W. Gish, E.W. Myers, et al.. Basic local alignment search tool[J]. J Mol Biol,1990, 215(3):403-410.
[21]Conesa, A., S. Gotz, J.M. Garcia-Gomez, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21: 3674-3676.
[22]Quevillon, E., V. Silventoinen, S. Pillai, et al. InterProScan: protein domains identifier[J]. Nucleic Acids Res., 2005, 33: W116-W120.
[23]Mortazavi A, Williams B.A, McCue, K, et al. Mapping and quantifying mammalian transcriptomes by RNA-Seq[J]. Nature methods, 2008, 5(7):621-628.
[24]Benjamini, Y. , D. Yekutieli. The control of the false discovery rate in multiple testing underdependency[J]. The Annals of Statistics, 2001, 29: 1165-1188.
[25]张礼凤, 徐冉, 张彦威, 等. 大豆PEBP基因家族的初步分析[J]. 植物遗传资源学报, 2015, 16(1):151-157.
[26]Kinoshita, T., N. Ono, Y. Hayashi, et al. FLOWERING LOCUS T Regulates Stomatal Opening[J]. Curr Biol., 2011, 21(14): 1232-1238.
[27]Liu, L., S. Farrona, S. Klemme et al. Post-fertilization expression of FLOWERING LOCUS T suppresses reproductive reversion[J]. Front. Plant Sci., 2014, 5:1-7.
(责任编辑:江 龙)