APP下载

红脚艾蒿的转录组解析

2022-01-24徐世强孙铭阳李静宇张闻婷王继华

广东农业科学 2021年12期
关键词:艾蒿碱基氨基酸

梅 瑜,徐世强,顾 艳,孙铭阳,周 芳,李静宇,张闻婷,王继华

(广东省农业科学院作物研究所/广东省农作物遗传改良重点实验室/广东省道地南药资源保护与利用工程中心,广东 广州 510640)

【研究意义】药用植物遗传资源是优良品种选育的基础。近年来随着市场需求的增长,导致野生资源枯竭、驯化栽培品种品质参差不齐。利用高通量测序技术能够精准评价药用资源,解析其药用活性的合成途径和调控机制,有利于药用资源的保护和利用。【前人研究进展】艾蒿(Artemisia argyi),是菊科蒿属植物,多年生草本或略呈半灌木状,具浓烈香气,全草入药,有温经、祛湿、散寒、止血、安胎、通经活络等功效。艾蒿中的挥发油类[1]、黄酮类、萜类、生物碱类、多糖类[2]等天然化学产物和大量微量元素[3],具有镇咳平喘、杀菌消炎、益气活血、温经活络、抗氧化等功效[4],艾灸具有增强免疫力和抗炎作用。其黄酮的主要成分包括甲基黄酮类、槲皮素和柚皮素等[5]。胡倩等[6]利用AB-8 型大孔树脂分离纯化了艾叶总黄酮提取物(TFEFAA),采用HPLC分析获得TFEFAA 的主要成分为棕矢车菊素和异泽兰黄素,虽然其质量分数分别只有0.6%和0.20%,但能显著增加SOD 酶、GSHPx 酶活力,且降低MDA 含量,能有效清除自由基和提高机体抗氧化能力。艾蒿还可作为天然的杀虫剂、植物染料和饲料添加剂。艾蒿药用功能显著、价格低廉,因此在医药、农业、工业等领域被广泛利用,也受到学者们青睐。艾蒿品种较多,分布较为广泛,药用历史悠久。梅全喜[7]记载艾蒿20 多种,红足蒿(红脚艾)是其中之一。三元宫碑文记载,1600 年前葛洪、鲍菇夫妇在罗浮山用红脚艾为当地百姓治病,因此罗浮山红脚艾在岭南地区较有代表性,又称“红艾”“鲍姑艾”,别名神艾,与北艾、蕲艾同属于菊科蒿属艾草种植物。岭南红脚艾为菊科红足蒿(Artemisia rubripesNakai),生长在阳光充足的田野,茎枝呈紫红色,多有横卧地下根状茎伴匍匐生长,植株最高1 m 左右,香气醇厚,基本为野生。红脚艾常用于艾灸,是临床应用艾叶的来源之一。其蛋白质中含有16 种常见氨基酸,7 种为必需氨基酸,必需氨基酸占总氨基酸的40.97%,功能性氨基酸占总氨基酸的53.6%,且叶小绒少,味略苦(其他品系艾草较苦)[8],因此广东当地人常将红脚艾用作主要的食材原料之一。【本研究切入点】目前,艾蒿的研究多集中于化学成分的分离鉴定、提取工艺优化,以及药理作用研究,而红脚艾相关研究较少,尤其对红脚艾组学研究和次生代谢产物合成途径解析及化合物合成关键基因鉴定等未见报道。【拟解决的关键问题】由于红脚艾基因组信息缺乏,本研究利用高通量测序平台Illumina HiSeq 2500,选择红脚艾不同组织进行混合DNA 池测序,通过Trinity 软件de novo 组装获得红脚艾转录组Unigene 库,并基于公共数据库对Unigene 进行功能注释,为后续的次生代谢产物合成途径研究、相关功能基因挖掘及验证提供基础数据。

1 材料与方法

1.1 试验材料

供试材料红脚艾蒿(A.rubripesNakai)种植于广东省农业科学院作物研究所南药资源圃,由王继华研究员鉴定。选择长势基本一致的健康植株,采摘叶片,用锡箔纸包裹迅速置于液氮中。

1.2 红脚艾RNA 的提取

红脚艾总RNA 采用生工生物Total RNA Extractor kit(B511311-0025)进行提取,用1%琼脂糖电泳检测总RNA 的完整性,用Qubit®2.0荧光计Life Tech(Invitrogen)对总RNA 进行定量。

1.3 转录组测序与功能注释

红脚艾RNA 样品检测合格后进行转录组测序。利用Illumina®NEBNext®UltraTMRNA Library Prep Kit 制备测序文库,之后使用Agilent Bioanalyzer 2100 评估文库质量;构建合格文库后,利用Illumina Hiseq 2500 平台进行测序,获得双端测序数据;过滤原始数据中的接头、低质量(reads≤35 nt)和ploy-N 碱基的序列,获得clean data,计算GC、Q20、Q30 含量及序列重复水平;采用Trinity 软件进行de novo 拼接组装,用RSeQC 软件去除冗余序列获得Unigene,并评估基因表达水平[9-10]。利用BLAST 软件[11],基于NR、GO、COG、KOG、KEGG 等数据库[12-18]对组装的Unigene 进行功能注释。

1.4 SSR 鉴定及分析

使用MISA 微卫星识别工具鉴定简单重复序列(Simple Sequence Repeat,SSR)并进行分析。

2 结果与分析

2.1 红脚艾转录组测序结果

利用Illumina Hiseq 2500 平台对红脚艾RNA样品进行转录组测序后,去掉含有接头和低质量的序列,共得到7.24 Gb clean data,24 126 043 条reads,GC 含量为44.67%,各样品Q30 碱基百分比均不小于92.57%,说明文库构建质量良好,试验数据可靠。经de novo 组装,共得到173 093个转录本,平均长度为891.24 bp,N50 为1 406 bp,序列长度大于500 bp 的有96 861 个,占总序列数目的55.96%;转录本去冗余后得到85 991 个Unigene,平均长度为616.87 bp,N50 为925 bp,其中30 533 个(35.51%)序列长度大于500 bp,有14 408 个(16.75%)序列长度在1 000 bp 以上(表1)。

表1 红脚艾转录组测序结果统计Table 1 Statistics of transcriptome sequencing results of Artemisia rubripes Nakai

2.2 Unigene 功能注释

通过BLAST软件将获得的85 991个Unigene序列与不同功能数据库进行比对,共注释到47 216个(54.91%)Unigene(表2)。其中,NR数据库(40 802个,47.45%)、KOG数据库(26 171个,30.43%)、GO数据库(23 203个,26.98%)和KEGG数据库(16 846个,19.59%),COG数据库注释到的Unigene数量最少(12 810个,14.9%)。

表2 Unigene 的功能注释统计Table 2 Statistics of functional annotation of Unigene

2.2.1 NR 功能注释 NR 数据库注释结果显示,红脚艾与向日葵(Helianthus annuus)的单基因匹配率(13 552 个,15.76%)最高,其次是莴苣(Lactuca sativa,9 187 个,10.68%)、洋蓟(Cynara cardunculusvar.scolymus,6 609 个,7.69%),与菊花(Chrysanthemum×morifolium)、莫氏黑粉菌(Moesziomyces antarcticusT-34)、青稞(Hordeum vulgaresubsp.Vulgare)的单基因匹配均小于400个。可见,红脚艾与菊目菊科物种的相似度高。

2.2.2 GO 功能注释 GO 注释结果(图1)显示,红脚艾有23 203 个Unigene 被归为生物过程(43 283 个,50.33%)、细胞组成(47 818 个,55.79%)和分子功能(27 375 个,31.83%)三大类共51 个功能分类。在分子功能中,催化活性(12 156 个,14.14%)和结合(11 434 个,13.30%)注释到的Unigene 较多;在细胞组分中,细胞(9 631 个,11.20%)和细胞部分(9 607个,11.17%)注释到的Unigene 较多;生物过程中,代谢过程(11 847 个,13.78%)和分子过程(10 948 个,12.73%)注释最丰富。

图1 红脚艾Unigene 的GO 功能分类Fig.1 Classification of GO function of Artemisia rubripes Nakai Unigene

2.2.3 KEGG代谢通路分析 从KEGG数据库注释结果来看,16 846 个Unigene 参与到130 条代谢途径中。其中核糖体途径注释的基因较丰富(824 个,4.89%),其次是碳代谢(604 个,3.59%)、剪切体(503 个,2.99%)、内质网中蛋白质加工(474个,2.81%)和氨基酸生物合成(466 个,2.77%)等。参与类黄酮生物合成的基因有49 个,仅占0.29%。萜类作为自然界中结构多、种类多的天然化合物,其生物合成分为前体合成、骨架构建和后修饰3 部分。本研究获得萜类骨架合成过程Unigene 105 个,参与直接前体GPP(Geranyl-PP)、IPP(Isopentenyl-PP)及DMAPP(Dimethylallyl-PP)的形成,参与单萜生物合成相关的Unigene 有13个,参与二萜生物合成的Unigene 有27 个,参与倍半萜和三萜生物合成相关的Unigene 有14 个,萜类经细胞色素P450 等酶修饰后形成化合物,如二萜类化合物对肿瘤有一定治疗作用,二萜类激素Gas 对植物发育具有调控作用,三萜皂苷具有很高的药用价值等。

2.2.4 KOG 功能分类 KOG 数据库分析结果(图2)显示,红脚艾26 171 个Unigene 被注释到25个KOG 功能分类中。其中,一般功能预测的基因最多,共有5 458 个,占20.86%;其次是信号传导机制相关基因(2 976 个,11.37%),翻译后修饰、蛋白质周转、伴侣基因(2 862 个,10.94%),翻译、核糖体结构与生物发生相关基因(1 690 个,6.46%),转录相关基因(1 527 个,5.83%),细胞内运输、分泌和囊泡转运相关基因(1 374个,5.25%),碳水化合物运输和代谢相关基因(1 319 个,5.04%),与次生代谢物生物合成、运输和分解代谢相关基因(1 164 个,4.45%)等,细胞运动注释到的基因最少,仅18 个,占0.07%;未知功能的基因有1 491 个,需在后期挖掘其功能。

图2 红脚艾Unigene 的KOG 功能分类Fig.2 Classification of KOG function of Artemisia rubripes Nakai Unigene

2.2.5 COG 功能注释 COG 数据库功能注释结果(图3)形式,共有12 810 个Unigene 被注释到25 个COG 功能分类中。其中,翻译、核糖体结构与生物发生的基因最多,有1 525 个,占11.9%;其次是一般功能预测基因(1 515 个,11.83%),翻译后修饰、蛋白质转运、伴侣基因(1 287 个,10.05%),信号传导机制相关基因(1 106 个,8.63%),碳水化合物运输和代谢相关基因(1 098 个,8.57%)等;注释基因最少的是RNA 加工与修饰,仅13 个,占0.1%;另有277 个Unigene 被注释到未知功能基因,762 个Unigene 与次生代谢生物合成、运输和分解代谢相关,占5.95%。

图3 红脚艾Unigene 的COG 功能分类Fig.3 Classification of COG function of Artemisia rubripes Nakai Unigene

2.3 SSR 分布

利用MISA 软件筛选得到10 00 bp 以上的红脚艾Unigene 并进行SSR 分析,结果(图4)鉴定出6 种类型、3 529 个SSR 标记。其中,单碱基重复SSR(p1)最多,共检测到1 684 个位点;其次是三碱基重复SSR(p3)共检测到1 017 个,双碱基重复SSR(p2)有539 个,复合型重复SSR(c)有232 个,四碱基重复SSR(p4)有37个,五碱基重复SSR(p5)和六碱基重复SSR(p6)较少,分别为5 个和11 个。

图4 红脚艾Unigene 的SSR 位点分析Fig.4 SSR sites analysis of Artemisia rubripes Nakai Unigene

3 讨论

红脚艾历史上主要分布于岭南地区,惠州市的博罗县、罗浮山及广州市番禺区等地皆有县志及通史记载,但近代以来对其研究与利用很少。随着本草组学技术的发展,许多药用植物基因组得到解析,也使得很多资源得以利用和保护[19]。由于药用植物基因组学研究晚于大众作物,因此转录组学成了本草基因组学研究的重要手段之一。本研究借助高通量测序技术对红脚艾转录组进行了初步探究,共获得7.24 Gb clean data,GC含量为44.67%,Q30碱基百分比达到92.57%以上;通过Trinity 进行de novo 组装,共得到173 093 个转录本,对组装的转录本去冗余后共获得85 991个Unigene,平均长度为616.87 bp,N50 为925 bp,说明红脚艾的组装质量较好,能够满足后续数据分析的要求。

通过数据库比对,注释到47 216 个Unigene,与向日葵(H.annuus)、莴苣(L.sativa)、洋蓟(C.cardunculusvar.scolymus)等菊科植物匹配基因最多,另有45.09%的Unigene 未被注释,可能由于蒿属植物组学报道较少或组装的序列较短等原因导致[20]。在KEGG 代谢通路分析中,核糖体途径、蛋白质加工、氨基酸生物合成途径注释的基因较丰富,可能与氨基酸种类、总氨基酸含量较高有关,而参与类黄酮生物合成的基因有49 个,仅占0.29%,这可能是红脚艾侧柏酮含量极低的原因。本研究结果可为红脚艾功能基因挖掘、次级代谢物质合成通路解析提供帮助,也可为中药指纹图谱构建和种质资源鉴定保存及分子辅助良种选育提供基础[21]。

SSR 分子标记具有丰度高、共显性和多等位性等优点[22],可利用现有的数据库资源开发SSR 引物。本研究鉴定到红脚艾SSR 位点3 529 个,可为其分子标记开发、遗传多样性分析、种质资源鉴定与优选、分子标记育种等奠定理论基础,为利用分子手段鉴定、区分红脚艾品种及评价其质量提供依据。

4 结论

本研究通过高通量测序技术获得了红脚艾的转录组信息特征,经de novo 组装共获得85 991个Unigene,有47 216 个Unigene 在NR、KEGG、COG、KOG、GO 和Pfam 数据库获得功能注释。KEGG 代谢通路中,有16 846 个Unigene 参与氨基酸、萜类、黄酮类等130 条代谢途径,其中有466 个Unigene 参与氨基酸合成、49 个Unigene 参与黄酮类合成。同时在红脚艾中还鉴定到3 529 个SSR 标记,通过获得的红脚艾遗传标记位点分布和Unigene,可进行SSR 引物设计,为红脚艾种质资源遗传改良、分子辅助育种奠定基础。

猜你喜欢

艾蒿碱基氨基酸
艾蒿坪听雪
梅全喜:艾蒿食疗百味
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
月桂酰丙氨基酸钠的抑菌性能研究
生命“字母表”迎来4名新成员
UFLC-QTRAP-MS/MS法同时测定绞股蓝中11种氨基酸
采一把艾蒿回家
一株Nsp2蛋白自然缺失123个氨基酸的PRRSV分离和鉴定