APP下载

黄花蒿bHLH转录因子基因家族鉴定及光调控分析△

2021-05-07甘雨吴端张栋王星文马婷玉向丽王辉

中国现代中药 2021年3期
关键词:亚族基序青蒿素

甘雨,吴端,张栋,王星文,马婷玉,向丽*,王辉

1.中国中医科学院 中药研究所 中药鉴定与安全性评估北京市重点实验室,北京 100700;2.北京城市学院,北京 100083;3.贵州大学 生命科学学院/农业生物工程研究院 山地植物资源保护与种质创新省部共建教育部重点实验室,贵州 贵阳 550025

黄花蒿ArtemisiaannuaL.又名臭蒿,为菊科蒿属1年生草本药用植物,有清热解暑、截疟、凉血之效,富含挥发油、青蒿素、青蒿酸、黄酮类等次生代谢物质,是一线抗疟药物青蒿素的唯一天然来源[1]。目前,以青蒿素为基础的联合疗法(ACTs)是世界卫生组织(WHO)推荐的最有效的治疗疟疾的方法,疗效好、起效快且不良反应较小。研究发现,黄花蒿广布于欧洲和亚洲的温带、寒温带及亚热带地区,世界大部分地区黄花蒿中青蒿素质量分数<0.2%,而我国黄花蒿资源中青蒿素含量由南到北逐渐降低[2]。随着青蒿素及其衍生物新适应证范围的不断扩大,黄花蒿的市场需求显著增加,有效提高青蒿素的含量成为黄花蒿优良品种选育的重点研究方向。

青蒿素是一种具有过氧桥结构的倍半萜内酯类化合物,其生物合成通过植物类异戊二烯代谢途径中的甲羟戊酸途径进行,受羟甲基戊二酸辅酶A还原酶(HMGR)、紫穗槐二烯合酶(ADS)、紫穗槐二烯氧化酶(CYP71AV1)等多种酶调控。研究发现,通过调控青蒿素生物合成特异途径的基因表达可以有效促进青蒿素积累,如调控HMGR、ADS基因的表达,提高前体物质青蒿酸及青蒿素含量[3-5];过表达FPS、CYP71AV1、CPR基因,提高转基因黄花蒿植物中青蒿素含量[6-7]。因此,探究青蒿素合成关键基因及其调控机制对于促进青蒿素合成和积累具有重要意义。

转录因子是真核生物中一类重要的调节因子,通过与顺式元件相互作用,调控特定基因的表达,从而调节药用植物次生代谢物质的合成和积累。AaWRKY1是黄花蒿中第一个成功克隆和验证的转录因子,其通过结合ADS和CYP71AV1基因启动子的W-box,激活青蒿素生物合成途径中关键酶基因的表达,促进青蒿素积累;此外,转录因子AaMYC2通过激活CYP71AV1和DBR2基因的转录,促进青蒿素含量增加[4,8]。bHLH(basic-helix-loop-helix)转录因子是真核生物转录因子中分布最广泛、最保守的转录因子家族之一,其保守结构域由约60个氨基酸组成,包含Basic和HLH 2个不同的功能区域[9-10]。Ji等[11]研究发现,黄花蒿bHLH1(AabHLH1)转录因子能够特异性结合青蒿素生物合成的关键基因ADS和CYP71AV1基因启动子上的E-box顺式作用元件,正向调控青蒿素的合成和积累;黄花蒿叶中瞬时共转化发现AabHLH1基因活性显著表达,但E-box突变会导致该基因激活取消[11]。随着基因组学、转录组学的不断发展,全基因组水平的生物信息学分析成为药用植物bHLH转录因子的研究热点,目前,丹参[12]、人参[13]、西洋参[14]、黑果枸杞[15]等药用植物中均报道了全基因组水平bHLH转录因子的研究,而黄花蒿中尚未见详细报道。因此,全基因组水平AabHLH转录因子的鉴定及相关生物信息学分析,对于进一步探究bHLH转录因子功能及其在青蒿素生物合成中的作用具有重要意义。

光照是调控药用植物生长发育的重要因子,参与植物生命周期的众多生物学过程,不同波长的光(即光质)对药用植物次生代谢产物的合成和积累具有不同的效果。付金颖等[16]发现环境紫外(UV)-B辐射能显著提高杜仲叶片中黄酮、总酚和鞣质等次生代谢物质含量。阎秀峰等[17]发现红光可增强高山红景天根中的红景天苷积累。赵德修等[18]发现蓝光能显著提高水母雪莲中黄酮类物质的合成,而红光强烈抑制黄酮类物质的合成。因而探究不同光质对次生代谢物质生物合成及调控机制,对于提高药材品质及选育优良品种具有重要意义。光照在青蒿素生物合成途径中具有重要作用,Rai等[19]研究发现,与非UV照射相比,UV-B和UV-C处理后,青蒿的生物量及生长发育阶段次生代谢物质(青蒿素和类黄酮)含量增加。Zhang等[20]研究发现,红光和蓝光可以通过促进青蒿素生物合成途径中的基因如ADS、CYP71AV1的表达而增强青蒿素的积累。Lopes等[21]研究发现,蓝光和黄光会影响黄花蒿新陈代谢和形态,而蓝光和红光促进脱氧木酮糖-5-磷酸/2-甲基赤藓醇磷酸(DOXP/MEP)途径而促进青蒿素积累。本研究利用黄花蒿基因组及转录组数据,通过对AabHLH转录因子进行鉴定及相关生物学分析,对不同光质处理下AabHLH基因表达模式进行探究,为进一步研究bHLH基因结构及其在青蒿素合成中的生物学功能提供参考。

1 材料与方法

1.1 AabHLH基因鉴定及理化性质分析

以黄花蒿全基因组数据库(登录号:PRJNA416223)为研究对象,对应的蛋白质数据、编码序列数据及全基因组数据下载于国际核酸序列数据库DDBJ/EMBL/GenBank(https://www.ncbi.nlm.nih.gov/genome)。通过Pfam数据库(http://pfam.xfam.org/)在线搜索获取bHLH转录因子隐马尔可夫模型(HMM)文件(ID:PF00010),利用本地Hmmsearch程序对黄花蒿蛋白数据库进行全基因组比对搜索,初步获取AabHLH候选基因。Pfam数据库(http://Pfam.sanger.ac.uk/search)进一步对候选基因进行鉴定,筛选具有bHLH蛋白保守结构域的AabHLH转录因子成员。并利用在线工具ExPASy(http://www.expasy.org/)对AabHLH蛋白质相对分子质量、理论等电点、总平均亲水性等蛋白质理化性质进行预测[22]。使用在线软件Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)对AabHLH蛋白进行亚细胞定位预测及分析。

1.2 AabHLH基因多序列比对及系统进化分析

利用ClustalX软件对AabHLH蛋白的保守域进行多序列比对,并利用MEGA 7.0 软件构建系统发育树分析,分析参数使用邻接法(neighbor-joining,NJ)的Poisson model 模型构建,并进行1000次Bootstrap抽样;利用iTOL在线软件(https://itol.embl.de/)对系统发育树进行可视化修饰分析[23]。

1.3 基因进化压力分析

非同义替换率/同义替换率(Ka/Ks)通常用于判断是否有选择压力作用于蛋白质编码基因。通过ClustalX软件对AabHLH复制基因对的编码区核酸序列进行两两比对,利用TBtools软件Simple KaKs/Calculato工具计算AabHLH核苷酸的Ks和Ka,基于Ka/Ks值评估每个基因对的进化压力。

1.4 基因结构及保守基序分析

通过解析黄花蒿基因组数据,获取AabHLH基因对应的蛋白序列和编码序列(CDS),利用在线工具GSDS(http://gsds.cbi.pku.edu.cn/)对AabHLH基因结构进行预测及可视化分析;利用在线工具MEME(http://meme-suite.org/tools/meme)预测AabHLH蛋白保守基序并进行相关分析。

1.5 光调控下基因表达分析

黄花蒿转录组数据下载于美国国家生物技术信息中心(NCBI)数据库(登录号:SRP133983),通过解析不同光照调控下黄花蒿转录组数据,获取蓝光、红光、远红光、白光、黑暗处理下AabHLH转录因子FPKM(fragments per kilobase of transcript per million mapped reads)值,利用TBtools在线工具(https://www.biorxiv.org/)对其进行聚类及可视化分析。

2 结果与分析

2.1 AabHLH基因鉴定及理化性质分析

根据HMM检索结果,将初步获得的黄花蒿bHLH蛋白序列提交至Pfam数据库进一步验证,去除不含或较不完整的bHLH典型结构域(PF00010)的序列,结果如表1所示,最终从黄花蒿全基因组中鉴定出99个bHLH转录因子家族成员用于后续分析。与全基因组水平已鉴定的药用植物bHLH基因数量相比,AabHLH基因数量少于人参(169个)、丹参(127个)、黑枸杞(132个),但多于西洋参(62个)[12-15]。蛋白质理化性质分析发现,AabHLH蛋白平均含有368个氨基酸残基,最短的AabHLH蛋白含有153个氨基酸(PWA77406.1),最长的AabHLH蛋白含有1002个氨基酸(PWA85745.1),其相对分子质量分别为17 450、114 070;理论等电点为4.64(PWA88561.1)~10.08(PWA42437.1)。其中,57个蛋白等电点>7.5,显碱性,26个蛋白等电点<6.5,显酸性;亚细胞定位及亲水性分析发现,所有AabHLH蛋白均定位于细胞核且均为亲水性蛋白。

表1 AabHLH家族信息

2.2 AabHLH基因进化分析

为了研究AabHLH系统进化关系,根据蛋白序列保守结构域氨基酸序列的相似性,利用MAGA 7.0软件对筛选出的99条AabHLH蛋白序列构建无根系统进化树,结果见图1。基于每个分支的统计支撑,根据Bootstrap>80,将AabHLH家族成员分为13个亚族,其中Ⅳ亚族包含最多的AabHLH蛋白(19个),其次是Ⅲ(16个)、Ⅻ(15个)、Ⅺ(12个)3个亚族,最少的是ⅩⅢ亚族,只含有1个AabHLH蛋白(PWA55744.1),其余亚族中AabHLH蛋白成员数在2~8个。

图1 AabHLH家族系统发育进化树

2.3 AabHLH基因进化压力分析

遗传学中通常用Ka/Ks表示基因复制后所经历的环境选择压力,通常情况下,Ka/Ks>1表示正选择效应,Ka/Ks=1表示中性选择,而Ka/Ks<1表示阴性或纯化选择。99条AabHLH基因中共含有49对复制基因对(表2)。对AabHLH基因中49对复制基因的环境选择压力进行分析,结果显示,除了PWA60184.1/PWA60186.1和PWA63778.1/PWA63780.1基因对未能有效计算Ka/Ks值,PWA52642.1/PWA52643.1和PWA89112.1/PWA89113.1基因对Ka/Ks值>1外,其余45个复制基因对Ka/Ks均小于1,表明AabHLH基因间在进化时存在纯化选择作用[24]。

表2 AabHLH基因Ka/Ks分析

2.4 AabHLH基因结构及保守基序分析

为了进一步探究AabHLH基因之间的结构与进化关系,绘制AabHLH基因结构图(图2A)。结果显示,99条AabHLH基因外显子数目为1~18个不等,其中有7条AabHLH基因不含内含子结构;除个别AabHLH基因外,同一个亚家族中的基因成员具有相似的外显子-内含子结构,造成不同亚族基因结构差异的原因可能是AabHLH基因家族在进化过程中内含子插入或者缺失导致[25]。

为了探究AabHLH蛋白结构多样性,通过MEME预测了99个AabHLH蛋白保守基序(图2B)。结果显示,AabHLH蛋白含有3个保守motif(motif1、motif2、motif3),且同一亚族基本含有相同基序;其中,motif1和motif2含有AabHLH蛋白保守结构域的特征基序(HX3ERXRRX9LX4PX3KXDX14L),两者的差异主要是motif1第1个位置的氨基酸为K/N/D/V,第2~50氨基酸为AabHLH保守基序,而motif2的1~49氨基酸位置为AabHLH保守基序,第50个氨基酸为K/Q/E。对保守基序进一步分析发现(图3),与其他植物相似,AabHLH蛋白基序包含N端碱性区域和C端2个HLHα-螺旋区,碱性区域具有DNA结合位点Glu或Arg且相对保守。值得注意的是,大多数保守基序位于bHLH结构域的C末端,且除了PWA72494.1基因外,其余AabHLH基因均只含有1个保守的bHLH结构域。

注:A.系统进化树;B.motif分布图;C.基因结构图。

图3 黄花蒿bHLH蛋白保守基序

2.5 AabHLH基因表达分析

光作为调控植物生长发育最重要的环境因子之一,在黄花蒿青蒿素合成中代谢途径调控中具有重要作用。对蓝光、黑暗、红光、远红光、白光处理下AabHLH基因表达数据进行聚类分析,结果见图4。除了PWA51892.1、PWA63778.1、PWA42909.1、PWA52643.1、PWA41055.1、PWA89112.1、PWA89113.1、PWA67205.1基因外,其余91条AabHLH基因均注释到基因表达数据。其中,约12%基因不响应光胁迫;与黑暗处理相比,约23%、42%、46%、37%基因分别在远红光、白光、红光、蓝光处理下基因表达量提高。

注:不同的颜色代表不同表达量,数值越大,表达量越高。

AabHLH基因表达图谱分析发现,与黑暗处理相比,13个亚族中,Ⅺ、Ⅰ、Ⅴ、Ⅱ、Ⅳ亚族基因整体水平上在不同光处理下不表达或表达量较低,而Ⅶ、ⅩⅢ亚族基因在光处理下基因表达降低;Ⅲ、Ⅹ、Ⅸ、Ⅶ亚族基因在光调控下基因表达量均有所提高,尤其在白光调控下其基因表达量明显提高。此外,Ⅻ、Ⅵ亚族基因在红光和蓝光处理下,其基因表达量显著提高,推测其可能与青蒿素合成下游途径中关键酶基因ADS、CYP71AV1表达调控有关,其基因功能的探究对于青蒿素合成及调控机制等研究具有重要意义。

3 讨论

黄花蒿是中药青蒿的基原植物,始载于《五十二病方》,在《神农本草经》《大观本草》《重修政和经史证类备用本草》《本草纲目》等历代本草中均有记载,有2000多年的应用历史。《中国药典》2020年版记载青蒿味苦、辛,性寒,归肝、胆经,具有清虚热、除骨蒸、解暑热、截疟、退黄等功效,用于温邪伤阴、夜热早凉、阴虚发热、骨蒸劳热、暑邪发热、疟疾、寒热、湿热黄疸[26]。作为抗疟一线药物青蒿素的唯一天然植物来源,黄花蒿中青蒿素含量普遍较低。根据本草基因组学研究指导建立含有重要活性成分的青蒿基因组研究体系,通过对青蒿素等重要次生代谢物质的合成途径关键基因的挖掘及其调控机制的研究,能够为青蒿品种改良、基因资源保护及药性研究提供参考[27-28]。

转录因子是影响中药药效的重要调控因子,其通过调控药用植物次生代谢物质合成酶基因的表达,激活中药有效成分的合成和定向积累。bHLH转录因子家族作为植物中第二大类转录因子,其通过在转录水平与相关基因启动子区的顺式作用元件结合,激活或抑制基因的表达,参与调控植物生长发育、植物生物合成及胁迫响应等过程[29-31]。萜类物质作为药用植物重要活性物质,其合成和调控机制的研究对于中药的开发应用及药性研究具有重要意义。目前,许多研究表明,bHLH转录因子能有效调控药用植物萜类物质的合成和积累,如拟南芥中MYC基因通过与DELLA蛋白互作调控倍半萜(E)-β-石竹烯合成,PIF5转录因子以同源聚体的形式促进四萜类化合物类胡萝素的积累[32-33];长春花中BIS1、BIS2转录因子通过调控生物碱早期合成基因转录水平促进单萜吲哚生物碱(MIA)的合成[34];蒺藜状苜蓿中TSAR1和TSAR2通过结合并激活HMGR1和MAKIBISHI1基因表达,促进三萜皂苷生物合成[35];青蒿AabHLH1转录因子通过激活ADS和CYP71AV1基因表达,正向调控青蒿素生物合成和积累[11]。此外,bHLH转录因子还参与植物类黄酮、生物碱等次生代谢物合成调控[36],如葡萄MYC1基因与MYB转录因子作用时激活类黄酮合成途径中GHI、UFGT、ANR基因表达,而单独作用时基因不表达[37-38];Yamada等[39]报道在黄连中bHLH转录因子调控异喹啉类生物碱(IQAs)启动子表达。

为了进一步了解bHLH转录因子在黄花蒿倍半萜物质青蒿素生物合成中的调控作用,本研究基于黄花蒿全基因组水平对AabHLH基因进行鉴定及光调控下基因表达模式分析。结果共鉴定出99条AabHLH基因,共包含49对复制基因对,其中45对基因间在进化时存在纯化选择;对蛋白理化性质分析表明,AabHLH蛋白均定位于细胞核且均为亲水性蛋白,但蛋白质大小、相对分子质量及等电点等在不同AabHLH蛋白间存在差异,推测差异原因可能与基因功能有关。基于系统进化树每个分支的统计支撑(Bootstrap>80),将AabHLH基因分为13个亚族,每个亚族成员在1~19个不等,同一个亚族中的基因成员较其他亚族成员具有相似的外显子-内含子结构及保守基序结构,具有较高的保守性;但不同亚族间基因结构具有较大差异,造成差异的原因可能是基因在进化过程中内含子的插入和缺失。而后通过对黄花蒿bHLH保守结构的预测,发现AabHLH蛋白含有3个保守motifs且多数motifs位于bHLH结构域的C末端,其中motif1、motif2均为黄花蒿bHLH保守基序,约由50氨基酸组成;除PWA72494.1基因外,其余AabHLH基因均有且只有1个保守的bHLH结构域,因此,该基因结构及生物学功能具有进一步研究意义。

研究发现,光显著提高青蒿素合成上游途径中关键酶基因如HMGS、DXS、DHR等表达,正向调控青蒿素积累,且白光比单色光更能促进青蒿素前体物质的积累[21];在青蒿素合成下游途径中,红光、白光、蓝光显著提高ADS、CYP71AV1基因表达,蓝光通过促进ALDH1和DBR2基因表达和抑制ESC和SQS基因表达,促进青蒿素积累[20-21]。本研究发现,与黑暗处理相比,13个亚族中Ⅺ、Ⅰ、Ⅴ、Ⅱ、Ⅳ亚族基因整体水平上在不同光处理下基因不表达或表达量较低,而Ⅶ、ⅩⅢ亚族基因在光处理下基因表达降低,推测这些亚族基因非光调控下黄花蒿青蒿素合成关键调控基因,其基因功能有待在其他研究中进一步发掘。参考Zhang等[20]报道的青蒿素生物合成关键基因表达特征,本研究发现,Ⅲ、Ⅹ、Ⅸ、Ⅶ亚族基因在光调控下基因表达模式与HMGS、DXS、DHR等基因表达相似,推测这4个亚族基因功能可能与HMGS、DXS、DHR等基因调控有关,具体的基因功能有待进一步生物学验证;而红光和蓝光处理下,Ⅻ、Ⅵ亚族基因表达量显著提高,推测其可能与青蒿素合成下游途径中关键基因ADS、CYP71AV1表达调控有关,其基因功能的探究对于青蒿素合成及调控机制的研究具有重要意义。

猜你喜欢

亚族基序青蒿素
二穗短柄草CYP72A亚族成员表达分析及亚细胞定位
甜瓜Trihelix转录因子的鉴定与生物信息学分析
带TRS基序突变的新型冠状病毒威胁更大
苦荞蛋白磷酸酶2C家族的鉴定及表达分析
芥蓝Aux/IAA家族基因生物信息学与表达分析
鼠伤寒沙门菌小RNA GcvB 靶基因筛选和验证分析
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
辣椒HD-Zip基因家族鉴定、系统进化及表达分析
切莫盲信所谓的“青蒿素食品”
一种新型的倍半萜内酯
——青蒿素