APP下载

丝状真菌的转录调控启动子及其功能研究进展

2022-01-27张浩东赵清梅薛佳祺崔省委余永涛

农业科学研究 2021年4期
关键词:丝状甲基化真菌

张浩东,赵清梅,薛佳祺,于 鲲,崔省委,余永涛

(1.宁夏大学 农学院,宁夏 银川 750021;2.北方民族大学 生物科学与工程学院,宁夏 银川 750021;3.国家民委发酵酿造工程生物技术重点实验室,宁夏 银川 750021)

丝状真菌统称为霉菌,多为真菌界子囊菌门子囊菌亚门真菌[1],是以腐生或寄生的形式普遍存在于自然环境中的低等真核生物,广泛分布在空气、土壤、水和动植物中。丝状真菌具有来源广泛、易于工业化生产、种类丰富以及功能多样等特点,因此被广泛应用于科研和生产[2]。在医疗卫生领域,利用产黄青霉(Penicillium chrysogenum)合成青霉素[3],利用土曲霉(Aspergillus terreus)合成降血脂药物洛伐他汀等[4]。在食品加工行业,常利用丝状真菌制作糕点、豆制品等[5]。在农业生产中,条形柄锈菌(Puccinia striiformis)、玉米大斑菌(Setosphaeria turcica)等丝状真菌会引起小麦、玉米等农作物发生病害[6-7]。部分植物的内生真菌会对人体及动物产生严重危害[8-9]。综上所述,丝状真菌与人和动物健康、工农业生产、社会经济发展关系紧密,丝状真菌的合理利用具有重要的社会经济价值。

丝状真菌的转录调控是丝状真菌及其开发利用研究的热点。在丝状真菌的基因转录调控中,作为顺式作用元件的启动子发挥着重要作用。启动子参与基因转录的起始,通过与转录因子结合来调控基因转录活性。深入了解启动子不仅能够拓展启动子的应用,还有助于丝状真菌基因表达调控机制及基因转录相关网络调控研究[1]。岑由飞等[10]对Tri5和Ttri2启动子功能进行研究,为Paramyrothecium roridum中单端孢霉烯毒素生物合成基因转录调控的研究奠定了基础;王小龙等[11]对毕赤酵母AOX1启动子进行研究,初步提出Paox1在葡萄糖、甘油和甲醇的调控模型,为毕赤酵母AOX1启动子的开发利用提供了参考。丝状真菌启动子被广泛应用于基因工程载体构建、转基因以及目的基因表达等方面[12]。本文对丝状真菌启动子分类、预测、筛选方法及功能研究进行综述,以期为丝状真菌启动子以及基因表达调控研究提供参考。

1 丝状真菌转录调控启动子的分类

1.1 Ⅰ类、Ⅱ类和Ⅲ类启动子

1.1.1 I类启动子I类启动子,又称rRNA基因启动子,可结合RNA聚合酶Ⅰ,参与rRNA前体基因的转录调控,其产物会被加工成成熟的5.8S rRNA、18S rRNA、28S rRNA[13]。Ⅰ类启动子的结构主要包括位于转录起始位点-45 bp至20 bp的核心启动子元件和位于转录起始位点-156 bp至-107 bp的上游调控元件,在转录调控中发挥着重要作用,但该类启动子保守性相对较差[14]。I类启动子具有种属差异性和高转录活性,常被应于构建病毒表达载体[15]。

1.1.2 Ⅱ类启动子Ⅱ类启动子结合RNA聚合酶Ⅱ,主要参与sn RNA和编码蛋白质基因的转录起始。该类启动子结构较为复杂,主要由基因近侧启动子和位于转录起始位点-200 bp内的核心启动子组成[16]。核心启动子的结构与功能多种多样,含有不同的序列基序组成的保守元件,如TFⅡB识别元件、TATA box、CAAT box、起始子(Inr)、下游启动子元件(DPE)等(表1)[17-21]。Ⅱ类启动子的核心启动子是调控基因转录的核心元件,在基因表达调控中发挥着重要作用[18]。

表1 核心启动子元件组成及功能

1.1.3 Ⅲ类启动子Ⅲ类启动子结合RNA聚合酶Ⅲ,主要参与tRNA、ssRNA、snRNA和某些小分子RNA的转录调控[22]。Ⅲ类启动子可分为基因内启动子和基因外启动子,基因内启动子又分为Ⅰ型内部启动子和Ⅱ型内部启动子。Ⅰ型内部启动子含有分开的box A(序列为RGYNNRRYGG)和box C(序列为CGGTCGANNCC),Ⅰ型内部启动子仅存在于5S rRNA的基因中[23]。Ⅱ型内部启动子含有分开的box A和box B(序列为GA/TTCRANNC),tRNA启动子为Ⅱ型内部启动子。基因外启动子位于转录起始位点上游,含有3个上游元件,分别为TATA box、近次端序列元件(PSE)、八聚体OTC元件,目前仅在snRNA启动子中发现了基因外启动子[23]。

1.2 强启动子和弱启动子

根据启动子的转录活性将其分为强启动子和弱启动子。有研究表明,里氏木霉能高效生产大量的纤维素酶[24],是因为其启动子与RNA聚合酶有较强的结合能力,能促进纤维素酶的高效表达。曲霉中也存在许多强启动子,如磷酸丙糖异构酶PtpiA启动子、乙醛脱氢酶PadhA启动子以及淀粉糖化酶PglaA启动子等[25],上述启动子常用于提高目的蛋白的表达效率。弱启动子转录起始能力相对较低,与RNA聚合酶结合能力较弱[26]。

1.3 组成型启动子和诱导型启动子

能使基因持续表达的启动子叫做组成型启动子,在基因表达调控中该类启动子可使目的产物稳定表达,不易受外界环境因素影响[27]。在丝状真菌中存在许多组成型启动子,如构巢曲霉中的GpdA基因启动子[28]、绿僵菌中PMagpd启动子、木霉属Pki1启动子等均为组成型启动子[1]。丝状真菌组成型启动子在基因工程中常用于异源基因的表达[29]。

能被诱导表达的启动子叫做诱导型启动子,该类启动子在基因表达调控中会受到外界刺激或诱导因素的影响[27]。当特定刺激或诱导因素存在时,诱导型启动子会使其对应基因的转录水平发生显著变化,这些刺激或诱导因素包括碳源、环境因素、化学信号和其他因素[30]。研究者在丝状真菌中也挖掘出许多诱导型启动子,如曲霉属的GlaA启动子、里氏木霉中Cbh1启动子、纤维二糖水解酶Cel7A启动子、橡胶树白粉病Wy195启动子[31]、构巢曲霉中AlcA启动子[1]等。目前,人们利用AlcA启动子已成功表达了多种异源基因蛋白[29]。

2 启动子的预测

启动子的预测主要是利用启动子数据库对某段序列进行对比和分析,从而判断该序列是否存在启动子并分析启动子的各种结构。启动子因组成结构和功能复杂,需要利用数据库或软件对其进行生物学信息分析。

在研究启动子的结构和功能前,首先要根据启动子序列信息,利用生物学信息数据库或者软件对启动子序列、启动子核心区域、顺式作用元件、转录因子结合位点、CPG island等进行预测,为进一步明确丝状真菌启动子功能提供参考。启动子结构分析和功能预测常用的主要数据库如下。

2.1 EPD数据库

EPD数据库(eukaryotic promoter database)(http://epd.vital-it.ch)由瑞士生物信息研究所建立,其中包含动物、植物、真菌、无脊椎动物等的RNA聚合酶Ⅱ型启动子的序列注释资源,还有经实验验证的转录起始位点。近年,EPD数据库被合并到了EPDnew数据库中,涵盖范围更广,真菌数据库中收集到5 117个酿酒酵母类启动子和4 802个粟酒裂殖酵母类启动子,具有更高的精确度和覆盖率。EPDnew数据库与信号搜索分析(SSA)和ChIP-Seq数据库关联,可以作为DNA基序导向分析、探索和下载与启动子有关的功能基因组学数据的工具[32]。该数据库操作简单,输入相关基因ID即可搜索到启动子的有关信息。

2.2 TRRD数据库

TRRD数据库(transcription regulatory regions database)(http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/)是一个独特的并经过实验验证的转录调控区数据库,收集了真核基因转录调控区的结构和功能组织信息。通过该数据库,可以查询人、动物、真菌等基因的转录因子结合位点、启动子、增强子和沉默子的位置及基因表达调控模式等信息。TRRD数据库主要由TRRDGENES、TRRDLCR、TRRDUNITS、TRRSSITES、TRRDFACTORS、TRRDEXP和TRRDBIB 7个子数据库构成[33]。该数据库操作简单,不需注册,用户可根据自身需求选择其中一个数据库,填写好相关信息后即可进行浏览或搜索。

2.3 TRANSFAC数据库

TRANSFAC数据库(http://www.gene-regulation.com/pub/databases.html)是真核生物转录调控数据库,包括人、酵母菌、植物、鼠等真核生物转录因子及经实验验证的转录因子结合位点,由site、factor、cell、matrix、gene等多个数据表构成。利用该数据库能够预测和分析启动子和转录因子结合位点。该数据库分公开版和专业版,目前专业版包含48 098个真核生物转录因子、68 917个真核生物转录因子结合位点以及453 601个真核生物启动子等,数量比公开版更加充足[34-35],但使用专业版需要支付昂贵的费用。由于公开版长时间未更新,使用公开版数据库分析丝状真菌启动子可能会造成较大误差。

2.4 JASPAR数据库

JASPAR数据库(http://jaspar.genereg.net/)包括整理的转录因子及结合位点,目前已更新到第8版,分为脊椎动物、线虫、昆虫、植物、真菌5类数据库,包含184个真菌类转录因子的位置频率矩阵[36]。该数据库公开、免费使用,可用于真菌转录因子及结合位点的预测。

2.5 Plant CARE数据库

Plant CARE数据库(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)常用的功能是预测植物顺式作用元件。输入目的基因序列,需等待一段时间才能获得预测结果。使用该数据库预测丝状真菌启动子顺式作用元件时可将其结果作为参考,并联合多个数据库共同分析。

2.6 Promoter 2.0 Prediction Server数据库

Promoter 2.0 Prediction Server数据库(http://www.cbs.dtu.dk/services/Promoter/)可用于预测启动子所在的位置以及转录起始位点,预测分值越高,预测结果可信度越大。用户只需提交或者输入fasta格式的DNA序列,即可获得预测结果,操作简单、快捷。

2.7 Laboratory of Molecular Medicine数据库

Laboratory of Molecular Medicine数据库(https://www.urogene.org/cgi-bin/methprimer/methprimer.cgi)由北京中国医学科学院北京协和医院维护,可以用于启动子CPG island的预测及甲基化PCR引物的设计,操作方法简单,输入目的序列即可获得结果。

由于目前专门用于丝状真菌启动子预测的数据库较少,与启动子有关的真核生物数据库收录的信息数量还不够充足,部分数据库存在长时间未更新等问题,在对丝状真菌启动子进行预测或者生物信息学分析时,为减少误差,可以使用多个数据库进行联合分析,再结合实验方法对启动子进一步验证。

3 启动子的筛选技术

启动子是位于基因非编码区5’端上游的特定DNA序列,通常在转录起始位点上游-100 bp至-1 000 bp内。为了确定启动子所在位置及其序列,常应用启动子捕获技术、启动子探针筛选技术、基因芯片技术、高通量测序等来挖掘、筛选启动子[34,37]。

3.1 启动子捕获技术

启动子捕获技术又称为启动子陷阱技术。该技术不仅用于确定基因启动子区域以及克隆启动子,还可用于基因功能以及表达模式的研究。应用启动子捕获技术时,首先需要构建不含启动子但是含有报告基因和标记基因的启动子捕获载体,然后将捕获载体正确插入到不同基因序列的外显子中[38]。若报告基因能够表达,则表明该序列中含有启动子序列,以此来确定启动子。该技术可获得大量单基因突变体库,但被捕获的基因较难分离,插入的DNA序列具有偏向性[39]。邓晟等[40]构建双向启动子捕获载体,成功确定了棉花黄萎病菌中6个基因的启动子。刘小红等[41]应用该技术,成功构建了稻瘟病菌突变体库。

3.2 启动子探针技术

启动子探针技术由Rachael等[42]首次提出,他通过该技术构建了启动子探针型质粒载体,并获得了一些真核生物的启动子片段。该技术利用限制性核酸内切酶将DNA序列随机切割成大小不等的片段,在DNA连接酶的作用下,将DNA片段与不含启动子的表达载体连接,然后将其转化给宿主细胞,并构建报告基因文库。通过检测报告基因的表达活性,筛选出具有转录起始活性的启动子片段。该方法适用于未知序列基因启动子的筛选,不需设计引物,能快速筛选出启动子;但其工作量较大,筛选到的启动子数量多,特异性相对较差。李维等[43]利用该技术成功筛选出黄孢原毛平革菌基因的启动子片段。徐良向等[44]应用该技术快速检测到橡胶树白粉病菌HO-73基因启动子。

3.3 基因芯片技术

基因芯片技术又称为DNA微阵列技术,具有全自动化、高精确与高精密、高灵敏、高度并行性、多样性等特点[45]。基因芯片主要将多种特定的寡聚核苷酸或DNA探针固定在芯片的特定位置,将待测基因用荧光标记后与芯片进行杂交,通过检测杂交信号来分析样本基因序列信息及表达信息。使用聚类分析和主元分析等分析方法处理基因序列信息,根据基因的启动子组成特性,通过多重序列比对,在基因序列的上游区域寻找出启动子[46]。Yuko等[47]根据裂殖酵母的基因组分析结果,制备了几种DNA微阵列,对裂殖酵母未知基因功能进行探索,并且寻找其可能用于异源蛋白表达的启动子。

3.4 高通量测序技术

在检测启动子前,可通过高通量测序技术对丝状真菌进行全基因组重测序,利用Weka等数据挖掘软件结合生物学信息技术对高通量测序数据进行分析,以筛选出启动子[48]。近年来,研究人员利用高通量测序技术开发出RNA测序技术(RNA-seq),此技术可以检测基因在全基因组内的表达情况,具有高通量、高重复性、检测范围广泛等特点[49],但价格昂贵。亓飞等[50]使用RNA-seq技术,在毕赤酵母中发现了2个新型强启动子。

4 启动子功能的研究方法

4.1 启动子的克隆方法

通过生物学信息的预测和对启动子的筛选,能够了解丝状真菌启动子的序列信息和结构特点,但还需进一步研究和验证启动子元件的功能,以便对启动子进行开发与利用,这需要对启动子进行克隆。

4.1.1 PCR方法对于已知序列的启动子,可以根据其序列设计特异性引物,利用PCR方法对启动子进行扩增与克隆。PCR克隆启动子的方法包括巢式PCR、热不对称PCR、反向PCR等,详见表2[34,51]。

表2 PCR克隆启动子的方法及其特点

叶伟等[52]利用巢氏PCR技术获得深海真菌埃德菌gliG、gliI、gliO基因的启动子片段。胡建坤等[53]采用热不对称PCR技术得到稻曲病菌的一段含有启动子的序列。王德培等[54]利用长引物嵌套式反向PCR技术克隆出隆雅致枝霉Δ6-脂肪酸脱氢酶基因上游1.3 kb序列。Fang等[55]利用YADE法,成功克隆出类球孢白僵菌类枯草杆菌蛋白酶基因CDEP-1的启动子。克隆丝状真菌启动子的PCR方法多种多样,研究者可结合实际状况选择合适的方法。

4.1.2 TA克隆通过PCR方法获得启动子片段后,可将其克隆到T载体上。TA克隆操作方法,首先将经纯化的启动子片段与T载体连接,再将其转入至感受态大肠杆菌中,经蓝白斑筛选、PCR及测序即可验证启动子片段是否成功连接在T载体上[56]。利用此方法可以克隆大量的同种启动子。黎晨等[57]使用热不对称PCR方法获得了玉米黑粉菌Cyp51基因启动子片段后,成功将其连接在pMD-18-T载体上,为后续研究分析启动子功能奠定了基础。

4.2 功能研究方法

作为真核生物的丝状真菌,周围存在大量顺式作用元件的启动子,其序列的跨越范围、结构与功能比原核启动子复杂。在对启动子进行克隆后,需要通过实验的方法研究启动子功能,启动子功能的研究包括预测及确认启动子周围的顺式作用元件、确定启动子片段的转录起始活性、启动子核心区域的位置、启动子与转录因子的相互作用等。目前常用的研究方法有定点突变分析、逐段缺失活性分析、转录因子-启动子互作分析、启动子甲基化和多态性分析等。

4.2.1 定点突变分析启动子定点突变是指通过盒式突变、PCR介导等方法使启动子片段发生单碱基替换或碱基的添加、删除等。通过该方法可以分析启动子的调节位点,还能研究启动子功能,确定启动子中的TATA box、CAT box、CAAT box等参与基因转录调控的重要的顺式作用元件[58]。通过构建突变的启动子重组载体,将重组的质粒转染至细胞,分析细胞中报告基因的表达活性,可确定启动子突变前后的转录起始活性。宫亚娟等[59]对瑞氏木霉Cbh1启动子进行点突变分析,成功构建了5个启动子定点突变载体,分析了Cbh1启动子点突变前后对其转录活性的影响。Matsushita等[60]对米曲霉Hsp30启动子进行定点突变,发现了位于Hsp30启动子-342~-272的热休克反应顺式作用元件HSE1和HSE2。

4.2.2 逐段缺失活性分析当预测启动子序列后,可采用启动子逐段缺失的方法来研究不同启动子片段的转录起始活性,以此来判定启动子的核心区域。常用的研究方法有5’端逐段缺失、3’端逐段缺失、中间缺失及点突变等,其中5’端逐段缺失方法应用较为普遍。首先构建启动子5’端逐段缺失的含有荧光素酶基因(Luc)、β-葡萄糖苷酸酶(GUS)、绿色荧光蛋白基因(GFP)等报告基因的表达载体[61]。然后将构建好的表达载体转染至细胞中,通过分析报告基因的表达活性判断目的基因启动子转录起始活性最强的区域。殷金瑶等[62]构建了5个5’端逐段缺失的橡胶树白粉菌(HO-73)启动子片段载体,确定了不同启动子片段的活性强弱。

4.2.3 转录因子-启动子互作分析丝状真菌基因的转录除了受到启动子的影响外,与启动子专一结合的转录因子也参与丝状真菌基因的转录调控,使目的基因以特定的强度在特定的时间参与空间表达[63]。研究启动子与转录因子的相互作用,将有助于了解启动子对丝状真菌基因的转录调控功能。目前,常见的分析转录因子与启动子相互作用的方法有酵母单杂交实验(Y1H)、凝胶阻滞迁移率实验(EMSA)、DNaseⅠ足迹实验、染色质免疫共沉淀法(CHIP)等。

酵母单杂交可研究蛋白质和特定DNA的相互作用,通过构建蛋白与转录激活区融合表达的载体,并使其在酵母中表达,根据报告基因在酵母细胞内表达活性的强弱,分析转录因子与DNA结合的情况[64]。刘兵等[65]利用酵母单杂交实验验证了WRKY40和WRKY75转录因子能与葡萄抗霜病VpPR4b基因启动子结合。怀宝玉等[66]对小麦条锈菌Tastp3启动子进行酵母单杂交,成功筛选出5个候选转录因子。

凝胶阻滞迁移率实验是研究DNA或RNA与蛋白质相互作用的常用技术。其主要原理是蛋白质与探针复合物结合后分子质量变大,在凝胶电泳过程中迁移率较慢。DNaseⅠ足迹实验可用于鉴别RNA聚合酶等蛋白质在DNA上的结合位点,能找到与DNA特异结合的目的蛋白,以此来确定转录因子。其原理是与转录因子结合的DNA不会被DNase破坏,在电泳凝胶的放射性自显影图片上,使其没有放射性标记带。凌敏等[67]通过EMSA技术确定了康氏木霉纤维素酶转录因子ACEI和Xyr。吕新星等[68]通过EMSA和酵母单杂交实验分析出里氏木霉纤维素酶基因转录因子Xyr1。

染色质免疫共沉淀法是在活细胞内固定DNA与蛋白质的复合物,将其随机切割成染色质小片段,利用免疫学方法沉淀,特异性地富集与目的蛋白结合的DNA片段,经纯化、测序即可获得蛋白质结合的DNA序列[64,69]。曹艳丽等[70]通过EMSA、DNaseⅠ足迹实验鉴定了里氏木霉中的转录因子Rce1在Cbh1启动子上的结合位点,通过染色质免疫共沉淀实验发现转录因子Rce1在纤维素诱导表达过程中与转录因子Xyr1相竞争结合纤维素酶基因启动子,进而实现对纤维素酶表达的抑制作用。

4.2.4 启动子的甲基化和多态性分析DNA甲基化最早是由Hotchkiss等[71]发现的。真核生物主要以5-甲基胞嘧啶(5mC)的形式存在[72]。丝状真菌启动子DNA甲基化是一种重要的可遗传的表观遗传修饰[73]。启动子DNA甲基化能改变染色质结构、DNA构像的稳定性以及DNA与蛋白质的互作方式,从而调控基因表达[74]。检测DNA甲基化的方法主要有限制性内切酶法、重亚硫酸盐法、芯片技术等[75]。限制性内切酶法比较敏感,主要利用部分限制性核酸难以将甲基化DNA序列切开的原理。SmaI-XmaI能识别并切开序列CCCGGG(SmaI-XmaI识别序列较少而不常用),HpaⅡ-MspⅠ能识别CCGG序列进行酶切,当序列中的胞嘧啶产生甲基化时,CCGG序列便不能被HpaⅡ切开,通过southern、PCR等方法可以确定甲基化状态[76-77]。HpaⅡ-MspⅠ可作为分析甲基化的工具,此法操作简单、成本低,但有较大缺点。重亚硫酸盐法将非甲基化的胞嘧啶C转化为尿嘧啶U,经PCR反应形成TA配对。重亚硫酸盐不能将已甲基化的胞嘧啶U改变,DNA中的甲基化信息通过DNA序列的差异表现出来。基因芯片方法是将能识别甲基化和非甲基化CpG的探针固定在芯片上,经过重亚硫酸盐转化后的DNA片段经扩增后与探针结合,从而检测甲基化位点[78]。

启动子由于单个核苷酸的变化会出现多态性(SNPs)。启动子序列的变化可能会引起转录因子结合位点发生改变,从而影响基因表达。SNP与生物的性状及某些疾病密切相关,SNP标记在遗传学研究、致病基因定位、易感基因检测、丝状真菌致病机制研究中具有重要作用[79]。

5 结语与展望

在基因的转录调控中,启动子作为顺式作用元件的重要组成部分,控制着基因表达时间、表达部位、表达强度及表达方式[1]。在研究基因功能前,应先对启动子的结构、功能等进行研究。近年来对启动子的研究已经形成了一套较为完整的体系。在获取启动子的序列后,利用各种在线数据库对启动子进行生物信息分析及预测,从而了解启动子的转录起始位点、顺式作用元件、核心启动子区域、转录因子结合位点等信息。然而专门用于丝状真菌启动子研究的数据库及分析工具还很少,研究者们往往需要借鉴一些真核生物数据库,这往往使得预测结果的准确性不够高,需要使用多个数据库进行联合分析,并通过各种实验方法对预测结果加以验证。

启动子的筛选可以使人们准确了解启动子的序列及位置信息,启动子的PCR克隆为研究启动子的功能提供了材料支撑。通过点突变分析、逐段缺失分析、启动子与转录因子互作分析等各种方法对启动子功能进行研究,从而判断该启动子转录活性的强弱,研究启动子转录活性最强的区域,某个顺式作用元件对基因是正向调节还是负向调节、某个转录因子能否与启动子结合。这些研究为丝状真菌启动子的开发利用提供了参考依据,如利用诱导型强启动子、构建双向启动子或改造启动子构建过表达载体来高效表达目的产物[25]。近年在丝状真菌中发现的U6启动子能有效提高基因编辑效率[80]。随着基因组学、计算机科学、分子生物学的不断发展,进行丝状真菌启动子研究的方法会更加简便、快捷,在未来将会有更多丝状真菌启动子被挖掘出来,不断推动丝状真菌启动子的应用与发展。

猜你喜欢

丝状甲基化真菌
甲基苯丙胺改变成瘾小鼠突触可塑性基因的甲基化修饰
LC-MS在真菌毒素检测中的研究进展
DNA甲基化与基因活性的调控
预处理对铝合金喷涂层丝状腐蚀性能的影响
千奇百怪的真菌
致命真菌
丝状物对污水厂运营的影响探讨
肝癌组织hSulf-1基因表达与其甲基化状态的关系
脖颈冒肉芽别拿手去掐
脖颈冒肉芽 别拿手去掐