猪HIF-1α基因启动子区及编码区的生物信息学分析
2022-04-25刘京鸽吴结革徐世永张金璧
刘京鸽,吴结革,徐世永,陈 清,张金璧
(金陵科技学院动物科学与食品工程学院,江苏 南京 210038)
缺氧诱导因子1α(hypoxia inducible factor 1α,HIF-1α)是缺氧诱导因子1的活性亚基及调节亚基,在缺氧或低氧的条件下被诱导表达,它参与动物机体多种生理(如糖代谢、脂代谢、血管生成、细胞增殖、细胞存活等)及病理(如肿瘤细胞增殖、肿瘤细胞转移等)的调控过程[1]。HIF-1α基因的稳定性和活性受到翻译后的修饰(如羟基化、泛素化、乙酰化和磷酸化等)调节[2-3]。在常氧条件下,氧依赖降解域(oxygen-depending degradation domain,ODDD)中的脯氨酸残基的羟基化和赖氨酸残基的乙酰化触发HIF-1α基因与VHL(von hippel-lindau)蛋白相结合,并通过泛素化-蛋白酶体途径进行降解。在缺氧条件下,HIF-1α蛋白质亚基变得稳定,被移至细胞核中,与稳定表达的HIF-1β 蛋白质相结合,从而发挥调节作用[4-6]。
卵泡的发育与血管密切相关,每个卵泡可以独立调节血管的生长。在排卵前,始基卵泡和原始卵泡主要依靠间质血管供血,此时,微血管还未产生,待原始卵泡开始发育后,微血管逐渐出现在卵泡膜层,并随着卵泡直径的增长和原始卵泡的进一步发育,卵泡周围的微血管的密度和血管分支也逐渐增多[7-8],最终形成巨大的微血管网,分布在卵泡膜层,并没有突破基膜进入到颗粒细胞层中,这给卵泡发育提供足够的养分[9-11],对卵泡发育起着至关重要的作用。血管内皮细胞的减少能够致使卵泡颗粒细胞凋亡,进而导致卵泡闭锁。卵泡闭锁在卵泡发育的早期启动,并且贯穿于整个卵泡的发育过程[6,12-13]。
研究发现HIF-1α基因可通过VEGF路径来调控卵泡膜表面血管的生成,进而调控大卵泡的发育,表明HIF-1α基因与卵泡的发育和成熟密切相关。本研究对NCBI中公布的猪缺氧诱导因子HIF-1α基因5′端上游2 000 bp长的候选启动子区和CDS区进行了核心启动子及转录结合位点的预测;同时对HIF-1α基因所编码蛋白质的理化性质、亚细胞定位、跨膜结构域、信号肽、高级结构及进化关系进行了分析。此为进一步深入研究HIF-1α基因对卵泡发育的影响及HIF-1α基因参与卵泡发育的分子调控奠定了基础。
1 实验材料与方法
1.1 实验材料
猪HIF-1α基因5′端及编码区序列来自NCBI数据库,登录号为NC_010443.5。
1.2 实验方法
利用在线分析工具(表1)及MEGA软件对猪HIF-1α基因的启动子区、蛋白质的理化性质、跨膜结构域、亚细胞定位、信号肽及高级结构进行分析。在NCBI数据库下载人、小鼠、家兔等11个物种的HIF-1α基因编码域序列(coding domain sequence,CDS)(表2),进行同源性分析和系统进化树的构建。
表1 生物信息学分析软件
续表1
表2 不同物种HIF-1α基因NCBI登录号
2 结果与分析
2.1 猪HIF-1α基因的启动子区生物信息学分析
启动子预测结果显示:猪HIF-1α基因的核心启动子区位于-1 793~-1 804 bp(表3),并存在多个调控元件(表4),可见真核生物启动子区的典型结构为顺式原件TATA盒(TATA box)和CAAT盒(CAAT box)。转录因子结合位点的预测结果显示:猪HIF-1α基因中存在4个转录因子,其中-572~-563 bp处的C/EBPA和-191~-182 bp处的Sp1可能性最大(表5)。CpG岛预测结果显示:猪HIF-1α基因启动子中共存在4个CpG岛(图1、表6)。
表3 猪HIF-1α基因启动子区的预测结果
表4 猪HIF-1α基因调控元件的预测结果
表5 猪HIF-1α基因转录因子结合位点的预测结果
图1 猪HIF-1α基因CpG岛的预测结果
表6 猪HIF-1α基因CpG岛的预测结果
2.2 猪HIF-1α基因编码区序列及蛋白质理化性质分析
利用NCBI中的ORF Finder对猪HIF-1α基因的开放阅读框进行定位,起始密码子位于第148个核苷酸,终止密码子位于第2 622个核苷酸。
由表7可知:猪HIF-1α蛋白的氨基酸共有824个;其中亮氨酸(Leu)含量最高,达到9.7%;色氨酸(Trp)含量最低,仅为0.4%。
猪HIF-1α蛋白的分子式为C4 014H6 379N1 097O1 302S44,相对分子质量为92 249.01,理论等电点为5.11,消光系数为48 790,不稳定系数为54.86,说明猪HIF-1α蛋白质不稳定,容易发生降解或变性。猪HIF-1α蛋白的脂溶性系数为74.31,平均亲水性为-0.551,推测其为亲水性蛋白。猪HIF-1α蛋白的N末端为甲硫氨酸(Met),在哺乳动物生物体外的网织红细胞中的半衰期为30 h。通过Protscale在线工具,利用Hphob./Kyte & Doolittle算法分析猪HIF-1α蛋白的亲水性和疏水性,结果发现大部分位点所对应的值都小于0,再次证明该蛋白为亲水性蛋白(图2)。
表7 猪HIF-1α基因编码的蛋白质氨基酸组成
注:负值表示亲水性,正值表示疏水性,绝对值越大表示性能越强 图2 猪HIF-1α基因编码的蛋白质亲/疏水性分析
2.3 猪HIF-1α基因编码区的结构与功能预测
信号肽主要是负责把蛋白质引入到不同亚细胞器内,利用SignalP 4.1工具对猪HIF-1α蛋白进行分析,结果显示原始剪切位点的得分(C)、信号肽的得分(S)、被结合剪切位点的得分(Y)均未达到信号肽的要求,说明此猪HIF-1α蛋白质不存在信号肽,为非分泌型蛋白。
二硫键预测结果显示,猪HIF-1α蛋白存在16个半胱氨酸(Cys),可以形成6对二硫键。利用在线网站TMHMM 2.0对猪HIF-1α蛋白进行分析发现,其蛋白结构上不存在跨膜结构域,由此推断猪HIF-1α基因编码的蛋白质为非跨膜蛋白。
使用在线网站PSORT Ⅱ对猪HIF-1α基因编码蛋白进行细胞内定位发现,该蛋白分别位于细胞核、细胞质、细胞骨架、线粒体及分泌小泡上,占比分别为:73.9%、8.7%、8.7%、4.3%和4.3%。可见猪HIF-1α蛋白主要位于细胞核内。
利用DNAMAN软件对猪HIF-1α蛋白进行高级结构的预测,结构表明其二级结构主要由无规卷曲、α-螺旋、链延伸和β-转角组成(图3),占比分别为48.91%、32.16%、15.05%、3.88%。可见无规卷曲和α-螺旋是猪HIF-1α蛋白的主要二级结构。
注:h:α-螺旋;e:链延伸;c:无规卷曲;t:β-转角 图3 猪HIF-1α基因编码的蛋白质二级结构预测结果
2.4 猪HIF-1α基因序列同源性比较和遗传进化树的构建
利用Megalign和MEGA 7.0软件对猪、牛、羊、鸡、鼠等11个物种的HIF-1α基因进行同源性分析及遗传进化树构建。从同源性分析结果(表8)来看,与猪HIF-1α基因同源性最近的是绵羊,其基因序列相似度达到95.4%,同源性最远的是原鸡,相似度仅为78.5%,说明HIF-1α基因编码区在不同物种中具有较高的保守性。
系统进化树同源性分析具有相似的结果,与猪HIF-1α基因同源性最亲近的是绵羊,同源关系最远的是原鸡(图4),进一步说明HIF-1α基因在不同物种之间既存在保守性,又存在一定程度的差异。
表8 11个物种中HIF-1α基因的同源性分析
图4 11个物种HIF-1α基因的系统进化树
3 结论与讨论
雌性动物在性成熟后,卵巢在神经和体液的调节下会出现周期性的卵泡成熟和排卵。伴随着每次的卵泡成熟和排卵,卵巢会发生一系列形态和机能的变化,同时动物出现周期性的性行为,称为发情周期[16-17]。通常将其划分为卵泡期和黄体期,排卵过程是卵泡期和黄体期的分界线。黄体是排卵后由卵泡迅速转变成富有血管的腺体样结构[18]。排卵后残留的卵泡壁塌陷,卵泡膜的结缔组织、毛细血管等伸入到颗粒层,此时,卵泡在促黄体生成素(LH)的作用下演变成体积较大,富含毛细血管,并具有内分泌功能的细胞团,细胞团新鲜时显黄色,称黄体。黄体的细胞多为颗粒细胞,体积大,着色浅,分泌孕酮;泡膜黄体细胞小,细胞数量少,大部分位于黄体外周,分泌雌激素[19]。
卵泡发育效率制约着家畜的繁殖能力,而卵泡发育与血管生成是密不可分的,血管用来供给卵泡发育足够的养分[20],血管内皮生长因子(VEGF)是参与血管生成与微循环的重要因子[8]。HIF-1α蛋白是缺氧诱导因子1的活性亚基及调节亚基,在缺氧或低氧的条件下被诱导表达,VEGF是其重要的下游靶向因子。Zimmermann等[21]研究表明HIF-1α基因可以通过调控VEGF的表达从而调控卵泡的发育。在此调控过程中,卵泡刺激素(FSH)通过结合受体来增加环磷酸腺苷(cAMP)的量,从而激活蛋白激酶A和cAMP响应元件[22]。HIF-1α基因通过抑制酪氨酸激酶(TK)来激活细胞外调节蛋白激酶(ERK1/2)[23],同时它也刺激了磷脂酰肌醇-3-激酶(PI3K)和蛋白激酶B(AKT)的通路[24-25]。FSH通过PI3K信号通路调节多个靶向因子(如mTOR、MDM2等),从而刺激HIF-1α基因的信号通路,使其增加转录活性来调控VEGF。综上所述,HIF-1α基因在卵泡发育过程中发挥着重要作用,因此对其表达调控进行研究为探索猪HIF-1α基因的结构和功能提供了一定的理论依据。
本研究通过生物信息学分析发现,猪HIF-1α基因具有潜在核心启动子区,其上存在多个顺式作用元件,具备启动子区的典型结构,如控制转录起始的TATA盒及调控转录频率的CAAT盒。该基因同时存在转录因子C/EBPA和Sp1结合位点,它们在转录起始中具有重要作用。CpG岛预测发现,启动子序列内存在4个CpG岛,此处序列容易发生甲基化修饰,从而调控基因的表达。猪HIF-1α基因的CDS区全长为2 475 bp,所编码的蛋白质含有20种共824个氨基酸,等电点为5.11,为亲水性蛋白质,为非分泌型的、含硫非跨膜蛋白,主要定位于细胞核、细胞质、细胞骨架、线粒体及分泌小泡等细胞器中。预测HIF-1α蛋白的高级结构发现,其二级结构中存在大量α-螺旋、无规卷曲等多样化结构。通过对不同物种基因序列进行同源性分析及遗传进化树构建发现,猪HIF-1α基因与绵羊同源性比较近,与原鸡同源性较远,可见HIF-1α基因保守性较高。