乳中不同体细胞数的新疆褐牛STAT5B基因表达及生物信息学分析
2022-02-20田月珍付雪峰李媛媛苟穆荣布佐拉姑丽库尔班黄锡霞
刘 攀,姜 徽,巨 星,王 丹,田月珍,付雪峰,李媛媛,苟穆荣,王 震,樊 琛,布佐拉姑丽•库尔班,黄锡霞*
(1.新疆农业大学动物科学学院,新疆乌鲁木齐 830052;2.新疆畜牧科学院,新疆乌鲁木齐 830000)
新疆褐牛是我国经长期选育而成的耐粗饲、耐寒、放牧性能优良的乳肉兼用品种牛,是新疆地区特有的品种资源。同时具有乳成分中乳脂率高、乳蛋白率高、乳房炎抗性性状中体细胞数低等优良特性,深受新疆本地农牧民青睐,在北疆广大牧区中得到广泛推广。乳房炎是危害奶牛业最严重的疾病之一,发病率极高,对奶牛业造成的经济损失也最大,一直困扰着奶牛业发展。据统计,国外奶牛乳房炎的发病率一般为25%~60%,国内发病率达20%~70%,个别牛群发病率更高。因此牛乳房炎的防治问题亟待解决。在乳品安全备受关注的今天,通过遗传育种技术选育乳房炎抗性强的个体来降低乳房炎的发生以减少抗生素等药物的应用尤为重要。信号转导与转录激活子5(Signal Transducer and Activator of Transcription,STAT5)包括5A和5B 2种亚型,和基因主要是由其基因调控元件决定转录调控功能的差异,基因最初是在绵羊的乳腺中作为催乳素诱导剂被分离得到,后来在小鼠、大鼠和人的乳腺、脂肪、肝脏、卵巢等组织器官中都可以检测到基因,并且参与催乳素和生长激素的信号转导,在组织细胞和生物体的生长、发育、繁殖等过程中起着非常重要的作用,对家畜生长、生产影响很大。
李胜等人在研究中首次分离到全长的(2 502 bp)和(2 515 bp)基因编码序列,在水牛乳腺中发现和基因表达量最高,在水牛脑中发现基因表达量最高,其试验结果表明和基因主要表达于水牛乳腺上皮细胞;敲除基因导致乳腺上皮细胞(BuMECs)的功能受到抑制,乳蛋白基因的表达也显著降低,而基因的过量表达则导致乳蛋白基因的表达显著升高。He等利用PCR-SSCP技术发现基因多态性与荷斯坦奶牛体细胞评分和产奶性能有显著关联。
本实验在前期课题组研究的基础上运用RTqPCR技术对基因在患乳房炎和健康的新疆褐牛血液中的mRNA表达量进行研究,并且采用生物信息学分析法对基因进行分析;通过NCBI获得牛和不同物种的基因序列,构建系统进化树,利用多种在线分析软件对基因编码的蛋白进行结构分析和功能预测,并对STAT5B蛋白的亚细胞定位、信号肽的预测和跨膜结构区进行分析,旨在为后续研究新疆褐牛基因的功能奠定理论基础。
1 材料和方法
1.1 实验材料
1.1.1 实验动物 实验动物来自乌鲁木齐新疆褐牛繁育中心统一饲养条件下的2~3胎次新疆褐牛(6头),进行尾根静脉采血用于RNA提取。根据国际奶业联合会(IDF)制定的牛奶中体细胞数推荐分级标准,将6头新疆褐牛按照不同体细胞数分成2组:I组健康组(n=3,SCC<50万个/mL),II组乳房炎组(n=3,SCC>100万个/mL)。
1.1.2 主要试剂和仪器 主要试剂包括血液RNA保存管(BioTeke公司)、血液总RNA提取试剂盒(BioTeke公司)、5×All-In-One RT MasterMix反转录试剂盒(ABM公司)、EvaGreen Express2×qPCR MasterMix-Low Rox荧光定量试剂盒(ABM公司)、无水乙醇、氯仿、异丙醇、琼脂糖。主要仪器包括超微量分光光度计(P100+,Pultton公司)和实时荧光定量PCR仪(LightCycler 9600,罗氏公司)。
1.2 方法
1.2.1 引物设计与合成 根据NCBI收录的牛与基因序列,使用Primer Premier 5.0软件设计定量引物,并由生工生物工程(上海)股份有限公司合成。引物序列信息见表1。
表1 引物信息
1.2.2 血液总RNA的提取及反转录 按照BioTeke血液总RNA提取试剂盒步骤进行RNA提取。先对RNA进行浓度检测,纯度在1.8~1.9之间,之后进行反转录。反转录步骤根据ABM说明书进行,实验步骤均在冰上操作,去除基因组DNA反应体系10.0 μL:RNA 6.0 μL,4×AccuRT Reaction Mix 4.0 μL,将反应液放置于PCR扩增仪中,温度42℃,时间2 min。
反转录的反应体系20.0 μL:步骤一反应液8.0 μL,5×AccuRT Reaction Stopper 2.0 μL,5×All-In-One RT Master Mix 4.0 μL,RNase Free ddHO 6.0 μL,将上述 反应混合液放置于PCR扩增仪中,反应程序:25℃ 10 min,42℃ 50 min,85℃ 5 min,待反应结束后,置于冰上降温,将获取的cDNA迅速保存于-20℃冰箱中,用于后续荧光定量实验。
1.2.3 PCR反应 以健康新疆褐牛和患乳房炎新疆褐牛血液反转录得到的cDNA为模板,按照实时荧光定量PCR试剂盒(ABM)进行扩增反应。实时荧光定量PCR的扩增体系20.0 μL:cDNA 1.0 μL,TB Green Premix Ex Taq II(2×)10.0 μL,上、下游引物(浓度均为10 μmol/L)各1.0 μL,RNase Free ddHO 7.0 μL。扩增程序:95℃ 3 min;95℃ 5 s,60℃ 3 min,95℃ 1 min,40个循环;4℃保存。扩增结束后分析熔解曲线。
1.3 统计与分析 本实验采用2方法计算基因在不同乳房健康程度新疆褐牛中的相对表达量,以基因为参照基因,而后利用SPSS19.0软件中的独立样本T检验法分析,比较2组不同乳房健康程度新疆褐牛目的基因表达量差异分析。
1.4 生物信息学分析
1.4.1 不同物种基因序列的获取 利用NCBI(https://www.ncbi.nlm.nih.gov)数据库获得牛()、山羊()、野猪()、单峰骆驼()、非洲野驴()、普氏野马()、弯角大羚羊()、水牛)、家猫()的基因序列,登录号分别为(NM_174617.4、XM_018065117.1、XM_021066239.1、XM_031468752.1、XM_014833666.1、XM_023652509.1、XM_040245263.1、XM_025280122.1、XM_023244609.1)。
1.4.2 生物信息学分析软件 利用线上软件Expasy的ProtParam tool模块(https://web.expasy.org/protparam/)对蛋白质理化性质和一级结构进行分析。利用ProtScale(https://web.expasy.org/protscale/)对蛋白质的亲水性与疏水性进行预测。基因编码蛋白的二级结构使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/secpred_sopma.pl)在线软件对其进行预测;运用SWISS-MODEL(https://swissmodel.expasy.org/interactive)在线软件对蛋白质三级结构进行预测。运用MEGA 7.0软件构建牛、山羊、野猪、单峰骆驼、非洲野驴、普氏野马、弯角大羚羊、水牛、家猫共9个物种的基因同源序列的系统进化树。采用TMHMM Server v.2.0(http://www.cbs.dtu.dk/services/TMHMM/)分析工具进行蛋白质跨膜域分析,用SignalP-5.0 Server(http://www.cbs.dtu.dk/services/SignalP/)分析工具进行蛋白信号肽的预测,用WoLF PSORT(https://psort.hgc.jp/)分析工具进行蛋白亚细胞定位。
1.4.3基因编码蛋白质理化性质和一级结构预测蛋白质的一级结构指的是蛋白质分子中氨基酸残基的排列序列,蛋白质的氨基酸序列测定对理解其结构与功能以及生物进化遗传变异的关系具有重要意义。利用线上软件Expasy的ProtParam tool模块对蛋白质进行物理性质及一级结构的分析,运用该软件ProtScale模块预测STAT5B编码蛋白的亲水性与疏水性。
1.4.4基因蛋白质二、三级结构预测 蛋白质二级结构是指周期性地出现在蛋白质肽链上的连续氨基酸片段,主要指-螺旋和-转角。基因编码蛋白的二级结构使用SOPMA在线软件对其进行预测;运用SWISS-MODEL在线软件对蛋白质三级结构进行预测。
1.4.5基因系统进化树的构建 系统进化树是描述生物有机体形成或进化顺序的拓扑结构,以及被认为具有共同祖先的各物种相互进化关系的树形。因此构建系统发育树对各物种亲缘关系的对比具有更直观的体现。通过在NCBI网站上下载牛基因的核酸序列,并使用此网站上的BLAST进行牛与其同源动物基因序列相似性比对分析,最终选择下载牛、山羊、野猪、单峰骆驼、非洲野驴、普氏野马、弯角大羚羊、水牛、家猫共9个物种该基因同源序列,再将序列导入MEGA 7.0软件以构建基因的系统进化树,从而获得各物种之间的亲缘关系。
1.4.6基因编码蛋白的亚细胞定位、信号肽的预测和跨膜结构区分析 蛋白质功能与亚细胞定位具有密切联系,蛋白质只有在特定的亚细胞中才可以发挥正常功能,蛋白质亚细胞定位信息可以为蛋白质功能预测提供有用的线索。信号肽在外源蛋白质的表达中具有重要作用,信号肽的提出为下一步研究蛋白质的结构和功能奠定了一定的基础。通过分析工具TMHMM Server v.2.0、SignalP-5.0 Server、WoLF PSORT对STAT5B蛋白进行分析,可以检测出STAT5B蛋白是否含有跨膜区;进行信号肽的预测,该蛋白是否存在信号肽,是否能引导蛋白质的跨膜运输;进行亚细胞定位,预测STAT5B蛋白表达产物在细胞内的具体存在部位。
2 结果
2.1 熔解曲线及扩增曲线的分析 采用实时荧光定量PCR对基因在不同乳房健康程度的新疆褐牛血液中的表达量进行分析,结果显示,目的基因和内参基因的扩增曲线都呈现出S型荧光定量动力学曲线,扩增曲线集中且流畅,重复性高,Ct值间隔均匀,扩增指数基本一致。
基因与内参基因的熔解曲线清晰流畅且曲线集中,各基因的熔解峰有且只有一个,表明未出现引物二聚体,熔解温度相对较高且基本一致,结果真实可靠。扩增曲线图、熔解曲线与熔解峰图见图1A、图1B、图1C和图2A、图2B、图2C。
图1 A STAT5B扩增曲线
图1 B STAT5B熔解曲线
图1 C STAT5B溶解峰
图2 A GAPDH扩增曲线
图2 B GAPDH熔解曲线
图2 C GAPDH溶解峰
2.2 新疆褐牛乳房炎抗性相关基因的相对表达量结果分析 根据牛奶中体细胞数推荐分级标准,将6头新疆褐牛按照不同体细胞数分成健康组和患乳房炎组(各3头)。通过SPSS19.0分析后,表明基因在检测的2组新疆褐牛的血液中均有表达,基因对奶牛乳房炎影响不显著。但基因在健康新疆褐牛血液中的表达量高于患乳房炎的新疆褐牛(图3),表明基因可能对新疆褐牛乳房炎抗性有一定的作用。
图3 STAT5B基因在健康和患乳房炎牛中的相对表达量分析图
2.3基因编码蛋白的理化性质和氨基酸组成通过ExPASy网站分别分析基因编码蛋白的理化性质及一级结构结果(表2)、氨基酸组成结果(图4)。基因编码蛋白的分子式CHNOS,总共12 602个原子,分子量为89 943.02,由787个氨基酸共同编码,其中95个为带负电荷氨基酸(Asp+Glu),79个为带正电荷氨基酸(Arg+Lys),不稳定参数高达51.52,结果表明该蛋白为较不稳定蛋白。脂肪系数为86,总平均亲水性为-0.472,氨基酸组成分析表明:含量最高的是亮氨酸(10.5%),其次是谷氨酰胺(9.7%),含量最低的是半胱氨酸(1.1%)。
表2 STAT5B基因编码蛋白的理化性质
图4 STAT5B基因编码蛋白的氨基酸组分
2.4基因编码蛋白二、三级结构分析 利用在线软件对基因编码蛋白进行蛋白二级结构预测,结果见图5。该蛋白质中-螺旋高达50.95%,无规则卷曲占比34.69%,延伸链占比11.69%,-折叠的含量仅占2.67%。结果显示-螺旋及无规则卷曲是整体蛋白质结构中的主要组成结构元件,最后利用SWISS-MOLD在线工具对基因编码蛋白三级结构进行建模预测(图6)。
图5 STAT5B基因编码蛋白二级结构
图6 STAT5B基因编码蛋白三级结构
2.5基因编码蛋白疏水性/亲水性分析 由图7可知,小于0的数值(位于第二象限)稍多于大于0的数值(位于第一象限),且该蛋白的最高值2.944,在第466个氨基酸处,此处疏水性最强;最低值-3.100,在第388个氨基酸处,此处亲水性最强。综上可得,STAT5B蛋白是一种亲水性蛋白。
图7 STAT5B基因编码蛋白的亲水性/疏水性预测
2.6基因编码蛋白的同源性分析 通过使用在线软件BLAST进行牛基因的核酸序列比对,搜索与其同源性较高的物种,进行同源性分析和比较。下载该基因同源物的核酸序列后再用MEGA7.0软件构建基因的系统进化树,结果显示:牛基因与水牛()亲缘关系最近,同源性为98.80%,其次与弯角大羚羊()亲缘关系较近,同源性为97.80%。在哺乳动物中家猫()跟牛基因亲缘关系较远,同源性为92.72%(图8)。
图8 9个物种的STAT5B基因编码产物的系统进化树
2.7 STAT5B蛋白的亚细胞定位、信号肽的预测和跨膜结构区分析
2.7.1 STAT5B蛋白亚细胞定位 通过对STAT5B蛋白进行亚细胞定位,得到结果显示:蛋白主要位于细胞质,可能性为52.2%,其次小部分存于细胞核和线粒体,其可能性分别为26.1%和13.0%,位于细胞骨架和细胞膜的STAT5B蛋白含量可能性相等,均为4.3%。因此,推测该蛋白主要在细胞质中发挥其性能。
2.7.2 STAT5B蛋白信号肽的预测 对STAT5B蛋白进行信号肽预测,结果显示:基因编码蛋白质的氨基酸残基信号肽最大分值为0.001,表明该蛋白不是分泌蛋白,从而不能进行跨膜转移或定位。
2.7.3 STAT5B蛋白的跨膜结构区分析 对STAT5B蛋白进行跨膜结构区分析,结果表明:基因编码蛋白没有明显的跨膜结构(图9),表明STAT5B蛋白不存在信号肽序列,可以高效表达。
图9 STAT5B基因编码蛋白的跨膜结构域分析
3 讨 论
3.1 不同乳房健康程度新疆褐牛基因的表达量分析 目前,基因与新疆褐牛乳房炎和泌乳性状关系的研究较少,通过查阅资料发现,基因参与调节GH引起的脂肪分解,活化的二聚体能够在细胞核内调节一系列与脂代谢相关的基因表达,而在和敲除的小鼠体内,GH引起的脂解作用消失。Urioste等研究发现,奶牛测定日SCC的标准偏差与临床乳腺炎密切相关。Tahir等通过候选基因法在基因检测到2个SNPs,其中基因的SNP1的野生型AA基因型与低水平的SCC、SCS和IL4显著相关;SNP2与血清细胞因子和奶牛乳房炎显著相关。何阳花等研究发现荷斯坦奶牛基因的SNP可能对乳蛋白量、对乳脂率、产奶量和SCS有显著影响。本研究通过RT-qPCR分析基因在不同乳房健康程度的新疆褐牛中的表达量,结果发现基因对奶牛乳房炎影响不显著,但基因在健康新疆褐牛血液中的表达量高于患乳房炎的新疆褐牛,推测该基因的存在可能起着抑制新疆褐牛乳房炎发生的作用。对于新疆褐牛基因是否参与新疆褐牛乳房炎炎症抗性的生物学过程,还需要进一步研究。
3.2基因生物信息学分析 蛋白质是构成生物体的重要组成之一,是生物体发挥正常功能的基础,通过了解蛋白质的结构,可以理解生命中许多本质问题。具有广泛的生物学作用,主要参与催乳素和生长激素的信号转导,参与免疫炎症反应,参与调控组织细胞的增殖、分化和凋亡。姜徽等研究发现,基因可能通过调节IL-2的合成来间接影响牛乳房炎。通过对基因编码蛋白质结构进行分析,能够确认功能单位或者结构域,从而指导设计进行功能确认的生物学实验,为遗传操作提供目标,为新疆褐牛乳房炎抗性的机制研究提供可靠依据。
本实验通过对下载的基因序列进行生物信息学分析,推测STAT5B蛋白可能对新疆褐牛乳房炎抗性具有调控功能。生物信息学分析表明:STAT5B编码787个氨基酸,脂肪系数为86,总平均亲水性为-0.472(<0),不稳定参数高达51.52,推测STAT5B蛋白是一种亲水性蛋白,其半衰期较短,为不稳定蛋白质。蛋白质的二级结构是蛋白质三维结构的基础,是在二级结构的基础上进一步盘绕、折叠形成的。-螺旋及无规则卷曲占STAT5B蛋白质结构中的绝大部分,成功的预测蛋白二级结构有助于正确建立序列对比关系。基因的DNA序列系统进化树显示牛基因与水牛的亲缘关系最为接近,其次与弯角大羚羊的亲缘关系较为接近,说明该基因在不同物种上可能存在着一定的差异。对基因编码蛋白的亚细胞定位预测发现,蛋白主要分布在细胞的细胞质内,研究表明,STAT5B蛋白是胞质蛋白质的可能性较大。进行信号肽和跨膜区分析发现,此蛋白的N端均无信号肽,因此推测这些蛋白为非分泌蛋白质,没有明显跨膜结构区,从而不能进行跨膜转移或定位。对STAT5B编码蛋白进行生物信息学分析,为进一步了解和分析STAT5B的结构与功能提供了理论依据。
4 结 论
本实验通过生物信息学分析的方法对牛基因编码的蛋白进行分析及功能预测,结果发现基因编码蛋白的分子式为CHNOS,总共12 602个原子,分子量为89 943.02,由787个氨基酸共同编码,属不稳定的亲水性蛋白;基因的DNA序列系统进化树显示牛基因与水牛的亲缘关系较为接近,与家猫关系较远。RT-qPCR结果表明,基因对奶牛乳房炎影响不显著。本研究结果为后期进一步研究和验证基因的结构和功能提供了一定的理论参考。