蓝尾蝾螈皮肤转录组及活性多肽分析
2022-01-18王洪亮梁广男刘雅莉段志贵
唐 兴, 王洪亮, 梁广男, 刘雅莉, 段志贵
(1.衡阳师范学院生命科学与环境学院,湖南 衡阳 421008;2.衡阳师范学院南岳山区生物资源保护与利用湖南省重点实验室,湖南 衡阳 421008;3.东华理工大学江西省质谱科学与仪器重点实验室,江西 南昌 330013;4.湖南师范大学动物多肽药物国家地方联合工程实验室,湖南 长沙 410081)
为了保护自己免受掠食者侵害,两栖动物已进化出不同的形态、生理和行为特征[1].两栖动物皮肤分泌物含有大量的活性多肽.这些多肽储存在两栖动物皮肤的颗粒腺体中,在受到压力或受伤时可以高浓度释放到皮肤分泌物中[2],它们能保护皮肤免受环境和致病性的伤害,并发挥许多其他生物学作用[3].
大量的研究证明,两栖动物皮肤活性多肽具有潜在药物治疗作用.在过去的几十年里,蛙和蟾蜍(两栖类无尾目)皮肤分泌物中的生物活性多肽被广泛研究,目前已发现约2 000个(超过100个家族)活性多肽[2-6].这些皮肤活性多肽功能各异,包括抗菌肽、神经肽、缓激肽、蛙皮素、速激肽、色氨肽、胆囊收缩素、阿片样肽、蛋白酶抑制剂肽、抗氧化肽、凝集素、胰岛素释放肽、肥大细胞降解/组胺释放肽、伤口愈合肽,免疫调节肽、神经元一氧化氮合酶抑制剂等[2].但是,蝾螈(两栖类有尾目)的皮肤活性多肽鲜有报道[7-9].
蓝尾蝾螈(Cynopscyanurus)属于两栖纲、有尾目、蝾螈科、蝾螈属,分布于我国贵州和云南的海拔1800米以上地区,多栖息于水塘、稻田水沟、沼泽地水坑,其捕食对象包括蚊、蝇虫等有害昆虫的幼虫[10,11],因此蓝尾蝾螈是一种具有重要的农业保护价值的两栖动物.目前关于蓝尾蝾螈的发育、繁殖生态、肢体再生等研究已有一些论文报道[10-12],但是未有对其皮肤的物质组成和功能进行研究报道.本研究首次对蓝尾蝾螈皮肤进行转录组测序,并分析其转录组和活性多肽成分.
1 材料与方法
1.1 蓝尾蝾螈皮肤总RNA提取和检测
将锡箔纸包裹铁制器具和研钵后在180 ℃下烘烤过夜以灭活RNA酶.双蒸水及滤纸均灭菌处理.试验所用枪头、离心管、手套等均为RNase Free产品.用70%乙醇擦洗超净台后,将所有试验用品在紫外灯下照射1 h.
蓝尾蝾螈成体(图1)购买于云南某养殖场,为人工繁殖的后代.取蓝尾蝾螈成体1只,用双蒸水清洗皮肤后用滤纸擦干.用眼科剪剪破蓝尾蝾螈背部皮肤,再用镊子撕下皮肤后立刻加入到液氮预冷的研钵中研磨约10 min至粉状,再通过Trizol试剂盒提取蓝尾蝾螈皮肤总RNA.
图1 蓝尾蝾螈
取适量皮肤总RNA以Agilent Bioanalyzer进行毛细管电泳以鉴定RNA样品浓度、纯度、完整性.RNA样品达到以下要求即可符合cDNA文库构建要求:RNA总量≥10 μg;RNA浓度≥200 ng·μL-1;RNA完整值≥7.0,28S∶18S浓度比≥1.0.
1.2 cDNA文库的构建及测序
总RNA用DNaseⅠ处理后,采用Oligo(dt)—磁珠法分离mRNA.在mRNA中加入片段化试剂以形成mRNA短片段,并以其为模板合成第一条链cDNA,然后以双链合成反应体系合成双链cDNA.将双链cDNA纯化后加入EB缓冲液,再进行末端修复.双链cDNA的3′末端添加腺嘌呤(A)并连接接头,再选择合适片段大小的双链cDNA进行PCR扩增.cDNA文库质检合格后使用Illumina HiSeq 4000进行测序.
1.3 测序数据处理和生物信息学分析
测序获得的原始reads经过过滤后,获得clean reads数据.使用Trinity软件对clean reads重叠序列连成更长的片段contig(重叠群),然后使用Tgicl软件将来自同一转录本的不同contig进行聚类、去冗余、组装,得到最长的unigene序列.
通过Blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi)对所有unigene进行NT、NR、COG、KEGG、SwissProt注释,使用Blast2GO(www.blast2go.com)以及NR注释结果进行GO注释,采用 InterProScan5[13]进行InterPro注释.根据unigene的COG和GO注释结果,统计了各自的功能分类.
多肽前体序列使用信号肽在线软件SignalP-5.0 Server[14]识别多肽信号肽序列,再利用MEGA 6.0软件将皮肤活性多肽与其同源多肽的氨基酸序列进行对比.
2 结果与分析
2.1 蓝尾蝾螈皮肤总RNA质检数据
在本试验中,蓝尾蝾螈皮肤总RNA经过质检后,其浓度为684 ng·μL-1,RNA总量为13.68 μg,RIN为7.6,rRNA的28S∶18S浓度比为1.2.蓝尾蝾螈皮肤总RNA完全满足cDNA文库构建要求.
2.2 测序数据结果
本试验使用Illumina HiSeq 4000共测定了6.65 Gb数据.测序的原始reads总数目为47.36 M,而过滤后clean reads数目为44.35 M(占原始reads总数93.64%).然后clean reads组装成contig,再通过聚类去冗余和组装得到75 462个unigene,其N50、GC含量、平均长度、总长度分别为1 617 bp、45.64 %、818 bp、61 801 999 bp.
2.3 功能注释
所有unigene在NR、NT、GO、COG、KEGG、Swissprot、Interpro数据库中完成注释后,统计了注释结果(表1).其中NR、Swissprot、KEGG数据库的注释unigene最多,均占unigene总数的30%以上(分别为42.31%、35.50%、32.74%).所有注释的unigene去冗余后,共获得34 850个非冗余注释unigene,占unigene总数的46.18%.
表1 蓝尾蝾螈皮肤转录组unigene的功能注释统计
Unigene注释结果的物种分布如图2所示,注释结果为两栖类物种的unigene数目约占注释总数的16%;注释结果最多的两栖类物种是热带爪蟾(Xenopustropicalis)和非洲爪蟾(Xenopuslaevis),注释结果分别约占注释总数的11%和4%;注释结果为其他两栖动物约占注释总数的1%,其中一些注释结果来源于蝾螈物种,如墨西哥钝口螈、红腹蝾螈、绿红东美螈、东方蝾螈等.
图2 蓝尾蝾螈皮肤转录组unigene注释结果的物种分布
将COG数据库的注释基因进行功能分类(图3).共鉴定22 154个COG注释项(25个COG类别).其中,“一般功能基因”(3 802个,占比为17.16%(3 802/22 154),下文同)的COG注释项最多;其次是“翻译、核糖体结构与生物发生”(2 180个,占比为9.84%)、“复制、重组和修复”(2 086个,占比为9.42%)、“转录”(1 745个,占比为7.88%)、“细胞周期控制、细胞分裂、染色体分裂”(1 390个,占比为6.27%)、“翻译后修饰、蛋白质周换、分子伴侣”(1 309个,占比为5.91%)、“未知功能基因”(1 309个,占比为5.91%);而COG注释项最少的类别是“核结构”(7个,占比为0.03%)以及“胞外结构”(39个,占比为0.18%).
1.翻译、核糖体结构和生物发生;2.转录;3.信号转导机制;4.次生代谢产物生物合成、运输和分解代谢;5.RNA处理和修饰;6.复制、重组和修复;7.翻译后修饰、蛋白质转换、伴侣;8.核苷酸转运和代谢;9.核结构;10.脂质运输和代谢;11.细胞内运输、分泌和囊泡运输;12.无机离子转运和代谢;13.一般功能蛋白;14.未知功能蛋白;15.胞外结构;16.能量生产和转换;17.防御机制;18.细胞骨架;19.辅酶转运和代谢;20.染色质结构和动力学;21.细胞壁/膜/包膜生物发生;22.细胞运动;23.细胞周期控制、细胞分裂、染色体分裂;24.糖类运输和代谢;25.氨基酸转运与代谢.
通过基因本体论(gene ontology, GO)数据库对所有unigene进行功能分类(图4),共获得76 963个GO注释项.其中,涉及生物过程的GO注释项有38 192个(49.62%),涉及细胞成分的GO注释项有27 409个(35.61%),涉及分子功能的GO注释项有11 362个(14.76%).
1.行为;2.生物粘附;3.生物相;4.生物调节;5.细胞聚集;6.细胞杀伤;7.细胞成分组织或生物发生;8.细胞过程;9.发育过程;10.生长;11.激素分泌;12.免疫系统过程;13.定位;14.运动;15.代谢过程;16.多细胞生物过程;17.多生物过程;18.生物过程的负调控;19.生物过程的正向调节;20.生物过程的调节;21.刺激反应;22.节律过程;23.信号传递;24.单组织过程;25.细胞;26.细胞连接;27.细胞组分;28.胶原三聚体;29.细胞外基质;30.细胞外基质组分;31.细胞外区域;32.细胞外区域组分;33.大分子复合物;34.膜;35.膜包腔;36.膜组分;37.细胞器;38.细胞器组分;39.突触;40.突触组分;41.抗氧化活性;42.结合;43.催化活性;44.通道调节活性;45.趋化活性;46.化学排斥活性;47.电子载体活性;48.酶调节活性;49.鸟苷酸交换因子活性;50.金属伴侣活性;51.分子转换器活性;52.核酸结合转录因子活性;53.蛋白质结合转录因子活性;54.蛋白质标签;55.受体活性;56.受体调节活性;57.结构分子活性;58.翻译调节活性;59.转运体活性.
2.4 蓝尾蝾螈皮肤活性多肽
在蓝尾蝾螈皮肤转录组学中鉴定到多种皮肤活性多肽.其中,胆囊收缩素、速激肽、防御素、降钙素、蛋白激酶抑制剂与已知多肽序列进行比较,结果发现在其他物种中均存在相同的成熟肽序列(表2).
表2 其他物种中存在相同成熟肽序列的蓝尾蝾螈皮肤活性多肽
另外,本次试验还鉴定一些与已知多肽具有高同源性的活性多肽,包括神经肽FF和神经肽AF、胸腺肽β4、C型利钠肽、降钙素基因相关肽、cathelicidin类抗菌肽等,它们与已知多肽序列具有高度的序列相似性.下面将对这些高同源性的活性多肽进行详细分析.
2.4.1 神经肽FF和神经肽AF 神经肽FF和神经肽AF最初被认为是一种抗阿片肽[15],能介导疼痛反应.后来的研究证明神经肽FF还具有一些其他作用,如调节神经内分泌系统、能量平衡、抗炎、疼痛传递和脂肪组织巨噬细胞的外周调节[16].而神经肽AF主要研究聚焦于动物摄食[17-19]和记忆[20].
本研究鉴定的蓝尾蝾螈神经肽FF与来源于加蓬蚓螈(Geotrypetesseraphini)以及非洲爪蟾(Xenopuslaevis)的神经肽FF具有较高的序列相似性,仅N端氨基酸有差异(表3).蓝尾蝾螈神经肽AF与3种两栖类动物—非洲爪蟾、热带爪蟾(Xenopustropicalis)、美洲牛蛙(Lithobatescatesbeianus)的神经肽AF的序列相似性超过83%(表4).从表3和表4可以看出,神经肽FF家族和神经肽AF家族的成熟肽C端序列均高度保守,且C末端均具有酰胺化的苯丙氨酸(F)残基.
表3 神经肽FF的成熟肽序列1)
表4 神经肽AF的成熟肽序列1)
2.4.2胸腺肽β4 胸腺肽β4是一种天然再生蛋白,具有血管生成和抗炎活性,并可在伤口处聚集大量血小板,在组织保护、修复和再生中起着重要作用[21-23].本次试验鉴定的蓝尾蝾螈胸腺素β4与两种蚓螈—加蓬蚓螈和Microcaecilia属蚓螈(Microcaeciliaunicolor)的胸腺素β4具有较高的序列相似性.它们均富含碱性氨基酸K以及酸性氨基酸E,而且它们的N端氨基酸序列在进化上相对保守(表5).
表5 胸腺肽β4的成熟肽序列1)
2.4.3 C型利钠肽 C型利钠肽不仅调节血管张力和血压,而且还调节多种心血管效应[24].此外,研究结果也表明C型利钠肽也参与了四肢骨骼发育的调节[25].将蓝尾蝾螈C型利钠肽前体与美洲牛蛙C型利钠肽前体进行序列比较,结果发现它们在信号肽(signal peptide)和中间肽(propeptide)的序列相似性很低.它们的成熟肽序列含有一对二硫键,且序列相似性达到86%(表6).
表6 C型利钠肽前体序列1)
2.4.4 降钙素基因相关肽 降钙素基因相关肽(calcitonin gene related peptide, CGRP)是一种高效血管舒张剂,对多种心血管疾病具有保护作用[26].此外,降钙素基因相关肽的表达水平与躯体、内脏、神经病理性和炎症性疼痛之间存在一定相关性[27].
将蓝尾蝾螈CGRP前体与高山倭蛙(Nanoranaparkeri)CGRP前体进行序列比较,结果发现它们均存在成熟肽将两段中间肽(中间肽1和中间肽2)隔开的序列结构,而且成熟肽序列高度相似(表7).两种两栖动物的CGRP前体的N端序列在进化上比C端更保守,且C末端均具有酰胺化的苯丙氨酸(F)残基.
表7 降钙素基因相关肽前体序列1)
2.4.5 cathelicidin类抗菌肽 在脊椎动物中均存在具有广谱抗菌活性的cathelicidin类抗菌肽[28].从红瘰疣螈皮肤中鉴定到一种cathelicidin,该多肽有助于蝾螈伤口愈合和皮肤再生.由于红瘰疣螈cathelicidin仅含有12个氨基酸残基,因此具有开发成为新型创伤愈合剂的潜力[29].
在分类学上,蓝尾蝾螈属于蝾螈科蝾螈属,而红瘰疣螈属于蝾螈科疣螈属.将两种蝾螈的cathelicidin前体序列进行比较(表8),结果发现它们信号肽的序列相似性最高(95.0%),中间肽的序列相似性略低(83%);而成熟肽序列中均含有一对二硫键,但是两者相似性最低(47%).由于两种成熟肽相似性较低,因此下一步将深入比较研究两种蝾螈cathelicidin的抗菌或伤口愈合活性.
表8 cathelicidin前体序列1)
3 讨论与结论
两栖动物的皮肤直接暴露于不同的环境中,其环境因素包括微生物、寄生虫、捕食者、物理、化学因素等,它的特殊栖息地也是作为水陆进化之间的桥梁[2].因此,研究两栖动物皮肤成分对阐明其生理学功能具有重要科学意义.
本研究首次揭示了蓝尾蝾螈皮肤转录组和活性多肽成分.通过生物信息学分析,共获得75 462个unigene.在功能数据库注释后得到34 850个非冗余注释unigene,占unigene总数的46.18%,其中注释结果为两栖类物种的unigene数目约占注释总数的16%.分别对GO和COG数据库的注释unigene进行功能分类.另外,从蓝尾蝾螈皮肤转录组中鉴定到多种皮肤活性多肽,如胆囊收缩素、速激肽、防御素、降钙素、蛋白激酶抑制剂、神经肽FF和神经肽AF、胸腺肽β4、C型利钠肽、降钙素基因相关肽、cathelicidin类抗菌肽等.下一步将合成或表达这些皮肤活性多肽并进行详细的功能研究.