意大利蜜蜂Hippo信号通路相关基因及其全长转录本的鉴定与分析
2023-11-18张佳欣高旭泽陈梦君宋宇轩荆欣刘治滩冯佩林陈大福郭睿
张佳欣,高旭泽,陈梦君,宋宇轩,荆欣,刘治滩,冯佩林,陈大福,2,郭睿,2*
意大利蜜蜂Hippo信号通路相关基因及其全长转录本的鉴定与分析
张佳欣1,高旭泽1,陈梦君1,宋宇轩1,荆欣1,刘治滩1,冯佩林1,陈大福1,2,郭睿1,2*
(1.福建农林大学动物科学学院(蜂学学院),福建 福州 350002;2.福建省蜂疗研究所,福建 福州 350002)
采用Blast工具将已鉴定到的意大利蜜蜂(,简称意蜂)全长转录本比对Nr数据库,共鉴定到意蜂Hippo信号通路中相关的49个基因及其550条全长转录本。运用Gffcompare软件将鉴定到的Hippo信号通路相关全长转录本与西方蜜蜂参考基因组(Amel_HAv3.1)上注释的转录本进行比较,分别延长西方蜜蜂参考基因组注释到Hippo信号通路的9个基因的5UTR和7个基因的3UTR。通过Astalavista软件鉴定到Hippo信号通路相关的4个基因的7次可变剪切(AS)事件,包括2次外显子跳跃、2次内含子保留和3次可变5端剪接。通过PCR验证了1个基因的AS事件真实性。利用TAPIS pipeline鉴定到意蜂Hippo信号通路相关的24个基因含有1个及以上可变多聚腺苷酸化(APA)位点,其中含有1个APA位点的基因数量最多。通过TBtool软件鉴定APA位点上游motif的一致性序列HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN。
西方蜜蜂;意大利蜜蜂;Hippo信号通路相关基因;全长转录本
西方蜜蜂() 在全球广泛分布,常用于农作物授粉、养蜂生产和科学研究,具有重要的生态和经济价值[1]。意大利蜜蜂(,简称意蜂)是西方蜜蜂的四大亚种之一,具有优良的生产性能。WALLBERG等[2]组装和注释了西方蜜蜂染色体级别基因组(Amel_HAv3.1)。
Hippo信号通路在黑腹果蝇()中被首次发现[3],作为一条进化较为保守的激酶级联反应链,在细胞增殖、组织生长、内环境稳态、免疫防御及病原侵染等诸多生物学过程中起关键作用[4]。陈庆等[5]在果蝇中鉴定到Hippo通路上的4种主要激酶,即Hippo(Hpo)、Salvador(Sav)、Warts(Wts)和Mob肿瘤抑制因子(Mats),发现它们中的任何一种失活都会促进细胞生长和抑制细胞凋亡而导致细胞无限增殖。LI等[6]发现家蚕()中、、、和基因的序列高度保守,在家蚕BmN–SWU1(NS)细胞系中上调和下调后,抑制细胞增殖,说明Hippo信号通路参与调控BmN–SWU1(NS)细胞的增殖。
目前,全长转录组研究仅在果蝇和家蚕等少数昆虫中见诸报道,多数昆虫的相关研究仍然缺失。蜜蜂的全长转录组研究迄今仅有2例报道:ZHENG等[7]通过纳米孔测序,发现在西方蜜蜂蜂王和工蜂级型发育过程中转录本的表达量发生动态变化,基因的可变多聚腺苷酸化(APA)和可变剪切(AS)导致转录本结构变得复杂;范小雪等[8]利用纳米孔测序技术对意蜂工蜂中肠组织RNA进行测序并获得了长读段数据。在范小雪等研究基础上,笔者运用生物信息学方法鉴定意蜂Hippo信号通路相关基因和全长转录本,进而对基因的AS事件和APA位点进行鉴定,以期展示意蜂Hippo信号通路相关基因和全长转录本的全面信息,为开展相关基因和剪接体的功能研究提供参考。
1 意蜂纳米孔测序长读段数据来源
范小雪等[8]制备意蜂7日龄和10日龄工蜂中肠样品,完成了RNA提取、cDNA建库、纳米孔测序及数据质控,获得了长读段测序数据,以此长读段测序数据作为本研究数据来源。
2 研究方法
2.1 意蜂Hippo信号通路相关基因和全长转录本的鉴定
参照蔡宗兵等[9]的方法,使用Blast工具(采用默认参数)将鉴定到的意蜂全长转录本序列比对到Nr数据库(https://ftp.ncbi.nlm.nih.gov/blast/db/FAS TA/),根据注释信息筛选Hippo信号通路相关基因和全长转录本。
2.2 西方蜜蜂参考基因组注释的Hippo信号通路相关基因的结构优化
按照杜宇等[10]的方法,利用gffcompare(http:// ccb.jhu.edu/software/stringtie/gffcompare.shtml)将鉴定到的Hippo信号通路相关全长转录本与西方蜜蜂参考基因组(Amel_HAv3.1)上已注释的转录本进行比较,优化已注释基因的结构,并鉴定未注释的新基因和新转录本。如果在已注释基因边界外区域有比对上的读段,则将基因的非翻译区(UTR)向上游或下游延伸,以修正边界。
2.3 意蜂Hippo信号通路相关基因的AS事件鉴定及PCR验证
参照陈华枝等[11]的方法,运用Astalavista软件鉴定意蜂工蜂Hippo信号通过相关基因的AS事件,采用默认参数。进一步统计内含子保留(IR)、外显子跳跃(ES)、可变5端剪接(A5SS)等3种类型的AS事件数量。
随机选择肌动蛋白克隆205样异构体X1基因(AS类型为ES)进行PCR验证,以验证Hippo信号通路中的AS事件准确性。根据核苷酸序列设计跨剪接位点的特异性引物(上游AACAAGAAACGGTG,下游TCATCTCCGACCAACCAG)。以肌动蛋白基因(GeneBank ID LOC107999330)作为内参,并设计相应的特异性引物(上游TTATATGCCAACAC TGTCCTTT,下游AGAATTGATCCACCAATCCA)。委托上海生工生物工程有限公司合成引物。使用RNA抽提试剂盒(Promega)分别提取意蜂7日龄和10日龄工蜂中肠样品的总RNA,等量混合后作为模板进行反转录,得到的cDNA作为模板进行PCR扩增。反应体系和程序按照范小雪等[10]的报道设置。PCR产物经3%的琼脂糖凝胶电泳检测后,使用核酸凝胶成像仪(Bio–red)观察和拍照。
2.4 意蜂Hippo信号通路相关基因的APA位点鉴定
参照杜宇等[12]的方法,利用TAPIS pipeline[13]鉴定酚氧化酶及丝氨酸蛋白酶相关基因的APA位点,参数设置:–meme–minw 6,–meme– maxw 6,–norc,–fimo–skip,–spamo–skip。采用TBtools v1.046 软件分析所有APA位点的上游50 bp的序列特征,进而鉴定出motif。
3 结果与分析
3.1 意蜂Hippo信号通路相关基因和全长转录本的鉴定
采用Blast工具,将已鉴定到的意蜂全长转录本比对Nr数据库,共鉴定到意蜂Hippo信号通路中相关的49个基因及其550条全长转录本。由于鉴定到的相关基因和全长转录本数量较多,仅在表1中展示意蜂Hippo信号通路相关的15个基因及其全长转录本。注释到14–3–3蛋白ε全长转录本最多,为14条;注释到转录增强因子TEF–1亚型X4的全长转录本为13条;注释到支架蛋白,肌动蛋白、克隆205蛋白,肌动蛋白、肌肉,丝氨酸/苏氨酸蛋白激酶STE20,类RasGTP结合蛋白,未特征蛋白,G1/ s特异性周期蛋白EL,LIM结构域蛋白,类克隆403蛋白3,未特征蛋白、转录变体X3,蛋白Wnt–1,互作蛋白类RIP3–like和Ras关联结构域蛋白2的全长转录本均为1条(表1)。
3.2 西方蜜蜂参考基因组注释到Hippo信号通路的基因结构优化
对西方蜜蜂参考基因组上注释到Hippo信号通路上的16个基因进行了结构优化。其中,正链和负链延长的基因分别为10个和6个;5端延长的基因有9个,延长长度69 445~1 863 562 bp;3端延长的基因有7个,延长长度1474~1 179 780 bp(表2)。
表2 西方蜜蜂参考基因组上注释到Hippo信号通路的基因结构优化结果
3.3 意蜂Hippo信号通路相关基因的AS事件及验证结果
意蜂Hippo信号通路相关的49个基因中,鉴定到4个基因的7次AS事件,涉及外显子跳跃(ES)、内含子保留(IR)和可变5端剪接(A5SS)等3种类型(表3),其中,肌动蛋白、克隆205蛋白编码基因(GeneBank登录号LOC551369)发生2次外显子跳跃,未表征蛋白编码基因(GeneBank登录号LOC107964603)发生2次内含子保留,丝氨酸苏氨酸蛋白磷酸酶2a催化亚基编码基因(GeneBank登录号LOC550710)和14–3–3蛋白ε编码基因(GeneBank登录号LOC408951)分别发生2次和1次可变5端剪接(表3)。
表3 意蜂Hippo信号通路相关基因的AS事件信息
C和W分别代表负义链和正义链。
图1–A显示外显子跳跃类型。琼脂糖凝胶电泳结果显示,通过PCR扩增鉴定到肌动蛋白异构体X2基因的2个目的片段,大小分别约为659 bp和375 bp(图1–B),与基于Nanopore测序数据的预测结果(图1–C)一致,证实了该AS事件的真实性。
3.4 意蜂Hippo信号通路相关基因的APA位点鉴定结果
在意蜂Hippo信号通路相关的49个基因中,鉴定到24个基因含有1个及以上APA位点(表4)。其中,含有1个APA位点的基因数量最多,为4个;含有2和3个APA位点的基因均为3个;含有4个APA位点的基因有2个(图2–A)。由于鉴定到的相关基因数量较多,仅在表4中展示意蜂Hippo信号通路相关的5个基因及其全长转录本,其中含有1、2、3、4和5个APA位点的相关基因分别展示1个。此外,在Hippo信号通路相关基因的APA位点上游鉴定到motif的一致性序列为HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN(图2–B)。
表4 意蜂Hippo信号通路相关的5个基因的APA位点信息
A 含不同数量APA位点的基因数统计;B APA位点上游40 nt鉴定到的motif。
4 结论与讨论
基于前期获得的纳米孔长读段数据,本研究共鉴定到意蜂Hippo信号通路相关的49个基因及其550条全长转录本,并对西方蜜蜂参考基因组上注释到Hippo信号通路的9个基因的5UTR和7个基因的3UTR分别进行了延长。共鉴定到意蜂Hippo信号通路相关的3个基因的7次AS事件,涉及ES、IR和A5SS等3种类型。推测上述3个基因通过发生ES、IR和A5SS影响意蜂Hippo信号通路,进而调节器官大小及个体发育等过程。
本研究共鉴定到意蜂Hippo信号通路相关的24个基因含有1个及以上APA位点,基因占比约为49%,说明意蜂Hippo信号通路相关基因普遍发生APA且存在丰富的APA位点,与白蝇()[14]、草地贪夜蛾()[15]和黑腹果蝇()[16]等昆虫中的研究结果相似。另外,在APA位点的上游鉴定到motif的一致性序列为HVNCCNBNDYVDVVHV NDBVDYCNBBDNNNHNNVNNVMNN,与前人在其他动植物如小鼠()[17]、拟南芥()[18]和东方蜜蜂微孢子虫()[11]中鉴定到motif均不相同,表明不同物种基因APA位点上游的motif具有种属特异性。这些motif如何调节意蜂APA位点形成,进而影响Hippo信号通路,需进一步研究。
[1] 曾志将.养蜂学[M].3版.北京:中国农业出版社,2017:10–11.
[2] WALLBERG A,BUNIKIS I,PETTERSSON O V,et al. A hybrid de novo genome assembly of the honeybee,,with chromosome-length scaffolds[J]. BMC Genomics,2019,20(1):1–19.
[3] 李俊宏,令狐月月,陈兰芬.Hippo信号通路调控免疫细胞稳态维持的研究进展[J].中国免疫学杂志,2019,35(15):1793–1801.
[4] 李雅雯,程保辉,赵海亮.Hippo通路在适应性免疫中的作用研究进展[J].医学综述,2022,28(4):654–659.
[5] 陈庆,殷焦.Hippo通路在感染及肿瘤免疫中的相关作用研究进展[J].解放军医学杂志,2019,44(9):791–796.
[6] LI N N,TONG X L,ZENG J,et al.Hippo pathway regulates somatic development and cell proliferation of silkworm[J]. Genomics,2019,111(3):391–397.
[7] ZHENG S Y,PAN L X,CHENG F P,et al.A global survey of the full-length transcriptome ofa by single-molecule long-read sequencing[J].International Journal of Molecular Sciences,2023,24(6):5827.
[8] 范小雪,张凯遥,朱乐冉,等.意大利蜜蜂丝氨酸/苏氨酸蛋白激酶基因和全长转录本鉴定及验证[J].昆虫学报,2023,66(4):478–485.
[9] 蔡宗兵,王紫馨,吴鹰,等.中华蜜蜂细胞色素P450基因及其全长转录本的鉴定及分析[J].昆虫学报,2023,66(1):11–18.
[10] 杜宇,祝智威,王杰,等.利用第三代纳米孔长读段测序技术构建和注释蜜蜂球囊菌的全长转录组[J].中国农业科学,2021,54(4):864–876.
[11] 陈华枝,范小雪,范元婵,等.东方蜜蜂微孢子虫基因的可变剪接及可变腺苷酸化解析[J].菌物学报,2021,40(1):161–173.
[12] 杜宇,王杰,蒋海宾,等.基于第三代长读段测序数据解析蜜蜂球囊菌基因的可变剪切与可变腺苷酸化[J].微生物学报,2021,61(3):667–682.
[13] ABDEL-GHANY S E,HAMILTON M,JACOBI J L,et al.A survey of the sorghum transcriptome using single-molecule long reads[J].Nature Communications,2016,7:11706.
[14] FAROOQ M,ZAHRA NAQVI R,AMIN I,et al. Transcriptome diversity assessment of(FDH228) leaves under control,drought and whitefly infestation using PacBio long reads[J].Gene,2023,852:147065.
[15] FANG L Y,GUO L N,ZHANG M,et al.Analysis of polyadenylation signal usage with full-length transcriptome in(Lepidoptera:Noctuidae)[J]. Insects,2022,13(9):803.
[16] SANFILIPPO P,WEN J Y,LAI E C.Landscape and evolution of tissue-specific alternative polyadenylation acrossspecies[J].Genome Biology,2017,18(1):1–22.
[17] LUO Z H,NIU M W,GONG S H,et al.Intestinal epithelial chemokine (C-C motif) ligand 7 overexpression protects against high fat diet-induced obesity and hepatic steatosis in mice[J].Chinese Medical Journal,2020,133(15):1805–1814.
[18] JING Y J,LIN R C.The VQ motif-containing protein family of plant-specific transcriptional regulators[J].Plant Physiology,2015,169(1):371–378.
Identification and investigation of genes and their full-length transcripts relative to Hippo signaling pathway in
ZHANG Jiaxin1,GAO Xuze1,CHEN Mengjun1,SONG Yuxuan1,JING Xin1,LIU Zhitan1,FENG Peilin1,CHEN Dafu1,2,GUO Rui1,2*
(1.College of Animal Sciences (College of Bee Science), Fujian Agriculture and Forestry University, Fuzhou, Fujian 350002, China; 2.Apitherapy Research Institute of Fujian Province, Fuzhou, Fujian 350002, China)
The previously identified full-length transcripts ofwere aligned to the Nr database by Blast tool, a total of 49 genes and their 550 full-length transcripts relevant to the Hippo signaling pathway were identified. The identified 550 full-length transcripts relative to the Hippo signaling pathway were compared with the annotated transcripts in the() reference genome (Amel_HAv3.1) using the gffcompare software, the 5UTRs of 9 genes and the 3UTRs of 7 genes annotated to the Hippo signaling pathway in thereference genome were respectively prolonged. Based on the Astalavista software, 7 alternative splicing (AS) events in 4 genes were identified, including two exon skipping, two intron retention and three alternative 5splicing sites. The authenticity of AS events in 1 gene was verified by PCR. On basis of the TAPIS pipeline, 24 genes associated with the Hippo signaling pathway were identified to contain at least 1 alternative polyadenylation (APA) sites individually; among them, the genes containing 1 APA site were the most abundant. By using the TBtool software, the consensus sequence of HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN was identified.
;; Hippo signaling pathway-related genes; full-length transcript
Q969.557.7
A
1007–1032(2023)05–0529–06
张佳欣,高旭泽,陈梦君,宋宇轩,荆欣,刘治滩,冯佩林,陈大福,郭睿.意大利蜜蜂Hippo信号通路相关基因及其全长转录本的鉴定与分析[J].湖南农业大学学报(自然科学版),2023,49(5):529–534.
ZHANG J X,GAO X Z,CHEN M J,SONG Y X,JING X,LIU Z T,FENG P L,CHEN D F,GUO R.Identification and investigation of genes and their full-length transcripts relative to Hippo signaling pathway in[J].Journal of Hunan Agricultural University(Natural Sciences),2023,49(5):529–534.
http://xb.hunau.edu.cn
2023–03–21
2023–08–25
国家自然科学基金面上项目(32172792);国家现代农业产业技术体系专项资金项目(CARS–44–KXJ7);福建省自然科学基金面上项目(2022J01131334);福建农林大学科技创新专项基金项目(KFb22060XA)
张佳欣(1998—),女,湖北十堰人,硕士研究生,主要从事蜜蜂分子生物学研究,jiaxin19981005@163.com;*通信作者,郭睿,博士,副教授,主要从事昆虫–病原互作研究,fafu_ruiguo@126.com
10.13331/j.cnki.jhau.2023.05.005
责任编辑:罗慧敏
英文编辑:罗维