东、西方蜜蜂的基因组生物信息学数据分析
——第44届国际养蜂大会蜜蜂科学论坛综述
2016-01-30李兴安薛运波刘振国吉林省养蜂科学研究所吉林308山东农业大学泰安708
李兴安薛运波刘振国(吉林省养蜂科学研究所,吉林308;山东农业大学,泰安708)
东、西方蜜蜂的基因组生物信息学数据分析
——第44届国际养蜂大会蜜蜂科学论坛综述
李兴安1薛运波1刘振国2
(1吉林省养蜂科学研究所,吉林132108;2山东农业大学,泰安271018)
东、西方蜜蜂是蜜蜂属生物的两个代表性物种,本文从东、西方蜜蜂基因组序列,东、西方蜜蜂免疫相关基因,以及东、西方蜜蜂分子进化论三个方面进行综述,旨在从基因组水平认识这两个蜜蜂属物种。
东方蜜蜂;西方蜜蜂;基因组序列;免疫相关基因;分子进化论
韩国位于长白山森林生态系统最南端,是东方蜜蜂的一个分布地域。韩国养蜂文字记载历史最早可以追溯至公元5年[1,2]。这个时间对应于中国西汉汉平帝(即西汉倒数第二任皇帝刘衎)5年,在此之前,中国大陆土法饲养东方蜜蜂技术传入韩国。由此看来,韩国人最晚在中国西汉末年已经从事养蜂活动。然而,韩国现代养蜂业始于20世纪早期,经过约100年的发展,韩国养蜂业正在同国际接轨;特别是自2009年以来,韩国的蜜蜂基础研究深度、广度,韩国的养蜂技术标准化程度,以及韩国的蜂产品开发精细层次,在亚洲养蜂业具有相当水准,被国际养蜂业渐渐认可。在这个背景之下,第44届国际养蜂大会于2015年9月在韩国第四大城市大田(Daejeon)举行。
此次大会的主题是“蜜蜂,连动世界”,东方蜜蜂自然成为大会讨论最多的一个研究对象。其中,韩国首尔大学Hyung Wook Kwon教授展示的“东方蜜蜂基因组生物信息学及其展望”研究进展,受到同行学者的关注。至此,蜜蜂基因组学分析将东、西方蜜蜂的遗传物质组装为1个染色体组(包括16条染色体)和1个细胞核外质体(即1拷贝线粒体基因组),将东、西方蜜蜂基因组鉴定为DNA全序列谱图,将东、西方蜜蜂之间的差异反映到基因组水平,这些重大发现对我们认识东、西方蜜蜂的“微观世界”颇具指导意义。
受此次从大会启发,在查阅相关文献的基础之上,从三个方面综述了东、西方蜜蜂,本文旨在从基因组水平认识这两个蜜蜂属物种。
1 东、西方蜜蜂的基因组序列
生物样品全基因组序列分析(比如从头测序)的思路是借助于基因组组装体长度和基因组组装体长度占全基因组序列百分比(即覆盖率)计算基因组全长,并且进一步预测基因转录物的数量。东方蜜蜂基因组序列分析的结果显示,基因组组装体全长228 Mbp,涵盖了96%全基因组序列,反映了238 Mbp基因组序列长全,预测了10651个编码蛋白质基因[3]。此外,东方蜜蜂转录组学分析示证实了2470个非编码蛋白质基因(即,长基因间非编码RNA基因)[4]。另一方面,西方蜜蜂基因组序列分析的首次结果显示,基因组组装体全长231 Mbp,涵盖98%全基因组序列,反映了236 Mbp基因组全长,预测了10157个编码蛋白质基因[5]。Elsik等(2014)在此基础上补充5.5%组装体数量,将覆盖率修正为88.7%,将全基因组长度扩展为250 Mbp,将编码蛋白质基因数量增加至15314个[6]。此外,西方蜜蜂转录组学分析示证实1514个非编码蛋白质基因[4]。总体上,东、西方蜜蜂基因组组装体间存在同线性关系。
动物基因组富含GC结构域,GC结构域序列占全基因组序列百分比(简称GC含量)是表征动物基因组序列构成的一项主要指标。东、西方蜜蜂基因组组装体的GC含量分别是30%和33%,这组数据低于模式动物黑腹果蝇基因组组装体的GC含量而高于模式动物人基因组组装体的GC含量[3]。CpG二核苷酸串联重复序列被命名为CpG岛,是GC结构域的特殊形式,CpG观察值与CpG期望值(或理论值)之比(简称CpG o/e)是表征动物基因组序列构成的另外一项主要指标。东、西方蜜蜂基因组组装体CpG o/e值分别为1.61和1.65,这组数据低于模式动物果蝇基因组组装体CpG o/ e值而高于模式动物人因组组装体CpG o/e值[3]。鉴于基因组甲基化水平与GC含量或CpG o/e值之间存在负相关关系,东、西方蜜蜂基因组既可以在昆虫基因组甲基化研究中充当模式生物,也可以在人基因组甲基化研究中扮演阴性对照角色。
转座子,或跳跃基因,被命名为DNA转座元件,是一类长度异质性DNA重复序列,可以在基因组内不同等位序列之间转移位置,既可以在原位保留“印记”,也可以在靶位置产生3~11 bp正向重复序列。转座子的一种存在形式被命名为DNA转座因子,为基因组固有序列,直接地从原位转移至到靶位点[7,8]。在东、西方蜜蜂基因组内,DNA转座因子占全基因组序列百分比分别为0.11%和0.57%[3];而且,东方蜜蜂基因组仅含有5个果蝇Marine同源DNA转座因子,西方蜜蜂基因组含有6个果蝇Marine同源DNA转座因子。转座子的另外一种存在形式被命名为DNA反转座因子,来源于反转录病毒,为反转录病毒同源序列,通过形成RNA中间体间接地转移至靶位点[7]。DNA反转座子的一种存在形式被命名为长末端重复序列,是一种非编码DNA序列但是含启动子、增强子等转录调控序列,因而这种DNA反转座子是基因表达所需的基本元件之一[8]。东、西方蜜蜂基因组长末端重复序列占全基因组序列百分比分别为0.1%和0.02%[3]。DNA反转座子的另外一种存在形式被命名为非长末端重复序列,呈弥撒性分布(与串联DNA重复序列相对应),属于中度DNA重复序列,也是一种非编码DNA序列,包括短分散重复序列(长度小于500 bp)和长分散重复序列(长度大于1000 bp)。迄今为止,东方蜜蜂基因组没有被检测出短、长分散重复序列;而在西方蜜蜂基因组中,短、长分散重复序列占全基因组序列百分比分别为分别是0.03%和0.04%[3]。报道显示,人DNA转座现象可能是一种基因组缺失形式,通常与疾病发生(比如肿瘤)相关[7]。
此外,东、西方蜜蜂线粒体基因组差异性主要表现为如下3个方面[9,10]:第一,东、西方蜜蜂线粒体基因组全长分别为15895 bp和16343 bp;第二,在东方蜜蜂线粒体基因排列方向和排列顺序中,丝氨酸-转运RNA基因只是发生了转位,而在西方蜜蜂线粒体基因排列方向和排列顺序中,丝氨酸-转运RNA基因不仅发生了转位而且发生了基因交换;第三,在东方蜜蜂线粒体基因组中,最大的基因间非编码区全长231 bp,生理功能不十分清楚,位于蛋氨酸基因-转运RNA基因与谷氨酰胺基因-转运RNA基因之间,而在西方蜜蜂线粒体基因组中,最大的基因间非编码区全长193 bp,是种内DNA多态性位点,位于亮氨酸-转运RNA基因与-细胞色素氧化酶基因亚单位-2基因之间。
2 东、西方蜜蜂的免疫相关基因
昆虫免疫防御等无脊椎动物免疫防御通常仅依赖于天然免疫,或固有免疫,或非特异性免疫。果蝇、蚊子、飞蛾等独居昆虫的天然免疫仅为个体免疫(individual immunity);蚂蚁、西方蜜蜂、东方蜜蜂等社会昆虫(或群居昆虫)的天然免疫则体现为个体免疫和社会免疫(social immunity)两个水平。蜜蜂囊状幼虫病和蜜蜂寄生性螨虫感染分别是东、西方蜜蜂的主要蜜蜂传染病,前者通常是研究东方蜜蜂个体免疫机制的理想素材,涉及数量较多的昆虫个体免疫相关基因,而后者通是研究西方蜜蜂群体免疫机制的理想素材,涉及数量较多的昆虫群体免疫相关基因[11,12]。
全基因组序列分析结果显示,东方蜜蜂基因组至少编码160个昆虫免疫相关基因,其中昆虫个体免疫相关基因数量较少(相对于西方蜜蜂的昆虫个体免疫相关基因数量),昆虫群体免疫相关基因数量较大(相对于西方蜜蜂的昆虫群体免疫相关基因数量)[3]。此外,蜜蜂抗微生物蛋白质基因和蜂毒肽基因属于蜜蜂昆虫群体免疫相关基因,基因转录物定量分析的结果显示,这两个基因的转录物在东、西方蜜蜂组织中存在量的差异,前者表达水平高于后者表达水平[13,14]。这些发现,或许有助于解释:东方蜜蜂易患蜜蜂囊状幼虫病,而不易发生蜜蜂寄生性螨虫感染。
西方蜜蜂基因组涉及17个昆虫个体免疫相关基因,这些西方蜜蜂旁系同源基因数量仅占独居昆虫个体免疫相关基因数量的三分之一,三分之二昆虫个体免疫相关基因没有对应的西方蜜蜂旁系同源基因[5,11]。为此,Weinstock等(2006)初步推测,西方蜜蜂可能具有相对弱的个体免疫防御功能,而且其原因可能是西方蜜蜂在与病原体协调进化过程中仅对种类有限的病原体发生免疫应答。同时,基于西方蜜蜂群体免疫的事实,Conte等进一步推测,在蜜蜂进化过程中,虽然部分个体免疫防御系统可能丢失,但是有可能被群体免疫防御系统取代。西方蜜蜂脑转录组序列分析的研究结果显示,39个昆虫群体免疫相关基因转录物属于多效性基因,均涉及群体免疫表型[11]。这些发现,或许有助于解释目前养蜂业存在的另外一个事实:西方蜜蜂易患蜜蜂寄生性螨虫感染,而不易发生蜜蜂囊状幼虫病。
3 东、西方蜜蜂的分子进化论
蜜蜂属生物包括9~12个物种,除西方蜜蜂外,东方蜜蜂等其他8~11个蜜蜂均自然分布于亚洲[15]。显然,这种分布格局表明东方蜜蜂起源于亚洲,而且在沿亚洲大陆扩展过程中自然分布于南亚(如印度)、喜马拉雅(如尼泊尔)、东南亚(如婆罗洲)、东亚(如中国)及东北亚(如日本)[16,17]。东方蜜蜂DNA分子标记(线粒体还原型烟酰胺腺嘌呤二核苷酸脱氢酶亚基-5基因和染色体延伸生长因子-1α基因内含子)多态性分析的研究结果,提供了东方蜜蜂起源于亚洲的遗传学证据[17]。
鉴于西方蜜蜂的自然分布地域涉及非洲、欧洲以及中东地区,有关于西方蜜蜂分子进化论存在诸多争议[18,19]。有些分学者依据西方蜜蜂形态变异分析的研究结果,认为西方蜜蜂起源于中东地区西北部(即西亚)乃至非洲东北部;其中,一部分祖先族群沿安托利亚高原扩展过程中自然分布于东部欧洲,另外一部分祖先族群沿直布罗陀海峡和伊比利亚半岛扩展过程中自然分布于西部欧洲。另一些学者依据西方蜜蜂线粒体基因组序列分析的研究结果,认为西方蜜蜂起源于中东地区的东北部及其中亚周边地区;其中,一部分祖先族群沿安托利亚高原和博斯普鲁斯海峡扩展过程中自然分布于东部欧洲,另外一部分祖先族群沿欧、亚分界线扩展过程中自然分布于西部欧洲,还有一部分祖先族群沿亚、非分界线扩展过程中自然分布于非洲。还有一些学者依据西方蜜蜂基因组1136个单核苷酸多态性位点多态性分析的研究结果,认为西方蜜蜂起源于中部非洲;其中,一部分祖先族群沿亚、非分界线扩展过程中自然分布于东部欧洲和西亚,另外一部分祖先族群沿非、欧分界线扩展过程中自然分布于西部欧洲。
最近,Wallberg等通过全基因组序列测定方法对来自世界各地140个西方蜜蜂样本进行重测序[20]。依据西方蜜蜂基因组830万个单核苷酸多态性位点多态性分析的研究结果,认为西方蜜蜂起源于亚洲而不是非洲。在方法学上,生物样品全基因组序列分析的关键技术是DNA芯片设计,伴随“大数据系统”和“互联网+”的技术进步,西方蜜蜂分子进化的谜底终将被揭开。
[1]Jung C,Jeong S,Lee C.Keeping economy in Korea:from income generation to ecosystem service[M].Daejeon(Republic of Kores):Scientific Program Abstract,44 Apimondia International Apicultural Congress,2015:114.
[2]Minsuk O,Lee S.Beekeeping of Apis cerana in Korea peninsula:history,present and future[M].Daejeon(Republic of Kores):Scientific Program Abstract,44 Apimondia International Apicultural Congress,2015:346.
[3]Park D,Jung JW,Choi BS,et al.Uncovering the novel characteristics of Asian honey bee,Apis cerana,by whole genome sequencing[J].BMC Genomics.2015,16:1-16.
[4]Jayakodi M,Jung JW,Park D,et al.Genome-wide characterization of long intergenic non-coding RNAs(lincRNAs)provides new insight into viral diseases in honey bees Apis cerana and Apis mellifera[J].BMC Genomics.2015,16(1):680.
[5]Honeybee Genome Sequencing Consortium.Insights into social insects from the genome of the honeybee Apis mellifera[J].Nature, 2006,443(7114):931-949.
[6]Elsik CG,Worley KC,Bennett AK,et al.Honey Bee Genome Sequencing Consortium.Finding the missing honey bee genes: lessons learned from a genome upgrade[J].BMC Genomics,2014, 15:86.
[7]Solyom S,Kazazian HH Jr.Mobile elements in the human genome:implications for disease[J].Genome Med.2012,4(2):12.
[8]赵寿元.遗传工程词典[M].上海(中国):复旦大学出版社, 1999:321-396.
[9]Crozier RH,Crozier YC.The mitochondrial genome of the honeybee Apis mellifera L.:complete sequence and genome organization[J].Genetics,1993,133:97-117.
[10]Tan HW,Liu GH,Dong X,et al.The complete mitochondrial genome of the Asiatic cavity-nesting honeybee Apis cerana(Hymenoptera:Apidae)[J].PLoS One.2011,6(8):e23008.
[11]Evans JD,Aronstein K,Chen YP,et al.Immune pathways and defence mechanisms in honey bees Apis mellifera[J].Insect Mol Biol,2006,15(5):645-656.
[12]Le Conte Y,Alaux C,Martin JF,et al.Social immunity in honeybees(Apis mellifera):transcriptome analysis of varroa-hygienic behaviour[J].Insect Mol Biol.2011,20(3):399-408.
[13]Xu P,Shi M,Chen XX.Antimicrobial peptide evolution in the Asiatic honey bee Apis cerana[J].PLoS One.2009,4(1):e4239.
[14]Park D,Jung JW,Lee MO,et al.Functional characterization of naturally occurring melittin peptide isoforms in two honey bee species,Apis mellifera and Apis cerana.Peptides.2014,53:185-193.
[15]Oldroyd BP,Nanork P.Conservation of Asian honey bees[J]. Apidologie,2009,40:296-312.
[16]Gupta RK.Beekeeping for Poverty Alleviation and Livelihood Security[M].Berlin(Germany):Springer Science+Business Media Dordrecht,2014:63-103.
[17]Arias MC,Sheppard WS.Phylogenetic relationships of honey bees DNA sequence data[J].Mol Phylogenet Evol,2005,37:25-35.
[18]Han F,Wallberg A,Webster MT.From where did the Western honeybee(Apis mellifera L.)originate[J]Ecology and Evolution, 2012,2(8):1949-1957.
[19]Whitfield C W,Behura S K,Berlocher S H,et al.Thrice out of Africa:Ancient and recent expansions of the honey bee,Apis mellifera[J].Science,2006,314:642-645.
[20]Wallberg A,Han F,Wellhagen G,et al.A worldwide survey of genome sequence variation provides insight into the evolutionary history of the honeybee Apis mellifera[J].Nature genetics,2014,46 (10):1081-1088.
Review of genome bioinformatics datasets for two species of honey bee, Apis cerana and Apis mellifera
Li Xing'an1,Xue Yunbo1,Liu zhenguo2
(1 Jilin Provincial Institute of Apicultural Science,Jilin 132108;2 Shandong Agricultural University,Tai'an 271018)
Two species of honey bee,Apis cerana and Apis mellifera,are often considered to be the representative in Apis genus.Here,to understand these two honey bee species at genome level,three main issues on honey bee are reviewed from genome-scale datasets in bioinformatics,including sequence pattern of genome,immuno-related genes and molecular evolution.
Apis cerana,Apis mellifera,sequence pattern of genome,immuno-related genes,molecular evolution
国家蜂产业技术体系建设专项资金资助项目(CARS-45-KXJ2);吉林省科技发展计划资金资助项目(No.20100719;20110580;20140101132JC)
李兴安(1965-),男,研究员,E-mail:Lxingan@sina.com