普通鸬鹚基因组微卫星分布规律研究
2020-02-21杨承忠
黄 杰 刘 磊 杨 波 杨承忠
(1.商丘师范学院 生物与食品学院,商丘,476000;2.中国大熊猫保护研究中心,都江堰,611830;3.重庆师范大学,生命科学学院,重庆市动物生物学重点实验室,重庆,401331)
微卫星(Microsatellite),是基因组中以少数几个核苷酸(一般1—6个)为基本短重复单元组成的DNA串联重复序列[1]。微卫星标记具有序列短、突变率高、选择中性、多态性丰富、通用性强、分布广泛、数量众多、检测容易、重复性好等特点,被广泛用于物种的遗传学研究[2]。近年来常被用于动物的亲权鉴定[3]、个体识别[4]、连锁分析[5]、物种进化[6]、指纹分析[7]、遗传疾病[8]等方面的研究。
普通鸬鹚(Phalacrocoraxcarbo),又名鸬鹚、大鸬鹚,隶属于鹈形目(Pelecaniformes),鸬鹚科(Phalacrocoracidae),鸬鹚属,是一种极为常见的海鸟,全身为带金属光泽的蓝黑色,眼和嘴后方的裸露皮肤黄色,并有宽广的白带[9]。普通鸬鹚广泛分布于世界各地,繁殖于中国各地的适宜生境,种群的数量趋于稳定,属低危(LC)物种[10]。
目前国内外学者对普通鸬鹚的研究主要集中于其繁殖期对筑巢树的选择[11]、营养级结构分析[12]、线粒体基因组分析[13]、粪便寄生虫研究[14]等,而有关普通鸬鹚基因组微卫星分布规律迄今知之甚少。近年来,由于栖息地破碎化、环境污染和大量的人为捕猎,普通鸬鹚的数量逐渐下降,因此对普通鸬鹚的保护显得尤为重要。生物多样性保护是物种保护的重要方面,其中,遗传多样性降低会使物种的适应环境能力和抵抗疾病的能力明显下降[15]。目前,国内外学者主要通过蛋白质[16]、线粒体DNA[17]、MHC基因[18]、微卫星DNA[19]、SNPs[20]等一系列分子标记进行种群遗传多样性研究。本研究是在普通鸬鹚基因组水平上,对其微卫星进行搜索,进而分析其分布情况,为今后建立完整的普通鸬鹚种群遗传背景资源库、个体识别、遗传多样性分析等相关方面的研究提供基础资料。
1 材料和方法
1.1 材料
本研究中普通鸬鹚基因组序列下载自http://www.diark.org/diark/species网站,该基因组序列大小约1.0 GB,下载的所有序列均以FASTA格式进行保存,以备分析。
1.2 方法
采用微卫星搜索及统计软件MSDB v2.4(http://msdb.Biosv.com)[21],对普通鸬鹚基因组的序列进行搜索和统计,获得微卫星相关类型和重复数量等信息。
本研究微卫星序列分析用到如下术语:
(1)重复类型:即重复序列中的每个重复单元的碱基数,现研究的微卫星的重复类型有6种。
(2)重复拷贝类别:是每种重复类型不同的碱基组合。
(3)重复拷贝数:即每个重复拷贝类别的重复数,如(GTC)12表示GTC重复拷贝数为12。
(4)重复数目:每种重复拷贝类别在基因组中的数目[22]。
(5)丰度:指1Mb基因组序列中微卫星数量,单位(个/Mb)。
(6)密度:指1Mb基因组序列中微卫星总长度,单位(bp/Mb)。
1.3 统计标准:
单碱基重复序列拷贝数≥12;二碱基重复序列拷贝数≥7;三碱基重复序列拷贝数≥5;四碱基、五碱基和六碱基重复序列拷贝数均≥4。本研究中,将所有与其互补的序列和可循环的序列分为同一类型,如三碱基重复ACT与ACT、CTA、TAC、TGA、GAT、ATG可合并为同一类型,因此,单碱基重复类型有2种,二碱基有4种类型,三碱基有10种类型,四碱基有33种类型,五碱基有102种类型,六碱基有350种类型[23]。
2 结果与分析
2.1 各类型微卫星重复序列数目和相应的百分比
普通鸬鹚基因组序列中,用MSDB v2.4微卫星搜索软件共搜索到135 498个不同类型重复序列,总长度约为2 304 711 bp。所有的重复类型如表1所示,单碱基重复数目最多,为102 005个,总长度为1 466 603 bp,丰度为102.8个/Mbp,占重复类型总数目的75.3%;其次是四碱基重复类型,为10 663个,总长度为289 560 bp,丰度为10.8个/Mbp,占重复类型总数目的7.8%;二碱基重复类型,为9 399个,总长度为160 132 bp,丰度为9.5个/Mbp,占重复类型总数目的6.9%;三碱基重复类型,为8 813个,总长度为152 043 bp,丰度为8.9个/Mbp,占重复类型总数目的6.5%;五碱基重复类型,为4 004个,总长度为203 835 bp,丰度为4.0个/Mbp,占重复类型总数目的3.0%;最少的是六碱基重复类型,为614个,总长度为32 538 bp,丰度为0.6个/Mbp,仅占重复类型总数目的0.5%。
表1 不同重复类型的微卫星在普通鸬鹚基因组的分布情况
Tab.1 Distribution of SSR for different repeat types in genomic of Phalacrocorax carbo
2.2 各重复类型拷贝数的数量分布
如表2所示,在单碱基重复类型中,拷贝类别为A的重复数目最多,为98 605个,所占比例为96.67%;在二碱基重复类型中,拷贝类别为AC的重复数目最多,为5 206个,所占比例为55.39%,其次是AT重复拷贝类别,数目为2 501,占二碱基重复序列总数目的26.61%;在三碱基重复类型中,拷贝类别为AAT的重复数目最多,为2 667个,所占比例为30.26%,其次是AAC重复拷贝类别,数目为1 783,占三碱基重复序列总数目的20.23%;在四碱基重复类型中,拷贝类别为AAAC的重复数目最多,为3 275个,所占比例为30.74%,其次是AAAT重复拷贝类别,数目为1 950,占四碱基重复序列总数目的18.30%。
2.3 不同重复拷贝类型的重复次数分布
如图1所示,在普通鸬鹚基因组中微卫星数量最多的前16种重复拷贝类别依次为A、AC、C、AAAC、AAT、AT、AAAT、AAC、AG、AGG、AAAG、AAGG、ACC、ACG、AACC、AGC。其中均为单碱基、二碱基、三碱基和四碱基重复类型,而且这些重复拷贝类别的微卫星数量都在500个以上,总数是126 226个,占所搜索到的微卫星重复拷贝类别总数的93.32 %,而其他所有拷贝类别仅占6.68%。
3 讨论
本研究利用微卫星搜索软件,对普通鸬鹚基因组微卫星序列的种类、数量等分布特征进行了统计和分析。1.0 Gb的普通鸬鹚基因组序列中搜索到135 498个不同类型重复序列,总长度约为2 304 711 bp,占到整个基因组序列长度的0.23% 。与牛Bostaurus(4.7%)[24],绵羊Ovisaries(4.8%)[24],北极熊Ursusmaritimus(0.79%)[25],大熊猫Ailuropodamelanoleuca(0.64%)[25]等多种哺乳动物基因组中相比,微卫星序列在普通鸬鹚基因组中分布相对较少。但与绿尾虹雉Lophophoruslhuysii(0.54%)[26],红原鸡Gallusgallus(0.49%)[27],虎皮鹦鹉Melopsittacusundulatus(0.41%)[1]等多种鸟类基因组中相比,微卫星序列在普通鸬鹚基因组中分布相差不大,这或许与哺乳动物基因组重复序列较多且较大有关。
表2 1—4碱基重复类型中各重复拷贝类别数量及其在所属类型中的比例
Tab.1 The number of repeat copy categories and the percent in their own types in 1-4 bp repeats
续表2
图1 普通鸬鹚基因组中分布最多的不同重复拷贝类型微卫星Fig.1 Distribution of the most frequent microsatellite motifs of Phalacrocorax carbo
不同物种基因组微卫星的重复类型、数量、丰度、密度等都存在很大差别[28]。在所有的微卫星重复类别中,单碱基重复类型所占的比例最高,为75.3%。这与牦牛(Bosgrunniens)[29]、红尾蚺(Boaconstrictor)[30]、原矛头蝮(Protobothropsmucrosquamatus)[30]等物种基因组中优势微卫星类型相同。这一结果表明物种基因组中单碱基微卫星类型重复偏多。其次是四碱基重复类型,所占的比例为7.8%。与二、三碱基重复类型相比,四碱基重复类型的微卫星位点在PCR过程中,不容易出现阴影带或滑带,基因分型结果更精确、更稳定,这一结果与红原鸡[27]和四川山鹧鸪(Arborophilarufipectus)[23]研究结果相同,进一步支持了鸟类基因组具有四碱基微卫星的偏好。
在单碱基重复类型中,拷贝类别为(A)n的重复数目最多,为98 605个,所占比例为96.67%。这一结果与已进行了全基因组微卫星序列分析的大多数物种的研究一致,这表明微卫星的分布对(A)n基具有偏好性。在二碱基重复类型中,拷贝类别为AC的重复数目最多,为5 206个,所占比例为55.39%,这与猪(Susscrofa)[31]、食蟹猴(Macacafascicularis)[32]、大黄鱼(Larimichthyscrocea)[33]二碱基AC重复数目的分布规律相同。CG重复拷贝类别最少,数目为21,占二碱基重复序列总数目的0.22%。一般认为,碱基的滑动有可能造成微卫星产生,而AT之间的双键比GC之间的三键较容易断裂,因而可能导致CG重复拷贝类别较少。在三碱基重复类型中,拷贝类别为AAT的重复数目最多,为2 667个,所占比例为30.26%,与绿尾虹雉[26]基因组中AAT的重复数目最多相同,然而虾虎鱼科(Gobiidae)[34]以ACT 重复拷贝类别最多,中华按蚊(Anophelessinensis)[35]中含有较多的AGC,由此可以看出,微卫星分布规律在不同物种中是有差异的。在四碱基重复类型中,拷贝类别为AAAC的重复数目最多,为3 275个,所占比例为30.74%,其次是AAAT重复拷贝类别,数目为1 950,占四碱基重复序列总数目的18.30%。这一结果与藏羚羊(Pantholopshodgsoni)[36]、德国小蠊(Blattellagermanica)[37]、食蟹猴[32]的研究结果一致。
随着生物信息学的发展,微卫星越来越受到重视,如在濒危动物保护[38]、异地保种[39]方面,通过对普通鸬鹚微卫星DNA的分布规律的分析,一方面了解了普通鸬鹚微卫星的分布特点,另一方面也为研究微卫星在基因组中的功能奠定了基础。了解普通鸬鹚中微卫星分布的特点,即为普通鸬鹚遗传多样性、物种保护、建立完整的遗传背景资源库以及不同物种微卫星的比较分析等方面提供基础理论依据。