食蟹猴全基因组微卫星分布特征分析
2018-06-26涂飞云韩卫杰黄晓凤
涂飞云 刘 俊 韩卫杰 黄 挺 黄晓凤*
(1.江西省林业科学院,南昌,330013;2.四川大学生命科学学院,四川省濒危野生动物保护生物学重点实验室,成都,610064)
微卫星又称为简单序列重复(simple sequence repeats,SSRs),是指由1~6个核苷酸为基本组成单元的串联重复序列[1],广泛存在于真核生物和原核生物基因组中[2]。微卫星具有分布广、选择中性、多态性高、共显性遗传等特点,是比较理想的分子标记,被广泛应用于遗传图谱构建、个体识别、群体遗传结构分析以及疾病研究等。
食蟹猴(Macaca fascicularis)分类上属猴科(Cercopithecidae)猴属物种,是被列入CITES附录Ⅱ的保护物种,也被当作灵长类动物模型应用于生物医药及疾病研究。关于微卫星标记用于食蟹猴群体遗传多样性有少量的报道。李瑞生等[3]利用15个多态性微卫星位点分析了食蟹猴群体间的遗传多样性。禹文海等[4]利用19个微卫星标记对恒河猴(Macaca mulatta)遗传多样性水平进行了评估。刘欢[5]利用微卫星标记我国笼养的食蟹猴种群的遗传多样性。皮道元等[6]利用11个微卫星标记分析了4个食蟹猴群落的遗传多样性。有关食蟹猴全基因组微卫星数量及分布特征研究,有助于筛选和开发更多的微卫星标记。本研究分析了食蟹猴各重复类型微卫星数量、分布以及微卫星数量与染色体GC含量、微卫星GC含量的关系,旨在为食蟹猴微卫星标记的筛选和开发提供参考依据。
1 研究方法
1.1 基因组序列
雌性食蟹猴全基因组下载自ftp:∥ftp.ncbi.nih.gov/genomes/Macaca_fascicularis/,基因组全长大小约为2.92 Gb,未定位到染色体上的序列约93.3 Mb,占整个基因组序列的1.96%。
1.2 数据分析
利用微卫星搜索及统计软件MSDB(2.4版本)对全基因组微卫星进行搜索[7],搜索设置为默认模式,即Perfect Search,最小重复次数分别是12、7、5、4、4和4。同时,利用编制的perl脚本将可循环的SSR序列及其互补的SSR序列合并为一类,如ACT重复拷贝类别,可以与之合并为一类的重复拷贝类别是TGA、CTA、GAT、TAC和ATG。为了研究微卫星丰度和密度与染色体GC含量,微卫星GC含量的关系,本研究利用DNASTAR中的EditSeq计算序列GC含量。
2 结果
2.1 食蟹猴各重复类型微卫星分布特征
食蟹猴基因组中微卫星总数为1284929个,长度是26044651 bp,占全基因组的0.890%。食蟹猴基因组微卫星的平均丰度(451.3个/Mb)和平均密度(9118.7 bp/Mb)。食蟹猴基因组不同重复类型微卫星表现为单碱基(56.74%)>四碱基(16.72%)>二碱基(16.67%)>三碱基(5.96%)>五碱基(3.35%)>六碱基(0.56%)。食蟹猴基因组不同染色体上微卫星数量上,以1号最多,其次是3号、2号,最少的是18号、19号。
2.2 食蟹猴染色体微卫星丰度、密度与GC含量关系
食蟹猴基因组染色体上微卫星丰度与染色体GC含量呈显著线性正相关(r=0.838,P<0.01),微卫星密度和染色体GC含量呈正相关(r=0.819,P<0.01)。本研究同样调查了食蟹猴基因组各染色体上微卫星丰度、密度和微卫星GC含量的关系,各染色体上微卫星丰度与其微卫星GC含量呈显著线性负相关(r=-0.876,P<0.01),各染色体上SSR密度和各染色体上微卫星GC含量同样呈显著线性负相关(r= -0.849,P <0.01)。
表1 食蟹猴不同染色体上不同重复类型微卫星数量的分布特点Tab.1 Distribution of SSRs in each chromosome of Macaca fascicularis
2.3 食蟹猴重复拷贝类别分析
食蟹猴有208种重复拷贝类别。出现次数最多的10种重复拷贝类别见表2,其中排名前5位的拷贝类别依次是A、AC、AAAT、AG、AT(表2)。食蟹猴微卫星,其中单碱基以A占绝对优势,二碱基AC占优势,其次是AG,三碱基以AAT、AAC数量多,四碱基则以AAAT占优势,五碱基AAACA,六碱基AAACAA最多。
表2 出现次数最多的10种重复拷贝类别Tab.2 The ten SSRs repeat type motifs occurs most frequently
3 讨论
本研究利用生物信息学方法搜索、统计、分析了食蟹猴全基因组微卫星数量、分布特征。食蟹猴全基因组中微卫星总数为1284929,其序列长度占全基因组的0.890%。食蟹猴微卫星序列长度所占比例高于偶蹄目(Artiodactyla)某些物种(如猪Sus scrofa、牛Bos taurus、牦牛 Bos mutus、水牛 Bubalus bubalis、绵羊Ovis aries、山羊Capra hircus和藏羚羊Pantholops hodgsonii)[8-11]、食肉目(Carnivora) 的大熊猫(Ailuropoda melanoleuca)、北极熊(Ursus maritimus)[12]和灵长目(Primates)的恒河猴[13],但低于啮齿目(Rodentia)的大鼠(Rattus norvegicus) 和小鼠(Mus musculus)[14-15]。可见,食蟹猴全基因组微卫星较为丰富。
大量的研究表明染色体长度与其微卫星数量呈显著线性正相关[8-9,12-13,15],本研究同样支持该结论。另外,本研究调查了各染色体长度与不同重复类型微卫星数量的关系,表明染色体长度与单碱基、二碱基、三碱基、四碱基、五碱基、六碱基微卫星数量都呈显著线性正相关(P<0.01),进一步支持 Hancock[16]等的假说,反映了不同重复类型微卫星在染色体上分布具有随机性。
GC含量是生物体核酸序列重要组成部分,其含量的变化与基因密度、重复元件分布等密切相关[17-18]。Qi等[19]研究表明牛、绵羊、山羊全基因组微卫星丰度、密度与染色体上GC含量显著负相关(P<0.01),而牦牛、水牛、藏羚羊未发现相关关系。本研究表明食蟹猴基因组微卫星丰度、密度与染色体上GC含量呈显著正相关(P<0.01),这可能是物种差异或个体差异引起的,但需要更多的研究来证实。另外,食蟹猴染色体上微卫星丰度、密度与微卫星GC含量呈显著线性负相关(P<0.01),与恒河猴的结果一致[13]。
本研究微卫星以单碱基A数量最多,与猪、牛和绵羊、大熊猫和北极熊结果一致[8-9],而有别于某些啮齿动物以二碱基占优势[15,20]。不同重复优势拷贝类型,除四碱基外,其余单碱基、二碱基、三碱基、五碱基、六碱基的优势拷贝类型与恒河猴是一致的[13],其原因可能是食蟹猴和恒河猴的亲缘关系近[21],在历史上可能发生过杂交[22]。
有研究表明四碱基微卫星比二碱基、三碱基更为准确和可靠[23-24]。与恒河猴相比,食蟹猴四碱基微卫星数量高于二碱基;Bonhomme等[25]利用15个现代人的微卫星标记对13个猴科物种实现了跨物种应用,其中9个微卫星标记为四碱基微卫星。因此,猴科动物中应用四碱基建库可能是不错的选择。
目前,利用生物信息学方法对基因组进行搜索,筛选稳定的多态性微卫星位点有较好的应用。Huang等[24]利用生物信息学方法对大熊猫基因组微卫星进行了搜索,并从四碱基微卫星中挑选设计出160对微卫星引物,最终筛选出15对稳定的微卫星多态性引物。都玉蓉等[26]同样基于生物信息学方法对藏羚羊基因组进行了微卫星进行扫描,并从随机挑选出的100个微卫星座位中,筛选到8个具有多态性的微卫星位点。本研究对食蟹猴的全基因组微卫星进行了搜索、统计与分析,期望能用于食蟹猴多态性微卫星筛选。
[1] Li Y C,Korol A B,Fahima T,et al.Microsatellites:genomic distribution,putative functions and mutational mechanisms:a review[J].Molecular Ecology,2002,11(12):2453-2465.
[2] Tautz D.Hypervariability of simple sequences as a general source for polymorphic DNA markers[J].Nucleic Acids Research,1989,17(16):6463-6471.
[3] 李瑞生,赵爽,高蓉,等.恒河猴与食蟹猴微卫星DNA多态性的比较分析[J].中国实验动物学报,2009,17(1):57-60.
[4] 禹文海,和占龙,鲁绍雄,等.基于微卫星DNA标记的恒河猴遗传多样性研究[J].中国比较医学杂志,2013,23(3):21-25.
[5] 刘欢.我国笼养食蟹猴种群遗传多样性与亲子鉴定研究 [D].哈尔滨:东北林业大学,2010.
[6] 皮道元,谢利萍,卢晟盛,等.利用微卫星标记分析4个食蟹猴群体的遗传多样性[J].中国兽医学报,2011,31(3):444-448.
[7] Du Lianming,Li Yuzhi,Zhang Xiuyue,et al.MSDB:a user -friendly program for reporting distribution and building databases of microsatellites from genome sequences[J].Journal of Heredity,2013,104(1):154-157.
[8] 戚文华,蒋雪梅,肖国生,等.牛和绵羊全基因组微卫星序列的搜索及其生物信息学分析 [J].畜牧兽医学报,2013,44(11):1724-1733.
[9] 戚文华,蒋雪梅,肖国生,等.猪全基因组中微卫星分布规律[J].畜牧与兽医,2014,46(8):9-13.
[10] 戚文华,蒋雪梅,杜联明,等.牦牛和水牛全基因组微卫星分布规律及其比较分析[J].基因组学与应用生物学,2015,34(7):1406-1412.
[11] 戚文华,严超超,肖国生,等.山羊和藏羚羊全基因组微卫星分布规律及其生物信息学分析[J].四川大学学报:自然科学版,2016,53(4):937-944.
[12] 李午佼,李玉芝,杜联明,等.大熊猫和北极熊基因组微卫星分布特征比较分析[J].四川动物,2014,33(6):874-878.
[13] Xu Yongtao,Hu Zongxiu,Wang Chen,et al.Characterization of perfect microsatellite based on genome-wide and chromosome level in rhesus monkey(Macaca mulatta) [J].Gene,2016,592(2):269-275.
[14] 童晓玲,代方银,李斌,等.小鼠基因组中的微卫星重复序列的数量、分布和密度 [J].动物学报,2006,52(1):138-152.
[15] 涂飞云,刘晓华,杜联明,等.大鼠全基因组微卫星分布特征研究[J].江西农业大学学报,2015,37(4):708-711.
[16] Hancock J M.Simple sequences and the expanding genome[J].Bioessays,1996,18(5):421 -425.
[17] Galtier N,Piganeau G,Mouchiroud D,et al.GC-content evolution in mammalian genomes:the biased gene conversion hypothesis [J].Genetics,2001,159(2):907 -911.
[18] Jabbari K,Bernardi G.CpG doublets,CpG islands and Alu repeats in long human DNA sequences from different isochore families [J].Gene,1998,224(1/2):123-128.
[19] Qi Wenhua,Jiang Xuemei,Du Lianming,et al.Genome-wide survey and analysis of microsatellite sequences in Bovid species [J].PLoS One,2015,10(7):e0133667.
[20] Tóth G,Gáspári Z,Jurka J.Microsatellites in different eukaryotic genomes:survey and analysis[J].Genome Research,2000,10(7):967-981.
[21] 王文,宿兵,杨凤堂,等.中国猕猴类的分子进化与遗传多样性[M]∥胡志昂,张亚平.中国动植物的遗传多样性.杭州:浙江科学技术出版社,1997:66-87.
[22] Yan Guangmei,Zhang Guojie,Fang Xiaodong,et al.Genome sequencing and comparison of two nonhuman primate animal models,the cynomolgus and Chinese rhesus macaques[J].Nature Biotechnology,2011,29(11):1019-1023.
[23] Archie E A,Moss C J,Alberts S C.Characterization of tetranucleotide microsatellite loci in the African savannah elephant(Loxodonta africana africana) [J].Molecular Ecology Resources,2003,3(2):244-246.
[24] Huang Jie,Li Yuzhi,Du Lianming,et al.Genome-wide survey and analysis of microsatellites in giant panda(Ailuropoda melanoleuca),with a focus on the applications of a novel microsatellite marker system [J].BMC Genomics,2015,16(1):61.
[25] Bonhomme M,Blancher A,Crouau-Roy B.Multiplexed microsatellites for rapid identification and characterization of individuals and populations of Cercopithecidae[J].American Journal of Primatology,2005,67(3):385-391.
[26] 都玉蓉,谭春敏,徐永涛,等.藏羚羊基因组微卫星分析与初步验证 [J].四川动物,2016,35(6):845-851.