APP下载

比较串联重复序列在玉米及高粱染色体上的差异

2015-12-16赵志新李浩

商洛学院学报 2015年6期
关键词:模体核苷酸高粱

赵志新,李浩

(商洛学院生物医药与食品工程学院,陕西商洛726000)

比较串联重复序列在玉米及高粱染色体上的差异

赵志新,李浩

(商洛学院生物医药与食品工程学院,陕西商洛726000)

串联重复序列广泛分布于真核生物,特别是植物中,为了比较其在禾本科植物染色体中的分布及差异,使用Phobos软件分析了玉米和高粱全基因组数据。结果显示,重复序列主要为短序列重复(<=6 bp),其中尤以二核苷酸和三核苷酸重复序列密度最高。玉米和高粱的二核苷酸重复单元都以AT重复为主,而其三核苷酸重复单元不尽相同;玉米主要以CCG极其互补序列CGG重复居多,而高粱以ATT极其互补序列AAT重复为主。并且玉米及高粱串联重复序列主要分布于染色体两端。对于理解串联重复序列在玉米及高粱染色体上的分布做了初步分析,研究揭示串联重复序列主要特征及分布位置,对重复序列在禾本科植物基因组中的研究具有借鉴作用。

串联重复序列;染色体;玉米;高粱

以各自的核心序列(重复单元)首尾相连多次重复称之为串联重复序列(Tandem repeats,TRs)。TRs广泛存在于真核生物和部分原核生物基因中,植物基因组的重复序列一般占80%左右,它们在基因组中表现出种属、碱基组成等特异性,同时在基因组中的存在亦有很大差异[1]。研究表明,重复序列在维持染色体的空间结构、基因表达以及遗传重组中都具有重要作用[2]。这些重复序列的类型和各重复拷贝类别在同一物种不同染色体间以及基因的编码区和非编码区也有种属和碱基组成的差异。这些差异显示了重复序列起源和进化的复杂性,它可能涉及到多种因素,并与生物功能密切相关[3]。对重复序列的深入研究能进一步了解重复序列在基因组进化中的作用,及其在基因组中的生物学功能等[4]。目前,重复序列的研究主要集中在染色体和基因这两大方面,本研究首先探查TRs在基因组中的密度含量及主要的重复模体,然后检测TRs在染色体上的分布,以期推测其在生物体及进化中的作用。

1 材料与方法

1.1 玉米及高粱全基因组数据收集

玉米(Zea mays)和高粱(Sorghum bicolor)的全基因组数据下载于Phytozome(http://www.phytozome.net)数据库,使用目前最新的Phytozome v10版本的数据。

1.2 研究方法

使用重复序列扫描软件Phobos version 3.3.12[4];扫描1-50 bp的重复单元(repeat unit),要求最短重复长度为12 bp;如有mismatch/ indel,则要求序列至少具有95%的保真度;然后将获得的数据使用Perl编写的程序处理。

对于循环的串联重复序列,依据字母顺序选定重复模体(repeat motif),如AAG,AGA和GAA为(AAG)n的重复模体。由于玉米高粱的基因组很大,因此罗列出其串联重复序列的具体数值是不现实的,因此引进一个比较适宜的统计方法,即通过比较两者的串联重复序列密度(TR density)来实现,就是每兆序列中含有的串联重复序列的长度(bp·Mbp-1)。

为了方便统计出TRs在玉米及高粱每条染色体中的具体分布,将玉米和高粱每条染色体分为1-100个单位(即百分化),然后据此分为10等份(1-10,11-20,…,91-100)来比较在每一位置中含有TRs的数量。

2 结果与分析

2.1 玉米基因组中1-50 bp TRs的密度分布

在玉米的基因组中,高密度的TRs(>400 bp·Mbp-1)全部为短重复单元(1-6 bp,如图1),其中尤其以二核苷酸以及三核苷酸重复单元为主,占总密度的24.3%。总体来看,随着重复单元的增大,密度逐渐降低,但某些重复单元(譬如6 bp,12 bp以及50 bp)虽然较长,却比其相近重复单元密度要高。由此可见,重复单元密度分布并非随机出现,而应该是基因组进化选择的结果。

图1 玉米基因组中TRs密度分布

对于占总密度近1/4的二核苷酸以及三核苷酸重复单元,其具体重复模体见图2。研究结果显示,二核苷酸重复单元主要以AT重复为主,占总重复模体的35.9%;而三核苷酸重复单元主要为CCG及其互补模体CGG为主,占总重复模体的34.4%。

图2 重复模体在玉米基因组中密度分布

2.2 高粱基因组中1-50 bp TRs的密度分布

在高粱的基因组中,高密度的TRs(>250 bp·Mbp-1)主要为短序列重复单元(1-6 bp,除了21bp,如图3),类似于玉米,二核苷酸和三核苷酸重复单元密度为第一、第二高,占总体密度的32.2%。虽然随着重复单元变长,密度逐渐下降;但在高粱基因组中,部分长重复单元(例如21 bp和38 bp)仍然有较高密度(为510 bp·Mbp-1和123 bp·Mbp-1)。这些具有高密度的长重复单元可能是基因组进化选择的结果,而不太可能是随机产生的。

图3 高粱基因组中TRs密度分布

对于具有高密度的二核苷酸和三核苷酸重复单元,如图4显示,其重复模体的密度。分析结果显示高粱的二核苷酸重复模体与玉米相类似,主要为AT重复,占总重复模体的66.5%;而三核苷酸重复模体则不同于玉米,主要为ATT及其互补序列AAT重复,占总重复模体的21.6%。

2.3 TRs在玉米和高粱染色体组的分布

玉米和高粱各有10条染色体,将每条染色体分为10个等分区间,通过TRs在每个区间所占的百分比含量来比较染色体上的分布差异。结果如图5所示,TRs在玉米和高粱的10条染色体上的分布趋势相一致,主要存在于染色体两端(>10%),而染色体中间含量较低(~5%)。

图5 TRs在玉米和高粱染色体中的分布

3 结论与讨论

TRs在玉米和高粱基因组中密度分布总体趋势是一致的,主要富集区域都集中于1-6 bp·Mbp-1重复单元,并且玉米及高粱的二核苷酸重复序列的重复模体都是以AT重复为主,虽然它们的三核苷酸重复模体不尽相同,玉米主要以CCG及其互补序列CGG为主,而高粱则以ATT以及其互补序列AAT居多。并且有些长的重复单元具有较高的密度,特别是在高粱中,显示重复序列具有生物学功能,而不是“垃圾DNA”,是进化选择的结果[5]。Mayer等[4]研究显示,长重复单元(7-50 bp)在有较高的密度值和特定的生物学功能。

富含TRs的区域大多集中在染色体的两端,而染色体两端是端粒所在位点,端粒本身的结构组成也是串联重复序列。因此,串联重复序列可能与端粒的形成有密切联系,亦可能影响端粒的结构、长度,从而影响整个染色体的稳定性。以玉米为例,其核糖体DNA中的45S rDNA存在于第6染色体前臂上,而5S rDNA位于第2染色体长臂近末端[6];显示存在于染色体两端的部分串联重复序列可能像核糖体DNA一般,可能是组成影响生物一系列生理活动的蛋白或结构。重复序列在参与染色体重组及端粒末端复制等过程中起到一些关键作用[7-8],由此可推测玉米、高粱产生的生理差异可能跟在染色体两端富集的串联重复序列含量有关联。

[1]Gemayel R,Vinces M D,Legendre M,et al.Variable tandem repeats accelerate evolution of coding and regulatory sequences[J].Annu Rev Genet,2010,44: 445-477.

[2]艾对元.基因组中重复序列的意义[J].生命的化学,2008,28(3):343-345.

[3]高焕,孔杰.串联重复序列的物种差异及其生物功能[J].动物学研究,2005,26(5):555-564.

[4]Mayer C,Lease F,Tellurian R.Genome-wide analysis of tandem repeats in Daphnia poleax-a comparative approach[J].BMC Genomics,2010,1:277-304.

[5]Zhao Z X,Guo C,Sutharzan S,et al.Genome-wide analysis of tandem repeats in plants and green algae[J].G3:Genes Genomes Genetics,2014,4(1):67-78.

[6]韩永华,宋运淳,金危危.玉米基因组重复序列的研究进展[J].玉米科学,2007,15(4):37-40.

[7]高武军,谢璐,卢靖雯,等.重复序列及染色质化在植物性染色体重组抑制中的作用[J].遗传,2010,32(1): 25-30.

[8]汤继华,马西青,滕文涛,等.玉米简单重复序列不对等交换的热点区域定位[J].科学作报,2009,35(5):958-961.

(责任编辑:李堆淑)

Com parison of Differences of Tandem Repeats in Chromosomes of M aize and Sorghum

ZHAO Zhi-xin,LI Hao
(College of Biopharmaceutical and Food Engineering,Shangluo University,Shangluo 726000,Shaanxi)

Tandem repeats(TRs)are detected widely in eukaryotes,especially in plants,the research is designed to investigate TRs in maize and sorghum genome by Phobos in order to compare and analyze the distribution and differences of TRs in Gramineae.Results showed that the TRs are mainly short repeat unit (<=6 bp),especially for the dinucleotide and trinucleotide.For repeat motifs,both maize and sorghum utilize AT motif in the dinucleotide repeat unit,yet in the trinucleotide repeat unit maize mainly employs CCG and its complementary CGG motifs,sorghum has ATT and its complementary AAT.In addition,the distribution of TRs in maize and sorghum demonstrates that TRs are mainly located in the both ends of chromosomes.The research analyzed the distribution of TRs in chromosomes in maize and sorghum primarily,and revealed the main features and distribution position in chromosomes,which is beneficial to the understanding of the TRs in Gramineae genome.

tandem repeats;chromosomes;maize;sorghum

S51

A

1674-0033(2015)06-0059-04

10.13440/j.slxy.1674-0033.2015.06.014

2015-10-13

商洛学院科研基金项目(14SKY028)

赵志新,男,河南滑县人,博士,讲师

猜你喜欢

模体核苷酸高粱
单核苷酸多态性与中医证候相关性研究进展
高粱名称考释
徐长风:核苷酸类似物的副作用
高粱红了
金秋时节高粱红
基于Matrix Profile的时间序列变长模体挖掘
Acknowledgment to reviewers—November 2018 to September 2019
植入(l, d)模体发现若干算法的实现与比较
基于网络模体特征攻击的网络抗毁性研究
基于模体演化的时序链路预测方法