大豆与野生大豆部分同源基因间基因置换分析
2021-11-08郭赫王希胤
郭赫 王希胤
摘 要:以大豆和野生大豆为研究对象,利用系统发育分析比较推断其最近一次加倍事件所产生的同源基因间发生基因置换的规模。结果表明,大豆中有37对同源基因间发生了基因置换,野生大豆中有33对同源基因发生了基因置换。通过对基因置换与基因在染色体上的位置关系研究发现,靠近染色体两端的基因更容易发生基因置换。
关键词:大豆;野生大豆;基因置换
文章编号: 1005-2690(2021)16-0002-03 中国图书分类号: S565.1 文献标志码: B
大豆(Glycine max)是重要的经济作物和油料作物。大豆经历过豆科共有的四倍体事件(Legume-common tetraploid,LCT)后又经历过一次大豆独有的四倍体事件(Soybean-specific tetraploid,SST)[1],是同源四倍体。目前,大豆与野生大豆(Glycine soja)的全基因组测序工作已经完成[2-3]。对大豆与野生大豆于最近一次全基因组加倍事件产生的同源基因间进行比较研究,有利于理解其基因组的进化。
全基因组加倍(whole genome duplication,WGD)即多倍化是基因复制的主要方式之一,植物的进化过程中多倍化是反复发生的,多倍化产生的大量重复基因为新功能的进化提供了原材料[4]。全基因组加倍后发生的染色体重组、基因丢失等现象对基因组结构及功能都造成很大影响[5]。
遗传重组(genetic recomnnation)作为生物进化的主要推动力之一,对DNA序列损伤的修复和同源序列间信息的传递有着重要意义[6]。很多物种多倍化后产生的同源序列之间的同源重组与经典的同源片段间重组不同,称为非正常遗传重组[7]。单向的一个基因替换其同源基因的过程称为基因置换(gene conversion)[8-9]。
1 材料和方法
1.1 物种基因组数据
豆科植物大豆和野生大豆的全基因序列由公共数据库NCBI(https://www.ncbi.nlm.nih.gov/)下载获得,包括其全基因组DNA(cds)序列、蛋白质序列(pep)以及其基因注释文件(gff3)。
1.2 基因共线性推断
首先,对大豆和野生大豆进行物种内和物种间的Blast比对分析,用以确定基因同源性;然后利用共线性分析软件ColinearScan鉴定基因是否是共线性基因,要求基因间距离大于50个基因、显著性大于1e-10,以确定大豆与野生大豆基因组内和基因组间同源基因间的共线性基因信息,然后以野生大豆全基因组基因作为参考,将其基因组内的旁系同源基因和大豆之间的直系基因按亲缘关系排列,生成共线性列表,并绘制全基因组联合比对图谱,目的在于将不同基因内及基因组间全基因加倍事件后染色体重组、基因丢失、同源基因在染色体上的分布等现象进行直观的展示。
1.3 基因置换推断
由于大豆所经历的加倍事件较多,大豆与野生大豆分离在大豆独有加倍事件之后,因此本研究只统计最近一次大豆独有加倍事件后产生的大豆与野生大豆之间、基因组内同源基因的差异。大豆中的一对旁系同源基因A1、A2以及它们所对应的野生大豆中的直系同源基因B1、B2构成同源基因“四联子”。
根据系统发育关系,利用Clustalw[10]对同源基因四联子中的基因进行多重序列比对,计算氨基酸一致性,同时分别计算两两之间的同义核苷酸置换率(Ks值),比较其Ks值大小,根据四联子中基因的相似性和Ks值的变化判断其是否发生基因置换。对发生基因置换的四联子基因用MEGAx[11]进行系统发育构树,对其系统发育树的拓扑结构变化进行研究,从而达到置换检验的目的。
2 结果分析
2.1 大豆和野生大豆中同源性
以野生大豆全基因组为参考,构建与大豆间的共线性基因图谱(图1)。圈图中的第一圈表示野生大豆的20条染色体,基于大豆与野生大豆共同经历的加倍事件,联合图谱展示了豆科和大豆独有两次加倍事件相关的同源基因的共线性关系。每一对同源基因间进行连线,不同染色体用不同颜色表示,内圈表示最近一次加倍事件产生的同源基因,外圈为较远的加倍事件产生的同源基因。由内圈的圈图可以看出,最近一次加
倍的野生大豆与大豆同源基因之间具有较完整的同源对应关系;越靠近外层的同源结构空白越多,表示同源基因丢失的越多,这是因为大豆经历的加倍事件次数较多,较为古老的加倍事件产生大量的重复基因随着物种的进化而丢失。
通过对共线性软件ColinearScan分析获得基因同源性片段和共线性列表的分析,分别统计了大豆与野生大豆基因组内、基因组间与SST加倍事件相关的同源性片段的个数和所涉及的同源基因数(见表1)。对同源基因的统计发现,大豆中保留的最近一次加倍事件相关的同源基因数量相对野生大豆更多,这可以说明大豆的基因保守性更好。
2.2 大豆与野生大豆的基因置换
分析大豆与野生大豆分歧后的基因置换规模,涉及大豆最近一次特异性全基因组加倍事件,根据共线性分析结果,得到17 306个最近一次加倍事件的同源基因四联子,每个四联子包括大豆和野生大豆的同源基因。根据同源基因间的亲缘关系,大豆与野生大豆间由物种分化产生的旁系基因对的相似性应高于大豆与野生大豆基因组内由加倍事件产生的直系基因对。但是由于基因置换,旁系基因对之间相似性变得更高。根据检验同源基因四联子之间的拓扑结构,发现37对大豆同源基因和33对野生大豆同源基因之间发生了基因置换。因此,大豆中發生基因置换的基因数量多于野生大豆。
2.3 基因置換发生的位置分析
为了分析基因置换的发生与基因在染色体上物理位置的关系,分别将大豆与野生大豆发生基因置换的基因对应到其所在染色体的物理位置,并将结果绘制了圈图进行展示(见图2)。大豆发生基因置换的基因中有50%的基因位于靠近两端10%的位置,86.46%的基因位于染色体两端20%的位置,98.69%的基因位于靠近两端30%的位置;野生大豆发生基因置换的基因中有48.48%的基因位于靠近两端10%的位置,81.81%的基因位于染色体两端20%的位置,98.48%的基因位于靠近两端30%的位置。这可以表明,靠近染色体两端的基因更容易发生基因置换。
3 讨论与结论
植物基因组在进化过程中经过一次或多次全基因组加倍事件[12- 13]。通过对禾本科物种研究发现,基因置换等非正常遗传重组的发生可以持续数千万年,进而导致水稻、高粱的同源染色体之间形成一种特殊的结构,在高粱和水稻基因组中的很多基因可能由其同源基因置换而来。
研究在大豆与野生大豆分离后的同源基因中分别发现37对和33对同源基因发生了基因置换。对大豆与野生大豆发生基因置换的同源基因对在染色体上的位置统计发现,有98%以上的基因置换发生在距离染色体两端30%的位置,这一现象表明靠近染色体两端的基因更容易发生基因置换现象,这与之前的研究结果相符合[14-15]。产生这一现象的原因是由于位于染色体两端的基因往往保留有更好的共线性,保留的同源基因数量更多,因此这个区域发生基因置换的概率更大[16]。
对大豆与野生大豆分离后基因置换的统计结果显示,在大豆与野生大豆分离后,由最后一次加倍事件形成同源四倍体基因组中的非正常遗传重组等现象还在继续发生。这一结果进一步表明在全基因组加倍事件后非正常遗传重组等现象的影响非常持久[17-19]。
参考文献:
[ 1 ] SHI X L,LING H Q.Current advances in genome sequencing of common wheat and its ancestral species[J].The Crop Journal,2018,6(1):15-21.
[ 2 ] YANTING, SHEN,JING,et al.De novo assembly of a Chinese soybean genome[J].Science China Life Sciences,2018,61(8):871-884.
[ 3 ] XIE M,CHUNG Y L,LI M W,et al.A reference-grade wild soybean genome[J].Nature Communications,2019,10(1):
85-96.
[ 4 ] XIAO G,WANG K,HUANG G,et al.Genome scale analysis of the cotton KCS gene family revealed a binary mode of action for gibberellin a regulated fiber growth [J].Journal of Integrative Plant Biology,2016,58(6):577-589.
[ 5 ] PATERSON A H,BOWERS J E,CHAPMAN B A.Ancient polyploidization predating divergence of the cereals,and its con-
sequences for comparative genomics[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101(26): 9903-9908.
[ 6 ] JIA J,ZHAO S,KONG X,et al.Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation[J]. Nature,2013,49(7443):91-95.
[ 7 ] WANG X,TANG H,BOWERS J E,et al.Comparative inference of illegitimate recombination between rice and sorghum duplicated genes produced by polyploidization[J].Genome Research,2009,19(6):1026-1032.
[ 8 ] WANG X,TANG H,BOWERS J E,et al.Extensive concerted evolution of rice paralogs and the road to regaining independence [J].Genetics,2007,177(3):1753-1763.
[ 9 ] WANG X,SHI X,LI Z,et al. Statistical inference of chromosomal homology based on gene colinearity and applications to Arabidopsis and rice[J].BMC Bioinformatics,2006,7(1):447.
[ 10 ] LARKIN M A,BLACKSHIELDS G,BROWN N P,et al. Clustal W and Clustal X version 2.0 [J].Bioinformatics,2007,23(21):2947-2948.
[ 11 ] SUDHIR,KUMAR,GLEN,et al.MEGA7:Molecular evolutionary genetics analysis version 7.0 for bigger datasets[J]. Molecular Biology Evolution,2016,33(7):1870-1874.
[ 12 ] TANG H,BOWERS J E,WANG X,et al.Synteny and collinearity in plant genomes[J].Science,2008,320(5875):
486-488.
[ 13 ] SOLTIS D E,VISGER C J,MARCHANT D B,et al.Polyploidy:Pitfalls and paths to a paradigm[J].American Journal of Bot-
any,2016,103(7):1146-1166.
[ 14 ] WANG X Y,PATERSON A H. Gene conversion in angiosperm genomes with an emphasis on genes duplicated by polyploidization[J].Genes,2011,2(1):1-20.
[ 15 ] LIU C,WANG J,SUN P,et al.Illegitimate recombination between homeologous genes in wheat genome[J].Frontiers in Plant Science,2020(11):1076.
[ 16 ] CARVALHO,BERNARDO A.The advantages of recombination[J].Nature Genetics,2003,34(2):128.
[ 17 ] JACQUEMIN J,LAUDIé M,COOKE R.A recent duplication revisited: phylogenetic analysis reveals an ancestral duplication highly-conserved throughout the Oryza genus and beyond [J]. Bmc Plant Biology,2009,9(1):146.
[ 18 ] LING H Q,ZHAO S,LIU D,et al.Draft genome of the wheat A-genome progenitor Triticum urartu[J].Science Foundation in China,2013,496(7443):87-90.
(編辑:郝焕霞)