APP下载

酵母 1号和 2号染色体 DNA的组成排列对比分析

2021-01-13刘建丽周德良靳文

关键词:酵母

刘建丽 周德良 靳文

摘 要:酵母基因与高等真核生物基因具有较高的同源性。针对酵母1号和2号染色体DNA,通过脚本程序分别计算分析了:单核苷和双核苷组成百分比;3种类型双核苷的步距频次百分比。分析发现:单核苷和双核苷组成百分比在1号和2号染色体DNA上基本相同;无论哪一种双核苷,它们在1号和2号染色体DNA上交替出现的步距频次百分比几乎相同,它们在2条染色体上的排列存在一定的相似性。上述结果说明:酵母1号和2号染色体DNA没有明显的单核苷和双核苷组成偏好,它们的单核苷和双核苷组成具有较高程度的趋同性;酵母1号和2号染色体DNA可能具有较高相似度的双核苷排列分布。上述结果或许对酵母与高等真核生物的同源性研究分析具有一定的意义和价值。

关键词:酵母;染色体DNA;组成百分比;步距频次百分比;核苷组成偏好;双核苷排列分布

中图分类号:Q811.4  文献标志码:A

基金项目:教育部全国教育科学规划资助项目(53200759777)

酵母是最简单的真核单细胞生物[1-5],其广泛分布于整个自然界,在有氧和无氧条件下均能存活。酵母是人类文明史中应用最早的微生物,也是基因克隆试验中常用的真核生物受體细胞[6-7]。近些年,随着获得更多的高等真核生物遗传信息,已经发现有更多的酵母基因与高等真核生物基因具有同源性,这也使得酵母基因组在生物信息学领域具有更加重要的作用[8-12]。相关研究已发现,人类和酵母同样存在一定的同源性,有三分之一的酵母基因可以在人类基因组中找到对应的版本,而且酵母和人类的对应蛋白,在氨基酸序列上平均重叠32%[13-17]。所以,对酵母基因组的生物信息学研究对高等真核生物的研究具有重要的意义和价值[18-19]。

本文利用生物信息学方法,通过编写脚本程序,对酵母1号和2号染色体DNA的核苷组成与排列分布进行分析研究,以获得酵母染色体DNA的核苷组成与排列特征,并在核苷组成与排列特征的基础上对酵母1号和2号染色体DNA之间的相似性和差异性进行统计分析,从而为酵母与高等真核生物基因的同源性分析提供更多的数据与技术支持。

1 数据与方法

1.1 序列提取

1.2 组成百分比

对给定的 DNA 序列,单核苷组成百分比(mononucleoside composition persentage,M)根据公式(1)进行计算:

M=N/L (1)

其中,N指某个单核苷(单核苷包括A、T、C和G共4个)在染色体DNA中出现的次数;L指染色体DNA的长度。

对给定的 DNA 序列,双核苷组成百分比(dinucleoside composition persentage,D)根据公式(2)进行计算:

D=N/(L-1) (2)

其中,N指某个双核苷(双核苷包括AA、AT、TA、TT、AC、AG、CA、GA、TC、TG、CT、GT、CC、CG、GC和GG,共16个)在染色体DNA中出现的次数,其以2 bp为窗口、1 bp为步长进行统计;L指染色体DNA的长度。

1.3 步距频次百分比

对给定的 DNA 序列,双核苷步距频次百分比(dinucleoside spacing frequency persentage,DSFP)根据公式(3)进行计算:

D=N/∑N (3)

其中,N指双核苷X和双核苷Y交替出现但出现间距为i的次数,其中X和Y可以是相同或不相同的单个双核苷,也可以是相同或不相同的多个双核苷的集合;i指X和Y交替出现的出现间距,是大于等于0的任意可能整数值(包含0),比如X和Y都是相同的单个双核苷AA,以AAACT-GAACC序列为例,AA交替出现的出现间距i分别为0和4;若X和Y都是相同的单个双核苷AC,同样以AAACTGAACC序列为例,AC交替出现的出现间距i为4;若X和Y都是AA、AT、TA、TT这4类双核苷的集合,以AAACTGATACC序列为例,AA、AT、TA、TT交替出现的出现间距i分别为0、4和0。

2 结果与分析

2.1 单、双核苷的组成分析

利用公式(1)计算酵母1号和2号染色体DNA的单核苷组成百分比(MCP),得到结果见表2。从表2发现,1号和2号染色体DNA的单核苷组成差异很小,其中单核苷A和T都是在30%左右,C和G都是在19%左右;单核苷G的组成百分比在2个染色体DNA之间的差异最大,但也只有0.89%。

利用公式(2)计算酵母1号和2号染色体DNA的双核苷组成百分比(DCP),得到结果见表3。从表3发现,1号和2号染色体DNA的双核苷组成百分比差异很小,几乎相同,其中双核苷AA、AT、TA、TT的组成百分比均占据最高的前4位,而CC、CG、GC、GG的组成百分比均占据最低的后4位;双核苷TT的组成百分比在2个染色体DNA之间的差异最大,但也只有0.42%。

从表2与表3的数据分析发现,对于酵母1号和2号染色体DNA,它们的单核苷和双核苷组成百分比基本相同,由此可以认为单核苷和双核苷组成在酵母1号和2号染色体DNA上并没有较明显的组成偏好性,它们在酵母两条染色体DNA上的组成具有较高程度的趋同性。目前已经发现有更多的酵母基因与高等真核生物基因具有同源性,我们推测,单核苷和双核苷组成应该不仅在1号和2号染色体DNA上没有较明显的组成偏好性,在全部16条染色体DNA上应该同样没有较明显的组成偏好性,这样的结果或许对高等真核生物的研究分析具有一定的意义和价值,这个工作我们将在后续工作中持续展开。

2.2 双核苷的步距频次分析

利用公式(3)分别计算酵母1号和2号染色体DNA上双核苷X和Y交替出现的步距频次百分比(D),这里双核苷X和Y均为AA、AT、TA、TT这4类双核苷的集合。同理,再分别计算:1)X和Y均为CC、CG、GC、GG这4类双核苷的集合;2)X和Y均为AC、AG、CA、GA这4类双核苷的集合;3)X和Y均为TC、TG、CT、GT这4类双核苷的集合;这3种条件下的X和Y交替出现的步距频次百分比(表4)。同时为了对步距频次实现显性分析,我们忽略了出现次数很少的出现间距i,只在表4中列出出现间距i在[0,15]间的步距频次百分比。

表4表明,AA、AT、TA、TT 在1号和2号染色体DNA上交替出现的步距频次百分比差异很小、几乎相同,它们在酵母1号和2号染色体DNA上的排列存在一定的相似性。同理,CC、CG、GC、GG,AC、AG、CA、GA,TC、TG、CT、GT在1号和2号染色体DNA上交替出现的步距频次百分比也几乎相同,它们在1号和2号染色体DNA上的排列同样存在一定的相似性。这样的结果表明,酵母1号和2号染色体DNA在一定程度上可能具有较高相似度的双核苷排列分布。

为了进一步验证上述观点,我们继续利用公式(3)分别计算酵母1号和2号染色体DNA上双核苷X和Y交替出现的步距频次百分比,这次双核苷X为AA、AT、TA、TT这4类双核苷的集合,Y为CC、CG、GC、GG这4类双核甘的集合。同时为了对步距频次实现显性分析,我们忽略了出现次数很少的出现间距i,只在表5中列出出现间距i在[0,15]间的步距频次百分比。

从表5发现,在酵母1号和2号染色体DNA上AA、AT、TA、TT和CC、CG、GC、GG交替出现的步距频次百分比同样差异很小、几乎相同,它们在1号和2号染色体DNA上的排列存在一定的相似性。这样的结果验证了我们上述提出的“酵母1号和2号染色体DNA在一定程度上可能具有较高相似度的双核甘排列分布”这一观点。

上述利用公式(3)分别计算酵母1号和2号染色体DNA上双核苷X和Y交替出现的步距频次百分比,使用的X和Y都是多个双核苷的集合。接下来,我们将X和Y均取为单个双核苷AA再进行计算验证。同理,再分别计算:1)X和Y均取为TT;2)X和Y均取为CC;3)X和Y均取为GG。这3种条件下X和Y交替出现的步距频次百分比,最终得到的结果见表6。同时为了对步距频次实现显性分析,我们忽略了出现次数很少的出现间距i,表6中只列出出现间距i在[0,15]间的步距频次百分比。

从表6发现,AA在酵母1号和2号染色体DNA上交替出现的步距频次百分比差异很小、几乎相同,它们在1号和2号染色体DNA上的排列存在一定的相似性。同理,TT、CC、GG在1号和2号染色体DNA上交替出现的步距频次百分比也几乎相同,它们在1号和2号染色体DNA上的排列同样存在一定的相似性。上述分析结果又更进一步表明,酵母1号和2号染色体DNA在一定程度上可能具有较高相似度的双核苷排列分布。

在上述分析中,我们利用公式(3)分别计算了3种不同类型双核苷在酵母1号和2号染色体DNA上的步距频次百分比,结果分析均一致表明“酵母1号和2号染色体DNA在一定程度上可能具有较高相似度的双核甘排列分布”。目前已经发现有更多的酵母基因与高等真核生物基因具有同源性,如果不仅是酵母1号和2号染色体DNA可能具有较高相似度的双核苷排列分布,而是酵母全部16条染色体DNA都可能具有较高相似度的双核苷排列分布,那么这样的结果或许对高等真核生物的研究分析具有一定的意义和价值,这个工作我们将在后续工作中持续展开。

3 结论

酵母是最简单的真核单细胞生物,包含16条染色体。本文利用生物信息学方法,分别计算分析了单核苷和双核苷在酵母1号和2号染色体DNA上的组成百分比,发现单核苷和双核苷组成百分比在这两条染色体DNA上基本相同,这说明单核苷和双核苷组成在酵母1号和2号染色体DNA上没有明显的组成偏好性,它们的组成在这两条染色体DNA上具有较高程度的趋同性。另外我们分别计算分析了3种不同类型的双核苷在酵母1号和2号染色体DNA上的步距频次百分比,发现无论哪一种类型的双核苷,它们在酵母1号和2号染色体DNA上交替出现的步距频次百分比都差异很小、几乎相同,它们在这两条染色体DNA上的排列分布均存在一定的相似性,这样的结果表明酵母1号和2号染色体DNA在一定程度上可能具有较高相似度的双核苷排列分布。

目前已经发现有更多的酵母基因与高等真核生物基因具有同源性,对酵母基因组的生物信息学研究对高等真核生物的研究具有重要的意义和价值。在后续的工作中,我们将对酵母全部16条染色体DNA的单核苷和双核苷组成百分比进行统计分析,同时也会对酵母全部16条染色体DNA的双核苷步距频次百分比进行计算分析,这两者的分析结果或许对高等真核生物的研究分析具有一定的意义和价值。参考文献:

[1]王凯. 生命科学研究中常用模式生物 [J]. 生命科学研究, 2010, 14(2): 156-165.

[2] 畢高峰, 朱立煌. 单细胞自由生物基因组全序列的测定和比较基因组研究 [J]. 生物工程进展, 1997,17(5): 30-35.

[3] JEFFARES D. The natural diversity and ecology of fission yeast[J]. Yeast, 2018, 35(3): 253-260.

[4] OHIRA M J, HENDRICKSON D, MCISAAC R, et al. An estradiol-inducible promoter enables fast, graduated control of gene expression in fission yeast [J]. Yeast, 2017, 34(8): 323-334.

[5] 徐赫鳴, 谢泽雄, 刘夺, 等. 酿酒酵母染色体设计与合成研究进展 [J]. 遗传, 2017, 39(10): 865-876.

[6] 杨毅, 张敏, 袁丽, 等. 抗对虾白斑综合症病毒单链抗体P1D3基因在毕赤酵母中的分泌表达 [J]. 生物工程学报, 2006, 22(6): 973-978.

[7] 谭云, 黎继烈, 王卫, 等. 重组毕赤酵母产青霉素G酰化酶的分批发酵动力学研究 [J]. 菌物学报, 2016, 35(1): 94-103.

[8] 张春玉. 云芝免疫调节蛋白基因克隆及酵母重组表达 [J]. 吉林农业大学学报, 2015, 37(3): 301-306.

[9] MACIASZCZYK-DZIUBINSKA E, REYMER A, KUMAR N, et al. The ancillary N-terminal region of the yeast AP-1 transcription factor Yap8 contributes to its DNA binding specificity [J]. Nucleic Acids Research, 2020, 48(10): 5426-5441.

[10]宋燕子, 贾彬, 林柏成, 等.莱茵衣藻酰基辅酶A合成酶cDNA克隆及其酵母表达 [J]. 生物技术通报, 2015, 31(9): 119-124.

[11]彭日荷, 熊爱生, 李贤, 等.应用毕氏酵母高效表达耐高温植酸酶 [J]. 生物化学与生物物理学报, 2002, 34(6): 725-730.

[12]彭日荷, 姚泉洪, 熊爱生, 等.泛肽交联酶(E_2)通过苯丙氨酸解氨酶基因启动子参与水稻对紫外光的防护 [J]. Acta Botanica Sinica, 2003, 45(11): 1351-1358.

[13]LAURENT J M, GARGE R, TEUFEL A I, et al. Humanization of yeast genes with multiple human orthologs reveals functional divergence between paralogs [J]. PLoS biology, 2020, 18(5): e3000627.

[14]QIAN Y F, KACHROO A H, YELLMAN C M, et al. Yeast cells expressing the human mitochondrial DNA polymerase reveal correlations between polymerase fidelity and human disease progression [J]. The Journal of biological chemistry, 2014, 289(9): 5970-5985.

[15]SHI W, SUN Q, FAN G, et al. gcType: a high-quality type strain genome database for microbial phylogenetic and functional research [J]. Nucleic Acids Research, 2021, 49: 694-705.

[16]KACHROO A H, LAURENT J M, YELLMAN C M, et al. Systematic humanization of yeast genes reveals conserved functions and genetic modularity [J]. Science, 2015, 348(6237): 921-925.

[17]应嘉, 赵睿颖, 尚彤. 生物信息学在人类基因组计划中的应用 [J]. 北京大学学报(医学版), 2002, 34(4): 389-392.

[18]周璐, 李越中, 李健. 酿酒酵母基因组学研究进展 [J]. 生命科学, 1999, 11(2): 87-91.

[19]张博, 陈晓芳, 黄勋, 等. 2015年中国动物遗传学研究领域若干重要进展 [J]. 遗传, 2016, 38(6): 467-507.

(责任编辑:于慧梅)

作者简介:刘建丽(1988—),女,讲师,博士,研究方向:环境科学与工程和生物信息学研究,E-mail:ljl2489@sina.com.

通讯作者:刘建丽,E-mail:ljl2489@sina.com.

Comparative Analysis of the Composition and Arrangement

of Yeast Chromosome 1 and 2 DNA

LIU Jianli ZHOU Deliang JIN Wen

(1.School of Water Resource and Environment Engineering, China University of Geosciences (Beijing), Beijing 100083, China;

2.Beijing Zhongdianyida Technology Co., Ltd., Beijing 100190, China; 3.Department of Clinical Medical Research Center,Inner

Mongolia key laboratory of gene regulation of the metabolic disease, Inner Mongolia People’s Hospital, Hohhot 010010, China)

Abstract: Yeast genes have high homology with higher eukaryotes genes. For yeast chromosome 1 and 2 DNA, we calculated and analyzed: the composition percentage of mononucleoside and dinucleoside; the spacing frequency percentage of three types of dinucleoside. The results show that: the composition percentages of mononucleoside and dinucleoside on chromosome 1 and 2 DNA were basically the same; no matter which dinucleoside, their spacing frequency percentage on chromosome 1 and 2 DNA were almost the same, and their arrangement on the two chromosomes were similar. These results indicate that: yeast chromosome 1 and 2 DNA have no obvious mononucleoside and dinucleoside composition preference, and their mononucleoside and dinucleoside composition have a high degree of convergence; yeast chromosome 1 and 2 DNA may have a high similarity of dinucleoside arrangement. These results may have some significance and value for the homology analysis between yeast and higher eukaryotes.

Key words: yeast; chromosome DNA; composition percentage; spacing frequency percentage; nucleoside composition preference; dinucleoside arrangement

猜你喜欢

酵母
西北农大育成葡萄酒酵母实现规模化产业应用
饲料中添加酵母硒对草鱼生长性能的影响
“亚军”安琪酵母
常吃含酵母的食物会伤胃吗
发面 酵母比碱面好
优化生产工艺提升酵母抽提物的口感和使用价值
酵母之味
安琪酵母:全球第三、亚洲第一、两市唯一
安琪酵母:全球第三、亚洲第一、两市唯一
日本原装进口的健康食品