同源性、一致性和相似性的辨析
2011-12-31宋亚珍南红梅潘新社裴阿卫
宋亚珍 南红梅 刘 枫 潘新社 裴阿卫
(西北植物学报编辑部,陕西杨凌 712100)
同源性、一致性和相似性的辨析
宋亚珍 南红梅 刘 枫 潘新社 裴阿卫
(西北植物学报编辑部,陕西杨凌 712100)
针对描述 cDNA、DNA、氨基酸和蛋白质序列等亲缘关系的 3个专用词语——同源性、一致性和相似性在生物类论文中交错使用的问题,对其具体含义和运用进行了分析,以明晰各词语在论文中的准确使用,提高编辑校对质量。
同源性,一致性,相似性
随着分子生物学和生物技术的发展,有关基因工程及其应用的研究广泛展开,同时各种新的科技词语不断出现,但有些词语在具体使用中常出现混淆。笔者在论文编辑校对过程中,常遇到在 cDNA、DNA、氨基酸、蛋白质等水平上分析物种亲缘关系的描述中,对同源性 (homology)、一致性 (identity)和相似性 (similarity)的交错使用现象,在描述序列的相似程度时表达模糊。实际上 homology、identity和 s imilarity的具体含义以及它们所表达的亲缘关系程度是有区别的[1-2]。因此,笔者依据文献对这几个词语进行辨析。
一 homology,identity和similarity的基本概念
homology:词根为 homo,拉丁语,意为 man (人)[3]。homology意为同系、同源[4]。一般科技论文将其译为同源性。《现代汉语规范词典》对同源性的解释为“泛指事物来源相同”[5]。
identity:与动词 identify同根,identify解释为证明、鉴定、认为同一、视为同一等[3]。identity意为同一性[4],而《现代高级英汉双解辞典》(英汉版)解释为“绝对相同,完全相同”[3],一般科技论文将其译为一致性。《现代汉语规范词典》对“同一性”解释为“指矛盾的统一性、一致性”[5]。
similarity:词根为 similar,意为 like,即类似的、相似的[3]。similarity则解释为相似、类似,一般科技论文将其译为相似性。《现代汉语规范词典》对相似性解释为“相像、相近”[5]。
同源性、一致性、相似性分别来源于英文单词homology、identity和 similarity,属于科技词语的舶来品,表达目的有相近之处,但实际含义又有不同。在编辑工作中,常常疏于深究它们的具体含义,这三个词语在分子生物学论文中的交错使用比较多见,因此有必要对这三个词语的含义进行具体分析:
(1)词根及其词根词性不同
homology词根为 homo,拉丁语意为 man(人),名词。identity源自 identify,identify为动词。similarity源自 similar,其为形容词。
(2)表达词义、程度不同
homology表示有血缘关系上的同一性,含有源自天然的、客观无法改变的同一性,表示事物某种性质的“是”或“不”,“有”或“无”,其英文解释为quality of being homogeneous,formed of the same kind。
identity表示身份等的同一,严格的匹配,是对鉴定行为的客观结论,表示事物某方面某种性质在客观评价指标上的高度同一性,其英文解释为 state of being identical,absolute sameness,exact likeness, who somebody is。
similarity是一般名词,对事物外在表现同一性的大概描述,其英文解释为 likeness,state of being similar。
二 同源性、一致性和相似性的区别
根据同源性、一致性、相似性概念的区别,在科技论文写作及编辑校对中应按照具体的表达目的选择合适的名词,确切地表述研究结果。
(1)同源性的使用示例及辨析
在生物学研究中,经常会通过寻找基因同源序列来探讨物种的进化关系。所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列[6],序列间有共同的祖先。同源性用以描述物种亲缘关系的远近,一般应表述为“有”或“无”,“完全”或“部分”。对序列同源性进行分析时,一般是将待研究序列加入到一组来自不同物种的多序列中,以确定该序列与其他序列的同源关系。常用的分析工具是CLUSTAL等。
例 1 细胞遗传学中,染色体组成相同的染色体被称为同源染色体;染色体组成有部分相似性,则称为部分同源染色体[7-8]。
(2)一致性的使用示例及辨析
序列间相同的程度即为一致性。当两条序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性。
核苷酸(氨基酸)序列一致性表示所选序列核苷酸(本序列编码的氨基酸)残基的一致程度。分析位点一致程度,它的数值代表比对序列中相同位点残基完全一致的比例。
例 2 研究结果表明,PtPPF-1与豌豆 PPF-1、水稻 PPF-1和拟南芥ALB3中编码叶绿体内膜蛋白的氨基酸残基的一致性分别为 94%、91%和91%。
例 3 苦荞 CHS基因核苷酸序列与其他植物CHS基因序列的‘同源性’依次为水蓼 84%、土沉香 80%、红掌 79%、大麦 79%、黄芩 79%、芸香80%、无茎糖芥 79%、莲 78%。
例 4 对三七三萜皂苷合成关键酶法呢基焦磷酸合酶(FPS)的基因进行克隆,cDNA序列全长1 409 bp,开放阅读框共编码 343个氨基酸残基,氨基酸序列与积雪草、银胶菊、青篙、山艾树的 FPS氨基酸序列的‘同源性’分别为 95%,87%,86%和86%,核酸序列‘同源性’则分别为 81%,66%, 68%和 66%。
例 2的“一致性”是正确的说法,而例 3、例 4中的“同源性”应为“一致性”。
(3)相似性的使用示例及辨析
在生物学研究中,在对DNA或蛋白序列比对过程中,用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基序列所占比例的多少,即为该序列的相似性。相似性越高,说明序列功能越保守,进化变异越小。当序列相似性程度高于50%,可能推测检测序列和目的序列是同源序列;而当相似性低于 20%时,就很难推断序列间的同源关系[6]。
序列比对的基本思想是找出检测序列和目标序列的相似性。从序列全长角度考虑序列的整体相似性,叫整体比对;只考虑序列部分区域的相似性是局部比对。实际应用中,多采用 Blast和 Fas tA等进行序列的局部比对。
例 5 丹参迷迭香酸生物合成途径中苯丙氨酸支路上的肉桂酸-4-羟化酶 SmC4H(einnamate-4-Hydorxyl-ase)基因,其 cDNA序列全长 1 800 bp,包含一个完整的 1512bp的开放阅读框,编码 504个氨基酸组成的前体蛋白,该基因与藿香的 C4H基因相似性达到 94.7%,一致性达到 89.7%[9]。
例 5的“相似性”和“一致性”说法正确。
三 同源性与一致性、相似性的关联
例 6 所谓基因家族[10],就是具有显著“相似性”的一组基因,编码相似的蛋白质产物。也就是具有类似结构,或功能相关的(保守的、同源的)一类基因。通过对同类基因的同源关系、进化历程的研究,进一步来研究基因的功能和调控机制。
例 7 序列分析结果表明,甘肃牦牛与青海牦牛该序列的核苷酸“同源性”为 98.13%,与云南牦牛该序列的核苷酸“同源性”为 97.65%,青海牦牛与云南牦牛该基因片段的核苷酸序列“同源性”为99.45%。
例 7中的“同源性”应该为“相似性”或“一致性”。
从以上分析可以看出,相似性 (一致性)与同源性有一定关系 (例 5、6),一般来说序列相似性(一致性)越高,则它们是同源序列的可能性越高,所以经常可以通过相似性(一致性)来推测序列是否同源。正因为如此,经常出现将相似性 (一致性)和同源性等价混合使用的现象(例 3、4、7)。
一致性、相似性,均描述的是序列间亲缘关系上的同一性,属于量化的指标,由此可以反映物种间在某些方面的关系,而同源性属于质的判断 (例1)。当序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性。如果两条序列有一个共同的进化祖先,那么它们是同源的。可以说,一致性、相似性是对同源性不同角度的量化指标,应根据分析结果确定不同的描述结论。所以,不能将相似性(一致性)和同源性混为一谈,所谓“具有 50%的同源性”或“这些序列高度同源”等说法,都是不确切的[6]。
致谢:衷心感谢西北大学生命科学院徐子勤教授、西北农林科技大学农学院刘曙东教授对本文形成过程中的启发和指导。
[1]序列比对和数据库搜索 [EB/OL].http://ggene.cn/html/protocol/bioinformatics/2009/0820/2528.h tml.
[2]Gaurav Pandey,Vipin Kumar,Michael Steinbach.蛋白质功能预测的计算机方法:概述 [Z].百度文库/高等教育/理学/生物信息学.
[3]现代高级英汉双解辞典 [M].英汉版.香港:牛津大学出版社,1978:527,1017.
[4]徐祥浩.英汉农业生物学词典[M].北京:农业出版社,1990:326,342.
[5]李行健.现代汉语规范词典[M].北京:外语教学与研究出版社,语文出版社,2004:1307,1420.
[6]赵国屏.生物信息学[M].北京:科学出版社,2003:70 -117.
[7]李竞雄.普通遗传学[M].北京:农业出版社,1961:1 -60.
[8]李竞雄,宋同明.植物细胞遗传学[M].北京:科学出版社,1997:100-198.
[9]段艳冰.丹参中迷迭香酸生物合成途径的苯丙氨酸支路基因的克隆及研究[D].上海:第二军医大学药学院,2006.
[10]朱玉贤,李毅.现代分子生物学(第二版)[M].北京:高等教育出版社,2002:1-400.
Comparison Analysis of Homology,Identity and Similarity
SONG Yazhen NAN Hongmei L IU Feng PAN Xinshe PEIAwei
Based on the analysis of homology, identity and sim ilarity in exp ressing the homological relation words of cDNA,DNA,am ino acid and p rotein,we discuss their different meanings in molecular biology. In order to imp rove the quality of editorial p roofreading for the three words,we discussed how to use them accurately in scientific papers.
homology,identity,similarity
N04;Q7
A
1673-8578(2011)02-0048-03
2011-02-10
国家自然科学基金项目(项目号:30971844)
宋亚珍(1972—),女,陕西西安人,西北农林科技大学杂志社编辑,博士,主要从事作物遗传育种及分子生物学方面的科研和编辑工作。联系方式:xbzwxb004@nwsuaf.edu.cn。