基于SCIE收录论文的中日基因编辑技术领域国际合作比较
2019-08-08
基因编辑技术的发展始于20世纪80年代,在CRISPR技术平台出现后,该技术受到了学术界、产业界的高度关注,进而发展迅猛[1]。目前,该技术不仅被应用于基因功能的研究、基因治疗,还被应用于动物模型的构建、动植物新品种的改造和培育等。同时,该技术能够高效率、低成本地定点修改以及编辑更多物种的基因,其未来的发展将会对学界、产业界以及国家层面的竞争力产生一定的影响。因此,整合利用各国优势资源要素,开展国际合作,探索科技前沿已成为该领域研究的重要内容。考虑到国际合作论文是国际合作成果的一种重要表现形式[2],中日同为人类基因组计划的亚洲参与国,两国各自的基因编辑国际合作研究甚少有人关注,因而本文主要以国际合作论文为数据基础,从论文发表情况、学科分布、研究热点与前沿、合作网络等角度,比较分析中国、日本在该领域的国际合作情况及两国之间的异同点,为相关研究提供参考。
1 数据收集和方法
1.1 数据收集
本文所收集的数据来自美国的科学引文索引(扩展版)数据库(Science Citation Index Expanded,SCIE)。在SCIE中,针对基因编辑技术领域进行主题检索。其中所采用的关键词主要围绕gene edit(基因编辑)、meganuclease(归巢核酸内切酶)、zinc finger nuclease(锌指核酸酶)、transcription activator-like effector nuclease(转录激活样效应因子核酸酶)、clustered regularly interspaced short palindromic repeats(规律间隔成簇短回文重复序列)等方面,检索的时间跨度为2000-2018年(检索时间为2019年1月25日),具体检索式为:TS=(("genome edit*" OR "gene edit*" OR "genetically edit*" OR "genetic edit*") OR (meganuclease* OR ("engineered meganuclease*") OR ("homing endonuclease*") OR ("family endonuclease*") OR ("engineered endonuclease*")) OR ("zinc finger nuclease*" OR"zinc finger endonuclease*" OR ( "Zinc Finger " AND "Protein") OR ("Zinc Finger " AND "gene") OR ("Zinc Finger" AND "peptide") ) OR ("Transcription activator-like effector nuclease*" OR ("TAL*" AND "effector nuclease*") OR ("Transcription Activator-Like Effector" AND "gene*") OR("TALEN" AND "gene*" )) OR (("Clustered Regularly Interspaced Short Palindromic Repeat") OR ("Clustered Regularly Interspaced Short Palindromic Repeats") OR ("CRISPR$") OR("CRISPER AND Cas9") OR("CRISPER AND Cas")))。经过对下载数据的清洗,最终得到32 848条论文数据,8 486条国际合作论文数据。在整合论文的国家信息后,经统计中国该领域论文5 916篇,国际合作论文1 979篇;日本该领域论文3 061篇,国际合作论文904篇。需要说明的是,中国的数据包含港澳台地区。在选取国际合作论文数据时,界定标准为地址字段中至少出现两个国家。
1.2 研究方法
本文以基因编辑领域的论文及国际合作论文为数据基础,主要使用文献计量法及Excel、CiteSpace、Pajek等软件,重点分析中日两国在该领域的国际合作发展态势,以期把握两国在该领域的国际合作研究现状、发展趋势以及异同点。使用社会网络分析法,分析中国、日本在该领域国际合作网络的特征,同时辅以可视化软件呈现分析结果。
2 比较和分析
2.1 论文发表情况比较
对中国、日本基因编辑技术领域的论文数量、国际合作论文数量以及发表年限进行统计,并计算相应发表年限的国际合作率,得到两国国际合作历年分布(图1)以及两国历年国际合作率情况(图2)。国际合作率是一段时间内,各国国际合作论文数占其总论文数的百分比。该比值可表示某一时间段某一国家在国际合作方面的活跃程度,比值越高活跃程度越高[3]。
从两国论文发表总数来看, 2000-2018年中国在该领域的研究论文数呈指数型增长,同期日本在该领域的研究论文数增速较为平缓。2010年,中国在该领域的研究论文数超过日本,并在随后的几年中两国之间的差距越来越大。
从国际合作论文数看,2000-2018年中国在该领域的合作论文数呈增长态势,2018年有545篇;同期日本在该领域的国际合作论文数也同步增长,但增速不及中国迅猛,2010年后两国之间的差距逐渐变大。
图1 2000-2018年中日两国基因编辑技术领域国际合作历年分布
图2 2000-2018年中日两国基因编辑技术领域历年国际合作率
从国际合作率来看,2000-2018年全球在该领域的国际合作率有一定的起伏,波动范围为17%~30%,但整体呈增长态势,说明全球基因编辑技术领域国际合作的活跃程度在不断提高。在此背景下,中国该领域的国际合作率总体上维持在24%~40%之间,且自2013年以来呈现明显的增长态势,存在与全球国际合作率变化幅度明显不同的点,主要因为中国国际合作论文数与总论文数变化幅度的差值变大。同期日本在该领域的国际合作率也并不稳定,总体维持在16%~35%之间,整体上处于增长的趋势,说明中日两国在该领域的国际合作活跃程度均在逐渐提高,而且两国的国际合作率基本上都高于全球国际合作率,说明两国在该领域的国际化程度较高。
对中国、日本基因编辑技术领域的国际合作论文数量、总被引频次进行统计,并计算两国的篇均被引频次、h指数以及标准引文影响指数(Normalized Citation Impact,NCI)[4](表1)。其中本部分所使用的h指数表示某一国家最多有h篇国际合作论文被引用了h次,该指数在一定程度上反映某一国家的合作论文质量;NCI为某一时间段内某一国家的国际合作论文篇均被引次数与全球的国际合作论文篇均被引次数的比值,该比值可在一定程度上代表该国在基因编辑技术领域国际合作的平均研究水平。其中全球的NCI代表全球国际合作的平均研究水平。
2000-2018年,在该领域中,虽然中国的国际合作论文发表量约是日本的2.2倍,但其总被引频次只是日本的1.5倍,导致中国的篇均被引次数小于日本,说明中国国际合作论文的平均质量低于日本。而在h指数方面,两国差异较小,说明两国都有质量较高的国际合作论文。在NCI方面,中国为0.76,低于全球国际合作的平均研究水平;日本为1.11,高于全球国际合作的平均研究水平,说明中国国际合作的平均研究水平与日本还存在一定的差距。
表1 2000-2018年中日两国基因编辑技术领域国际合作论文被引频次
2.2 学科分布比较
根据Web of Science类别字段整合统计中国、日本基因编辑技术领域的国际合作论文所属学科信息发现,中国该领域的国际合作论文涉及100个学科,日本该领域的国际合作论文涵盖71个学科,其中中国国际合作包含的100个学科的合作论文发表数总和为3 021篇,日本国际合作包含的71个学科的合作论文发表数总和为1 388篇。基于国际合作论文数的中国、日本各自排名前10的该领域国际合作所涉及的学科见表2。经比较,在排名前10学科中,两国有8个相同的学科,分别为生物化学与分子生物学,细胞生物学,多学科科学,遗传学和遗传性,植物学,生物工程学和应用微生物学,肿瘤学,医学、研究和试验;两国分别有2个不同的排名前10的学科,中国的是生物化学研究方法和微生物学,日本的是发育生物学和免疫学。通过两国各自排名前10学科的所占比例可知,中、日国际合作均有2个重点学科,分别是生物化学与分子生物学、细胞生物学,但日本这2个学科的占比均超过中国,其他6个相同学科在比例和排名方面均存在差异,并且日本排名前10的学科的占比存在较为明显的分层。第一部分为排名前4的学科,其占比总和约50.79%;第二部分为排名5至10的学科,其占比总和约为20.39%。中国排名前4的学科与日本相同,占比总和约为43.32%,比日本低,说明中日两国在该领域国际合作方面存在较高的契合度。两国国际合作学科倾向存在的差异与各国在该领域的规划布局、资源优势、生产要素等原因有较为紧密的关系,日本在其排名前4的学科方面显示出较高的集中度。
2.3 研究热点与前沿比较
文献的关键词是研究成果核心内容的一种重要表现形式[5],对其进行分析可以识别特定研究领域的热点以及前沿主题。高频关键词或具有重要知识连接作用的高中介中心性关键词均可在一定程度上反映其研究热点。通过探测突现强度高的关键词(即突发词)可识别特定领域的研究前沿[6]。本文分析比较了中日两国在基因编辑技术领域的研究热点,并识别两国在该领域的研究前沿。
本文利用CiteSpace软件,选取“Keyword”(关键词)作为节点类型,“Top 50”(即选取每年频次排名前50的关键词)作为参考阈值,分别绘制出中日两国的关键词共现图谱(图3和图4)。
表2 中日两国排名前10的基因编辑技术领域国际合作的学科分布比较
图3 中国基因编辑技术领域国际合作关键词共现图谱
图4 日本基因编辑技术领域国际合作关键词共现图谱
图3和表3显示,2000-2018年中国该领域国际合作研究中,频次与中介中心性均较高的关键词分别为expression(表达)、crispr/cas9(成簇规律间隔的短回文重复序列)、zinc finger protein(锌指蛋白)、identification(识别)、activation(活性)、in vivo(体内)、mice(老鼠)、arabidopsis(拟南芥)。“锌指蛋白“是锌指核酸酶的重要组成部分,它来源于转录调控因子家族。ZFN技术通过锌指蛋白构成的DNA识别域和Fok I构成的切割域实现定点修饰基因,至今已应用于大鼠、小鼠、斑马鱼、拟南芥等物种细胞或胚胎中[7],说明中国该领域国际合作的前期研究主要集中于对ZFN技术的应用及研究。crispr/cas9是频次第二高的关键词,说明中国的研究热点逐渐集中于研究crispr/cas9系统的应用及原理,表3中关键词cancer(癌症)和human cell(人体细胞)说明中国在积极探索基因治疗。
图3中,2011年出现的关键词mechanism(方法)也从一定程度上验证了中国在该领域国际合作的“生物化学研究方法”学科倾向,即位列第9的生物化学研究方法。
表3 2000-2018年中国基因编辑技术领域国际合作高频和高中介中心性关键词
图4和表4显示,2000-2018年,日本该领域国际合作研究中频次与中介中心性均较高的关键词分别为expression(表达)、zinc finger protein(锌指蛋白)、differentiation(分化)、transcription factor(转录因子)、cell(细胞)、activation(活性)、mice(老鼠)、sequence(序列)、in vivo(体内)。日本该领域国际合作的前期研究主要集中于由转录因子锌指蛋白和Fok I核酸内切酶构成的ZFN技术的应用研究,并已应用于鼠、斑马鱼以及拟南芥等物种中。关键词system(系统)以及cas9于2014年开始出现,且system的频次较高,说明日本已开始探索新一代基因编辑技术crispr/cas9系统。图4中所显示的关键词evolution(进化)、embryo(胚胎)、growth(发育)以及出现频次较高的关键词differentiation(分化)从一定程度上验证了日本在该领域国际合作的“发育生物学”学科倾向。表4中中介中心性较高的关键词cancer(癌症)和图4中human cell(人体细胞)说明日本密切关注基因治疗。
中日两国在该领域国际合作的研究热点呈现一定的相似性,前期研究热点主要是对ZFN技术的应用研究,2014年左右研究热点逐渐集中于crispr/cas9系统的应用研究,两国都密切关注基因治疗。两国的研究热点显示出各自的学科倾向,如中国对生物化学研究方法的关注,日本对发育生物学的关注。
在CiteSpace中,选择术语类型为“Burst Term”(突发词),再次运行可以得到该领域关键词的突现强度。本文选取突现强度排名前20的关键词,对中日两国在该领域国际合作的研究前沿分别进行归纳并比较(表5和表6)。
表4 日本基因编辑技术领域国际合作高频和高中介中心性关键词
表5 中国基因编辑技术领域国际合作研究前沿
表6 日本基因编辑技术领域国际合作研究前沿
表5显示,中国国际合作的研究前沿可归纳为3个方面:一是对比研究不同的基因编辑技术,如ZFN技术、TALEN技术和crispr/cas9系统,优化相关技术;二是拓展基因编辑技术的应用范围,构建动物模型以进一步研究抗癌药物或开展基因治疗;三是深入研究不同基因编辑技术的原理,如zinc finger protein(锌指蛋白)、domain(域)、messenger RNA(信使RNA)、double strand break(双链断裂)以及homologous recombination(同源重组)等。
由表6可知,日本国际合作的研究前沿可归纳为4个方面:一是研究不同的基因编辑技术,优化相关技术;二是深入研究不同基因编辑技术的原理机制;三是通过基因编辑技术,研究基因表达的激活(activation)和抑制(repressor);四是拓展基因编辑技术的应用,如模式植物的构建、疾病模型的构建与基因治疗。
从两国国际合作的研究前沿来看,两国存在较高的相似性,均紧密跟进基因编辑技术的新进展,同时深入研究基因编辑技术的原理与机制,拓展技术的应用(如基因治疗、模式动物或植物的构建)。与中国相比,日本对运用基因编辑技术研究基因表达的激活与抑制更为关注。
2.4 国际合作网络比较
利用国际合作论文数据中的国家信息,通过Pajek分别构建中日两国的国际合作网络。Pajek是自由可视化网络分析软件[8],可高效处理网络数据,具有出色的图形展示功能。本文主要从网络规模和结构特征的角度比较分析中日两国在该领域的国际合作网络。网络规模涉及节点、节点连线数以及网络密度3个指标,结构特征指标包含平均路径长度和聚类系数。其中节点连线粗细表示任意两个国家之间的合作频次大小,它与网络密度都可以用来衡量各国之间合作的紧密程度;平均路径长度反映网络的连通性,可表示国家间的知识交流与合作关系的紧密程度[9];聚类系数表示网络的传递性,可反映网络中各国之间建立合作交流的可能性[10]。
中国基因编辑技术领域国际合作网络共涉及92个国家,以92个国家为节点,以国家间的合作关系为节点连线,得到了图5所示的中国基因编辑技术领域的国际合作网络。在Pajek中,通过相关指令去除重复的国家合作边,并将删除的国家合作间的边的值加到没删除的相应边的值上,得到1 424条节点连线。该网络的密度为0.33,平均路径长度为1.66,聚类系数为0.76。从图5可以看出,中国与其他国家的国际合作存在较大的发展空间,与美国、英国、加拿大、日本、澳大利亚等国的合作较为紧密。平均路径长度的数值表明网络中任意2个国家合作最多只需经过2个中介国家,网络的连通性较高说明中国可以与网络中其他国家进行较好的知识交流,网络中各国之间建立合作交流的可能性较大。
图5 中国基因编辑技术领域国际合作网络
日本基因编辑技术领域国际合作网络共涉及88个国家,以88个国家为节点,以国家间的合作关系为节点连线,得到了图6所示的日本基因编辑技术领域的国际合作网络。通过Pajek中的相关指令去除重复的国家合作边,得到1 435条节点连线。该网络的密度为0.37,平均路径长度为1.63,聚类系数为0.76。从图6可以看出,日本与其他国家的国际合作也存在较大的发展空间,与美国、中国、英国、德国、法国等国的合作较为紧密。网络连通性较高。说明日本与其他国家的知识交流较好,知识也可以得到较为广泛的传播,各国之间进行知识合作与交流的可能性较大。
图6 日本基因编辑技术领域国际合作网络
经比较可以发现,在网络规模方面,虽然中日两国各自的国际合作网络规模相似,与美国、英国等国之间的合作都较为紧密,但中国的网络密度小于日本,说明日本与其他国家的合作更为紧密。在结构特征方面,两国的数值相差不大,说明两国的国际合作网络均具有较好的连通性和传递性,都可以与网络中的其他国家进行较好的知识交流与合作,且网络中各国之间进行合作交流的可能性较大。
3 结论
通过对2000-2018年中日两国基因编辑技术领域国际合作论文的分析,可以得出以下结论。
一是中日两国在基因编辑技术领域的论文及国际合作论文发表数均呈增长态势,但两国增速存在较大差异。中国的增速迅猛,论文及国际合作论文发表数均从落后日本的状态进入反超日本的状态;而日本的增速较为平缓,与中国的差距逐渐变大。
二是中日两国近年来在基因编辑技术领域的国际合作率虽均有起落,但整体上呈增长态势,说明两国的国际合作活跃程度在逐渐提高。
三是中日两国均有质量较高的国际合作论文,但中国国际合作论文的平均质量不及日本,中国在该领域国际合作的研究水平也低于日本,说明中国在SCIE国际合作论文的质量方面仍有待提高。
四是从中日两国国际合作的学科倾向、研究热点以及研究前沿可知,两国在基因编辑技术领域国际合作方面存在较好的契合性,两国可进一步加深合作。两国国际合作方向差异性与国家层面的规划、资源优势等有一定的关系,如应用微生物技术是中国的传统优势[11],而日本学者率先报道了与发育生物学密切相关的诱导性多功能干细胞[12]。
五是中日两国各自的国际合作网络规模相似,两国与其他国家的合作均存在较大的发展空间,且合作较为紧密的国家包括美国、英国。与中国相比较,日本与其合作网络中的其他国家的合作更为紧密。两国在各自的合作网络中均具有较好的知识交流及扩散性。