APP下载

植物合成生物学领域发展态势的文献计量分析

2022-03-10郭晓真张学福

生物技术通报 2022年2期
关键词:芥子油生物学领域

郭晓真 张学福

(中国农业科学院农业信息研究所,北京 100081)

合成生物学其基本含义是采用工程化的设计原理,对生物体进行有目标的设计、改造、重新合成,它是生物学与数学、化学、计算科学、工程科学等多学科的深度交叉融合而形成的新兴学科,具有显著的通用性特征,已在生物能源、生物材料、医疗技术、生态学等领域取得突破性进展[1-2]。基于合成生物学在国际科技、经济竞争中的重要战略性作用,世界各国政府对合成生物学进行了持续性和大规模的布局和资助。美国于2006年便开始布局合成生物学相关研究,建立了合成生物学工程研究中心(SynBERC),2016年提出将重点关注农业等方面的研究和转化[3];欧盟2012年启动建立了欧洲合成生物学研究区域网络(ERASynBio),在其2014年战略愿景报告中指出合成生物学将在生态和农业等领域有巨大应用潜力;英国生物技术和生物科学研究理事会(BBSRC)以及英国工程和自然科学研究理事会(EPSRC)于2014年出资成立植物合成生物学开放研究中心(OPSBRC)致力于加快植物合成生物学技术的开放和发展,实现农业领域的可持续发展和创新[4]。我国政府及相关部门也高度重视合成生物学研究的重要性及重大发展潜力。国家“十二五”规划、科技部“973”计划和“863”计划等重大科学项目都将合成生物学列为重点研究方向(表1)[5]。了解当前合成生物学在其它领域的扩散效应,对于科技管理部门进行资源的优化配置,对于科研人员了解学科动态、把握领域科技前沿以及开展科研合作等均具有重要意义。

表1 “973”计划支持的合成生物学相关项目Table 1 Synthetic biology related projects supported by“973” program

文献计量学作为一种偏定量的统计分析方法,能实现对于论文数据等的多维度计量分析[6]。相较于专家咨询的定性方法能显著提高分析效率。科技论文是科技成果的重要组成部分,在一定程度上能反映科研主体的学术研究水平。本研究采用文献计量学的基本原理和方法,统计2000-2019年全球合成生物学领域相关科技文献数据,包括发文量、主题分布,基于高被引论文及其引文关系揭示主要研究方向,探测全球农业合成生物学领域发展态势,判定其演化趋势。

1 数据与方法

1.1 数据来源

本文以Web of Science数据库中的Web of Science核心合集(包括SCI-EXPANDED和CPIP-S)作为数据来源进行论文检索,在合成生物学领域检索式确定时,经专家咨询并修改确定最终的检索式,出版年限定为2005-2019年,检索结果共301 743篇,检索时间2021年1月。检索式为TS=(“synthetic biology” or “chromosome engineering” or genome editing or “quantitative engineering biology” or chassis or “biological parts” or gene circuits or synthetic metabolism or “enabling technology” or genetic network or artificial design or molecular module* or synthetic module* or biosynthesis)。

1.2 统计分析方法及指标

本文借助Web of Science数据库文献分析平台、InCites数据库、Excel等数据处理工具对文献的时序出版数量进行计量分析,利用可视化工具Vosviewer对领域进行主题挖掘和可视化展示。此外,选取其中的植物合成生物学领域2015-2019年高被引文献的核心内容进行解读和计量。本研究所分析的“高被引文献”基于ESI数据平台已标识的“高被引文献”。聚焦植物合成生物学主题,构建论文引文知识网络,利用主路径分析方法[7]识别领域内容。

2 结果与分析

2.1 领域发文趋势分析

对特定时间段内领域论文发表量进行统计,在一定程度上能反映科学研究活动的活跃程度。本研究通过对在Web of Science核心合集中检索到的出版年为2005-2019年的15年间301 743篇论文数据,构建基础领域基础数据集。根据合成生物学领域文献累积发文量绘制时间分布图(图1),同时添加累积发文量的趋势线,对近15年的文献累积数据进行指数增长定律的回归分析。结果显示发文量随出版年代呈指数增长趋势,符合普赖斯提出的科学文献指数增长规律,增长曲线尚未向逻辑曲线转变,因此判定该领域处于稳定发展中阶段。

图1 合成生物学领域累计发文量的时间分布图Fig. 1 Time distribution of cumulative published articles in synthetic biology field

进一步绘制文献发表量、文献增长量随时间的变化曲线如图2所示。从发文量曲线中可以看出,2005-2010年发文量曲线及增长曲线相对平缓,文献增长速度慢,当时以线路设计工作为主的合成生物学已经开始对简单基因调控网络进行探索,合成生物学的规模和范围得到了一定程度的提高,研究人员开始尝试使用新元件构建更加复杂的网络,也开展了关于细胞治疗和对代谢途径(网络)改造和优化的积极探索,合成生物学处于起步阶段后的扩张和发展时期。随着基因组学研究逐渐深入,欧美发达国家自2008年前后开始在合成生物学领域相继投入资金开展学科布局,政策和资助推动学科领域发展,合成生物学也随即进入快速增长期,2011-2015年发文量持续稳定增长,平均年发文量达到20 000多篇。2016-2019年曲线斜率有明显提高,文献增长幅度明显增大,是合成生物学领域快速发展阶段,除了各国政府的持续关注和资金支持,推测该时间段领域有重大突破,如基因编辑技术推动领域的快速发展。

图2 合成生物学领域文献发表量和增长量的时间分布图Fig. 2 Time distribution diagram of published amount and growth amount of literature in synthetic biology field

2.2 主题内容结构分析

文献主题是相关文献构成的知识集合,对一组内容未知的文献通过相关性计算使主题相关的文献进行聚类,可实现对文献主题的表征。关键词共现是相同关键词在不同文献中出现的频次,如果一组文献中相同关键词数量越多,那么表征文献内容的相关性越强,这组文献应该属于同一主题方向。根据关键词共现的原理可以实现对目标文献的主题聚类、形成知识图谱,在一定程度上实现对于文献内容结构的分析。

将本研究中2005-2019近15年的文献时间划分3个时间节段(2005-2009年;2010-2014年;2015-2019年),对3个时间段内的高被引文献的高频关键词进行相似性计算,获得主题聚类,如图3-图5所示。2005-2009年产生了3个显著聚类(图3),分别是植物、化工、医药;2010-2014年(图4)产生了4个显著聚类,分别是植物、化工、医药、纳米技术,专家和学者开始利用合成生物学对纳米技术领域进行探索;2015-2019年产生了4个显著聚类(图5),分别是植物、化工、医药、纳米技术,与上一个五年的时间片中聚类核心相同,其中植物合成生物学主题持续出现,反映了该主题的重要性和创新潜力。

图3 2005-2009年合成生物学领域关键词共现图谱Fig. 3 Co-occurrence map of keywords in synthetic biology from year 2005 to 2009

图4 2005-2009年合成生物学领域关键词共现图谱Fig. 4 Co-occurrence map of keywords in synthetic biology from year 2005 to 2009

图5 2015-2019年合成生物学领域关键词共现图谱Fig. 5 Co-occurrence map of keywords in synthetic biology from year 2015 to 2019

我国植物学领域发展的历史悠久,研究水平处于国际领先水平,该主题是与农业作物领域密切相关的重要学科,是影响全球粮食安全的重要学科领域[8-10]。下文聚焦植物合成生物学主题内的高被引文献构建知识网络,从中识别在领域创新发展过程中发挥不同作用的知识,对揭示领域知识扩散特征、判定并预测领域发展态势具有重要意义。

2.3 植物合成生物学关键内容分析

2.3.1 文献引文网络构建 本研究中与植物相关的合成生物学(本研究称为“植物合成生物学”)文献共15 560篇,划分4个时间段引文数据分别构建直接引文网络,并提取各时间窗节点数量大于10的连通子网络可视化结果如图6所示。由引文网络图谱可以看出,时序内引文网络的节点规模显著增大,反映了该领域知识数量及知识扩散规模随时间呈现显著增长趋势。

图6 植物合成生物学领域2000-2019年引文网络Fig.6 Citation network in the field of plant synthetic biology from year 2000 to 2019

2.3.2 基于主路径方法的关键内容解析 主路径中弧线权值越高表明通过该弧线的知识流量越大,对知识扩散的支撑作用越强。基于SPC/SPLC算法得到的高线值的弧线集,获得弧线上的关键节点对,从中提炼重要知识点。

2000-2019年这一时间窗内整个主路径共涉及25篇文献(表2),解读每篇文献的节点内容构建知识图谱(图7)。

图7 2000-2009 年主路径分析方法获得的关键节点Fig.7 Key nodes obtained by main path analysis method from year 2000 to 2009

表2 2010-2019年主路径节点内容解析Table 2 Content analysis of main path nodes in year 2010-2019

2000-2005年这一时间节段内,主题内容是与油芥子油苷合成途径中P450南芥细胞色素基因的克隆及其在芥子油苷生物合成中重要催化作用。芥子油苷是一类重要的次生代谢产物,其合成途径首先色氨酸经细胞色素P45079B2 和CYP79B3 合成酶催化而形成吲哚-3-乙醛肟(IAOx),它是多个代谢途径前体物质,参与IGS 合成吲哚族芥子油苷。这组研究数据首次证明了进化上保守的细胞色素P450催化芥子油苷和氰基葡萄糖苷的生物合成途径,使得芥子油苷的生物合成得到发展;拟南芥细胞色素P450 CYP79B2的鉴定为修饰吲哚芥子油苷的含量提供了重要工具。这一阶段的另一重要特征是重要次生代谢产物合成途径中,关键步骤及关键酶的生物合成。例如,拟南芥中CYP79基因和芥子油苷分布的调控,结合防御信号传导途径分析特定芥子油苷积累的因素[11]。

2005-2009年这一时间段内文献聚焦调控芥子油苷合成的转录因子的识别及其调控作用分析。转录因子的作用在芥子油苷合成酶基因起到直接调控作用。2009-2010年4篇文献是利用组学方法,包括代谢组学、转录组学方法识别芥子油苷的合成的关键基因及其生物合成途径、转录因子的调控作用,利用代谢工程技术揭示拟南芥吲哚芥子油苷修饰中的关键酶功能。反映了这一时间阶段内先进技术手段在植物合成生物学领域中发挥的重要作用。

2012-2016年这一时间窗内,主题文献主题为利用工程酵母进行生物合成。酵母是生物合成过程中重要的底盘生物,在所探测到的文献报道[12],向酵母引入拟南芥吲哚基芥子油苷的七步途径使得在微生物宿主中首次成功生产芥子油苷,用植物来源的酶替代内源性酵母活性进一步优化了吲哚基芥子油苷的生产,实现了在微生物细胞工厂中生产这些化合物。此外,苄基异喹啉生物碱(BIA)代表一类植物次生代谢产物,在酵母中组装的最长的重组生物碱途径,并证明了在微生物系统中生产高价值生物碱的可行性。同时避免了植物体内产生的一些局限性[13]。从植物源到微生物进行生物合成也是植物生物合成发展的重要跨越。

2019年3篇文献聚焦更加复杂的次生代谢产物的合成,利用化学修饰方法进行生物合成。例如,苄基异喹啉生物碱(BIAs)是来自高等植物的重要次生代谢产物,通过级联反应生产BIA,从而揭示其功能,为合成途径等奠定基础。

综上分析,基于主路径方法获得的关键节点,时序下这些代表性的节点内容整体反映了所分析领域的主要内容体系。从合成生物学角度,整体反映了植物合成生物学最基本的理论层面的内容,以芥子油苷为代表性次生代谢产物[14],内容分别涵盖了介子油苷生物合成途径,重要催化酶功能解析,转录因子的调控作用、组学方法的应用、利用微生物酵母进行生物物质合成、这些内容分别表征了合成生物的核心理论技术,包括元器件的识别与分析、底盘生物分析、合成途径等。这些内容相对完整地呈现了植物合成生物学最基本的理论层面的主要内容。同时反映了植物合成学领域的基本发展脉络,从简单到复杂,从简单元器件的识别与功能分析到复杂的次生代谢在微生物中合成;以及从简单模式植株中次生代谢产物合成到高等植物中复杂生物合成的整体趋势。

3 结论与讨论

本文通过文献计量学方法对合成生物学的整体态势和主题分布进行了初步分析。基于领域的主题分布可知,其中植物合成生物学这一主题方向是稳定存在的,且处于稳定增长趋势,在主题规模上相对于其它主题规模较小,其主题的持续性出现,反映了该主题的重要性。聚焦植物合成生物学这一主题,利用主路径分析方法从知识流动角度探测植物合成生物学领域在发展过程中重要知识节点,关键性内容包括以介子油苷为代表的生物合成途径分析,重要催化酶功能解析,转录因子的调控作用,组学方法的应用[15],以及利用微生物酵母进行生物物质合成,这些内容在一定程度上表征了植物合成生物学的部分重要内容。

随着全球气候变化、人口持续增加、以及工业化导致的土地沙化、盐化等世界范围内的土壤退化问题使人均可用耕地面积进一步减少,人类生存所面临的粮食危机越来越严重,将来必须利用更少的土地生产更多的粮食以维持人类的可持续发展,而合成生物学的发展给农业领域应当前人口、环境因素的挑战带来新的发展机遇。

传统的作物育种技术已难以培育出应对繁杂多变环境的作物。因此与农作物品种改良和优化、应对复杂环境胁迫等相关的一系列重要科学问题亟待突破,而合成生物学技术由于其具有定向设计和工程化改造等优势,为作物产量和品质改良、提升作物的耐逆性等重要农艺性状的解析和重要经济性状的遗传改良带来了新的机遇,也为生物育种技术创新奠定了重要科学基础[16]。2018年科技部公布了“合成生物学”重点专项,其年度项目申报指南中与农业合成生物学有关的课题包括,“植物底盘的设计与构建”“抗逆基因回路设计合成与抗逆育种”“植物天然产物合成的工程细胞构建”,反映了农业领域开展合成生物学基础研究的需求。

基于主路径分析方法,内容上反映的是领域中基础性成果,直接反映了植物合成生物学紧密相关的基础性理论知识与基本发展脉络。本研究聚焦植物合成生物学主题,利用主路径分析方法对主题内容进行了挖掘,在功能上这些内容对植物合成生物学领域的演化发展起到支撑作用,例如转录因子作为一种重要元器其调控作用解析,在合成生物学领域是重要的主题方向,是对其它相关内容如关键酶的识别与合成的基础性内容。但是对于相对较新兴的技术,如基因编辑技术[17],通过主路径方法并未得到较好的识别。因此,要想更加全面的分析目标领域具有不同特征的重要内容,后续还将结合其它计量分析方法,对领域内容进行深入挖掘。

对于学科领域来说,利用本方法可以从知识网络中快速梳理到具有重要作用的知识节点,对于把握学科的发展态势、进行知识演化分析、开展领域技术预见等具有参考作用。

猜你喜欢

芥子油生物学领域
玛咖中芥子油苷及其降解过程的研究进展
谷稗的生物学特性和栽培技术
领域·对峙
初中生物学纠错本的建立与使用
初中生物学纠错本的建立与使用
PEDF抗肿瘤的生物学作用
一种玛咖中苄基芥子油苷的含量测定方法
新常态下推动多层次多领域依法治理初探
肯定与质疑:“慕课”在基础教育领域的应用
云南栽培玛咖芥子油苷提取工艺的优化*