APP下载

基于文献计量学的烟草基因组研究知识图谱分析

2022-09-02张玉婵田嘉树王晓丽景艺卓黄五星韩丹许自成

中国烟草学报 2022年4期
关键词:图谱基因组烟草

张玉婵,田嘉树,王晓丽,景艺卓,黄五星,韩丹*,许自成

基于文献计量学的烟草基因组研究知识图谱分析

张玉婵1,田嘉树1,王晓丽2,景艺卓1,黄五星1,韩丹1*,许自成1

1河南农业大学烟草学院,河南郑州 450002;2湖北省烟草公司襄阳市公司,湖北襄阳 441003

【目的】明确烟草基因组领域研究现状、发展历程、重点前沿及未来研究的方向。【方法】运用文献计量学,结合CiteSpace文献可视化软件,对中国知网(CNKI)和Web of Science两个数据库中的烟草基因组研究文献进行数据挖掘。【结果】(1)近年来关于烟草基因组研究的文献发文量增加速度快,总体呈上升趋势。(2)中国与美国的文献在发文量和影响力方面占据优势地位。(3)国内研究学者以童治军、肖炳光和龚达平及其团队在基因组方面研究较为突出,作者之间合作关系密切,国外作者Sierro等人的文献在该领域有很高的影响力。(4)得益于测序技术的发展,烟草基因组研究在基因标记技术、基因的鉴定与分析、基因组测序和基因组图谱绘制等方面取得了丰硕的成果,同时在烟草抗性研究、烟叶病毒和农艺性状改良等方面应用广泛。【结论】我国烟草基因组研究已跻身世界前列,有力推动了现代烟叶的发展以及优质烟草品种的培育。

烟草;基因组;知识图谱;文献计量;CiteSpace可视化

基因组(genome)是指包含在生物体DNA中的全部遗传信息[1],目前烟草基因组领域的研究主要以烟草基因组的序列结构研究为出发点,系统地开展功能基因组学研究,并建立起烟草基因组学研究的相关理论体系和技术平台[2]。

通过对烟草基因组结构和序列的研究,科研人员绘制了烟草基因组图谱,为烟草分子生物学和功能基因组学研究奠定了基础。在20世纪80年代前后,几项关键技术的发展和成功运用使得全基因组序列测定成为可能,烟草基因组测序和基因图谱的绘制也不断发展[3]。在逐步探明烟草基因图谱的基础上,烟草基因组研究转入功能基因组学阶段,即对控制烟草生长发育、逆境响应、品质等性状的基因进行克隆和生物学功能分析,挖掘优质烟草种质资源中的优异等位基因,进一步通过分子标记辅助选择方法进行育种利用[4]。

本研究运用中国知网(CNKI)和Web of Science(WOS)数据库的检索分析,同时利用CiteSpace软件绘制烟草基因组研究文献的图谱,再结合文献计量学方法,对烟草基因组研究文献进行量化分析,为烟草基因组学的研究提供参考。

1 研究设计

1.1 数据来源

本研究的中文数据来源主要为中国期刊全文数据库(CNKI)。数据字段主要包括文献的作者(Authors)、题目(Title)、摘要(Abstract)和文献的引文(Cited References)等,检索时间为2021年10月14日。中文文献数据的检索策略为在知网中选择专业检索,检索条件:SU=(‘烟草’+‘绒毛烟草’+‘林烟草’)*‘基因组’-‘小麦’-‘玉米’-‘水稻’–‘番茄’OR SU=(‘烟草’+‘绒毛烟草’+‘林烟草’)*‘基因组学’-‘小麦’-‘玉米’-‘水稻’-‘番茄’,时间段设置为1991年1月1日至2020年12月31日,去除其中不相关文献,以“Refworks”格式导出由CiteSpace软件去重后得到适合分析的文献495篇。

国外文献数据由Web of Science检索,选择Web of Science核心合集数据库,在专业检索中设置检索条件为:TS=(tobacco genome OR tobacco genomics) AND AK=(tobacco OR Nicotiana benthamiana OR Nicotiana rustica L. OR Nicotiana tabacum OR Nicotiana Sylvestris OR N. tomentosiformis) NOT TS=(rice OR cotton OR hornworm),时间段设置为1991年1月1日至2020年12月31日。进行检索后对结果进行筛选,以“纯文本”格式导出,运用CiteSpace软件进行数据的过滤与转换,得到相关的英文文献共432篇[5]。

1.2 研究工具与方法

CiteSpace软件能够对检索到的文献进行不同节点类型的知识网络分析和信息元提取,再根据信息单元间的联系类型和强度进行重构,形成具有不同意义的网络结构,对其现状及演化趋势进行总结和推测。利用信息可视化工具CiteSpace 5.8.R3对检索到的文献数据进行知识图谱挖掘,解析时间跨度、核心作者、科研机构及关键词等,生成直观的合作网络图谱、共现图谱、时区视图及时间线聚类图谱,概述烟草基因组文献的现状、研究历程及发展趋势,为烟草基因组学的研究提供参考。

2 烟草基因组研究文献现状

2.1 国内外文献发文总体趋势分析与比较

对1991年至2020年烟草基因组研究的中英文发文量进行统计,每5年中英文载文量分布如图1所示。R表示中英文发文量变化趋势线的拟合程度,数值越接近1,趋势线拟合程度越高,图1两条趋势线的R分别为0.98±0.01、0.87±0.01,表明趋势线可靠。

相关文献数量的变化能够直观地反映出烟草基因组的科研状况,在2010年以前,我国关于烟草基因组的研究不多,增长十分缓慢。自2010年之后,随着我国烟草基因组计划的启动,相关研究步入快速增长阶段,发文量总体呈指数上升(图1)。国外有关烟草基因组研究文献的发表早于国内,在2010年以前,国外文献较国内多,但自2010年之后,国内发文量显著高于国外。

图1 烟草基因组研究载文量每5年年度分布图

2.2 文献来源国家和机构分析

将CiteSpace 的节点类型设为“Country”和“Institution”得到发文国家共现网络知识图谱(图2)。发文量位于前5位的国家为中国、美国、日本、德国和英国,由复杂交叉的连线可知,各个国家之间的合作关系较为密切。发文量位于前5位的机构为中国农业科学院烟草研究所、名古屋大学、罗格斯州立大学、云南烟草农业科学院和剑桥大学(表1)。综合发文量、总被引频次与中介中心性来看,中国发文量高,美国文献影响力大。

图2 发文国家机构合作网络图谱

表1 国家机构发文概况

Tab.1 Overview of the publications of national institutions

2.3 文献作者分析

从作者合作网络共现图谱可知,发文量位居前5位的作者包括童治军、肖炳光、龚达平、刘贯山和孙玉合,作者之间合作关系紧密(图3)。

龚达平[6]在2013年与孙玉合和刘贯山等合作,通过现有的基因组数据和EST数据,对烟草超基因家族P450s进行了初步分析。童治军[7]在2018年与肖炳光等人合作,在烟草全基因组范围内进行QTL扫描分析。截至本研究数据收集时间点,以上两篇论文在中国知网上的被引频次分别达到28次和5次,下载量达到1250次和106次,表明龚达平和童治军两位作者及其合作团体在烟草基因组研究领域具有影响力。

注:圆圈的大小表示发文量,连线代表作者之间的合作关系。

2.4 文献被引分析

被引频次排名前10位的烟草基因组文献如表2所示,前10位烟草基因组文献中没有中国学者,且其中7篇均为2010年之前的文献,可见中国早期的烟草基因组研究水平相对落后。

这10篇文献的主要研究内容为:(1)Sierro等[8]研究了3个主要烟草品种的高质量基因组草图,显示了烟草与其祖先的低分化性以及与其他茄科植物的微同步性。(2)Sugiyama等[9]确定了烟草DNA的完整序列,并研究了线粒体与叶绿体在植物细胞中的遗传交互作用。(3)Bock等[10]的研究证实编辑是蛋白质发挥功能必不可少的加工步骤,为烟草细胞RNA编辑的生物学意义提供了直接证明。(4)Odell等[11]研究证明了位点特异性重组系统的有效性,为该系统的开发提供了基础。(5)Zoubenko等[12]研究发现载体是研究转基因启动子活性的理想选择。(6)Endo等[13]证实可以成功地应用于烟草的基因组工程。(7)Chilton等[14]发现了T-DNA 能够通过非同源末端连接在断裂点处插入植物基因组,表明非同源末端连接的方法具有实际应用价值。(8)Skalicka等[15]研究表明异源多倍体对烟草基因组进化有直接影响。(9)Fleischmann等[16]报告了七种核糖体蛋白质的反向遗传分析,研究了质体翻译的作用及其对基因组进化的意义。(10)Murad等[17]发现了烟草父系T基因组的来源,为烟草亲子鉴定的研究做出贡献。

表2 排名前10的高被引文献

Tab.2 The top 10 cited references with high citation frequency

续表2

注:*,影响因子为2021年的统计数据。

3 烟草基因组研究热点分析

3.1 高频关键词图谱制作

对科学知识图谱的高频关键词进行分析来确定烟草基因组研究领域的热点。选择节点“keywords”对检索到的中文文献和国外文献的关键词进行分析,制作关键词共现图谱(图4和图5)。一般而言,聚类模块值(Modularity,Q值)在区间[0,1)内,Q≥0.3意味着划分出来的结构是显著的;当聚类平均轮廓值(Silhouette,S值)在0.7以上,聚类是令人信服的[18]。图4的Q=0.947,S=0.786;图5的Q=0.8321,S=0.758,表明本次的聚类结构是合理的。

图4 中文关键词共现图谱

图5 英文关键词共现图谱

3.2 国内外烟草基因组研究热点及关键词分析

3.2.1 国内烟草基因组研究热点及关键词分析

中文关键词共现图谱(图4)显示烟草、基因组、叶绿体、基因组编辑、普通烟草和烟草花叶病毒等关键词出现频次较高,表明在我国烟草基因组的相关研究中,基因组编辑和叶绿体基因组分析等是研究热点,其中对烟草花叶病毒的研究较多。从相关文献的发表来看,近年来,SSR标记、RAPD技术和CRISPR-Cas9基因编辑技术的应用是研究热点[19-20]。

3.2.2 国外烟草基因组研究热点及关键词分析

英文关键词共现图谱(图5)中出现频次较多的关键词包括表达(expression)、基因(gene)、植物(plant)和基因组(genome)、烟草(tobacco),表明基因表达是国外烟草基因组研究的热点,大多数文献将烟草作为载体来研究其他植物基因在烟草中的表达情况。

国外烟草基因组的研究热点还包括烟草基因组的整合组装和抗逆性应用,如2017年德国马普研究所和海德堡大学的研究,结果表明在烟草全基因组三倍化后,转座元素快速扩张,烟草基因组扩大,推动了复制基因表达的分化及多个代谢途径的进化[21]。同时,近年来开展了将叶绿体基因成功“拷贝”到烟草核基因组的研究,获得了响应高温胁迫启动表达的特性[22]。

3.2.3 中英文关键词对比

(1)中英文共同关键词:包括烟草、基因组、基因表达和转基因烟草。可见国内外在烟草基因表达和转基因烟草等方面均有大量研究(表3)。

(2)中英文差别关键词:中文文献的关键词包括农艺性状、遗传分析、基因组计划、遗传多样性、分子标记、基因测定和SSR等关键词,表明国内对烟草农艺性状的改良、基因组测序、烟草基因编辑技术和烟草基因遗传十分重视。英文文献的关键词包括植物、拟南芥、进化、识别、叶绿体、质体转化等,表明国外烟草质体基因组、烟草作为模式植物及烟草基因组在其他植物中的应用等研究是重点。

表3 中英文重点关键词

Tab.3 Key words in Chinese and English

3.3 国内外烟草基因组研究历程分析

3.3.1 国内烟草基因组研究历程分析

时区图能够体现历年来关键词的演变、研究热点的更替。归纳整理1991年至2020年间烟草基因组中文文献的主要关键词并制作中文关键词时区视图(图6)和时间线聚类图(图7),圆圈位置表示关键词首次出现的年份,综合分析后将烟草基因组研究发展历程大致分为3个阶段:

图6 中文关键词时区视图

图7 中文关键词时间线聚类图

(1)2009年之前为初步研究阶段。二代测序技术的应用使人们对烟草基因组有了初步的探索和认识,主要在烟草基因的表达、转基因烟草、遗传转化与遗传多样性和分子标记等方面。同时,对部分烟草基因组的测序和基因图谱有了一定研究,但烟草基因组的框架图以及烟草全基因组信息仍不清楚。

(2)2010年至2016为快速发展阶段。2010年中国烟草基因组计划正式启动,“烟草突变体创制、筛选和分析”项目也正式开展[23]。自此,国内烟草基因组研究开始快速发展。2012年,我国制作了全球第一套烟草全基因组基因芯片,其基因覆盖度和芯片质量均处于国际领先水平[24],建成迄今为止规模最大的烟草突变体资源生物信息库和应用平台[25]。中国烟草基因组数据库不断被充实,可用于基因组浏览和多序列比对等工作。基于烟草基因组信息开发出的RFLP、SSR 和SNP分子标记在烟草基因定位、分子标记辅助选择、遗传图谱构建、种子纯度检测和种子真伪鉴定等领域发挥了重要作用[26]。这些分子标记也推动了烟草品种快速鉴别、烟草分子设计育种、烟草功能基因组和遗传多样性等研究的快速发展[27-28]。

(3)2017至今为深入探索阶段。随着烟草基因组数据库和烟草基因组图谱的不断完善,以及第三代测序技术的应用,我国在烟草基因家族、重测序、基因定位、基因组进化分析和航天诱变育种等方面均有深入研究。周世奇等[29]对烟草突变体材料进行全基因组重测序,为烟草优良变异种质资源的研究作出了贡献。谢小东等[30]开发的CRISPR/Cas9多基因编辑系统可将多个基因进行有效突变,对烟草功能基因组研究以及多性状改良有巨大的推动作用。

3.3.2 国外烟草基因组研究历程分析

(1)2000年之前,国外烟草基因组研究与烟草RNA紧密联系。1994年,Vera等[31]研究了烟草小质粒编码的RNA(RNA)在叶绿体核糖体中的作用。1996年,Kovařik等[32]为烟草复合基因组中端粒和核糖体重复的物种进化提供了证据。

(2)2000年至2010年,国外烟草基因组研究主要在烟草质体基因组方面。2005年,Sugiyama等[33]确定了烟草的完整线粒体DNA(DNA)序列并进行比较分析。2006年,Stegemann等[34]揭示了烟草细胞质体DNA转移到细胞核的分子机制。2008年,Masanori等[35]研究表明被纳入烟草叶绿体基因组的基因是有用的可持续标记物。

(3)2010年至2020年,国外烟草基因组的研究应用了各种基因编辑技术。2019年,Ankita等[36]通过CRISPR-Cas9-gRNA系统实现了一对烟草RNA的靶向突变,表明这个系统在植物靶向基因组编辑中是一种简单有效的方法。2020年,Yanagawa等[37]将蛋白转移到烟草叶片的活细胞中,证明了在不引入任何外源DNA或RNA的情况下进行植物基因组编辑的可行性。

4 烟草基因组图谱绘制的发展及趋势分析

2011年,我国采用第二代测序技术,先后完成了绒毛状烟草、林烟草和栽培烟草全基因组图谱框架图和精细图的绘制,有效解决了烟草多倍体、高重复序列基因组的组装难题,图谱质量达到国际领先水平[38]。2012年至2016年完成了标记数最多、密度最高的烟草分子遗传连锁图谱[39]。

国外烟草研究开展较早,2003年美国北卡罗来纳州立大学农业和生命科学学院启动烟草基因组测序计划,开始绘制烟草基因组图谱[40]。跨国烟草集团菲莫烟草公司于2013年至2014年先后完成了绒毛状烟草、林烟草和栽培烟草(烤烟K326、白肋烟TN90和香料烟BX)的基因组测序草图,但其测序质量和精度较我国的烟草图谱差距甚大[41]。英美烟草于2017年采用WGS + Optical Mapping的技术路线,对栽培烟草K326基因组进行了升级完善[42]。

可见,绒毛状烟草、林烟草和栽培烟草是烟草基因组的主要研究材料(图4、图5)。2017年,美国对渐狭叶烟草和欧布特斯烟草这两个野生烟草基因组进行了第三代测序,完成了基因组的组装并公开发表[43]。目前,我国充分利用烟草基因功能元件全景图、烟草重测序等技术产生的组学大数据,结合三代测序技术,持续完善烟草基因组图谱[44]。国外研究人员构建了烟草染色质互作图谱、染色质开放图谱和蛋白质-DNA互作图谱等,系统解析了烟草基因组中的染色质构象与互作、遗传变异等功能位点[45-46]。

未来,随着第四代测序技术不断发展和完善,以此为基础展开的RAD简化基因组测序(RAD-seq)、全基因组关联分析(GWAS)等规模化基因编辑技术以及大数据支撑下的基因挖掘技术将在烟草基因组研究中得到更多应用[47]。

5 结论

(1)我国烟草基因组研究起步较晚,但发展迅速。(2)中国与美国的文献在发文量和影响力方面占据国际优势地位。(3)烟草基因组测序和转基因烟草序列分析是国内外的研究热点。(4)测序技术的进步使烟草基因组图谱不断完善,基因编辑技术的发展使烟草基因组进化分析、航天诱变育种等领域的研究更加广泛和深入。

[1] 杨维恒. 分子生物学中核心概念的语义分析[D]. 太原:山西大学, 2014.

YANG Weiheng. Semantic analysis of core concepts in molecular biology [D]. Shanxi University, 2014.

[2] 刘贯山,龚达平,杨爱国. 烟草基因组学的发展现状与趋势[C]// 2010年—2011年烟草科学与技术学科发展报告. 中国烟草学会,2012:81-97.

LIU Guanshan, GONG Daping, YANG Aiguo. Development status and trend of tobacco genomics [C]//Development report of tobacco science and technology from 2010 to 2011: China Tobacco Society, 2012: 81-97.

[3] 尹国英. 茉莉酸辅助的烟草烟碱突变体筛选及分子生理学研究[D]. 重庆:西南大学,2017.

YIN Guoying. Screening and molecular physiology of tobacco nicotine mutants assisted by jasmonic acid[D]. Southwest University, 2017.

[4] 余世洲,张磊,张洁, 等. 烟属物种基因组研究进展[J]. 基因组学与应用生物学,2015, 34(07): 1541-1548.

YU Shizhou, ZHANG Lei, ZHANG Jie, et al. Research progress of tobacco genome [J]. Genomics and applied biology, 2015, 34 (07): 1541-1548.

[5] 张璐翔,邵惠芳,朱智威,等. 基于文献计量学的烟草转录组研究知识图谱分析[J]. 中国烟草学报,2018, 24(5):42-50.

ZHANG Luxiang, SHAO Huifang, ZHU Zhiwei, et al. Knowledge domains mapping analysis of tobacco transcriptome research based on Bibliometrics[J]. Acta tobacco Sinica, 2018, 24 (5):42-50.

[6] 解敏敏,龚达平,李凤霞,等. 烟草细胞色素P450的基因组学分析[J]. 遗传,2013, 35(03): 379-387.

JIE Minmin, GONG Daping, LI Fengxia, et al. Genomic analysis of tobacco cytochrome P450 [J]. Genetics, 2013, 35 (03): 379-387.

[7] 童治军,焦芳婵,陈学军,等. 7个烤烟产量相关性状的QTL定位分析[J]. 西北植物学报,2018, 38(07): 1235-1243.

TONG Zhijun, JIAO fangchan, CHEN Xuejun, et al. QTL mapping analysis of 7 yield related traits of flue-cured tobacco[J]. Journal of Northwest botany, 2018, 38 (07): 1235-1243.

[8] Nicolas Sierro, James ND Battey, Sonia Ouadi, et al. The tobacco genome sequence and its comparison with those of tomato and potato[J]. Nature Communications, 2014, 5(1): 107-127.

[9] Y Sugiyama, Y Watase, M Nagase, et al. The complete nucleotide sequence and multipartite organization of the tobacco mitochondrial genome: comparative analysis of mitochondrial genomes in higher plants[J]. Molecular Genetics and Genomics, 2005, 272(6): 603-615.

[10] Bock R, Kössel H, Maliga P. Introduction of a heterologous editing site into the tobacco plastid genome: the lack of RNA editing leads to a mutant phenotype[J]. The EMBO journal,1994,13(19): 4623- 4628.

[11] Joan Odell, Perry Caimi, Brian Sauer, Sandra Russell. Site-directed recombination in the genome of transgenic tobacco[J]. MGG Molecular & General Genetics, 1990, 223(3): 3819-3824.

[12] Zoubenko O V, Allison L A, Svab Z, Maliga P. Efficient targeting of foreign genes into the tobacco plastid genome[J]. Nucleic acids research, 1994, 22(19): 3819-3824.

[13] Akira Endo, Mikami Masafumi, Hidetaka Kaya, Seiichi Toki. Efficient targeted mutagenesis of rice and tobacco genomes using Cpf1 from Francisella novicida[J]. Scientific Reports, 2016, 6(1): 448-462.

[14] Chilton Mary-Dell M, Que Qiudeng. Targeted integration of T-DNA into the tobacco genome at double-stranded breaks: new insights on the mechanism of T-DNA integration[J]. Plant Physiology, 2003, 133(3): 956-965.

[15] K Skalická, KY Lim, R Matyasek, et al. Preferential elimination of repeated DNA sequences from the paternal,genome donor of a synthetic, allotetraploid tobacco[J]. New Phytologist, 2005, 166(1): 291-303.

[16] Fleischmann, Tobias T, Scharff, et al. Nonessential plastid-encoded ribosomal proteins in tobacco: a developmental role for plastid translation and implications for reductive genome evolution(W) (OA)[J]. Plant Cell, 2011, 23(9): 3137-3155.

[17] Murad, L Lim, KY Christopodulou, et al. Leitch, AR. The origin of tobacco's t genome is traced to a particular lineage within(solanaceae)[J]. American Journal of Botany, 2002, 89(6): 921-928.

[18] 王小明. 我国高校教学质量研究:轨迹、热点及未来走向——基于高等教育十四种核心期刊的Citespace可视化分析[J]. 教育学术月刊,2018(01): 91-103.

WANG Xiaoming. Research on teaching quality of colleges and universities in China: track, hot spots and future trend -- CiteSpace visual analysis based on 14 core journals of Higher Education [J]. Educational academic monthly, 2018 (01): 91-103.

[19] 耿歆淇,杨惠娟,秦艳青,等. 基于不同烟草类型基因组重测序的烟草SSR标记的开发和应用[J]. 作物杂志,2019(02): 84- 89.

GENG Xinqi, YANG Huijuan, QIN Yanqing, et al. Development and application of SSR markers in tobacco based on genome re sequencing of different tobacco types [J]. Journal of crops, 2019 (02): 84-89.

[20] 郑赛. CRISPR/Cas9介导烟草的基因编辑及家族生物学效应分析[D]. 重庆:西南大学,2018.

ZHENG Sai. CRISPR/cas9 mediated gene editing of tobaccoand analysis of biological effects offamily[D]. Southwest University, 2018.

[21] Jinggong Guo, Kun Li, Lifeng Jin, et al. A simple and cost-effective method for screening of CRISPR/Cas9-induced homozygous/biallelic mutants[J]. Plant Methods, 2018, 14(1): 764-372.

[22] 张剑锋,李阳,金静静,等. 烟草叶绿体基因工程研究进展[J]. 烟草科技,2017, 50(06): 88-98.

Zhang Jianfeng, Li Yang, Jin Jingjing, et al. research progress of tobacco chloroplast genetic engineering[J]. Tobacco science and technology, 2017, 50 (06): 88-98.

[23] 刘贯山. 烟草基因组计划进展篇:2.烟草突变体创制、筛选与鉴定[J]. 中国烟草科学,2013, 34(02): 113-114.

LIU Guanshan. Progress of tobacco genome project: 2. Creation, screening and identification of tobacco mutants[J]. Chinese Journal of tobacco science, 2013, 34 (02): 113-114.

[24] 曹祥金. 基因研究“芯”力量[N]. 东方烟草报,2014-07-23(007).

CAO Xiangjin. Core power of gene research [n]. Oriental tobacco news, July 23, 2014 (007).

[25] 刘贯山. 烟草基因组计划重大专项成功创制了全球最大的烟草突变体库[J]. 中国烟草学报,2012, 18(01): 2-3.

LIU Guanshan. The major project of tobacco genome project successfully created the world's largest tobacco mutant library[J]. Acta tobacco Sinica, 2012, 18 (01): 2-3.

[26] 陈杰,杨静,龙胜贤,等. SSR分子标记在烟草研究中的应用进展[J]. 生物技术通报,2015, 31(03): 43-48.

CHEN Jie, YANG Jing, LONG Shengxian, et al. Application progress of SSR molecular markers in tobacco research[J]. Biotechnology bulletin, 2015, 31 (03): 43-48.

[27] 唐静. 基于质谱技术的组学数据分析的算法研究及工具开发[D].重庆:重庆大学,2019.

TANG Jing. Algorithm research and tool development of omics data analysis based on mass spectrometry[D]. Chongqing University, 2019.

[28] 余世洲,曹培健,李泽锋,等. 基于烟草基因组重测序数据的SNP提取软件组合比较[J]. 烟草科技,2017, 50(10): 1-7.

YU Shizhou, CAO Peijian, LI Zefeng, et al. Comparison of SNP extraction software combinations based on tobacco genome re sequencing data [J]. Tobacco science and technology, 2017, 50 (10): 1-7.

[29] 周世奇,刘东阳,潘旭浩,等. 烟草航天诱变突变体变异检测及分析[J]. 植物遗传资源学报,2019, 20(02): 377-386.

ZHOU Shiqi, LIU Dongyang, PAN Xuhao, et al. Mutation detection and analysis of tobacco space mutation[J]. Journal of plant genetic resources, 2019, 20 (02): 377-386.

[30] 谢小东,高军平,李泽锋,等. CRISPR/Cas9介导烟草多基因编辑体系的应用[J]. 中国烟草学报,2019, 25(04): 72-80.

XIE Xiaodong, GAO Junping, LI Zefeng, et al. The application of CRISPR / cas9 mediated tobacco polygene editing system [J]. Acta tobacco Sinica, 2019, 25 (04): 72-80.

[31] Vera A and Sugiura M. A novel RNA gene in the tobacco plastid genome: its possible role in the maturation of 16S rRNA.[J]. The EMBO journal, 1994, 13(9) : 2211-2217.

[32] A. Kovařik et al. Species-specific evolution of telomeric and rDNA repeats in the tobacco composite genome[J]. Theoretical and Applied Genetics, 1996, 92(8): 1108-1111.

[33] Y. Sugiyama et al. The complete nucleotide sequence and multipartite organization of the tobacco mitochondrial genome: comparative analysis of mitochondrial genomes in higher plants[J]. Molecular Genetics and Genomics, 2005, 272(6) : 603-615.

[34] Stegemann Sandra and Bock Ralph. Experimental reconstruction of functional gene transfer from the tobacco plastid genome to the nucleus[J]. The Plant cell, 2006, 18(11): 2869-2878.

[35] Masanori Shimizu et al. Selectable tolerance to herbicides by mutated acetolactate synthase genes integrated into the chloroplast genome of tobacco[J]. Plant Physiology, 2008, 147(4): 1976-1983.

[36] Ankita Shrestha and Ahamed Khan and Nrisingha Dey. CRISPR- Cas9-Mediated Editing of the CYP82E4-Nicotine N-Demethylase (nnd) Gene in Tobacco Protoplasts[J]. Journal of Plant Biochemistry & Physiology, 2019, 7(1) : 1-7.

[37] Yanagawa Yuki et al. I-SceI Endonuclease-Mediated Plant Genome Editing by Protein Transport through a Bacterial Type III Secretion System[J]. Plants, 2020, 9(9) : 1070-1070.

[38] 何沛,苏代发,杨俊誉,等. 二代测序技术在烟草中的应用进展[J]. 生命科学研究,2020, 24(03): 234-240.

HE Pei, SU Daifa, YANG Junyu, et al. Application progress of second generation sequencing technology in tobacco[J]. Life science research, 2020, 24(03): 234-240.

[39] 中国烟草基因组重大专项首席科学家团队. 战略与机遇:迈进烟草基因组时代[J]. 中国烟草学报,2017, 23(03): 8-13.

Chief scientist team of China tobacco genome major project. Strategy and opportunity: stepping into tobacco genome era[J]. Acta tobacco Sinica, 2017, 23 (03): 8-13.

[40] 汪开治. 美启动烟草基因组测序计划[J]. 生物技术通报,2004(04): 57.

WANG Kaizhi. US launched tobacco genome sequencing project [J]. Biotechnology bulletin, 2004 (04): 57.

[41] 胡日生. 国际领先的烟草基因组研究[J]. 湖南烟草,2017(05): 55-57.

HU Risheng. World leading tobacco genome research[J]. Hunan tobacco, 2017 (05): 55-57.

[42] 张蕊. 基于烟草全基因组重注释的碱性亮氨酸拉链鉴定与功能分析[D]. 泰安:山东农业大学,2020.

ZHANG Rui. Identification and functional analysis of basic leucine zipper based on tobacco genome re annotation[D]. Shandong Agricultural University, 2020.

[43] 卢鹏,金静静,李泽锋,等. 基于第三代测序技术的基因组组装方法及其在烟草中的应用[J]. 烟草科技,2018, 51(02): 87-94.

LU Peng, JIN Jingjing, LI Zefeng, et al. Genome assembly method based on third-generation sequencing technology and its application in tobacco[J]. Tobacco science and technology, 2018, 51(02): 87-94.

[44] 杨荣武. 分子生物学[M]. 南京大学出版社:普通高等教育“十三五”规划教材,2017.

YANG Rongwu. Molecular biology[M]. Nanjing University Press: textbook for the 13th five year plan of general higher education, 2017.

[45] Abdurakhmonov Ibrokhim Y, Ayubov Mirzakamol S, Ubaydullaeva Khurshida A, et al. RNA interference for functional genomics and improvement of cotton (Gossypium sp.)[J]. Frontiers in plant science, 2016, 7.

[46] Mehmood Furrukh, Abdullah, Ubaid Zartasha, et al. Plastid genomics of(Solanaceae): insights into molecular evolution, positive selection and the origin of the maternal genome of Aztec tobacco ().[J]. PeerJ, 2020, 8: 9552-9552.

[47] 张百厚,张敬一. 迈向舞台中央——写在国家烟草基因研究中心成立十周年之际[J]. 中国烟草学报,2020, 26(06): 121.

ZHANG Baihou, ZHANG Jingyi. Towards the center of the stage-- written on the 10th anniversary of the establishment of the national tobacco gene research center [J]. Chinese Journal of tobacco, 2020, 26 (06): 121.

Knowledge domains mapping analysis of tobacco genome based on bibliometrics

ZHANG Yuchan1, TIAN Jiashu1, WANG Xiaoli2, JING Yizhuo1, HUANG Wuxing1, HAN Dan1*, XU Zicheng1

1 College of Tobacco Science,Henan Agricultural University, Zhengzhou 450002, China;2 Xiangyang Branch of Hubei Tobacco Company, Xiangyang 441003, Hubei, China

This study aims to explore the current status, development process, key frontiers and research direction of tobacco genome. [Method] Bibliometrics and CiteSpace information visualization software were used to conduct data mining on the publications related to tobacco genome research in two databases, CNKI and Web of Science.(1) The number of publications about the tobacco genome had an obvious increasing trend in recent years. (2) The literature of China and the United States occupied an dominant position in terms of publication volume and influence. (3) Domestic scholars such as Zhijun Tong, Bingguang Xiao and Daping Gong and their teams achieved prominent genomic research results. Foreign scholars such as Sierro had strong academic influence in this field. (4) Benefiting from the development of sequencing technology, tobacco genome research had achieved rich results in gene labeling technology, gene identification and analysis, genome sequencing and genome mapping. At the same time, tobacco genome was widely used in tobacco resistance research, tobacco virus and agronomic trait improvement.China's tobacco genome research has been among the forefront of the world, which has effectively promoted the development of modern tobacco and the cultivation of high-quality tobacco varieties.

tobacco; genome; knowledge domains map; bibliometrics; CiteSpace visualization

Corresponding author. Email:hd1987@henau.edu.cn

河南省科技攻关项目“利用转录因子WRKY70提高茄科作物硒元素利用效率的研究”(212102110066)

张玉婵(1999—),硕士研究生,主要从事烟草营养生态研究,Email:1165298568@qq.com

韩丹(1987—),博士,讲师,主要从事烟草营养生态研究,Email:hd1987@henau.edu.cn

2021-08-16;

2022-01-14

张玉婵,田嘉树,王晓丽,等.基于文献计量学的烟草基因组研究知识图谱分析[J]. 中国烟草学报,2022,28(4).ZHANG Yuchan, TIAN Jiashu, WANG Xiaoli, et al. Knowledge domains mapping analysis of tobacco genome based on bibliometrics[J]. Acta Tabacaria Sinica, 2022,28(4). doi: 10.16472/j.chinatobacco. 2021.T0140

猜你喜欢

图谱基因组烟草
上海烟草包装印刷有限公司
基于图对比注意力网络的知识图谱补全
“植物界大熊猫”完整基因组图谱首次发布
牛参考基因组中发现被忽视基因
绘一张成长图谱
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
图表
主动对接你思维的知识图谱
全国首次青少年烟草调查