基于CiteSpace 对水果无损检测研究进展和趋势的可视化分析
2023-08-13孙元明李冬升李同玺张永成兰海鹏
丁 燕,孙元明,李冬升,李同玺,张永成,刘 扬,兰海鹏,
(1.塔里木大学机械电气化工程学院,新疆阿拉尔 843300;2.塔里木大学图书馆,新疆阿拉尔 843300;3.新疆生产建设兵团第一师阿拉尔职业技术学校,新疆阿拉尔 843300)
近年来,随着科学技术的发展和人民生活水平的不断提高,国际水果进出口市场竞争的增加,水果的质量管理变得尤为重要。水果无损检测是指在不损伤待检水果的前提下,运用一定的检验技术和方法对水果的内在及外在质量进行检查,并按照相应的要求对其进行评估的过程[1]。水果的外观、缺陷、色泽、成分等品质用传统的检验方法均难以实现无损伤、在线检测。所以,研究快捷、高效、准确的果蔬质量监测技术,对改善果蔬交易价格有着非常关键的现实意义[2]。
当前,国内外学者对水果无损检测的研究已有大量成果,主要集中在对水果的无损检测方法、水果品质检测、水果分级等方面。事实上,研究者如果只通过阅读大量文献来开展科研,则难以精确掌握当前该领域的研究趋势、研究热点及前沿,加上每个研究者的科研能力差异,便造成了对研究领域的发展趋势产生判断偏差[2]。文献计量学是指以研究领域机构共引、作者合作网络以及主题和领域共现为主体,用数学和统计学的方法,定量描述和监测已发表的研究文献,解析当前研究领域的学术发展趋势和科研热点[3]。2004 年,陈超美博士团队开发了一款文献计量的建模软件—CiteSpace,由于该软件能够将研究领域的结构、动态模式和趋势进行可视化分析,在学术界备受关注[4]。所以,本文选择该软件对水果无损检测领域的文献进行可视化分析。
考虑到水果对人类生活的重要性,本文基于CNKI及Web of Science 核心数据库中水果无损检测领域的研究文献为主体,选取2012~2022 年的文献数据,利用CiteSpace 软件对水果无损检测领域的相关文献进行计量分析,利用其系统的、透明的、可重复的审查过程,准确掌握水果无损检测领域前沿的演进路径及经典基础文献,以期为水果无损检测领域的后续研究学者提供借鉴。
1 研究设计
1.1 数据来源
本文数据选取CNKI 核心期刊库和Web of ScienceTM核心数据集为数据来源。由于在CiteSpace中,有针对性的主题检索效果相对最好,因此本研究CNKI 数据以主题途径检索,检索式=“水果+农产品+梨+苹果+西瓜+葡萄+柑橘+香蕉”AND“无损检测+无损伤检测+无损检验+无损伤检验”精确检索,时间节点选取2012 年1 月1 日~2022 年9 月30 日,并手动剔除报道、会议文件、卷首语等数据,共获得相关文献1322 篇。外文期刊数据选择Web of ScienceTM核心数据集,以主题=“(*Nondestruct* *Test* OR Nondestructive OR No damage Test)and (*Fruit OR Apple OR Agricultural products OR citrus OR crops OR Watermelon OR grape OR banana OR pear)”进行检索,共检索到文献3857 篇,通过手动剔除重复、无效等文献,最终获得有效文献3526篇。
1.2 分析方法
本研究采用CiteSpaceV.6.1.R2 软件进行可视化分析。将从CNKI 核心期刊库及Web of ScienceTM核心数据库检索到的相关文献数据以文本格式导出,经过CiteSpace 软件进行格式转化后导入CiteSpace主界面中,时间跨度选择2012 年1 月~2022 年9 月,时间分区为1 年,设置Top N=10,TopN%=20,阈值分别设置为(2、2、20)、(4、3、20)、(4、3、20)。对获取的文献数据进行作者、机构、国家、关键词及引文文献进行可视化分析。
1.3 数据处理
本文通过CNKI 和Web of Science 系统自带的统计分析功能对年度发文量及被引情况进行量化分析,并用Excel 软件绘制图表。此外从CNKI 和Web of Science 核心数据库将全部文献相关信息导出并保存为txt 格式,利用CiteSpace 软件的数据分析板块进行处理,对水果无损检测领域的发文国家、机构、作者合作关系及关键词进行统计分析,在绘制知识谱图的基础上,阐明不同时期的研究热点以及未来的研究趋势。
2 结果与分析
2.1 历年发文量分析
2.1.1 国内发文量及被引分析 发文量反映了科研人员对该领域热点问题的关注程度,表明了相关领域研究的发展程度和发展速度[5],2012~2022 年间水果无损检测研究文献的年度发文量总体呈上升趋势(图1)。通过对CNKI 核心期刊库发文量数据进行分析,2012 年至2015 年是水果无损检测领域发表相关文献研究的起步阶段,年度发文量均保持在100上下,通过对文献被引频次数据进行分析(表1),2014年北京市农林科学院张保华、李江波等人团体通过深入了解高光谱成像技术的检测原理并跟踪国内外最新的研究进展,将高光谱成像技术应用在水果和蔬菜外部品质、内部品质和品质安全检测中[6],并简要介绍和讨论了高光谱成像系统的构成、常用的数据分析方法、发展趋势及面临的挑战,该研究确立了无损检测技术的主要研究对象及研究方法,截止2022年10 月7 日,该文献被引用118 次,下载3900 次,成为这一时期高被引、高下载文献。2016 年至2022 年该领域研究文献发表量持续增加,趋势明显加快,增长率介于1.3%~14.44%之间,年平均增长率为7.82%,这一时期共发表文献1055 篇,通过文献分析,发现这一时期主要针对无损检测技术将水果及农产品进行分级分类,并出现了电子鼻等新的无损检测技术,研究的方向主要为品质检测、成熟度检测及损伤程度分析等,同时也可以看出,这一时期的研究基本成型[6-10],研究的主体以及方向大体一致。
图1 国内外发文量Fig.1 Number of posts at home and abroad
表1 排名前5 的高被引论文Table 1 Top 5 highly cited papers
2.1.2 国外发文量及被引分析 通过对Web of ScienceTM核心数据库检索到的相关文献数据进行分析(图1、表1),可明显看出,从2012 年起,该领域研究文献一直呈显著增长,年均发文量约为321 篇,并且研究方向大致分为两个阶段,2015 年之前以无损检测技术方法为主要研究方向,2015 年之后以无损检测技术用途为主要研究方向,其中,西班牙的Lorente, D 团队研究的光谱成像的最新进展和应用水果和蔬菜质量评估于2012 年5 月发表在《Food and Bioprocess Technology》期刊上,通过高光谱成像系统对食品质量评估的短板出发,开发基于该技术的新系统,该系统能够分析无法使用可见成像检查的质量特征,可用于对这些产品的内部和外部特征进行无损检测[11-15],该文献被引频次达401 次,这为水果无损检测领域的研究奠定了方向。
通过对国内外发文量及被引分析可知,国内外的研究主体及方向大多保持一致,并持续呈上升趋势,全球发文量的飞速增长很大程度上得益于水果无损检测研究领域的快速发展,同时也吸引了更多的学者关注该领域,因而近些年文献发表量出现持续增长趋势。
2.2 发文国家(机构)分析
2.2.1 发文国家分析 如表2 所示,对Web of ScienceTM核心数据库检索到的3526 篇文献进行分析,可以看出,该领域的发文量在全球分布不均。中国发文880 篇,占比达24.96%,是该研究领域发文最多的国家。我国目前是全球人口最大的发展中国家,同时也是全球人口第二大经济体,随着2021 年的脱贫攻坚全面胜利,人们的生活水平逐渐提升,对水果的品质要求也越来越高,因此对该领域的研究最多。第二为美国,共发文786 篇,占比21.68%。其次为巴西、西班牙、意大利等国家,根据前瞻产业研究院《中国水果制品行业市场前瞻与投资战略规划分析报告》可以看出,全球水果种植产量和种植面积60%以上均来自于中国和美国,这也是其他国家在研究领域发文较少的重要原因。通过对排名前5 的发文国家年度发文量分析(图2),各个国家在水果无损检测领域的研究文献呈持续上升,自2012 年以来,水果无损检测方面的文献发表量逐年递增,2021 年全球发文量达到最高(276 篇),当年发文量占2012 年~2022年总发文量的13.84%,表明水果无损检测研究已经成为当下全球关注的焦点。可以看出,随着社会经济快速发展,越来越多的国内外学者关注水果无损检测领域的发展。
图2 排名前5 的发文国家的年度发文量Fig.2 Annual publication volume of the first 5 published countries
表2 发文量排名前10 的国家Table 2 Top 10 countries in the number of publications
2.2.2 发文机构分析 通过对获取的国内外文献进行发文机构分析(表3)。可以看出,国内发文机构均为大学,这些机构构成了我国该领域的研究的主要力量。其中发文最多的机构为中国农业大学,共发文84 篇,其次为浙江大学(32 篇)、江苏大学(30 篇)等机构。外文文献发文机构前十中有6 个来自于中国,4 个来自于美国,且是由8 所高等院校和2 所农业科学研究院组成,说明该研究领域全球发文量极不平衡,且以国家级科研机构为主体。其中,浙江大学以发文105 篇成为该领域研究最多的机构,其次为美国农业部农业研究所(80 篇)、中国农业大学(76篇),说明了中国学者对该领域研究关注度较高,在全球已具有一定的影响力。
表3 排名前10 的国内外研究机构Table 3 Top 10 domestic and foreign research institutions
通过将发文机构中的国内机构进行整合,得出4 个研究机构的发文量,分别为中国农业大学160篇、浙江大学137 篇、西北农林科技大学69 篇、江苏大学64 篇,并对其年度发文趋势进行分析(图3),大致分为3 个阶段,2012 年~2015 年,国内研究机构处于快速发展阶段,说明国内学者对水果无损检测研究的重视程度在不断增加;2015 年~2018 年,国内研究机构发文量相对平稳;自2019 年开始,水果无损检测相关研究成果出现了缓慢下降的趋势,但2021 年稍有回升,这种现象可能与新冠疫情有关,相信在不久的将来人类终将战胜疫情,恢复科研生产力。
图3 国内研究机构年度发文量Fig.3 Nnual publication volume of domestic research institutions
2.3 核心研究团队分析
2.3.1 国内发文作者分析 通过发文作者共现网络分析可以得出合作密切的学者群发掘学术研究的团队效应[16],为进一步了解主要研究作者间的合作关系,将从CNKI 核心期刊库获取的文献数据导入CiteSpace 中,进行发文作者的可视化分析(图4),图谱共产生节点440 个,连线492 条,网络密度为0.0051。图中的结点代表发文作者,结点标签文字越大则代表该作者发文量更多,之间的连线则代表写作双方的合作程度,而连线的颜色越深则代表双方合作更紧密[17]。根据分析可得,国内该研究领域以团体研究居多,其中应义斌—刘燕德团体、于小庭—任圆—何贤团体、彭彦昆—李永玉团体、北京农林科学院团体发文量较多,在水果无损检测领域中处于领先地位,说明目前水果无损检测领域研究是靠几位核心作者带动的;且应义斌是合作网络中与外界联系较多的主要作者,可以看出,我国该研究领域的作者之间合作较为紧密,独立研究作者相对较少,且已经形成了较为稳定的研究团体。
2.3.2 国外发文作者分析 通过对国外发文作者合作图谱(图5)进行分析,共产生1014 个节点,988 条连线,网络密度为0.0019。其中有2 个较大的研究团体,Jiangbo Li 与其他17 位作者构成的合作群最大,这2 个中心网络内的作者间协作较为紧密,也代表了在水果无损检测研究领域最为活跃的科研团队;周围还分布着不少的5~10 人的中型合作团体,与其他团队间合作较少,表明大部分水果无损检测研究人员分布广泛且独立性较强,如果能够加强作者之间,尤其是来自不同国家或机构的作者之间的合作研究,可以极大地促进该研究领域学术思想的交流和创新。从发文量来看,排名前3 位的作者有Jiangbo Li、Wenqian Huang 和Shuxiang Fan,分别发表了30、24、20 篇文章,他们在该研究领域较为活跃,表明其在水果无损检测领域的研究具有较强的影响力。通过上述分析可以发现,两大合作集团的主要成员分别来自中国和美国,这也进一步表明了中国与美国在水果无损检测研究领域的重要地位。
图5 国外发文作者合作图谱Fig.5 Cooperative map of foreign published authors
2.4 高被引文献网络分析
2.4.1 文献共被引分析 如果前两篇(或多篇文章)一起被后来的或多篇文章所引证,则称这两篇论文构成共被引关系。共被引分析通过同时被其他文献引用的频次来表达文献间的关系[18],引文的频率越高,就表示联系越密切,也就表示了这两种文献的学术背景更接近。但鉴于文献共被引的可视化功能仅用于Web of Science 文献数据信息,所以本研究只针对于外文的文献数据信息中的共被引现象研究[19]。通过可视化共得到278 个节点,1189 条连线,网络密度为0.0309,生成文献共引网络图谱(图6)。在图表中的结点表示被引的文章,结点数量越大代表其被引用频率越高,而结点相互之间的连接则代表共引关联,粗细代表共引的大小。从图6 可以看出,Mendoza F(2011)这篇文章是一篇非常重要的论文,因为他的被引频次最高,说明其在该领域内具有重要影响,此外,还发现文献共引网络有比较明显的自然聚类,大体分为2 类,通过13 篇关键文献使这两个聚类紧密联系在一起,且两个聚类的活跃时间也有着显著区别[20],2014 年以前的主要在图的左上方,2015 年之后的主要在图的右下方,这说明该领域主要有2 个研究方向,并且联系紧密。
图6 文献共被引图谱Fig.6 Document co-citation map
2.4.2 文献共被引聚类分析 利用CiteSpace 聚类功能进行文献共被引的聚类分析,可以让我们挖掘相似文献的共同主题,从主题角度分析共被引每一个簇所代表的主题,无需我们在共被引的图谱上再进行人工归纳总结[21]。通过对该领域文献共被引分析图谱进行聚类分析,生成22 个聚类,聚类效果良好。并自动生成8 个聚类标签视图(见图7),通过分析聚类标签,将该领域研究划分为2 个研究方向。
图7 文献共引网络聚类标签图谱Fig.7 Document co-citation network cluster label map
一是水果无损检测技术的研究对象。该研究方向中共有4 个聚类标签,分别为#0 发霉的苹果心(moldy apple core)、#1 荔枝果皮(lychee pericarp)、#2 柑橘类果实(clementine mandarin fruit)、#5 农产品(agro-food product),可以看出,无损检测技术的应用领域特别广,但主要集中在人们生活中可食用的范围之内,研究对象针对性强。
二是水果无损检测技术的研究方法。该研究方向中共有4 个聚类标签,分别为#3 在线预测(online prediction)、#4 溶液法(solution method)、#6 可见光谱线性化梯度偏移(visible spectral linearisation gradient shift)、#5 机器视觉系统(using machine vision system),可以看出,随着时代的不断进步,人们针对无损检测技术的方法不断改善,针对不同产品的不同品质检测需求都有相对较好的检测方法,为该领域的研究提供了技术保障[22-24]。
2.5 关键词共现及研究领域分析
2.5.1 关键词共现分析 关键词是对文献研究内容的高度概括,高频关键词可以在一定程度上反映某一研究领域的热点。CiteSpace 的关键词共现分析可以直观反映某一研究领域当前的研究热点以及过去的研究热点[25]。本研究中通过对水果无损检测领域的国内外研究文献进行关键词共现分析,见图8 和图9。关键词节点较大,文献提及次数较多,关键词间的连线密集,被共现程度高。
图8 CNKI 关键词共现图谱Fig.8 CNKI Keyword co-occurrence map
图9 Web of Science 关键词共现图谱Fig.9 Web of Science Keyword co-occurrence map
对CNKI 数据库中目标文献进行关键词共现,得到262 个关键词节点、306 条节点间连线。国内水果无损检测研究领域文献中除检索词“无损检测”和“水果”外,与其共现次数较多的节点有“苹果”、“糖度”、“介电特性”、“内部品质”、“成熟度”等,这反映出苹果是水果无损检测领域的重要研究对象,糖度、品质、成熟度是水果无损检测的重要目的,此外,“光谱分析”、“机器视觉”也是一个较大的结点,是水果无损检测的重要手段,由此可以看出,国内针对水果无损检测的研究已经形成了相对成型的知识网络。
对Web of Science 数据库中目标文献进行关键词共现,得到353 个关键词节点和510 条连线。国外围绕该领域的研究的高频关键词之间联系网络颜色较深、线条较粗、网络较为密集,说明它们之间共现时间、共现次数和共现程度较高[26]。水果无损检测研究领域文献中除检索词“fruit(水果)”和“nondestructive measurement(无损检测)”外,高频关键词主要包括“quality(品质)”、“soluble solids(可溶性固形物)”、“firmness(硬度)”等,说明在水果无损检测时,往往将实际问题建模为多目标优化问题,此外在附近还出现了一些比较大的节点,包括“near infrared spectroscopy(近红外光谱)”、“spectroscopy(光谱分析)”等等[27-28],这说明在水果无损检测时,光谱分析是比较适合当前研究的重要内手段。由此可以看出,国内外对该研究领域的方向大体一致,国外对该领域研究起步较早、成果更为丰富,研究涉及方面更多,内容更细,也为国内的研究者们提供了更多的研究方向。
2.5.2 关键词聚类分析 图10、图11 分别为基于CNKI 和Web of Science 数据库的关键词聚类时间序列图谱。在关键词聚类分析网络中,CiteSpace 依据网络结构和聚类清晰度提供了聚类模块值(Q 值)和聚类平均轮廓值(S 值)两个指标,可以作为我们评判图谱绘制效果的依据。一般而言,Q 值一般在区间[0,1]内,Q>0.3 就意味着划分出来的社团结构是显著的;当S>0.7 时,聚类是高效率且令人信服的[29]。本研究中,基于CNKI 数据库的关键词聚类分析结果Q 值为0.8358,S 值为0.9831;基于Web of Science数据库的关键词聚类分析结果Q 值为0.8484,S 值为0.9701,可认为该图谱的分析结果是令人信服的。
图10 CNKI 关键词聚类时间序列图谱Fig.10 CNKI Keyword cluster time series map
图11 Web of Science 关键词聚类时间序列图谱Fig.11 Web of Science Keyword cluster time series map
图谱中的结点和颜色分别代表关键词出现的频率和年份,关键词间的连线代表关键词共现的年份。国内文献中,通过对聚类时间序列图谱进行分析,可以看出,该研究领域的聚类标签可以分为两类,第一类为该领域的研究对象(#1 红提、#3 西瓜、#6 苹果)。第二类为水果无损检测的检测方法,(#2 介电特性、#4 电子鼻、#5 光谱分析、#7 机器视觉、#8 光谱校正),提示二者相互伴生。从序列知识图谱的演变来看,水果无损检测中品质检测是长期的,检测手段也从外部特征到电学参数至现在的光谱分析,而水果的分级及贮藏将会成为以后的研究重点。
国外该研究领域中,聚类标签大体可分为研究指标(#0 radio protective effect 抗辐射指数、#4drosophila suzukii 果蝇、#5 overload-induced renal oxidative damage 损伤程度、#6 internal qualities 内部品质)和研究方法(#1 non-invasive monitoring 无损检测、#2 direct analysis 直接分析法、#3 early detection早期检测、#8 spectral shift 光谱偏移度),说明国外研究以研究方法为主体,更注重无损检测的技术更新,并且该研究方向还在持续。综合聚类标签来看,国内外水果无损检测的研究聚焦的大趋势基本一致,但国内研究更注重于技术的应用领域,国外研究领域更为全面,研究更注重技术的更新,在研究方向上存在部分差异。
2.6 研究进展与前沿热点分析
通过对关键词的共现和聚类分析不难发现,除出现中心量较大的关键词之外,也有产生突现值高的关键词,突现值高则表明了关键词在某一时期快速产生的数量,能够反映某一时段该领域的研究热点及前沿[30-31]。本文通过导出突现值关键词,获得CNKI 高突现值关键词11 个,Web of Science 高突现值关键词17 个,见图12、图13。
图12 高突现值关键词(CNKI)Fig.12 High present value keywords (CNKI)
图13 高突现值关键词(Web of Science)Fig.13 High present value keywords (Web of Science)
通过对CNKI 高突现值关键词图谱进行分析,可以看出,在2012 年~2022 年突现时间较早的词是“西瓜”,是该领域最早被研究的水果;2013 年之后出现突现强度高的关键词是“西瓜”(4.25)、“分级”(3.97)和“硬度”(3.84),表明西瓜的无损检测、果实的分级和硬度检测是2018 年之前的研究重点,近几年受关注的的关键词是“随机森林”、“光谱分析”和“脐橙”,突现强度最高的是“脐橙”(2.13),表示对脐橙的无损检测研究是目前该领域的研究前沿。突现时间最长的是“光谱分析”,并且仍在继续,说明无损检测目前最常用的研究方法方法主体是光谱分析[32]。
通过对Web of Science 高突现值关键词图谱进行分析,得出在2012 年~2022 年突现时间较早的词是“Sugar 糖分”,说明水果无损检测领域一开始的目的是为了检测水果的含糖量;出现突现强度高的关键词是“Nondestructive prediction 无损预测”(5.5)、“Optical property 光学性质”(5.42)、和“Spectra 光谱”(5.1),表明国外对于水果无损检测领域研究重点是检测技术,2020 年之后同时出现的高突现关键词是“Nondestructive prediction 无损预测”、“Machine leaning 机器学习”、“Algorithm 算法”和“Water 水”,表示现在的消费者更注重水果的新鲜程度,因为水果的贮藏期与水分的流失有着密不可分的关系,因此对水果含水率的检测也成为了该领域的研究前沿,并且结合计算机领域的新的算法和新的科学(Machine leaning 机器学习)进行研究,并且会持续在该领域进行技术更新,为国内的水果无损检测研究提供了新的方向。突现时间最长的是“Vis/nir spectroscopy(VIS/NIR 光谱技术)”,与国内研究方法一致,说明光谱技术分析在该研究领域应用时间最长[33]。
3 结论
本研究通过CiteSpace 文献计量分析软件对水果无损检测研究领域的近十年中外文文献进行可视化研究,较为直观科学的呈现了该领域的研究热点及趋势。水果无损检测领域在2012~2022 年间发文总量总体呈上升趋势,特别在2016 年以后,发文总量有明显的大幅提升,结果表明,越来越多的国内外学者开始关注水果无损检测研究领域。发文国家中,中国及美国发文总量占到的全球的46.64%,是水果无损检测研究领域具有较大影响力的国家。通过绘制和分析关键词共现图谱和聚类图谱,发现:苹果是水果无损检测领域的重要研究对象,糖度、品质、成熟度是水果无损检测的重要目的,光谱分析是水果无损检测的重要手段。通过对国内外发表文献的聚类图谱及高突现值图谱进行分析,可以得出,国内外相关研究在热点领域基本一致,但在侧重点和研究进展略有不同,国内更专注于该领域的研究对象和检测指标,而国外则在果实品质监测的指标更为细致和充分,并且在技术更新领域研究较为活跃。
未来应加强各国研究团体之间的科研协作,关注该领域的研究热点及发展趋势,扩宽对水果无损检测研究的深度和广度,从而全面推进水果无损检测向国际化发展。