APP下载

基于文献计量的农作物种植结构遥感提取发展态势分析

2023-09-15张代维马友华王肖飞

江苏农业学报 2023年4期
关键词:发文农作物领域

张代维, 马友华, 吴 雷, 王 强, 王肖飞

(1.安徽农业大学资源与环境学院,安徽 合肥 230036; 2.安徽省北斗精准农业信息工程实验室,安徽 合肥 230036)

农业是社会经济发展的基础,农业生产对粮食安全、土地资源管理和社会稳定有至关重要的作用[1-3]。农作物种植结构是农业生产活动对土地利用的具体体现形式,其主要包括3个方面的内容:一是作物的种植类型和空间分布;二是种植的规模;三是农作物的种植模式,包括连作、轮作、间作和套种等模式[4-6]。高精度且快速地提取农作物种植结构不仅可以为农作物生长监测、产量预测、农田灌溉和灾害评价等农业应用提供基础,也是整体把握粮食储备、评估人口承载能力和农产品价格调控等决策的重要依据,对增强区域农业竞争力、优化农业资源利用、保障粮食安全、促进可持续发展都具有重要的意义[2,7]。

获取农作物种植结构信息的方法主要包括调查统计和遥感提取。中国农作物种植结构具有范围广、面积大的特点,传统的调查统计方式存在着主观性强、调查周期长、数据更新缓慢、缺乏空间信息的问题,且调查过程中需要大量的人力财力,无法及时、有效、经济地获取种植结构信息[8-9]。遥感技术具有时效性强、监测范围广、成本低的优点,随着空间信息技术的发展和卫星及传感器的不断更新,具有更高空间分辨率和时间分辨率的遥感数据被广泛应用于农作物种植结构遥感提取领域,为农作物种植提供了科学、准确的信息[10-12]。

已有综述对农作物种植结构遥感提取的研究进展进行了总结[4-6],但利用文献计量学方法对农作物种植结构遥感提取领域进行全面系统总结的鲜有报道。本文采用文献计量学方法,以Web of Science核心合集和中国知网(CNKI)为数据源,利用Vosviewer软件和R语言程序包Bibliometrix对农作物种植结构遥感提取领域近20年的发文量、发文国家、发文机构、载文期刊、关键词进行分析,系统地总结了农作物种植结构遥感提取领域的发展态势及热点问题,并对具体的数据源及方法的特点和应用现状进行总结分析。

1 数据来源与研究方法

研究的文献数据来源于Web of Science核心数据集和中国知网,具体文献检索规则如表1所示,获得初步检索结果后,对文献类型进行精炼,剔除会议通知、书评、新闻报道、政策文件、领导讲话等非学术性文章;然后,利用文献计量学方法对国内外现有农作物种植结构遥感提取领域的文献数据进行分析。文献计量学是一套注重量化分析的综合性知识体系,有利于帮助学者从海量文献中高效挖掘出其中隐藏的有价值的信息,预测出研究领域未来的发展趋势[13]。本文主要利用Vosviewer软件和R语言程序包Bibliometrix,对所检索到的文献进行文章数量、发文国家和国内发文机构、主要发表期刊、研究内容与发展态势的计量和可视化分析。

表1 文献检索规则及结果

2 文献现状分析

2.1 文献时序分布

发文量是科学界对某一领域关注程度的总体表征,可在一定程度上反映该领域的发展动态,并对判断研究趋势有重要意义[12]。根据检索结果,绘制了2000年1月1日至2022年5月31日的中英文发文量图(图1),英文总发文量465篇,中文总发文量402篇。农作物种植结构遥感提取的研究整体分为初步探索和快速发展2个阶段。其中,2000-2010年为该研究领域的初步探索阶段,年均发文量为3.77篇,研究成果较少;2011-2022年为该研究领域的快速发展阶段,年发文量由2011年的20篇增长至2021年的139篇,年均发文量为32.67篇,是前一阶段的8.67倍。其原因可能是随着遥感技术的快速发展,能获取到更高时间、空间分辨率和更多光谱波段的遥感数据,推动了农作物种植结构遥感提取研究的发展。2000-2014年中英文文献年发文量明显增长;2019年至今该领域的英文文献发文量增长迅速,高于中文文献发文量。从图1的中英文累计发文量可以看出农作物种植结构遥感提取研究的发展是稳步上升的,整体呈现指数增长的趋势,其拟合曲线R2为0.973 4,拟合优度较高。

图1 中、英文文献发文量变化趋势Fig.1 Trend of publication number of Chinese and English literatures

2.2 国家及国内机构的发文量和合作分析

分别对发文量前10的英文文献的发文国家和中文文献的发文机构进行统计分析,结果如表2所示。农作物种植结构遥感提取领域英文文献发文量前三的国家分别是中国(197篇)、美国(87篇)、德国(46篇);中文文献发文量前三的国内研究机构分别是中国科学院(89篇)、中国农业科学院(38篇)、北京师范大学(19篇)。再利用Vosviewer分别对英文文献中的发文国家和中文文献中的发文机构进行网络共现图谱分析,结果如图2所示。

图2 国家间及国内机构间研究合作网络图谱Fig.2 Research cooperation network map between nations and domestic agencies

表2 英文文献、中文文献发文量前10名的国家与国内机构

2.2.1 论文产出国家间合作网络分析 对Web of Science中的英文文献进行发文国家网络共现分析,其发文量、合作关系和大致的地理空间分布如图2a所示。中国、美国、德国、印度和加拿大是农作物种植结构遥感提取研究领域与其他国家合作较丰富的5个国家。在所有发文国家中中国发文量最多,与美国、德国、加拿大、西班牙等14个国家有合作关系,中国与印度等7个国家没有合作关系,其中中国和美国是在整个国家合作关系网中合作最密切的2个国家。

2.2.2 中国学术机构间的科研合作 图2b是利用Vosviewer对知网文献的发文机构进行网络共现分析,并对各二级机构进行合并,得到的机构合作网络图。在农作物种植结构遥感提取研究领域中主要研究机构是中国科学院和中国农业科学院。在整个机构合作共现网络中主要形成了以中国科学院、中国农业科学院、北京师范大学和广州大学为合作中心的4个聚类,中国科学院和其他3个合作中心都有紧密的合作关系。中国科学院作为国内自然科学研究领域重要的学术机构,在农作物种植结构遥感提取研究领域也是和其他机构合作交流最频繁的研究机构。

2.3 来源期刊分析

学术期刊是研究者发表成果的主要载体,对文献的来源期刊进行分析,有利于研究农作物种植结构遥感提取的研究人员进行相关文献的查询和投稿[14]。本文筛选出的465篇英文文献分布于91种期刊上,402篇中文文献分布于108种期刊和硕士、博士学位论文中。表3展示了国内外关于农作物种植结构遥感提取研究载文量排名前10的期刊。其中,英文期刊载文数量最多的期刊是《Remote Sensing》,载文量为110篇,2021年影响因子为5.349,而影响因子最高的是《Remote Sensing of Environment》,其影响因子高达13.850,载文量为25篇;中文期刊中发文量最多的是《农业工程学报》,载文量27篇,影响因子3.446,而影响因子最高的是《地球信息科学学报》,影响因子为3.455,载文量为5篇。

表3 国内外农作物种植结构遥感提取研究载文量排名前10的期刊分布

3 农作物种植结构遥感提取研究热点分析

关键词是期刊论文和学位论文中内容或研究方法的高度概括,在一定程度上可以反映该领域研究方向的热点问题[12-13]。使用Vosviewer分别对英文文献和中文文献进行关键词可视化分析,删掉遥感、种植结构、农作物这3个本体核心词,将部分同义关键词进行合并处理(例如:Landsat8和Landsat-8合并为Landsat-8),得到如图3所示的中文文献、英文文献的农作物种植结构遥感提取研究热点的密度视图,在密度视图中,关键词越接近黑色表示其共现的频次越高,研究主题的热度越高。利用Bibliometrix程序包对中英文文献出现频次排名前20的关键词进行时间序列演变分析,结果如图4所示,图中圆的大小和数字表示2000年至当前年份该关键词出现的频次。结合文献分析对图中热门数据源和提取方法进行整理和总结,表4展示了热门数据的基本参数、适用性及挑战性,表5展示了热门提取方法的原理及特点。

MODIS:中分辩率成像光谱仪;evi:增强植被指数;GEE:谷歌地球引擎;SAR:合成孔径雷达;SVM:支持向量机。图3 中英文文献关键词密度视图Fig.3 Keyword density view of Chinese and English literatures

圆和数字的大小表示2000年至2022年该关键词出现的频次高低。NDVI:归一化植被指数;GEE:谷歌地球引擎;MODIS:中分辩率成像光谱仪。图4 农作物种植结构遥感提取研究热点关键词时间序列变化Fig.4 Time series changes of hot keywords in research on remote sensing extraction of crop planting structures

表4 农作物种植结构遥感提取研究采用的热点数据源信息

表5 农作物种植结构遥感提取研究常用方法

由图3可知,英文文献中的热点关键词为Random forest(随机森林)、Time-series(时间序列)、Sentinel-1、Sentinel-2、Deep learning(深度学习)、Phenology(物候学)、Machine learning(机器学习);中文文献中的热点关键词为时间序列、面向对象分类、随机森林法、决策树分类、无人机遥感、GF-1、归一化植被指数(NDVI)、中分辨率成像光谱仪(MODIS),国内的热点研究区域是东北三省、河南省和新疆维吾尔自治区,提取的主要作物是小麦、水稻等。在整体上中英文文献的研究热点保持一致,大致分为3类,分别是提取的影像选择、提取方法和提取特征的选择。

3.1 遥感数据源

关注度持续升高且当前最高的是基于时间序列的遥感影像,多时相遥感数据能够较完整地反映各类作物不同时间的生长特征,从而利用作物波谱时间效应特征实现农作物种植结构遥感提取精度的提高[15]。早期的时间序列农作物种植结构遥感提取多以MODIS数据为代表的低空间分辨率遥感影像为主,其仅在大区域的农作物种植结构遥感提取中有较好的表现[16-17]。随着空间信息技术和卫星传感器的进步,不断有Sentinel、GF-1/WFV等高空间分辨率和高时间分辨率的遥感数据源丰富遥感数据,利用中高时间、空间分辨率的时间序列遥感影像进行农作物种植结构提取可以进一步提高提取精度[17-18]。与此同时,多源遥感数据融合也受到广大科研学者的关注,多源遥感数据融合技术是解决传感器的局限性对遥感数据指标限制的有效途径[19],且向着多指标综合、多源传感器综合、提高融合精度和增强算法鲁棒性发展[20]。多源遥感数据融合技术的发展为农作物种植结构遥感提取提供了信息更加丰富的数据源,农作物种植结构遥感提取也将继续向多源遥感数据发展。根据研究区的范围和耕地分布实际情况选择最合适的影像是利用最少的成本、最快的运算速度满足最高精度的基础。

3.2 遥感提取方法

当前发展最为成熟的农作物种植结构遥感提取方法是机器学习中的随机森林分类法(表5),研究热度最高的提取方法是深度学习,深度学习中的N维卷积神经网络(N-D Convolutional neural networks,N-D CNN)和递归神经网络(Recursive neural network, RNN)已经在农作物种植结构提取领域有相关的研究和应用,其中卷积神经网络应用最为广泛。支持向量机和决策树分类都是在2008年就开始应用于农作物种植结构遥感提取领域中,近年来支持向量机的热度要高于决策树分类,但与随机森林和深度学习相比整体热度较低。面向对象分类在农作物种植结构遥感提取领域受到学者的关注较晚,但发展速度一直稳定增大,至今已经拥有了较高的关注度。谷歌地球引擎 (Google earth engine,GEE)是在遥感大数据时代背景下发展起来的遥感云计算平台[21],在2017年开始运用到农作物种植结构遥感提取中,近年来其关注度较高。

3.3 特征选择

自2018年起多特征组合和特征优选就成为了农作物种植结构遥感提取研究领域的热点之一,其中归一化植被指数是应用最广泛的特征指数,在此之前已经有学者选择除光谱特征、时相特征和空间特征之外的物候特征作为提取特征。多特征量的集成可以有效地解决作物交界处和内部的光谱混合现象,在农作物种植结构复杂的区域有较好的表现[4]。如何选择特征是农作物种植结构遥感提取研究面临的主要问题之一,若特征选择不合理不仅不能提高精度,反而会因为特征量的增加降低数据处理和运算效率造成数据冗余,同时还会带来误差积累从而降低提取精度[22]。最优的多特征量组合应该具有特征和目标相关性强、特征之间冗余小和不同作物种类间可分性强的特点,提取农作物种植结构才可以有效地提高运算速度和提取精度。

4 结论与展望

本文以Web of Science核心合集和中国知网的农作物种植结构遥感提取领域的867篇文献为数据源,利用文献计量法、Vosviewer软件和R语言程序包Bibliometrix,对发文量、发文国家、国内发文单位、载文期刊、关键词等关键信息进行统计分析和知识图谱可视化,分析作物种植结构遥感提取领域的研究发展态势,得出以下主要结论:

(1)世界范围内对农作物种植结构遥感提取的关注度在持续升高,2000-2022年该领域的中英文累计发文量整体呈指数增长。中国是英文文献发文量最多(197篇)的国家,也是与其他国家合作交流最丰富的国家,尤其与美国的合作最为密切;中文文献中主要的研究机构是中国科学院和中国农业科学院,在该领域和其他研究机构合作交流最频繁的研究机构是中国科学院。

(2)《农业工程学报》和《Remote Sensing》分别是国内、国外发表农作物种植结构遥感提取相关文章数量最多的期刊,而《Remote Sensing of Environment》是该领域影响因子最高的期刊,学者可以通过关注这些具有高影响力、高载文量的期刊了解该领域的研究动态。

(3)通过对关键词进行可视化分析发现,中文文献中的研究热点为时间序列、面向对象分类、随机森林法、决策树分类、无人机遥感、GF-1、NDVI、MODIS,英文文献中的研究热点为Random forest、Time-series、Sentinel-1、Sentinel-2、Deep learning、Phenology、Machine learning;对其进行时序变化分析发现,未来基于时间序列的多源数据更受学者的青睐,提取方法也向着基于GEE等云计算平台利用随机森林、卷积神经网络进行提取的方向发展,热门特征指数还是以NDVI为主并结合其他特征进行多特征量的集成。

基于以上分析,笔者认为以下方面是农作物种植结构遥感提取研究未来关注的几个方面:①对种植结构复杂、地块破碎区域的种植结构进行精细化提取。过去对中国农作物种植结构遥感提取区域主要在种植结构单一、耕地地块较大、耕地资源分布集中的东北三省、河南省和新疆维吾尔自治区,但对种植结构复杂区域的遥感提取也是实际生产的需求。②避免数据冗余、对特征进行优选。丰富的高光谱数据和多源数据融合都为农作物种植结构提取提供了丰富的特征量,但随之也会造成一定的数据冗余,如何进行特征优选并得到最佳特征组合是当前和将来的一个热点话题。③利用遥感云计算平台对农作物种植结构进行高效率提取。当涉及大范围、长时间序列、多源遥感影像时,利用云计算平台可以节约大量的数据下载、预处理、影像分析的时间,大大提高提取速度。

猜你喜欢

发文农作物领域
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
厉害了!农作物“喝”上环保酵素
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
领域·对峙
校园拾趣
爷孙趣事
以牙还牙
新常态下推动多层次多领域依法治理初探