基于不同遥感数据源的农作物精细化分类研究
2024-09-20梁明月杨倩何卫军张生
摘要 遥感技术已成为农业信息提取的重要手段。为探究不同遥感数据源下的农作物精细化识别与分类,选取广西壮族自治区贺州市八步区东融供港蔬菜产业示范区为研究区,基于Planet、GF6 WFV、Landsat 8 OLI影像数据,利用支持向量机分类算法,对研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物进行识别与提取,通过类别可分离性、总体分类精度、Kappa系数、光谱变化、成图效果等几个方面对提取效果进行评价,结果表明GF6 WFV影像是研究区农作物识别与提取的最佳数据源。
关键词 Landsat 8 OLI;GF6 WFV;Planet;农作物分类;支持向量机
中图分类号 S127 文献标识码 A 文章编号 0517-6611(2024)17-0228-05
doi:10.3969/j.issn.0517-6611.2024.17.052
Crop Refinement Classification Based on Different Remote Sensing Data Sources
LIANG Ming-yue1,2, YANG Qian1,2, HE Wei-jun1,2 et al
(1.Guangxi Remote Sensing Center, Nanning, Guangxi 530023; 2.Guangxi Remote Sensing Geological Engineering Technology Research Center, Nanning, Guangxi 530023)
Abstract Remote sensing technology has become an important means of extracting agricultural information. In order to explore the identification and classification of crops of different remote sensing data sources, we selected Babu District Dongrong vegetable industry demonstration zone supplied to HongKong as the research area. Base on Planet, GF6 WFV, Landsat 8 OLI remote sensing images, we used the support vector machine method to identify and extract different crops of the tip leaves of bean, Xuedou, Qingzai, vegetable heart of pointed leaf, cabbage mustard. We also evaluated the extraction effect through class separability, overall classification, Kappa coefficient, spectral variation and mapping effect. Results showed that GF6 WFV images were the best resource for crop recognition and extraction in the study area.
Key words Landsat 8 OLI; GF6 WFV; Planet; Crop classification; SVM
基金项目 广西壮族自治区地矿局部门预算前期项目“基于多源遥感数据融合的广西特色农产品遥感空间信息平台构建应用示范”(桂地矿综研〔2023〕4 号)。
作者简介 梁明月(1993—),女,广西柳州人,工程师,硕士,从事遥感信息提取工作。
收稿日期 2023-09-27
习近平总书记在党的二十大中强调,锚定建设农业强国目标,切实抓好农业农村工作[1]。中国是一个农业大国,农业是中国经济的重要支柱。农作物的精细化分类是分析农作物种植结构的关键,可有效为农作物产量预测、作物长势监测、农业风险评估、作物种类识别与空间分布研究等提供重要的数据支持[2-3]。传统获取农作物数据的方式有2种:其一为以最小行政区划为单位层层上报;其二为由国家统计局派遣调查人员对选定样本村随机抽取的数个地块作为样方进行测量后推算统计[4]。但这2种方式均存在工作周期长、速度慢、成本高的弊端,不仅耗费较大的人力物力,而且精度与准确性难以验证。
遥感技术具有宏观性、及时性、准确性等优势,越来越多的国内外学者将遥感影像数据应用于农业信息的提取中。朱紫琳等[5]利用多时相Landsat 8数据与全球高精度土地覆盖数据集GlobelLand 30,提取吉林省梨树县玉米种植面积。Sharma等[6]基于多源遥感数据构建农作物生长期内的NDVI时间序列,利用支持向量机算法监测季节性地下水灌溉的农田。解文欢等[7]基于GF-6宽幅数据,利用随机森林算法对黑龙江省拜泉县玉米、水稻和大豆的空间分布进行提取。以往对农作物信息提取局限于利用中低分辨率Landsat 8或中分辨率GF6宽幅影像数据,而近年发展迅猛的商业卫星Planet农作物精细化信息提取探索却鲜见报道。鉴于此,笔者以广西壮族自治区贺州市八步区东融供港蔬菜产业示范区为研究区,采用2022年11月18日的Planet、2022年11月13日的Landsat 8 OLI及2022年11月13日GF-6 WFV卫星遥感影像数据,利用支持向量机算法,对研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物进行提取,对提取结果进行对比分析评价,探讨不同影像数据提取农作物方法的优缺点,为未来农作物信息提取研究时数据源的选择提供科学依据。
1 研究区和数据来源
1.1 研究区概况
研究区为东融供港蔬菜产业示范区,位于广西壮族自治区贺州市八步区南部,占地66.67 hm2,周围属南岭山系中低山山地地貌,海拔标高一般为500~800 m,最高为张公岭山,海拔1 103 m,一般相对高差为300~500 m,最大相对高差为878 m。该区域属亚热带季风气候,年均气温19.9 ℃,最低气温-1.9 ℃,日夜温差较大,春天多雾,冬季有短期冰冻;年均降雨量为1 535 mm,4—6月为雨季。研究区2021年11月12日入选《全国农村创业园区(基地)目录(2021)》,该地发挥其区域及生态优势,大力发展绿色生态农业,打造粤港澳大湾区“菜篮子”高品质生产基地,每年约有70%蔬菜、50%生猪供应大湾区市场,享有粤港澳美丽“后花园”之誉。
1.2 数据源
1.2.1 Landsat 8 OLI。
Landsat 8是美国陆地卫星计划的第8颗卫星,2013年2月11日在加利福尼亚范登堡空军基地Atlas-V火箭塔发射,30 m多光谱中低分辨率陆地成像仪OLI含9个谱段。该研究下载2022年11月13日的Landsat 8 OLI Collection 2 Level 2数据,含7个谱段(表1),数据下载平台为地理空间数据云。
1.2.2 GF-6 WFV。
GF-6是中国高分辨率对地观测系统重大专项系列卫星,2018年6月2日于酒泉卫星发射中心发射,16 m多光谱中分辨率宽幅相机(WFV)含8个谱段(表2),是我国首颗增加“红边”谱段的卫星。该研究采用2022年11月13日的GF-6 WFV影像数据对研究区进行农作物精细化分类提取。数据申请网站:http://rs.dnr.gxzf.gov.cn:8080/platform。
1.2.3 Planet。Planet曾命名为Planet Lab,是由数以百计的Dove卫星组成的全球最大的微小卫星群,可以在2~3 d对全球绝大多数地区进行覆盖,2022年3月1日,Planet宣布新一代数据监测产品PlanetScope上市,在提供4个光谱谱段的
数据服务基础上新增至8个光谱谱段(表3),在海岸带、地表类型识别、农作物长势评估、产量估算及环境监测等方面应用广泛。该研究采用 Planet数据时相为2022年11月18日。数据申请平台为www.earthstar-cloud.com。
1.2.4 外业数据。2022年11月对研究区开展野外实地调查,共采集研究区及周边林地、水体、厂房、居民地、道路、豆杯、学斗、青仔、尖叶菜心、芥蓝等不同地物类型信息,采集野外点共127个,作为支持向量机算法的训练样本。利用野外点结合奥维地图及国产高分辨率影像数据目视解译研究区内不同地物类型,用于构建混淆矩阵,验证提取精度。
2 研究方法
基于ENVI 5.3遥感图像处理软件平台,对Planet、Landsat 8 OLI及GF6 WFV影像数据进行辐射定标、大气校正、正射校正、几何校正、裁剪等预处理,对研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物利用支持向量机算法进行提取分析,对比分析不同遥感数据源下的提取结果。
2.1 类别可分离性
根据研究区内主要农作物野外实地调查采集信息,利用空间特征及光谱信息分析不同地类样本图斑之间的可分离性。该参数值域区间为[0,2],两地物间光谱信息的冗余度随该参数值的增加而减小。该值大于1.8表明训练样本图斑满足分类需求,大于1.9表明两地物间训练样本图斑光谱可分离性很好。该研究基于野外实地调查点,建立研究区林地、水体、厂房、居民地、道路、豆杯、学斗、青仔、尖叶菜心、芥蓝等地物训练样本图斑共计127个。
2.2 支持向量机(SVM)算法
基于预处理后的影像数据,采用监督分类的方法对研究区进行农作物精细化分类。ENVI5.3遥感图像处理软件平台的监督分类包括平行六边形、最大似然、神经网络、支持向量机、马氏距离、最小距离、波谱角等算法,其中支持向量机分类算法有较高的分类准确率和较好的推广性。该算法是以统计学理论为基础的一种机器学习方法,可自动寻找对分类有较大区分能力的支持向量,可将各类之间的间隔最大化,有效避免因噪声引起的分类错误[8-10]。因此,该研究采用ENVI 5.3下监督分类中支持向量机分类算法,对研究区的豆杯、学斗、青仔、尖叶菜心、芥蓝等进行分类提取。
2.3 精度验证方法
通过对不同遥感数据源分类图像的精度评价,客观分析分类结果。混淆矩阵是评价遥感分类结果的常用指标。该研究基于野外调查点,结合奥维地图及国产高分辨率影像数据目视解译研究区内不同农作物,构建混淆矩阵,利用总体分类精度及Kappa系数,对Planet、GF6 WFV、Landsat 8 OLI影像分类结果进行精度验证。
2.3.1 总体分类精度(Overall Accuracy)。总体分类精度为被正确分类的像元总和与总像元数量的比值。表达式为:
OA=Mi=1aiiN(1)
式中:OA为总体分类精度;N为总像元数量;m为类型总数;i为类型数;aii为被正确分类的像元。总体分类精度越大,分类精度越高。
2.3.2 Kappa系数(Kappa Coefficient)[11-12]。Kappa系数是基于混淆矩阵,用于一致性检验及衡量分类精度的指标。该指标将总像元数量与被正确分类的像元总数相乘,减去混淆矩阵中每类行列像元总数乘积之和,再除以纵像元数平方减去混淆矩阵中每类行列像元总数乘积之和。表达式为:
K=Nmi=1aii-mi=1(aii×aji)N2-mi=1(aii×aji)(2)
式中,N为总像元数量,m为类型总数,i为类型数,aij为类型i所在行的总像元数,aji为类型j所在列的总像元数。Kappa系数可直接反映分类结果与地面信息间的一致性,一致性直接反映分类结果质量。Kappa系数和分类结果与地面信息间一致性及分类质量对应关系见表4。
3 农作物分类结果与分析
3.1 不同遥感数据源下农作物样本类别可分离性
基于Planet、GF6 WFV、Landsat 8 OLI不同遥感数据源,利用相同训练样本图斑,计算各类别间可分离性,结果见表5~7。
(1)Planet影像数据下,青仔和尖叶菜心与豆杯、学斗、芥蓝可分离性很高,均达到1.900,青仔-学斗、青仔-芥蓝、尖叶菜心-学斗、尖叶菜心-芥蓝可分离性甚至达到1.999 0。但豆杯-学斗、豆杯-芥蓝的可分离性很低,分别为1.226 9和1.484 9,不能满足分类需求,表明Planet影像下青仔和尖叶菜心均与学斗和芥蓝较易区分,豆杯易与学斗、芥蓝混淆,但学斗与芥蓝之间也有很好的区分度。
(2)GF6 WFV影像数据下,青仔-学斗、芥蓝-青仔、芥蓝-尖叶菜心可分离性极高,达到1.999 0,豆杯与学斗和芥蓝的可分离性较低,分别为1.803 2和1.824 6,但均大于1.800 0,满足分类需求。这表明GF6 WFV影像下芥蓝、青仔、尖叶菜心较易区分,豆杯与学斗和芥蓝较易混淆,但学斗和芥蓝之间也有很好的区分度。
(3)Landsat 8 OLI影像数据下,豆杯与学斗可分离性较低,为1.898 9,该值小于1.900 0但大于1.800 0,满足分类需求。其他农作物之间可分离度较高,表明Landsat 8 OLI影像下各农作物之间能够很好区分。
(4)3种遥感数据源下,豆杯-学斗的可分离性较其他任两种农作物的可分离性均为最低,表明豆杯与学斗在3种数据源下均较难区分。Planet影像下豆杯与学斗的可分离性不可满足分类需求,GF6 WFV、Landsat 8 OLI影像下可分离性不高但可满足分类需求。
(5)除豆杯-学斗外,Planet与GF6 WFV影像下豆杯与芥蓝的可分离性也较低,Planet不满足分类需求,GF6 WFV可分离性不高但满足分类需求。
3.2 光谱反射率变化分析
基于野外验证数据,选取同名地物点分析Planet、GF6 WFV、Landsat 8 OLI遥感影像数据各谱段上不同农作物的光谱特征,各农作物的光谱曲线在某谱段点间隔较大时被认为该几类农作物在该谱段可较好区分,若点距离相近或重叠则被认为较难区分。从图1~3可以得出以下结论:
(1)Planet影像数据下,青仔、尖叶菜心、豆杯在第5谱段黄谱段处能够区分农作物统计特征,但间隔较小,区分度有限,该谱段无法区分芥蓝与学斗;在第8谱段近红外谱段处能够区分青仔、尖叶菜心和芥蓝的光谱统计特征,且间隔较大,区分度较高,但无法区分豆杯与学斗。
(2)GF6 WFV影像下,青仔、尖叶菜心、芥蓝、学斗、豆杯在第4谱段黄谱段与第6谱段红边谱段均有反射峰,青仔与尖叶菜心的光谱统计数值间隔较大,能够很好区分2类作物;芥蓝、学斗、豆杯在第4谱段黄谱段也能区分作物统计特征,但点间隔较小,区分度不高;第7谱段红边谱段可区分5类农作物统计特征,但点间隔不大,区分度有限。
(3)Landsat 8 OLI影像下,青仔、尖叶菜心、芥蓝、学斗、豆杯在第5谱段近红外谱段光谱统计数值间隔较大,能够区分该5类农作物,在第6谱段短波红外谱段豆杯、芥蓝、学斗点间隔较大,区分度较高,但青仔和尖叶菜心点间隔极近,区分度不佳。
综上结果可以看出,Planet影像数据下没有能够全部区分5类农作物统计特征的谱段;GF6 WFV影像数据下第谱段黄谱段与第7谱段红边谱段能够区分5类农作物,但区分度有限;Landsat 8 OLI影像数据下第5谱段近红外谱段能够完全区分5类农作物统计特征,区分度较高。
3.3 不同数据源下分类精度比较
基于ENVI5.3遥感图像处理软件平台,对Planet、GF6 WFV及Landsat 8 OLI影像数据利用支持向量机算法,对研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物进行提取,通过成图效果对分类结果进行主观评价,根据总体分类精度及Kappa系数对分类结果进行客观评价,对比分析不同遥感数据源下农作物提取效果。
3.3.1 主观评价。
利用3种不同数据源对研究区内5类不同农作物进行提取,提取结果如图4。从分类结果可知,3种
影像下提取不同农作物的空间位置几乎一致,但图斑大小稍有差别;从成图效果来看,Planet提取结果图斑
更加规整,更能体现地物细节;Landsat 8影像锯齿状明显,细小图斑在后期处理时会被兼并至周围的大图斑,出现错分的情况;GF6 WFV与Landsat 8 OLI的提取结果道路出现间断的情况。综上,成图效果Planet影像最好,GF6 WFV次之,Landsat 8 OLI最差。
3.3.2 客观评价。
主观评价与判读人员的分析能力及知识水平有关,得出的结果具有极大的主观性。除定性评价外,还需要对分类结果进行客观评价。该研究利用野外验证数据,结合奥维地图及国产高分辨率影像数据,通过构建混淆矩阵,利用总体分类精度与Kappa系数对分类结果进行评价(表8)。Planet、GF6 WFV、Landsat 8 OLI影像数据下农作物
的分类总体精度均达到75%,Kappa系数均大于0.6,满足分类生产需求。其中,GF6 WFV影像数据总体分类精度最高,达89.193 1%,Kappa系数也最高,达0.897 3,表明GF6 WFV影像分类质量极好,分类结果与地面信息几乎一致;Planet影像数据分类精度低于GF6 WFV,为83.224 7%,Kappa系数为0.766 2,表明Planet影像分类质量很好,分类结果与地面信息高度一致。Landsat 8 OLI影像总体分类精度最低,仅有75.206 6%,Kappa系数为0.699 0。
4 结论与讨论
基于Planet、GF6 WFV、Landsat 8 OLI影像数据识别和提取研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物,分析不同数据源下农作物样本类别可分离性、光谱曲线、成图效果和分类精度,得出以下结论:
(1)在3种数据源下,豆杯与学斗较其他任2种农作物可分离度较低,GF6 WFV与Landsat 8 OLI下豆杯、学斗、青仔、尖叶菜心、芥蓝的可分离度满足分类要求,Landsat 8 OLI农作物样本可分离度最高。
(2)Planet影像数据下豆杯和学斗的光谱曲线在全谱段的统计特征皆极为相近,且没有能够完全区分5类农作物统计特征的谱段;GF6 WFV影像数据下第4谱段黄谱段与第7谱段红边谱段能够区分5类农作物,但区分度有限;Landsat 8 OLI影像数据下第5谱段近红外谱段能够完全区分5类农作物统计特征,区分度较高。
(3)Planet提取结果图斑圆滑、规整,能区分相邻较近但面积不大的2种地物;由于分辨率问题,Landsat 8 OLI影像锯齿状明显,细小图斑在后期处理时会被兼并至周围的大图斑,出现错分的情况;成图效果Planet影像最好,GF6 WFV可满足需求,Landsat 8 OLI最差。
(4)从总体分类精度与Kappa系数上对比分析,3种数据源下识别提取研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物的结果均满足生产需求,GF6 WFV分类精度最高,分类结果与地面信息一致性最好。
(5)Landsat 8 OLI影像下农作物样本可分离度最高,有区分度较高且能完全区分5类农作物统计特征的谱段,但由于研究区面积不大,影像空间分辨率较低,提取精度及成图效果不好,该数据适用于对农作物大面积提取。GF6 WFV影像下农作物样本可分离度满足分类要求,有可区分5类农作物统计特征的谱段,成图效果较好,分类精度较高,分类结果与地面信息一致性最好,GF6 WFV影像是研究区农作物识别与提取的最佳数据源;Planet影像数据分辨率较高,重访周期短,提取结果成图效果好,分类精度能达到生产需求,该数据源适合小面积青仔、尖叶菜心、芥蓝的周期性监测。
在研究Planet、GF6 WFV、Landsat 8 OLI影像数据识别和提取研究区豆杯、学斗、青仔、尖叶菜心、芥蓝等不同农作物时,该研究采用了监督分类中的支持向量机分类算法,但未与如最大似然法、随机森林、最小距离、神经网络等其他监督分类算法进行对比分析,这将是下一步研究的重点。
参考文献
[1]
习近平:加快建设农业强国 推进农业农村现代化[EB/QL].(2023-03-15)[2023-03-17].https://www.gov.cn/xinwen/2023-03/15/content_5746861.htm.
[2] 康金忠.基于机器学习的农作物种植结构提取方法研究[D].武汉:武汉大学,2020.
[3] 张荣天,张赟.江苏省农作物种植结构时空格局演变探析[J].中国稻米,2023,29(2):48-52.
[4] 刘焕军,闫岩,张新乐,等.面向农业区划的作物种植结构遥感提取[J].中国农业资源与区划,2017,38(8):43-54.
[5] 朱紫琳,王加,潘阳虹,等.基于Landsat8数据的梨树县玉米种植面积提取研究[J].科技创新与应用,2023(13):47-50.
[6] SHARMA A K,HUBERT-MOY L,BUVANESHWARI S,et al.Identifying seasonal groundwater-irrigated cropland using multi-source NDVI time-series images[J].Remote sensing,2021,13(10):1-21.
[7] 解文欢,张有智,吴黎,等.基于GF-6影像的农作物种植结构提取研究[J].现代农机,2023(3):61-63.
[8] 朱梦豪,李国清,彭壮壮.特征优选下的农作物遥感分类研究[J].测绘科学,2022,47(3):122-128.
[9] 王立国,赵亮,刘丹凤.SVM在高光谱图像处理中的应用综述[J].哈尔滨工程大学学报,2018,39(6):973-983.
[10] 段金馈,李峰,秦泉,等.高分六号红边波段对夏玉米种植区识别的影响[J].海洋气象学报,2023,43(3):104-112.
[11] 曹宇佳,孙嘉迎,孙微,等.基于珠海一号高光谱数据的农作物精细化分类研究[J].测绘与空间地理信息,2023,46(S1):101-103,106.
[12] 许志龙.基于多源卫星影像的农作物种植信息遥感提取方法研究[J].现代化农业,2023(7):62-65.