基于高分辨率SAR数据的高原山区烟草后向散射特征分析
2014-06-01周忠发
廖 娟,周忠发*,李 波,3,王 昆
(1.贵州师范大学中国南方喀斯特研究院,贵阳 550001;2.贵州省遥感中心,贵阳 550001;3.贵州省科技风险投资有限公司,贵阳 550002)
基于高分辨率SAR数据的高原山区烟草后向散射特征分析
廖 娟1,2,周忠发1,2*,李 波1,2,3,王 昆1,2
(1.贵州师范大学中国南方喀斯特研究院,贵阳 550001;2.贵州省遥感中心,贵阳 550001;3.贵州省科技风险投资有限公司,贵阳 550002)
为实现高原山区现代烟草定量监测,针对贵州高原山区天气多云雨,导致光学数据难以获取,提出一种利用高分辨率合成孔径雷达(SAR)应用于烟草快速监测的方法。结果表明,利用不同地物后向散射特征差异,采用支持向量机分类方法提取烟草种植分布情况,分类总精度达到了 85.08%,烟草识别精度达到了 78.36%;运用回归分析,将烟草生长参数与后向散射系数建立监测模型,所建立的叶长、叶宽都与 HH极化后向散射系数,叶片鲜重与 HH、VV 极化后向散射系数的模型都能反映其线性回归的耦合关系。表明高分辨率 SAR 数据为数据源的新型遥感监测手段能提供丰富的高原山区典型地物的后向散射信息,能为现代烟草农业大范围实时遥感监测提供技术支持。
SAR;后向散射系数;遥感监测;烟草
农业是人类社会赖以生存的基本生活资料的来源,是社会分工和国民经济其他部门成为独立的生产部门的前提和进一步发展的基础,也是一切非生产部门存在和发展的基础。遥感作为一门综合性的技术是 20 世纪 60 年代提出来的,农业一直是遥感的重要用户之一,农作物的遥感监测和估产一直是一个挑战性的难题[1]。目前更多的研究主要是利用多光谱或是高光谱[2-4]对农作物进行动态监测与估产,而大量的研究表明,利用合成孔径雷达(SAR)数据进行作物遥感监测同样具有良好的效果[5-8]。前人多采用多时相全极化数据,识别精度高,但成本和数据处理量也高,大面积遥感监测难以推行;大多都以平原地区为研究区域,对高原山区的农作物定量监测很少,特别是烟草。及时准确地对烟草的生长状况和种植情况的动态监测,对于该种植区域内的经济、生态双重方面有着极其重要的意义。在研究区内,烟草种植采取轮作形式以保证烟草的正常生长,每年种植的位置会有明显的变化,研究选取 2013 年 8 月 24 日烟草成熟期 Terrasar-X双极化为研究数据,探讨 X 波段双极化 SAR 数据在高原山区烟草种植情况(既精准识别烟草种植位置)继而对识别烟田进行准确提取,实时有效监测的应用潜力;实现在室内利用计算机技术就能对烟田进行识别,进而进行实时监测。
1 材料与方法
1.1 基地单元概况
研究选取贵州清镇流长现代烟草农业基地单元 为 研 究 区 , 位 于 106°7′6″E~106°29′37″E ,26°24′5″N~26°45′45″N,总面积为 489 km2,辖流长、犁倭、红枫湖等 3 个乡(镇),涉及 32 个行政村,124 个村民组,农业人口 11.83 万人。研究区种烟历史悠久,于 1973 年开始种植烤烟,是清镇市主产烟区。主烟区流长乡和犁倭乡为喀斯特高原地貌,地层主要为三叠系下统茅草铺组为主,灰岩与白云岩大量出露,区内受乌江支流三岔河切割的影响,导致地貌组合形态以峰丛洼地、谷底为主;土壤以黄砂壤、黄壤为主,pH 5.5~6.5,呈微酸性,有机质含量丰富;属亚热带季风湿润气候,年平均气温 14 ℃,无霜期 275 d,年平均降雨量 1150.4 mm,年日照时数 1433 h。主烟区面积占基地单元的90.26%,土壤条件和气候条件均有利于烤烟生产,主要种植云烟 87、云烟 85、K326 及江南三号等品种。该研究区烟草种植习惯为烟草-小麦(油菜)-玉米-小麦(油菜)两年三熟轮作制。
1.2 Terrasar-X 数据与预处理
研究选取德国发射的 Terrasar-X 卫星,于 2013年8 月24日获取覆盖研究区的双极化(HH、VV)分辨率为 6 m 的 EEC 数据。影像采用 WGS84 椭球进行了通用横轴墨卡托投影或通用极球面投影,能有效地克服由于地形变形引起的透视收缩现象。
Terrasar-X 数据预处理过程包括噪声滤波、几何精校正、地理编码、辐射定标。由于不同滤波器的滤波算法不同,对原始雷达影像进行不同窗口、不同滤波方法的滤波处理。研究尝试 Lee、Enhanced Lee、Gamma、Kuan 滤波器的 3*3、5*5、7*7 的窗口,通过对比各种算法,最后选择 Frost 滤波器的5*5 窗口。利用 1:1 万的地形图,采取二次多项式模型对影像进行几何精校正。最后对影像进行地理编码以及绝对辐射定标,数据定标公式为:
其中,式中, σd0B表示后向散射系数;DN 表示像元的灰度 值 ;θloc表 示当地的入射角 , 可以通过 GIM 文件换算获得; KS为绝对定标常数。定标之后,影像像元值就是后向散射系数值。
1.3 典型地物后向散射系数分析
结合 GPS定点样方数据,提取影像中的烟地、玉米地、水稻田、有林地、居民点五类典型地物后向散射系数。居民点主要由建筑物构成,结构和形状使得反射现象增大[9],HH、VV 极化方式下的后向散射系数较其他地物强,HH 更为明显,达到-4.75 dB。有林地由灌木或乔木覆盖,较烟草、玉米、水稻,枝干高大、冠层稳定、叶片繁茂,具有植株含水量丰富且在短时间内主要形态结构稳定性高的特点;HH 对冠层含水量敏感[10],反射强且稳定,其后向散射为-6.55 dB。在研究时期中,研究区严重缺水,水稻田中水干涸,土板结裂缝,水稻生长差,秧苗矮小,干旱使得水生植被的下垫面变为陆生植被的下垫面,表现为散射能力低,HH、VV 极化后向散射系数小,分别为-7.09 dB、-8.47 dB。玉米高大的枝条结构及其垂直形态和茎干粗细的区别,使得玉米VV极化散射能力要高于水稻;玉米进入成熟期,穗已成熟,植株的水分减少,叶片披垂,颜色由深绿色逐渐变为黄绿色,同期烟草处于成熟期,烟株开始现蕾,下部叶逐渐衰老,叶片由下而上落黄成熟后,被烟农打掉,上层叶子叶片大,含水量丰富,颜色为深绿色,使得玉米HH极化散射能力要低于烟草。
1.4 烟草后向散射系数分析
提取 SAR 影像上的 10 个样方内烟草后向散射系数,计算双极化下后向散射系数平均值如图1所示。由图1可见,烟草在本研究时期内HH极化散射能力大于VV极化散射能力。这是由于烟草处于成熟期,烟草植株所有的养料、水分供上部叶子的生长,上部叶片生长旺盛、大叶片含水量丰富,HH极化对冠层的含水量敏感,极化反射强,加上叶面有光泽,加大了HH极化的反射;成熟期叶片完全张开,叶片宽大冠层密集,植株冠层直接减少了VV 极化的穿透能力,减小体散射;烟草成熟期叶片下垂,自然弯曲呈弓形,叶边下卷,茎叶角度增大,同样增大了 HH 极化的散射强度。因此,HH极化强度大于 VV 极化强度,表现在 HH 极化后向散射系数高于 VV 极化后向散射系数且高于0.55~1.03。
图1 SAR 影像后向散射系数平均值Fig. 1 The average of SAR image backscatter coefficient
1.5 支持向量机分类
利用比值法可以提取更多的信息,比值法可使影像中某些地物的均值拉开、方差缩小,便于将其分类,多用于区分不同的地物。对不同地物在影像上的后项散射的差异分析,了解不同地物的散射特征,加以比值图像(HH/VV)来丰富地物信息,利用支持向量机(Support Vector Machine, SVM)分类器对影像进行分类。支持向量机是基于研究小样本情况下机器学习规律的统计学习理论的一种新的机器学习方法,它以结构风险最小化为准则,对实际应用中有限训练样本的问题,表现出很多优于已有方法的性能[11]。
1.6 计算机建模
②堤防(含穿堤建筑物)。南堤以南肩线为界,北堤堤外有调度河的至调度河北子堰外堤脚线征地红线,无调度河的至北堤堤脚线外征地红线。
计算机建模的目的是通过构造一个简单但能反映物理世界中真实对象的数学抽象描述模型,模拟被研究对象的发生、发展过程,为解释现象,揭示机理发展规律,预测未来提供有用的工具[12]。提取的 10 个样方双极化波段后向散射系数及波段组合,与烟草生长参数进行相关性分析,得到 SAR影像后向散射系数与样方烟草生长参数相关性(r)[14-17](表1)。
表1 SAR 影像后向散射系数与烟草生长参数相关性(r)Table 1 The correlation (r) between SAR image backscatter coefficient and tobacco growth parameters
由表1可以看出,在叶长和叶宽的相关性分析中,HH 极化方式最优,相关性分别达到 0.907、0.856,这是由于极化后向散射特征,HH>VV 后向散射系数都随着叶长、叶宽的增大而增加,呈正相关,故此HH极化更加明显,与其相关性也就越高;对于叶片含水量,相关性都小,不建议建立模型;而叶片鲜重与HH、VV极化方式相关性都较高,分别高达 0.922、0.901。利用后向散射系数与烟草叶长、叶宽、叶片鲜重的实测值来反演烟草叶长、叶宽、叶片鲜重,建立线性回归耦合关系,得到雷达遥感监测模型,可获取生长参数的估测值。
2 结 果
2.1 烟草识别结果与精度验证
从分类效果(图2)来看,利用加以比值的支持向量机分类能够识别典型地物——烟地、玉米地、水稻田、有林地、居民点。在大片烟田中,有零星水田的出现,可能是存在的烟水配套工程(水窖或水池),由于水窖、水池的机构与形状和蓄水,使其后向散射特征接近水田;某些区域,烟地与玉米地相互交错,一是可能由于种植紧挨,边界不易识别;二是可能是烟草-玉米套种,计算机不能识别套种情况,若散射特征靠近烟草就识别为烟草,否则相反。
图2 2013 年成熟期烟草识别图(局部)Fig. 2 Tobacco identification map (locally) during tobacco maturity stage in 2013
将 GPS 样方数据,与分类图叠置进行精度验证。精度验证方法如下[13]:1)NTT为在分类图中正确识别出样方内烟草的面积;2)NTO为在分类图中未能识别出样方内烟草的面积;3)NOO为在分类图中未将样方内其他地物识别为烟草的面积;4)NOT为在分类图中将样方内其他地物错误识别为烟草的面积。分类总精度(PA)计算公式为:
由表2可以看出,分析典型地物后向散射系数并利用支持向量机分类,分类总精度达到了85.08%,烟草识别精度也到达了 78.36%,取得了较理想的分类结果。
2.2 建模结果与精度验证
通过对比相关系数,选择较高相关系数组合,将生长期中的生长参数与后向散射系数建立不同极化方式下的监测模型(表3)。建立的监测模型拟合度(R2)分别为 0.822、0.736、0.850、0.81,利用 F分布统计量对拟合度进行显著性分析(公式4),在显著水平 λ上,查 F 分布临界值表,得临界值 Fλ,若 F 统计量大于临界值 Fλ,则拟合度(R2)在该显著水平上是显著的,否则是不显著的。其中,n 代表样本含量,K 代表独立变量的个数,n-K-1 代表自由度。
在后向散射系数与生长参数拟合度较高情况下,建立了叶长、叶宽HH极化方式下的一元线性回归模型与叶片鲜重HH、VV 两种极化方式下的一元线性回归模型。为了进一步对模型建立精确性进行检验,采用相对误差分析法,对模型精度进行验证。重新选取 10 组样方,分别计算比较模型反演的叶长、叶宽以及叶片鲜重与样方实测叶长、叶宽以及叶片鲜重。分析相对误差(RE)、绝对误差(E),取其 10 组误差的平均值(表4)。其中 x 是经过模型反演值,xT是实际测量值。
表2 研究区烟草分类精度验证结果Table 2 The validation accuracy of the identification of tobacco study area
表3 烟草雷达遥感监测模型Table 3 Tobacco growth monitoring model based on SAR
表4 模型验证Table 4 Verification of the model
3 讨 论
邵芸等[18]利用高分辨率的 SAR 数据运用于水稻的面积识别,其精度可以高达 90%以上,而在此次研究中,烟草的识别精度为 78.36%,而地物分类总精度 85.08%。在云南、贵州、四川等高原山区,是烟草种植的重要区域,故在这些区域内进行现代化烟草监测具有重要的意义。在贵州喀斯特地貌突出,地表破碎,耕地分布不集中,为整个研究区域的种植识别带来了困难,使得精度远远低于平原地区。另一方面,前人[6,19-20]在农作物监测上主要是水稻与玉米,而对于烟草后向散射特征研究几乎是一片空白。此次将成像 SAR 数据运用于烟草,分析烟草后向散射特征,提取烟草种植的精准位置,但在识别精度上,烟草分类精度(PT)<分类总精度(PA),主要原因是玉米与烟草套种以及玉米与烟草生长周期基本同期,使得影像上混合像元现象严重,后向散射特征不明显,难以区分烟草与玉米,导致烟草的识别精度低于其他地物。在农作物监测建模中,针对于多光谱和高光谱主要是用叶面积指数(LAI)与各类遥感植被指数建立模型[21-22],而对于 SAR 数据,则是利用后向散射系数与 LAI建立模型[23]。不同于水稻、玉米、小麦,烟草的产出就是烟叶,产量多少直接由叶子质量决定,本研究直接采用与叶子质量紧密相关的参数(叶长、叶宽、叶片含水量、叶片鲜重)来进行模型的建立,可以更加直观的反应烟草的产量。由于在烟草灌层中,HH极化能力大于VV,受到外界影响更小,更加稳定,所以在模型的建立中,对于叶长、叶宽而言,HH 极化方式优于 VV 极化方式。叶片鲜重与 HH、VV 极化方式的拟合度都大于叶长、叶宽的,这是由于叶片鲜重与叶长、叶宽有着密切关系,融合两者特性使得其拟合度增加。
4 结 论
在利用遥感数据参与农作物分类识别和生长建模的研究中,多数研究是以多光谱和高光谱数据为主。此次研究采用高分辨率 SAR 影像为研究数据,利用 SAR 影像的不受时间、天气影响的优势,对贵州高原山区烟草进行监测,取得良好效果。在此次研究中,建立的 18 m*18 m 样方是在标准烟田里,在地块破碎的喀斯特高原山区能建立的样方数量有限,给本文分析结果的客观性带来一定的困难,另一方面,在研究时期研究区内有干旱发生,对数据结果的普适性也带来一定的困难,因此,本文结果还需要更多的数据来验证和完善。但总体来说,此方法为现代烟草农业实现大范围精准实时监测提供新的研究思路。
[1]陈劲松,林珲,邵云. 微波遥感农业应用研究——水稻生长监测[M]. 北京:科学出版社,2010.
[2]夏天,吴文斌,周清波,等. 基于高光谱的冬小麦叶面积指数估算方法[J]. 中国农业科学,2012(10):2085-2092.
[3]刘海岩,牛振国,陈晓玲. EOS-MODIS 数据在我国农作物监测中的应用[J]. 遥感技术与应用,2005(5):531-536.
[4]冯美臣,杨武德,张东彦,等. 基于 TM 和 MODIS 数据的水旱地冬小麦面积提取和长势监测[J]. 农业工程学报,2009(3):103-109.
[5]赵伟颖. 极化 SAR 监督分类方法对植被分类效果比较分析[C]//连云港:第九届长三角科技论坛,2012:117-120.
[6]化国强,肖靖黄,黄晓军,等. 基于全极化 SAR 数据的玉米后向散射特征分析[J]. 江苏农业科学,2011,39(3):562-565.
[7]谭炳香,李增元,李秉柏,等. 单时相双极化 ENVISAT ASAR 数 据 水 稻 识 别[J]. 农 业 工 程 学 报 ,2006 , 22(12):121-127.
[8]张晓倩,刘湘南,谭正. 基于全极化 Radarsat-2 数据的水稻生物量估算模型[J]. 农业现代化研究,2012,33(2):249-252.
[9]高程程,惠晓威. 基于灰度共生矩阵的纹理特征提取[J].计算机系统应用,2010,19(6):195-198.
[10]杨沈斌,李秉柏,申双和,等. 基于 ENVISAT ASAR数 据 的 水 稻 遥 感监测[J]. 江苏农业学报,2008,24(1):33-38.
[11]惠文华. 基于支持向量机的遥感图像分类方法[J]. 地球科学与环境学报,2006,28(2):93-96.
[12]胡包钢,赵星,严红平,等. 植物生长建模与可视化——回顾与展望[J]. 自动化学报,2001,27(6):816-835.
[13]张云柏. ASAR 影像应用于水稻识别和面积测算研究——以江苏宝应县为例[D]. 南京:南京农业大学,2004.
[14]谭正. 基于 SAR 数据和作物生长模型同化的水稻长势监测与估产研究[D]. 北京:中国地质大学,2012.
[15]贾龙浩,周忠发,李波. 高分辨率 SAR 在喀斯特山地烟草生长建模中的应用探讨[J]. 中国烟草科学,2013,34(5):104-107.
[16]陈磊,范伟,任竹.浅谈星载 SAR 在冬小麦估测产方面的应用[J]. 农技服务,2013,30(11):1230-1231.
[17]李坤,邵云,张风丽. 基于多极化机载合成孔径雷达(SAR)数据的水稻识别[J]. 浙江大学学报,2011,37(2):181-186.
[18]邵芸,郭华东,范湘涛,等. 水稻时域散射特征分析及其应用研究[J]. 遥感学报,2001,5(5):340-344.
[19]张晓倩. 基于全极化 SAR 数据的水稻识别与作物参数估算模型[D]. 北京:中国地质大学,2012:32-41.
[20]张萍萍,申双和,李秉柏,等. 水稻极化散射特征分析及稻田分类方法研究[J]. 江苏农业科学,2006(1):148-152.
[21]李开丽,蒋建军,茅荣正,等. 植被叶面积指数遥感监测模型[J]. 生态学报,2005,25(6):1491-1496.
[22]Peng G, Ruiliang Pu, Biging G S, et al. Estimation of forest leaf area index using vegetation indices derived from hyperspectral data[J]. IEEE Transaction on Geoscience and Remote Sensing, 2003, 41: 1355-1362.
[23]申双和,杨沈斌,李秉柏,等. 基于 ENVISAT ASAR数据的水稻时域后向散射特征分析[J]. 农业工程学报,2009,25(增刊 2):130-136.
Analysis of Tobacco Scattering Characteristics Based on High Resolution SAR Data in Plateau Mountainous Area
LIAO Juan1,2, ZHOU Zhongfa1,2*, LI Bo1,2,3, WANG Kun1,2
(1. Institute of South China Karst, Guizhou Normal University, Guiyang 550001, China; 2. The Remote Sensing Center of Guizhou Province, Guiyang 550001, China; 3. The Technology Venture Capital Investment Management Center of Guizhou Province, Guiyang 550002, China)
In order to carry out quantitative monitoring of modern tobacco in plateau mountain area, a new method was proposed in which high resolution synthetic aperture radar (SAR) method was applied to rapidly monitor tobacco, since weather in Guizhou plateau is too rainy to obtain optical data. The results showed that the after scattering feature of different ground objects was extracted by difference, and used classification method of SVM to classify ground objects, the accuracy of total classification was 85.08%, and tobacco identification accuracy was 78.36%. Using of regression analysis, the monitoring model between the tobacco growth parameters and the backscattering coefficient was established. The model which was between the leaf length/leaf width and HH polarization backscatter coefficient or leaf fresh weight and HH, VV polarization backscattering coefficients could reflect the linear regression equation. The high resolution SAR data as the data source of the new remote sensing techniques can provide rich backscatter information of typical objects in plateau mountainous area, and provide technical support for modern tobacco agriculture in large-scale and real-time monitoring by remote sensing.
SAR; backscattering coefficient; remote sensing monitoring; tobacco
S572
1007-5119(2014)06-0074-06
10.13496/j.issn.1007-5119.2014.06.015
国家重点基础研究发展计划(973 计划)课题“人为干预下喀斯特山地石漠化的演变机制与调控”(2012CB723202);贵州省科技计划“喀斯特山区 SAR 遥感平台监测与识别关键技术研究与应用”{黔科合 GY 字〔2013〕3062};贵州省国际科技合作计划“不同生态恢复措施干预下喀斯特石漠化演变及调控研究”{黔科合外 G 字[2012]7022 号}
廖 娟,女,硕士研究生,研究方向:地理信息系统与遥感。E-mail:liaojuan0825@163.com。*通信作者,E-mail:fa6897@163.com
2014-05-12
2014-11-18