APP下载

高分1 号数据用于云南文山三七种植信息提取

2020-01-18袁希平张良洁赵庆会

浙江农林大学学报 2020年1期
关键词:图斑目视决策树

朱 赞, 袁希平, 甘 淑,3, 张良洁, 赵庆会

(1. 昆明理工大学 国土资源工程学院, 云南 昆明650093; 2. 滇西应用技术大学, 云南 大理671006;3. 昆明理工大学 云南省高校高原山区空间信息测绘技术应用工程研究中心, 云南 昆明650093)

受市场经济背景下供需关系的影响, 农作物尤其是农业经济作物的产量与价格波动之间存在着紧密联系。 如何及时准确地掌握农作物的面积、 产量是地方政府农业主管部门进行种植业结构调整[1]和价格宏观调控的重要依据。 遥感技术具有高效、 快速、 动态、 宏观和实施成本低等优点, 目前已广泛应用于农业经济作物的面积调查[2-3]、 产量估算[4-5]以及长势监测[6]等方面。 农业遥感已经成为传统农业向信息化农业过渡的主要支撑技术之一[7]。 与粮食、 蔬菜等农作物相比, 中草药具有产地区域性较强、 经济价值较高、 且市场需求量弹性较弱等特点, 如果政府相关部门不加以引导, 很容易造成与市场供求失衡相伴随的价格大幅度波动, 从而对药农的经济利益和生产生活造成很大影响。 这就要求相关部门须掌握时效性强且准确的产量数据。 三七Panax notoginseng为五加科Araliaceae 人参属Panax植物[8], 为中国名贵中药材, 云南文山三七因其优质和独特的道地性而著称于世, 具有较高的经济价值。 周应群等[9]采用5 m 分辨率的SPOT 5 影像和30 m 分辨率的TM 5 影像相配合, 采用目视解译的方法分别对三七种植面积较大的文山州马关县和丘北县的三七种植面积进行提取并与相关部门的实际统计数据相对比, 最终发现5 m 分辨率的SPOT 5 影像提取成果相对面积精度为92.7%, 而30 m 分辨率的TM 5 影像提取成果相对面积精度为74.4%, 取得了相对理想的效果。 上述方法主要是在高分辨率商业影像目视解译的三七资源遥感调查, 需要大量的人力和资金, 成本较高, 因此无法保证每年都进行1 次完整的三七种植资源调查。 戴晨曦等[10]基于Landsat TM/ETM+ /OLI 数据, 结合数字高程模型 (digital elevation model, DEM)和归一化植被指数(normalized difference vegetation index, NDVI)等提出了一种基于遥感影像自动提取三七种植面积的方法, 并利用该方法对云南文山、 红河两州2010-2015 年三七种植面积进行监测, 验证了该方法的可靠性。 2013 年4 月26 日发射成功的高分1 号(GF-1)卫星是中国高分辨率对地观测系统的首发星, 它突破了高空间分辨率、 多光谱与高时间分辨率结合的光学遥感技术[1]。 目前该卫星获取的影像已被广泛应用于森林蓄积量估测[11-12]、 精准农业[13-14]、 国土资源调查和环境监测等方面。 基于GF-1 数据进行三七种植资源的调查, 目前仅有少量学者做过探索: 史婷婷等[15]通过对研究区内各地物的光谱特征进行分析构建了基于GF-1 数据估算文山三七种植面积的决策树模型, 然而并没有对该模型的提取精度进行计算和验证。 本研究对史婷婷等[15]提出的决策树模型进行改进, 然后基于16 m 分辨率的GF-1 影像对文山州4 个三七主产县的三七种植面积进行提取, 并通过与同时段的高分辨率谷歌影像进行抽样监测的方法对该方法的识别精度进行评价; 最后以同区域内目视解译提取的三七图斑为基准, 对该决策树模型的面积提取精度进行计算。

1 研究区概况与数据获取

1.1 研究区概况

云南省文山壮族苗族自治州(22°40′~24°28′N, 103°35′~106°12′E)位于云贵高原东南部, 为典型的高原山地区域, 北回归线贯穿全州。 文山州干湿季分明, 5-10 月为雨季, 雨量占全年的82%, 11 月至次年4 月为干季。 独特的土壤和气候条件使这里成为全国最主要的三七产区, 三七种植面积和产量均占全国的90%以上。 1995 年文山州被命名为“中国三七之乡”[16]。 文山州三七主产地主要集中在丘北、 广南、 砚山和文山等4 个县地势相对平坦的盆地和河谷区域。 本研究选取该4 个县作为主要研究区域。

1.2 数据获取

文山州的11 月至次年4 月为旱季, 为保证影像的能见效果, 结合文山州的天气和三七的耕作时段规律, 本研究选取了2016 年2 月13 日、 4 月15 日和5 月1 日的3 景16 m 分辨率的GF-1 开源数据作为基础数据。 此外, 还获取了覆盖该区域的6 景30 m 分辨率DEM 数据作为辅助数据。

2 三七荫棚图斑提取的决策树构建

2.1 三七荫棚

三七属于喜阴植物, 光照强度对三七的生长有较大影响, 人工栽培的三七一般都要架设荫棚。 因此, 基于遥感影像进行三七种植面积的提取主要是提取出三七荫棚的图斑。 崔秀明等[17]研究发现: 当荫棚的透光率为12%时, 三七的单位产量达到峰值。 目前大部分三七荫棚都以透光力更易于控制的黑色塑料遮阳网代替传统的枯枝棚(图1)[18]。

图1 三七专用遮阳网(左)和GF-1(16 m)影像上的三七荫棚(右)Figure 1 P. notoginseng special net (left) and the shade on the GF-1(16 m) image (right)

2.2 三七荫棚分类决策树构建

史婷婷等[15]构建了基于GF-1 影像进行三七种植区提取的决策树分类模型。 依据三七的生长区域一般为5°~15°的缓坡地带[14]的特点, 本研究对此分类决策树模型进行改进(图2)。 在构建决策树过程中, 基于预处理后的DEM 构建坡度值,坡度值用变量 “Slope” 表示, 然后通过执行决策树分类提取出三七的荫棚图斑。 针对该决策树模型所完成的分类成果如图3 所示。

2.3 分类成果精化处理

根据GF-1 影像上三七荫棚和其他地物的图像机理特征的对比, 可以观察到部分区域水体和三七荫棚在目视效果上可分离度不高(图4A 和图4B)。 且在三七荫棚的决策树分类成果中有部分水体的边缘区域被错分为三七荫棚(图4C)。 为剔除分类成果中被错分的部分, 对分类结果进行基于GIS 空间分析的精化处理。 经过统计得出决策树分析提取的三七荫棚图斑中水体边缘被误判的区域平均约1.5 个像元, 最大约3.0 个像元(约48 m), 且一般而言在水域周围50 m 范围内很少有三七种植区。 因此, 数据处理中在GIS 平台上针对提取的水体图斑构建50 m 缓冲区, 并将缓冲区图斑与决策树分类提取的三七荫棚图斑进行叠置分析, 用以剔除水体边缘被误分的区域, 进而实现对提取成果的精化处理。 精化前后成果对比如图4C 和图4D 所示。

图2 提取三七荫棚图斑的决策树模型Figure 2 Decision tree model for extracting shade patches of P.notoginseng

3 提取成果的精度验证与分析

3.1 分类精度的验证方法

对决策树分类所提取的三七荫棚成果进行精度验证主要包括2 项内容: ①三七荫棚地类识别精度验证; ②专家决策树分类的三七荫棚面积提取精度验证。 对决策树分类提取成果的精度验证主要是以三七荫棚的目视解译成果为基准的, 在目视解译过程中对于目标判定困难的地物, 进一步采用了谷歌地球(Google Earth)提供的同时段2.18 m 分辨率的影像作为参考进行解译(图5)。

3.2 三七荫棚的地类识别精度验证

采用专家决策树分类方法提取并经过精化处理的成果和采用目视解译方法在研究区域内勾绘的三七荫棚的图斑成果如图6 所示, 研究区内各县三七荫棚图斑的提取成果统计如表1 所示。 根据本研究2.18 m分辨率的同时段Google 影像对三七荫棚提取成果的判定精度进行验证。 具体方案为: 分别在在研究区内对精化后三七荫棚的专家决策树分类成果和目视解译成果各均匀选取100 组图斑作为检验样本, 并与同时段的Google 影像中相对应位置的图像进行对比, 用以对三七荫棚判定的正确性进行检验。 判定成果精度的统计如表2 所示。

图3 决策树分类成果示意图Figure 3 Decision tree classification results

图4 提取成果精化处理Figure 4 Refined processing of extraction results

如表2 所示: 利用决策树分析法和目视解译法对三七荫棚进行地类识别, 判定正确率分布可达到87%和99%。 通过总结, 决策树分类法判定错误的原因一方面是由于混合像元的影响产生的,尤其是细小的荫棚斑块所形成的像元产生影响较大; 另一方面是由于新旧荫棚之间的光谱特征存在差异而导致误判。 目视解译法产生误判的原因主要是部分水体像元和山体阴影产生的像元与三七荫棚像元在目视判别时难以区分。

图5 Google 影像(左, 2.18 m)和GF-1 中的三七荫棚(右, 16 m)Figure 5 Google image (left, 2.18 m) and the P. notoginseng special net on the GF-1 image(right, 16 m)

3.3 决策树分类的面积提取精度验证

郭燕等[1]利用GF-1 影像提取玉米Zea mays种植面积, 并将提取的图斑与实测的实地面积进行对比, 最终得出影像上面积的准确率达91.8%, 验证了基于GF-1 影像提取农作物面积的方法是可靠的。 同理, 为验证GF-1 影像上三七荫棚面积的准确性, 以相关部门在三七种植资源抽查中获取的部分实地调绘数据为基准, 分别在三七种植较为集中的丘北和砚山两县各选择10 块三七荫棚作为样本, 在GIS 平台上分别对相应地块的实地调绘图斑和GF-1 影像上的目视解译图斑进行叠置分析, 并统计其面积重合率。 经统计, 二者的平均面积重合率为丘北县85.4%,砚山县89.2%。 可得出GF-1 影像与实地的三七荫棚面积符合度较高, 将GF-1 影像用于提取三七荫棚面积的方法是可行的。 因此, 针对专家决策树分类提取三七荫棚的面积精度评价, 本研究采用专家决策树分类提取的荫棚成果与目视解译的荫棚成果进行叠加分析, 然后对两类成果的重叠部分面积进行统计。专家决策树分类提取的面积精度按下式进行计算。

图6 决策树分类法(A)和目视解译法(B)提取三七荫棚的成果示意图Figure 6 Decision tree classification (A) and Visual interpretation (B) of the extracted results

表1 实验区各县荫棚图斑提取面积精度统计Table 1 Accuracy of statistical experimentation area shade extraction counties

表2 三七荫棚地类识别精度评价Table 2 P. notoginseng of the land intensive evaluation shed recognition

式(1)中: P 为专家决策树分类提取成果的面积精度; So为2 类成果重合的面积; SV为目视解译提取的三七荫棚面积。 实验区内各县专家决策树分类提取的三七荫棚面积精度统计如表1 所示。 通过对研究区域4 个县的专家决策树分类和目视解译提取的荫棚图斑数和面积进行统计, 并根据式(1)对各产区专家决策树分类提取的面积精度进行计算得出: 专家决策树分类和目视解译提取的图斑数总计分别为3 185和2 942 个; 提取的荫棚面积总计分别为70.11 km2和62.11 m2; 专家决策树分类提取的平均面积精度为80%; 4 个主产县的荫棚图斑面积提取精度都能达76%以上。

4 结论与讨论

本研究基于16 m 分辨率的GF-1 开源影像对云南文山州4 个三七主产县的三七的种植面积进行提取。 在遥感提取方法上, 主要考虑三七生长区域自然条件对文献[15]所构建的决策树模型进行改进, 并在对决策树分类成果进行观察、 分析和统计的基础上对分类成果进行精化处理。 最后采用谷歌影像、 实地调绘和目视解译数据相配合的方式分别对提取成果的图斑识别精度和面积提取精度进行验证。 结果表明: 本研究所提出的基于专家决策树和分类精化处理提取三七种植面积的方法是可行的, 三七荫棚图斑识别精度可达87%, 面积提取的平均识别精度可达80%。

综上所述, 基于国产高分系列数据开展三七种植面积快速调查的方法虽然从技术层面而言已经日趋成熟, 然而三七荫棚面积的提取精度仍有待提高, 一方面是由于三七种植区域气候和其他地物信息的影响, 另一方面是由于不同年份铺设的新旧三七荫棚存在一定光谱差异, 这为决策树分类阈值的确定带来一定难度。 因此, 下一步的研究可以聚焦于2 个方面: ①结合地面采集数据对新旧三七荫棚和三七生长环境内的各类地物进行更有针对性和更精细化的光谱特征分析; ②结合地面实测数据和光谱特征分析构建精度更高的三七种植信息分类提取模型。

猜你喜欢

图斑目视决策树
莫让“目视”被“无视”
地理国情监测中异形图斑的处理方法
新安县有序开展卫星遥感监测图斑核查工作
基于C#编程的按位置及属性值自动合并图斑方法探究
以另一种方式存在
少林黑虎拳(下)
土地利用图斑自动检测算法研究
眼神在六字诀中的应用
决策树和随机森林方法在管理决策中的应用
决策树学习的剪枝方法