APP下载

基于大数据技术的森林资源管护智慧林云体系构建方法

2023-09-07杨丽艳

南方农业·下旬 2023年6期
关键词:洮河样点决策树

杨丽艳

摘 要 森林资源是地球上最重要的自然资源之一,对于保护生物多样性、调节气候、维护生态平衡具有重要意义。为提供更为科学有效的森林管护决策,推动森林可持续发展,以甘肃洮河国家级自然保护区为例,利用大数据技术构建森林资源保护智慧林云体系,通过构建的智慧林云体系对保护区内森林资源数据进行采集、预处理及分析,为该地区森林管护措施提供有效的数据支撑,并验证智慧林云体系在森林资源管护上的可行性。

关键词 大数据技术;森林资源管护;智慧林云;构建方法;甘肃洮河国家级自然保护区

中图分类号:S757 文献标志码:C DOI:10.19415/j.cnki.1673-890x.2023.12.030

森林覆盖面积的不断减少、森林火灾的频发及非法砍伐等问题对全球森林资源构成严重威胁[1]。传统的森林资源管理方法往往依赖于人工采集和分析数据,效率低下且易受限于人为因素[2]。大数据技术的合理应用,为森林资源的实时监测和管理提供了新的手段[3]。笔者利用大数据技术,提出了一种森林资源管护智慧林云体系的构建方法,并在甘肃洮河国家级自然保护区(以下简称为洮河保护区)内进行此体系在森林资源管护中的可行性试验。采集、分析洮河保护区内森林资源的数据,通过云平台对这些数据进行综合分析,实现对森林资源数据分析结果的可视化展示。通过以上方法决策者可以实时了解各类森林资源的状态和变化趋势,制定科学合理的管理和保护策略,以最大限度地保护和利用森林资源。

1 智慧林云体系框架设计

智慧林云体系框架将利用现代信息技术,如云计算、大数据、物联网等,对林业资源进行实时监测、数据采集和分析[4]。洮河保护区作为我国重点国有林区的主体部分之一,森林资源丰富。为实现森林资源的有效管护,以洮河保护区内森林资源为例构建一种森林资源管护智慧林云体系,智慧林云体系构建方法主要由数据采集与预处理、数据分析及智慧管护决策组成。数据采集设计是通过多种森林数据采集设备,共同组成传感器网络,将采集到的各类森林数据传输至边缘储存设备共同储存。数据分析部分的设计思路为将储存的数据经过网络上传至云平台,在云平台中搭建数据库用于划分森林地块类型并采用决策树算法对数据进行分析,将分析结果于智慧管护决策内展示,操作人员可根据分析结果查看当前洮河森林内草地的状态信息,对森林草地管护进行科学规划。

2 数据采集与预处理

森林资源的数据采集设计重点在于选取有效的采集方式并将数据快速并发收集[5]。森林数据的采集包含但不局限于温度、湿度、土壤含水量等环境数据,各类型的采集设备共同组成传感器网络,覆盖需要进行管护的森林地区。

考虑到采集森林数据时会出现重复,在服务器中加入Jaccard算法用于筛选重复的数据,在此算法中将每种森林数据设定为一个集合,以单位时间划分为不同的数据集合,通过两个数据集合中的数据相似度来筛选重复数据,重复数据D筛选的计算公式如式(1)。

(1)

式中,A和B分别为不同时间对同一森林资源地块采集到的数据集合,|A|为集合A的数据个数,|B|为集合B的数据个数,|A|∩|B|为A和B的交集的数据个数,|A|∪|B|为A和B的并集的数据个数,由此储存器优先剔除重复数据,再将数据进行储存。

3 数据分析

云平台主要对采集到的森林数据进行分析,EdgeStore 2000X服务器将初始数据通过WLAN传输到云平台后,优先将数据分类储存到数据库中。本文设计采用谷歌云平台(Google Cloud Platform)作为此次智慧林云体系构建的服务平台,该平台可在控制管理页面直接导航到数据库服务。依据洮河保护区内森林资源的多类型数据,笔者采用MySQL创建关系型数据库,以不同类型的传感器设备作为数据储存的主键创建不同的数据表,并在数据表中加入该类数据的属性字段,其中洮河保护区森林土壤数据表的创建类型如表1所示。

在数据库中创建不同类型的数据表时,加入SQL查询语句来执行查询和操作数据的功能,操作人员可根据需要添加或者删除字段或其他的数据属性。对于批量数据查询的需求,操作人员可采用云平台提供的一键导出功能,将一种类型的数据批量导出,数据的承载方式可选择Excel或txt等,方便操作人员对数据的把控。

采用决策树算法对数据库中的森林资源数据进行分析处理,其中CART算法可根据给定的特征和标签数据,自动构建一棵决策树,因此每一种类型的数据均可独立计算分析,在数据并发处理上不会出现冲突,可保证平台运行的稳定性。在构建决策树模型时,选择数据库中的数据字段作为决策树的节点,这个过程被称为特征选择。根据特征选择的方法,计算每个森林资源数据特征的度量值,选择度量值最大的特征作为当前节点的划分特征。在特征选择中,常用的方法是计算每个特征的信息增益(Information Gain),而信息增益的计算依赖于数据集的信息熵,信息熵Entropy(C)的计算公式如式(2)。

Entropy(C)=-∑(pi×log2(pi))(2)

其中,C为数据集,pi表示数据集中属于第i类的数据的比例。通过计算每个特征划分后的子集的信息熵,可以衡量特征划分后的数据集的不确定性的减少程度,从而选择具有最大信息增益的特征作为节点进行划分。通过计算每个特征划分后的子集的信息熵,可以比较不同特征的信息增益,选择可较大减少数据集不确定性的特征进行划分,信息增益Gain(C,A)的计算公式如式(3)。

Gain(C,A)=Entropy(C)-∑(|Cv|/|C|)×Entropy(Cv)(3)

式中,A为特征,Cv为特征A上取值为v的数据子集,|Cv|为Cv的数据个数,|C|为数据集C的数据样本个数。根据特征选择的结果,将数据集划分为不同的子集,并为每个子集构建子树。递归地重复这个过程,直到满足某个停止条件,完成决策树的构建。构建完成的决策树往往会过拟合训练數据,为了避免过拟合,需要对决策树进行修剪。本文采用预剪枝的方法对决策树进行修剪,预剪枝是在构建决策树时,在每个节点上进行判断,如果判断决策树在验证集上无法得到改善,就停止拓展该节点。最后通过构建好的决策树模型进行数据总体预测,对于新的数据点,根据其特征值沿着决策树的分支进行判断,此时面临处理数据分类问题,使用基尼指数衡量特征对于分类的贡献程度,帮助选择最佳的划分特征,基尼指数Gini(C)的计算公式如式(4)。

Gini(C)=1-∑(pi2)(4)

式中,C表示数据集,pi表示数据集中属于第i类的样本的比例。经过以上处理分析的森林资源数据,将在平台的用户页面进行可视化,为森林资源的管护提供帮助。

4 智慧管护决策

基于云平台建模对森林资源数据分析的结果,操作人员可以进行智慧决策和管控,以优化森林资源的管理和保护。在云体系中可加入森林资源状况评价体系,通过分析实时的森林资源数据判断森林的健康程度。笔者对洮河保护区森林资源数据进行采集分析,以裸地与斑面积占比为判定指标,创建洮河保护区森林健康状况评价体系,将森林健康程度分为健康、亚健康、不健康和极不健康4个等级,分别将其标为4、3、2、1级,以洮河保护区内草原、林地、苗圃以及灌草丛4种森林资源类型为例,建立森林健康程度分级标准表,如表2所示。

以裸地/斑面积比例作为评价体系决策者可以评估森林资源的总体面貌和可利用性,合理划定生态保护区、制定生态补偿政策、推动可持续利用等。为了支持智慧决策和管控,笔者基于云平台的交互功能设立一个可视化窗口,将分析和建模的结果以图表和地理信息的形式展示出来。决策者可以通过该平台直观地了解森林资源的状态和变化趋势,以便制订相应的管理和保护策略。

5 应用实例分析

笔者选取洮河保护区以验证智慧林云体系的实用性,洮河保护区位于甘南藏族自治州的卓尼县、临潭县、碌曲县、迭部县及合作市,东邻岷县,南接迭部县和四川省若尔盖县,西与碌曲县接壤。甘肃洮河国家级自然保护区管护中心总面积287 760.00 hm2。其中林地面积为261 483.12 hm2,占土地总面积的90.87%;非林地面积为26 276.88 hm2,占土地总面积的9.13%。森林覆盖率为44.4%,林地绿化率为71.33%,拥有丰富的森林自然资源。从该自然保护区中选定大峪沟、车巴沟、卡车沟、麻路小镇4个范围开展地上植被覆盖率监测试验,每个范围确定3个数据采集点,共12个采集点,以编号1~12标记区分,经过统一采集时间后由本文设计的云平台输出可视化结果,生成不同样点植被覆盖率图(见图1)。

由图1可知,卡车沟9号样点(26.7%)和麻路小镇的12号样点(31.3%)地上植被覆盖率最低,其次为大峪沟的1号样点(37.5%)和车巴溝的6号样点(42.3%)。地上植被覆盖率最高的是麻路小镇的10号样点(94.6%)和11号样点(87.4%),其次为卡车沟的8号样点(77.8%)。其余样点地上植被覆盖率在50%~70%。不同分布区位间比较,仅车巴沟内样点间地上植被覆盖率差别较小,其余区位内样点间差别较大,决策人员可根据此类数据信息做出适合当前植被覆盖情况的资源管护决策。

6 结语

综上所述,基于大数据技术的森林资源管护智慧林云体系是一种具有潜力的管理和保护方法。笔者提出了一种森林资源管护智慧林云体系构建方法,并在实验中验证了其有效性,智慧林云体系能够充分利用大数据、数据分析和智能决策技术,基于数据收集、预处理、分析和建模等步骤,实现对森林资源的实时监测、智能决策和管控,未来的研究和应用将进一步推动智慧林云体系的发展,为森林资源的保护和可持续发展做出重要贡献。

参考文献:

[1] 黄晓莹,张婧懿.基于大数据技术的中医药云服务平台基础架构设计[J].自动化技术与应用,2023,42(5):150-153.

[2] 吴昊,唐忠.基于物联网技术的广西城镇智慧居家养老服务体系构建[J].数字技术与应用,2023,41(4):102-104.

[3] 张杨,朱麟奇.吉林省智慧景区评价指标体系构建探讨[J].绿色建造与智能建筑,2023(4):82-85.

[4] 赵怡琼.智慧林业助力森林资源管护[J].林业科技情报,2022,54(4):90-92.

[5] 沈轩,张钧,张诚,等.医院智慧云导诊平台的构建与应用研究[J].中国卫生信息管理杂志,2022,19(4):588-593.

(责任编辑:张春雨)

猜你喜欢

洮河样点决策树
小麦条锈病田间为害损失的初步分析
车过洮河
歼敌
星火燎原
洮河流过生根的岩石(外二章)
基于空间模拟退火算法的最优土壤采样尺度选择研究①
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于分融策略的土壤采样设计方法*
基于决策树的出租车乘客出行目的识别