APP下载

数据挖掘技术在柳州森林资源管理中的应用探析

2020-02-28蓝海涛

林业科技情报 2020年4期
关键词:森林资源数据挖掘资源管理

蓝海涛

(柳州市林业技术推广站,广西 柳树 545001)

我国地域辽阔,森林资源调查数据存在着复杂、庞大的特点,因此,如何将此类数据转化成具有价值的信息是林业信息化工作的重点。就单以柳州市为例,根据2019年森林资源管理“一张图”统计,全市总计面积186.04万公顷,林地面积127.15万公顷,森林覆盖率66.69%,主要种植松、杉、桉树,分别占地6.6万公顷、41.92万公顷、23.45万公顷,若通过传统方式来对这些森林资源进行管理,显然是不现实的。近年来,数据挖掘技术从无到有,发展十分迅速,随着理论研究的逐渐推进,此技术开始在各个领域中进行运用。在森林资源管理工作中对数据挖掘技术进行运用,可以在海量且关系复杂的数据之中将蕴藏深层次含义的信息挖掘出来,以促进森林经营以及资源管理工作效率的提升,同时还能够通过知识管理与发现来优化森林资源管理工作,推动森林资源决策管理向着现代化以及科技化的方向发展。

1 数据挖掘技术的概念

就数据挖掘技术而言,其属于一个处理过程,主要通过多种计算机技术对数据库之中存在的数据进行自动分析,并对相应知识进行提取[1]。在此种定义中,数据挖掘需要将数据库作为对象,立足于宏观角度进行分析,数据挖掘属于将某些事实与观察数据作为基础的集合。就数据挖掘对象而言,还包含文件系统,以及与其它组织进行结合的集合。简而言之,数据挖掘技术指的是在海量的数据之中挖掘、提取知识。

2 林业数据挖掘的意义

2.1 提高林业地理信息系统的智能化分析能力

现存林业地理信息系统主要涉及空间分析、资源数据管理、林业专题制图以及信息查询等相关功能,对林业领域知识进行表达以及获取的方式较为匮乏[2]。把DMDK与SDMDK技术和林业GIS进行融合,能够在海量的数据之中发掘出概括性强以及蕴藏各类林业领域的知识规则,诸河流、公路的关联规律,以及森林在二维、三维地表的分布规律等,进而确保森林资源管理、林业发展辅助决策、林业规划的科学性、合理性以及准确性,推动森林资源管理、决策工作能够向着智能化的方向发展,从而形成林业决策支持系统。

2.2 提高森林资源遥感影像自动解译的精度

针对森林资源遥感影像自动解译,亦或是目标识别而言,同物异谱以及同谱异物的情况较为普遍[3]。在遥感影像分类的过程中对GIS数据进行良好的运用,并在其中挖掘知识来优化影像分类,推动解译精度以及自动化程度的提升,属于遥感领域需要深入探究的一个问题。同时,如果分类器需要数据拥有相应的统计特性,那么就不宜将GIS技术作为辅助数据。所以,立足于现存林业GIS数据,挖掘适宜的森林分类规则促进分类精度的提升,可有效解决上述问题。

3 数据挖掘技术在森林资源管理中的应用

3.1 数据挖掘技术在森林资源管理中的主要分析方法和实现算法

对数据中存在的潜在模式进行挖掘,属于数据挖掘的重要任务[4]。模式属于通过语言L来进行表达的表达式E,其能够对数据集F之中数据的特性进行描述,同时E描述的数据属于集合F的子集FE。作为一个模式,E在描述方式上需要比列举子集FE中包含的全部元素更加简单。例如,“如果部分林分在郁闭度方面为0.5~0.6,那么可开展预备伐”,我们可以将其作为一个模式,但“如果部分林分在郁闭度方面为0.51、0.52、0.53……0.59,那么可开展预备伐”,不能够被作为一个模式。现阶段,在森林资源管理中运用数据挖掘技术,主要涉及以下几个方面。

3.1.1 分类模式

分类模式通常表现为一棵分类树,结合数据值由树根进行搜索,然后立足于数据满足的分支向上走,到树叶后方可对类别进行明确[5]。将分类模式在森林资源数据中予以应用,可对比不同地区以及林种的相关数据,以便于明确该地区的自然区域类别,同时判断树种在此区域的适应性。

3.1.2 回归模式

就回归模式而言,函数能以与分类模式较为相似,不同点在于前者预测值属于连续的,后者为离散的[6]。对回归方式进行运用的过程中,变量组合的复杂程度和数量,与方程稳定性呈反比关系。若无法掌握变量关系,那么可多选择几项,次要变量可运用逐步回归的计算被剔除。若通过回归模式对树木种类、高度的年增长量进行判断,并分析其属于0.5m之下、0.5~1.0m、1m之上中的哪个类别,可通过此方式得出结论。

3.1.3 时间序列模式

结合数据随着时间出现的变化趋势,时间序列模式能够对未来的值进行预测[7]。需要对时间存在的特殊性质进行充分考虑,诸如周期性时间定义年、月、周等,不同时间长度会引起特定的影响。对此,需要对时间因素进行全面的考虑,运用现存数据跟随时间出现变化的值,进而对未来值予以预测。时间能够对数据产生显著的影响,许多指标会在时间变化的影响下,表现出显著或潜在的变化特点。

3.1.4 序列模式

序列模式和关联模式非常接近,其充分联系起了数据间的关联性和时间。若要将序列模式找到,除了需要掌握事件发生与否之外,还应对事件发生的时间予以确定[8]。在对实际问题进行解决时,鉴于每个数据具有不同的特点,因而需对最佳数据挖掘模式做出选择,又或是在同一时间段对多种模式进行使用。受监督知识包括分类模式、回归模式、时间序列模式,由于在模式建立之前就已经知晓了数据结果,进而在模式准确性检测的过程中进行直接运用,所以模式属于在监督状况下形成的。非监督知识则有聚类模式、关联模式、序列模式,由于模式构建前未对结果进行掌握,所以模式在形成过程中不会受到监督。通常,在对这部分模式进行建立时,会将其中一些数据当作样本,而还有一些则用于对模式进行检验和校正。

3.2 主要的应用分析过程

3.2.1 问题定义

掌握挖掘任务与数据的特点,并了解和数据处理相关的背景知识,特别是面对的记录数据,关系复杂、具有较大的时间跨度时,需把整个处理过程的细节要求一个一个弄清楚,选择的挖掘算法一定要符合实际情况,同时将合理的处理流程与控制方案设计出来[9]。

3.2.2 数据预处理

在长时间的森林资源数据搜集过程中,受各种原因的影响,比如地域差异、工作水平差异以及技术标准改进等,因而被存储于数据库、数据仓库中的数据经常存在不一致性,或者有一些不正确、超乎寻常的值。针对这一情况,就应检查原始数据库中数据的完整性和一致性,处理其中的噪声数据,并相应的填补那些失去的数据。现阶段,经常使用的数据预处理技术包括数据集成、数据清理、数据归纳、数据变换等。在接受预处理后,挖掘模式的质量会有很大提升,且实际挖掘所需时间也会非常明显的减少[10]。

3.2.3 数据挖掘

立足于知识发现算法,在数据之中提取出用户所需的知识。对此部分知识予以表示的过程中,可运用特定方式,亦或是运用使用频率较高的表达方法。

3.2.4 知识评估

通过用户可以了解的方式来呈现所发现的知识。数据可视化为使用频率较高的一种方法,其简单来说就是以直观的方式表现从大量数据中所获得的数据集,进而便于分析者在最短时间内将数据特征找出,并掌握到隐藏于其中的依赖关系。

4 结语

综上所述,在森林资源管理工作中运用数据挖掘技术能够在海量的数据之中发掘出概括性强以及蕴藏各类林业领域的知识规则,进而推动林业资源实现可持续发展的目标,并增强管理工作的智能化水平。

猜你喜欢

森林资源数据挖掘资源管理
人事档案管理在人力资源管理中的作用
人力资源管理促进企业绩效提升
企业人力资源管理
森林保护和森林资源开发利用研究
探讨人工智能与数据挖掘发展趋势
森林资源保护管理中存在问题及对策探讨
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
保护好森林资源 让林区青山常在
GIS在森林资源管理中的应用
新形势下北方森林资源保护探讨