基于森林资源二类调查数据的香格里拉市森林生物量二阶抽样优化
2021-12-11杨沁雨
杨沁雨 王 瑞 胥 辉
(西南林业大学林学院/西南林业大学西南地区生物多样性保育国家林业局重点实验室,云南 昆明 650233)
森林生物量是森林生态系统最基本的数量特征,也是陆地生态系统植被总生物量的主要组成部分,对调节全球气候、碳平衡、温室气体、物质循环与能量流动等方面有着极其重要的作用[1-3]。森林生物量是研究许多林业问题和生态问题的基础数据依据,对评估森林的经营水平和发展利用的价值至关重要[4-6]。因此,准确测定森林生物量无论在生产上,还是在理论研究上都有着十分重要的意义[7]。但是,目前对于区域尺度上的森林生物量估算,由于缺少抽样设计而缺乏精度保障。然而,森林生物量的精准测定非常困难,而且费时费力,因此确定一种行之有效而又准确的抽样调查方法是十分重要的。
抽样调查技术以数理统计和概率论为基础,主要研究抽样理论、抽样方法及其应用[8]。抽样的最终目标是实现寻求经济投入与分析结果精度之间的优化平衡,即以较小的投入得到较高精度的分析结果[8]。简单抽样与系统抽样法是最基础、使用频率较高的抽样方法[8]。但森林调查通常涉及到较大的森林面积,且很多区域地形险峻、通行困难、地域辽阔、人迹稀少,采用这2种抽样时很难做出更好的优化方法。然而,基于二阶抽样单元进行抽样调查,就可以很好的解决上述问题,既能节省抽样单元编制成本和往返时间,又能提高抽样调查效率与抽样精度[9]。实际上许多年来林业工作中早已自发地采用二阶抽样技术,并已广泛地应用于其它林业调查,例如样地中抽选样木,又如在标准木中选择标准枝等都属于二阶抽样的范畴。张宗秀等[10]基于2007年四川省森林资源连续清查数据,通过研究和分析对比得出二阶抽样能够明显提高各类土地面积的成数估计精度;李云霄等[11]等采用三阶抽样技术与实地调查相结合的方法,用4 km×4 km作为二阶抽样单元尺寸,使其估测的研究区林地蓄积量与实际研究区林地蓄积量比较,总体精度高达99.53%,估计精度也达到87.16%;林芳芳等[12]比较了8种抽样单元,最后选取了1.5 km×1.5 km作为最优抽样单元尺寸,与传统抽样方法相比相对误差较小,抽样稳定性较好,在考虑了抽样单元的空间自相关性,降低了抽样调查的样本容量,节约抽样成本。华一枝等[13]等比较4种抽样单元,最终确定1 km×1 km的空间抽样为最优方案,可以降低抽样成本,提高抽样精度,减小抽样误差。可见二阶抽样在林业调查中已经广泛应用,但在森林生物量调查中应用研究不多。因此,基于目前森林生物量的调查往往没有提供精度,在数据应用上带来了极大困扰的问题,二阶抽样是通过抽样精度的损失来换取成本支出的减少,在地形复杂、交通不便的林区更为适用。因此,对二阶抽样进行优化设计,从而提高森林生物量进行估测精度,对于森林生物量的精确估算具有重要的理论和实践意义。
鉴于此,以云南省香格里拉市为研究区,采用2016年森林资源二调数据为信息源,因二调数据中没有生物量数据,所以用生物量扩展因子法计算研究区生物量,以单位蓄积量变动系数来决定所需要抽取的抽样样本量,规定在95%的可靠性指标和85%的抽样精度下,采用二阶抽样和二阶优化抽样方法,对香格里拉市针叶林地上生物量进行抽样精度分析。以期证明利用单位蓄积量的平均值±标准差作为二阶优化抽样的优越性,为今后森林生物量在区域尺度的精度调查评价提供技术支撑。
1 研究区概况
香格里拉市地处横断山脉三江并流区域的东部,位于滇西北迪庆藏族自治州境内,北纬26°52′~28°50′,东经99°23′~100°18′,全市总面积11 417.39 km2。研究区地势高耸,香格里拉市的最高点是巴拉格宗雪山(5 545 m),最低点是洛吉吉函(1 503 m),海拔高差达4 042 m,平均海拔为3 459 m。热量不足,气温偏低,多年平均气温为5.5 ℃,属山地寒温带季风气候,历年平均降水量为618.4 mm,平均降雪日为35.7 d,年日照率为40%~50%。本地区主要包含高原、山地、盆地、河谷四种地形地貌,总体地形趋势为西北高、东南低。森林植被面积大,植物资源丰富,常见针叶树种主要有高山松(Pinus densata)、华山松(P. armandii)、云南松(P. yunnanensis)、冷杉(Abiesspp.)、云杉(Piceaspp.)和落叶松(Larixspp.)等。
2 材料与方法
2.1 数据来源及预处理
本研究数据包括2016年香格里拉市森林资源二类调查数据和香格里拉市行政边界。利用Arc-GIS 10.5通过二调数据提取香格里拉市针叶林,涵盖云冷杉、高山松、云南松、华山松、落叶松等(图1),根据二调数据的小班调查数据进行数据分析。
图1 研究区针叶林分布图Fig. 1 The distribution map of the coniferous forests
2.2 林木生物量扩展因子法
由于小班属性中并没有地上生物量数据,因此采用林木生物量扩展因子法进行蓄积-生物量转换来计算小班生物量[14],生物量转换因子法模型见式(1),各树种生物量扩展因子及木材密度见表1。进而计算得出研究区针叶林地上生物量,见表2、图2。计算得出研究区针叶林总面积为600 823.6 hm2,总地上生物量为6.304 2×107t,单位面积地上生物量为104.93 t/hm2。
图2 研究区针叶林地上生物量密度分布图Fig. 2 The distribution map of the coniferous forests’aboveground biomass density
表1 生物量转换因子Table 1 Biomass conversion factor
表2 香格里拉市针叶林地上生物量统计Table 2 Aboveground biomass statistics of coniferous forests in Shangri-La City
式中:B为森林地上生物量;BEF为生物量扩展因子;SVD为某一树种或树种组的木材密度;V为林分蓄积。
2.3 二阶抽样设计
二阶抽样首先是把总体划分为N个单元,叫做一阶单元,在每个一阶单元内再划分为M个单元,叫二阶单元。从N个一阶中随机地抽取n个,作为一阶样本单元,再从被抽中的一阶单元中随机地抽取m个二阶样本单元,组成二阶总体样本单元nm[15]。
2.3.1 抽样单元
一阶抽样单元设计:不同的抽样单元大小会影响抽样精度、抽样成本等。本研究利用ArcGIS 10.5中的渔网工具将香格里拉市针叶树种划分成不同规格的抽样单元。在可靠性指标为95%,抽样精度为85%的情况下,试选取了1 km×1 km、2 km×2 km、3 km×3 km、4 km×4 km、5 km×5 km、6 km×6 km、7 km×7 km、8 km×8 km、9 km×9 km、10 km×10 km共计10种规格的抽样单元。
二阶抽样单元设计:在一阶抽样单元基础上,划分二阶抽样单元为30 m×30 m的抽样单元。
2.3.2 样本单元数
一阶样本单元个数:
式中:C为变动系数,E为相对误差,tα为可靠性指标。
单位蓄积量的变动系数计算方法为:
式中:n为总体网格数,yi为第i个样本单元的单位蓄积量,y为香格里拉市各阶样地总体的平均单位蓄积量。
二阶样本单元个数:
式中:m为二阶抽样单元个数,C1为一阶单元变动系数,C2为二阶单元变动系数,D1为调查一个一阶样本单元所需的平均成本,D2为调查一个二阶样本单元所需的平均成本,M为二阶总体样本单元平均数。
二阶样本平均数:
式中:y为二阶样本单元平均数,yij为第i个一阶样本单元中第j个二阶样本单元的生物量。
2.3.3 方差计算及精度计算
二阶抽样中,估计总体方差(S2(y) )需要分解为两部分,即一阶间方差和一阶内二阶间方差,依据参考文献[15]中第7章的相关方法,计算相对误差(E)和总体抽样精度(P)。
2.4 二阶抽样优化设计
以往的二阶抽样只考虑了一阶样本单元的大小,在随机抽取一阶样本单元时,导致其方差差异较大,若要提高二阶抽样效率必须设法减小一阶样本单元间方差[11]。因此,在对二阶抽样方法进行一阶抽样时,还要考虑调查对象之间的方差关系,避免抽取到数值过小或过大的单元,以此来提高调查精度和效率。
在本研究中当一阶间单位蓄积量差异减小时,随机抽取的一阶单元方差就随之减小。所以对二阶抽样优化设计是用不同规格抽样单元的单位蓄积量的平均值±标准差,得到10种方差差异较小的研究区范围,在此范围上在进行随机一阶样本单元的抽样(n),在从一阶样本单元中随机抽取相应数量的30 m×30 m二阶样本单元(m)。
3 结果与分析
3.1 一阶样本单元数确定
通过二调数据中的蓄积量得到10种规格不同抽样单元的单位蓄积量变动系数(C1)。根据不同的变动系数,在可靠性指标为95%,抽样精度为85%的情况下计算出10种规格不同抽样单元的一阶样本单元数,见表3。在ArcGIS 10.5中用渔网工具对香格里拉市进行不同规格抽样单元的划分,按照表3中的一阶样本单元数随机抽取得到10种规格不同的一阶样本单元(n),如图3。变动系数随着抽样单元面积的增大而减小,所需要抽取的一阶样本单元数也随着变动系数的减小而减小。当一阶抽样单元为1 km×1 km时,C1最大,为57.84%,其所需要抽取的n最多,为57个;当一阶抽样单元为10 km×10 km时,C1最小,为38.71%,其所需要抽取的n最少,为26个。
图3 一阶样本单元分布Fig. 3 Distribution of first-order sample units
因一阶总体单元数不变,一阶单元的变动系数也没有发生改变,所以二阶优化抽样中抽取的一阶样本单元量与未优化的一阶样本单元量相同。在ArcGIS 10.5中用渔网工具对香格里拉市进行不同规格抽样单元的划分,用不同规格单位蓄积量的平均数±标准差,得到优化后的研究区抽样范围。用表3中的一阶样本单元数作为10种大小不同抽样单元的一阶优化样本单元数,如图4。优化后一阶样本单元间方差()与未优化的一阶样本单元间方差()差异明显,表4中未优化之前最大的是4 km×4 km规格的抽样单元值为17.00,最小的是6 km×6 km规格的抽样单元值为6.76。优化后最大的是1 km×1 km规格的抽样单元值为8.76,最小的是6 km×6 km规格的抽样单元值为2.75。
表4 一阶样本单元间方差对比Table 4 Comparison of variance among first-order sample units
图4 一阶优化样本单元分布Fig. 4 First-order optimization of sample units distribution
表3 一阶抽样单元变动系数及样本单元数Table 3 The variation coefficient of the first-order sampling units and the number of sample units
3.2 二阶抽样样本确定及抽样精度分析
在一阶样本单元(n)中划分30 m×30 m的二阶单元,10种规格抽样单元中含有的二阶单元都不一样,在可靠性指标为95%、抽样精度为85%情况下计算出10种30 m×30 m的二阶变动系数(C2)。因二阶单元样地较小,考虑到无反应样本单元问题,在确定的二阶样本单元数(m)上增加10%的安全系数,2种抽样方法抽样结果见表5。二阶单元的变动系数趋势与一阶变动系数趋势不同,二阶单元的变动系数数值最低的抽样单元大小为6 km×6 km,为45.46%,其所需要抽取的nm为544个。
表5 2种抽样方法抽样结果比较Table 5 Comparison of sampling results between the 2 sampling methods
对二阶抽样优化后,由表5可知,二阶变动系数(C2)、二阶样本数(m)、二阶总体样本单元数(nm)和相对误差(E)均明显减小,总体精度(P)均明显提高。优化后的二阶变动系数在7 km×7 km抽样单元处变动系数值最低为28.64%,其所需要抽取的二阶样本单元数为352个。
由表5可知,在抽样单元大小为6 km×6 km时相对误差最小、总体精度最高,分别为9.12%和90.88%。经过对二阶抽样方法进行优化后,同样是在抽样单元为6 km×6 km时相对误差最小、总体精度最高,分别为6.39%和93.61%。在抽样单元为6 km×6 km时,二阶抽样与二阶优化抽样的一阶样本抽样数量均为34个,但是经过优化后,6 km×6 km的一阶样本间方差从未优化之前的6.76降低到2.75,使之二阶的变动系数也从未优化之前的45.46%降低到了33.40%。
4 结论与讨论
本研究提出用规格不同的抽样单元,通过二阶抽样为区域尺度的森林生物量估测提供精度保障。二阶抽样方法在森林生物量抽样调查中也运用较少,本研究基于不同规格的抽样单元进行总体精度比较发现,研究得到在可靠性指标为95%、抽样精度为85%的抽样水平下,香格里拉市针叶林生物量的二阶抽样方法的最优抽样单元规格为6 km×6 km,二阶抽样样本量为544个,其抽样相对误差最小、总体精度最高,二阶抽样的生物量相对误差为9.12%,总体抽样精度为90.88%。
二阶抽样优化后10种抽样单元精度均有提高,其中6 km×6 km精度最高,抽样样本量为408个,相对误差为6.39%,抽样精度为93.61%。优化后的二阶样本比未优化之前的二阶样本减少了136个样本量,优化后的二阶抽样精度比未优化之前的二阶抽样精度提高了2.73%。这样就说明二阶优化抽样能以最少的成本及最高的效率来估测研究区的生物量。
香格里拉市地处横断山区,地形极为复杂,且交通不便,二阶抽样是先进行一个大范围的第一次抽样,在第一次抽取的样本中再进行第二次抽样,所以会很大程度上的集中抽样样本,提高抽样效率[15];二阶抽样可以视为整群与分层抽样的结合,二阶抽样有利于提高抽样估计精度,也有利于各阶段对调查资料的需求;二阶抽样与简单随机抽样相比,二阶抽样更为灵活、更实用,在交通不便的林区更加方便快捷[16]。因此,使用二阶优化抽样方法对区域尺度的森林生物量进行估测,可以弥补之前在提供生物量数据上精度保障的空白。二阶抽样虽精度稍低,但是大大的节约了抽样时间和抽样成本,针对二阶抽样技术在森林生物量调查中存在的问题和不足,提出了二阶优化抽样方法。二阶抽样是在研究区上随机的抽取相应样本单元,导致最终抽取的一阶单元样本间的调查因子方差大,所抽取的样本单元就不能很好地代表整个研究区情况。而二阶优化抽样方法考虑到一阶抽样间的方差问题,运用不同规格抽样单元中单位蓄积量的平均数±标准差,在研究区中进行了一个区域筛选,就可以将调查因子差异不大的归在同一区域,这样二阶所抽取的一阶样本单元间的方差就会减小
在二阶抽样的基础上对二阶抽样进行优化,就解决了随机二阶抽样在一阶样本间方差较大,从而导致抽样精度较低的问题。说明二阶优化抽样在森林生物量的调查中具有较高精度和可操作性,可为森林生物量估算数据精度保障提供一个快捷有效的抽样方法。
此外,本研究在计算生物量一阶抽样单元的变动系数时,采用的是单位蓄积量值,会在一定程度上影响一阶抽样单元的变动系数的准确度,生物量值是通过生物量扩展因子法转换出来的,最终导致一些生物量值偏高或偏低,而且在现实调查中,生物量值也是未知的,可以在今后的试验中调整计算变动系数的标准,采用林地变动系数或者重新寻找一种方法代替单位面积蓄积量[11]。