APP下载

基于哑变量的马尾松生物量模型研究

2016-09-26吕常笑邓华锋王秋鸟陈振雄王雪军

河南农业大学学报 2016年3期
关键词:马尾松起源预估

吕常笑,邓华锋,王秋鸟,陈振雄,王雪军

(1.北京林业大学林学院,北京100083; 2.国家林业局中南林业调查规划设计院,湖南 长沙410014;3.国家林业局调查规划设计院,北京100714)

基于哑变量的马尾松生物量模型研究

吕常笑1,邓华锋1,王秋鸟1,陈振雄2,王雪军3

(1.北京林业大学林学院,北京100083; 2.国家林业局中南林业调查规划设计院,湖南 长沙410014;3.国家林业局调查规划设计院,北京100714)

以重庆、四川和湖北省马尾松生物量实测数据为例,利用哑变量方法分析了林分起源、地域对地上生物量及各分项生物量模型的影响,建立了包含起源、地域因子的哑变量通用模型。结果表明,利用哑变量方法分析林分起源、地域因子对地上生物量及各分项生物量模型影响的方法是可行的;树干、干材、树皮和地上生物量模型仅受地域因子的影响;树冠、树枝和树叶生物量受林分起源和地域因子影响相对较大;地上生物量及各分项生物量三元生物量模型预估精度最大,二元生物量模型次之,一元生物量模型最小;考虑地域、起源的哑变量模型,对地上生物量、树干和干材生物量的预估效果最好,树冠、树枝和树皮生物量次之,树叶生物量的预估效果最差。

生物量;哑变量;地域;林分起源;马尾松

森林是地球上最大的陆地生态系统,对维护全球生态平衡、减缓全球变暖具有不可替代的作用,而森林生物量是森林生产力的重要表现[1-4]。因此,森林生物量的监测和评估越来越受到世界各国的重视。目前,国内外学者主要对地上生物量与各分项生物量、立木材积之间的相容性做了大量研究,曾伟生等[5]利用度量误差模型的方法,采用比值函数分级联合控制和比例函数总量直接控制两种方案构建了马尾松地上生物量与各分项生物量相容性生物量模型。符利勇等[6]利用比例平差法和非线性联立方程组法建立了南方马尾松不同林分起源的相容性生物量模型。曾伟生等[7]利用度量误差模型的方法构建了杉木人工林地上生物量与立木材积的相容性模型;曾鸣等[8]在构建地上生物量与立木材积相容性模型的基础上,通过哑变量构建了杉木不同总体的通用模型;刘琼阁等[9]构建了东北云杉地上生物量与立木材积和各分项生物量相容的通用模型。然而,利用哑变量分析地域、起源对马尾松各分项生物量模型的研究相对较少。哑变量为虚拟变量,常用于处理定性因子或分类变量,一般取值为0或-1。中国学者对哑变量在模型中的应用也做了大量研究,李忠国等[10]以日本落叶松为例,利用哑变量方法构建了北亚热带高山区和暖温带中山区两个区域的通用生长模型;郑冬梅等[11]以落叶松和栎类为例,利用哑变量方法分段建模,解决小径阶林木地上生物量的偏估问题;高东启等[12]以蒙古栎为例,利用哑变量构建了间伐林分和未间伐林分的林分断面积和蓄积量通用生长模型;王勇等[13]以华北落叶松为例,利用哑变量方法构建了燕山3个地区的通用性生长模型;符利勇等[14]利用哑变量方法构建了东北地区兴安落叶松和长白落叶松不同树种的地上生物量通用模型;因此,本研究在前人研究基础上,以重庆、四川和湖北省马尾松生物量样本数据为例,通过哑变量分析地域、起源对地上生物量及其各分项生物量模型的影响,构建不同区域、起源马尾松各分项生物量的通用模型,以增加模型的预估精度和广泛的应用性。

1 材料与方法

1.1数据来源

本研究数据来源于国家林业局2009年全国连续清查生物量调查建模项目。数据共有151株马尾松样木,采集于重庆、四川和湖北3个省市。为保证样本在大尺度范围内具有广泛的代表性,样本的单元数按各省马尾松资源的多少平均分配。每个径阶的样木数也按2、4、6、8、12、16、20、26、32和38 cm以上共10个径阶均匀分布。对全部样木进行每木检尺,测量其胸径、地径和冠幅以及样木伐倒后的树高和冠长,称取样木各分量(干材、干皮、树枝、树叶)的鲜质量,并对其分别抽样,放在实验室85 ℃ 恒温箱中烘干至质量稳定,算出立木各部分生物量的干质量和地上部分总干质量。样本数据的分布情况见表1和表2。

表1 生物量建模样本分布情况Table 1 Sample trees distribution for modelling by forest origin and region

表2 建模数据变量概况Table 2 Summary statistics for modelling

1.2基础模型

本文主要研究马尾松地上生物量及各分项生物量与胸径、树高和冠幅之间的回归关系[19-20]。对应的一元、二元和三元模型表达式如下:

一元生物量模型:W=aDb

(1)

二元生物量模型:W=aDbHc

(2)

三元生物量模型:W=aDbHcCWe

(3)

式中:W为地上生物量及各分项生物量;D为胸径;H为树高;CW平均冠幅;a、b、c、e为模型参数。

1.3哑变量模型

1.3.2 不同起源的哑变量模型 根据符利勇等[19]的研究,同一树种的不同林分起源立木生物量可能存在明显差异。为了区分不同起源的差异性,在模型(1)~(3)中构造一个反映林分起源的哑变量S1,即S1=0为人工林,S1=1为天然林。模型(1)~(3)的表达式为:

一元生物量模型:W=(a+a1S1)D(b+b1S1)

(4)

二元生物量模型:W=(a+a1S1)D(b+b1S1)H(c+c1S1)

(5)

三元生物量模型:W=(a+a1S1)D(b+b1S1)H(c+c1S1)CW(e+e1S1)

(6)

式中:a1、b1、c1、e1分别为哑变量S1的特定系数。

1.3.3 不同区域的哑变量模型 由于不同区域的立地环境和气候不同,同一树种在不同区域的生物量也应该是不一样的。因此,在构建马尾松生物量模型时,为体现不同区域的差异性,在模型(1)~(3)构造两个反映地域的哑变量S2、S3,即当S2=1,S3=0时为重庆市;当S2=0,S3=1时为湖北省;当S2=0,S3=0时为四川省。其表达式为:

一元生物量模型:

W=(a+a2S2+a3S3)D(b+b2S2+b3S3)

(7)

二元生物量模型:

W=(a+a2S2+a3S3)D(b+b2S2+b3S3)H(c+c2S2+c3S3)

(8)

三元生物量模型:

W=(a+a2S2+a3S3)D(b+b2S2+b3S3)H(c+c2S2+c3S3)CW(e+e2S2+e3S3)

(9)

式中:a2、b2、c2、e2、a3、b3、c3、e3分别为哑变量S2、S3的特定系数。

1.3.4 不同起源、区域的通用模型 为了减少工作量并增加模型的预估精度,根据区域和林分起源对马尾松各分项生物量的影响,利用哑变量将不同区域、起源的马尾松整合成一个模型来构建,具体表达式如下:

一元生物量模型:

W=(a+a1S1+a2S2+a3S3)D(b+b1S1+b2S2+b3S3)

(10)

二元生物量模型:

W=(a+a1S1+a2S2+a3S3)D(b+b1S1+b2S2+b3S3)H(c+c1S1+c2S2+c3S3)

(11)

三元生物量模型:

W=(a+a1S1+a2S2+a3S3)D(b+b1S1+b2S2+b3S3)H(c+c1S1+c2S2+c3S3)CW(e+e1S1+e2S2+e3S3)

(12)

1.4异方差

利用加权回归法,权函数根据传统回归模型的残差平方来确定,选用传统生物量模型本身作为权函数形式对残差进行拟合,公式如下:

ω=1/f(x)2

(13)

1.5模型评价

为了对不同模型进行对比分析,本研究采用确定系数(R2)、估计值的标准误差(SEE)、总相对误差(TRE)、平均预估误差(MPE)、平均系统误差 (MSE)和预估精度 (P) 6项统计指标[23]对模型进行评价分析,同时把考虑地域、起源因子的哑变量模型与之相对应的传统回归模型进行比较分析。其计算公式为:

(14)

(15)

(16)

(17)

(18)

(19)

2 结果与分析

本研究以重庆、四川和湖北省马尾松151株样木生物量实测数据为例,采用Forstat软件构建地上生物量及各分项生物量的一元、二元和三元生物量模型,并利用哑变量分析林分起源、地域因子对各分项生物量模型的影响,构建通用模型,增加模型的预估精度和适用性。

表3 马尾松传统回归模型和不同起源哑变量模型的评价指标Table 3 Fitting results of conventional models and dummy models for Masson pine from different orign

表3为马尾松传统生物量模型(模型1~3)和引入起源哑变量生物量模型(模型4~6)的评价指标结果。由表3可以看出,在传统生物量模型中引入起源哑变量后,树干、干材、树皮和地上生物量模型的各项评价指标变化不大,树冠、树枝和树叶生物量模型的评价指标具有明显改进,其中以树叶生物量改进效果最为明显(如树叶三元生物量模型确定系数由0.73提高到了0.77,预估精度由88.50%提高到了89.53%)。这说明林分起源对树冠、树枝和树叶生物量的影响较大,对树干、干材、树皮和地上生物量影响较小。因此,在建模过程中,树干、干材、树皮和地上生物量可以不考虑起源对模型的影响,而树冠、树枝和树叶生物量需要考虑起源对模型的影响。

表4为马尾松传统生物量模型(模型1~3)和引入地域哑变量生物量模型(模型7~9)的评价指标结果。由表4可以看出,在传统生物量模型中引入地域哑变量后,地上生物量及各分项生物量模型的评价指标均有明显改善,其中以树皮生物量的改善效果最明显(如树皮三元生物量模型确定系数由0.80提高到了0.90,预估精度由90.68%提高到93.37%)。这说明地域因子对地上生物量及各分项生物量都有影响,在构建模型时都需要考虑地域对模型的影响。

表4 马尾松传统回归模型和不同区域哑变量模型的评价指标Table 4 Fitting results of conventional models and dummy models for Masson pine from different region

综合表3和表4可以看出,3种方法对马尾松地上生物量及各分项生物量的预估效果几乎都满足:三元生物量模型>二元生物量模型>一元生物量模型。其中,从一元模型到二元模型,树干、干材、树皮和地上生物量模型的改进效果比较大;从二元模型到三元模型,树冠、树枝和树叶生物量模型的改进效果比较大。这说明,树高因子对树干、干材、树皮和地上生物量的影响比较大,冠幅因子对树冠、树枝和树叶生物量的影响比较大。另外,考虑起源、地域的哑变量模型对树干、干材和地上生物量的预估效果最好,预估精度约为95%以上,其次是树皮、树枝和树冠生物量,预估精度约为93%,树叶生物量预估效果最差,预估精度约为88%。

考虑到树冠、树枝和树叶生物量既受林分起源的影响,又受地域因子的影响,需要利用哑变量构建树冠、树枝和树叶生物量不同起源、区域的通用模型,评价指标结果见表5。由表5可以看出,同时考虑地域、起源的生物量模型要比只考虑单一因子的生物量模型预估效果更好、更稳定(如树冠生物量:仅考虑起源的三元生物量模型确定系数是0.90,预估精度是93.44%;仅考虑区域的三元生物量模型确定系数是0.90,预估精度是93.38%;同时考虑地域和起源的三元生物量模型确定系数是0.91,预估精度是93.83%)。这说明通过哑变量构建马尾松不同区域、起源的通用模型来改进模型精度和适用性是可行的。

表5 含林分起源、区域因子的哑变量通用模型的评价指标Table 5 Fitting results of the dummy variable universal models containing the origin and regional factors

3 结论

1)利用哑变量方法分析不同地域、起源对地上生物量及各分项生物量影响的方法是可行的。结果显示:树干、干材、树皮和地上生物量受地域因子的影响比较大,受林分起源因子的影响比较小,在建模过程中可以仅考虑地域对模型的影响;树冠、树枝和树叶生物量受地域因子和林分起源的影响都比较大,在建模过程中需要同时考虑地域、起源对模型的影响。

2)地上生物量及各分项生物量都满足三元生物量模型预估精度最高,二元生物量模型次之,一元生物量模型最小。其中,树干、干材、树皮和地上生物量从一元模型到二元模型改进效果明显,树冠、树枝和树叶生物量从二元模型到三元模型改进效果明显。

3)考虑地域、起源因子后的哑变量模型对树干、干材和地上生物量的预估效果最好,树冠、树皮和树枝生物量次之,树叶生物量最差。据分析可能是因为树叶受落叶等外界干扰较大,造成树叶生物量误差较大,从而影响模型的预估精度。

本研究的着重点是林分起源和地域对地上生物量及各分项生物量建模的影响,模型的建立没有考虑地上生物量与各分项生物量、立木材积之间的相容性。后续研究可考虑利用哑变量模型和误差变量联立方程组方法,建立包含林分起源、地域的与各分项生物量、立木材积相容的生物量模型。

[1] CRONAN C S.Belowground biomass,production,and carbon cycling in mature Norway spruce,Maine,U.S.A [J].Canndian Journal of Forest research,2003,33(2):339-350.

[2] WOODBURY P B,SMITH J E,HEATH L S.Carbon sequestration in the U.S.forest sector from 1990 to 2010[J].Forest Ecology and Managemant,2007,241(1/2/3):14-27.

[3] HOUGHTON R A.Aboveground forest biomass and the global carbon balance[J].Global Change Biology,2005,11(6):945-958.

[4] 蔡兆伟,孙玉军,刘凤娇.长白落叶松林下灌木生物量模型研究[J].河南农业科学,2013,42(6):126-129.

[5] 曾伟生,唐守正.利用度量误差模型方法建立相容性立木生物量方程系统[J].林业科学,2010,23(6):797-803.

[6] 符利勇,雷渊才,孙伟,等.不同林分起源的相容性生物量模型构建[J].生态学报,2014,,34(6):1461-1470.

[7] 曾伟生,夏忠胜,朱松,等.贵州人工杉木相容性立木材积和地上生物量方程的建立[J].北京林业大学学报,2011,33(4):1-5.

[8] 曾鸣,聂祥永,曾伟生.中国杉木相容性立木材积和地上生物量方程[J].林业科学,2013,49(10):74-79.

[9] 刘琼阁,彭道黎,黄国胜等.东北云杉相容性立木材积和地上生物量模型研建[J].北京林业大学学报,2015,37(2):8-15.

[10] 李忠国,孙晓梅,陈东升,等.基于哑变量的日本落叶松生长模型研究[J].西北农林科技大学学报,2011,39(8):69-74.

[11] 郑冬梅,曾伟生.用哑变量方法构建东北落叶松和栎类分段地上生物量模型[J].北京林业大学学报,2013,35(6):23-27.

[12] 高东启,邓华锋,王海滨,等.基于哑变量的蒙古栎林分生长模型[J].东北林业大学学报,2014,42(1):61-64.

[13] 王勇,王鑫梅,牟洪香,等.哑变量在燕山地区华北落叶松人工林生长模型中的应用[J].东北林业大学学报,2014,42(10):44-50.

[14] 符利勇,唐守正,张会濡,等.东北地区两个主要树种地上生物量通用方程构建[J].生态学报,2015,35(1):150-157.

[15] PARRESOL B R.Additivity of nonlinear biomass equations[J].Canadian Journal of Forest Research,2001,31(5):865-878.

[16] ZHANG Y J,BORDERS B E.Using a system mixed-effects modeling method to estimate tree compartment biomass for intensively managed loblolly pines an allometric approach[J].Forest Ecology and Management,2004,194(1/2/3):145-157.

[17] BI H,TURNER J,LAMBERT M J.Additive biomass equations for native eucalypt forest trees of temperale Australia[J].Trees,2004,18(4):467-479.

[18] FEHRMANN L,LEHTONEN A,KLEINN C,et al.Comparison of linear and mixed-effect regression models and a k-nearest neighbor approach for estimation of single-tree biomass[J].Canadian Journal of Forest Research,2008,38(1):1-9.

[19] 曾伟生,唐守正.利用度量误差模型方法建立相容性立木生物量方程系统[J].林业科学研究,2010,23(6):797-802.

[20] 张会儒,唐守正,胥辉.关于生物量模型中的异方差问题[J].林业资源管理.1999(1):46-49.

[21] 曾伟生,骆期邦,贺东北.论加权回归与建模[J].林业科学,1999,35(5):5-11.

[22] 曾伟生.再论加权最小二乘法中权函数的选择[J].中南林业调查规划,1998,17(3):9-11.

[23] 贾宏汝,张旭,陈云.小秦岭国家级自然保护区乔木生物量随地形因子变化格局[J].河南农业大学学报,2015,49(6):777-782.

(责任编辑:李 莹)

DummyvariablemodelsinMassonpinebiomass

LV Changxiao1,DENG Huafeng1,WANG Qiuniao1,CHEN Zhenxiong2,WANG Xuejun3

(1.Beijing Forestry University,Beijing 100083,China; 2.Central South Forest Inventory and Planning Institute of State Forestry Administration,Changsha 410014,China; 3.Academy of Forest Inventory and Planning,State Forestry Administration,Beijing 100714,China.)

Because of the different regions and forest origin,the total aboveground biomass and the biomass of components may have some differenced.Based on the measurement data of biomass from 151 sample trees of Masson pine in Chongqing,Sichuan and Hubei provinces,the author analyzed the influence of the region and forest origin on the aboveground biomass and the biomass of components by using the dummy variable method.And then the author established dummy variable universal models containing the origin and regional factors.The results showed that the method was feasible to analyze the effects of the forest origin and the region on the aboveground biomass and the biomass of components by using the dummy variable;the influence of the region was relatively large for the biomass of tree trunks,wood,bark and aboveground,while the influence of the origin was relatively slight;The biomass of the crown,branches and foliage was greatly influenced by the origin and the region factors;Overall,the trivariate biomass models had the highest prediction accuracy,following by bivariate biomass models,and univariate biomass models were the worst;For the dummy variable universal models containing the origin and regional factors,aboveground biomass,tree trunks and dry wood had the highest prediction effect,followed by the biomass of the crown,branches and bark,and the biomass of foliage was the worst.

biomass;dummy variable;region;forest origin;Masson pine

S758

:A

2015-11-02

北京市教育委员会科学研究与科研基地建设项目(省部共建重点实验室);国家林业公益性行业科研专项(201204510)

吕常笑(1990-),男,山东淄博人,硕士研究生,从事生物量模型研究。

邓华锋(1966-),男,北京人,教授。

1000-2340(2016)03-0304-07

猜你喜欢

马尾松起源预估
马尾松种植技术与栽培管理
美国银行下调今明两年基本金属价格预估
圣诞节的起源
奥运会的起源
马尾松栽培技术及抚育管理
马尾松松针挥发油化学成分及抗氧化活性研究
万物起源
万物起源
SVM分类模型预估网站商业价值
浙江省松阳县马尾松林下阔叶化改造结果分析与评价