基于相关分析和主成分分析的国有林场分类指标体系设计研究
2016-12-19谢第斌胡明形
谢第斌,胡明形
(北京林业大学 经济管理学院,北京 100083)
基于相关分析和主成分分析的国有林场分类指标体系设计研究
谢第斌,胡明形
(北京林业大学 经济管理学院,北京 100083)
对国有林场施行分类经营和管理是国有林场改革的重要内容,科学的分类标准是国有林场分类经营和管理的基础,进行国有林场分类指标体系的研究具有十分重要的现实意义。针对几种指标筛选的适用性和优缺点,提出了基于相关分析和主成分分析的指标选取方法。在依据全国主体功能区规划对国有林场进行功能分区的基础上,使用该方法最终确立了我国国有林场分类指标体系,指标体系包括林场经营管理水平、林场资源水平、林场经营条件、林场生态及非林产业发展水平、林场所在地区经济效益5个一级指标和众多二级指标。
国有林场;指标选取方法;相关分析和主成分分析;分类指标体系
2015年3月国家出台的《国有林场改革方案》将国有林场主要功能明确定位于保护培育森林资源、维护国家生态安全,在国有林场改革的基本原则中指出:坚持因地制宜,分类施策。这实际意味着,国有林场改革中要根据林场实地情况及生态要求,施行分类经营和管理。国有林场分类的基础是确定分类的依据和标准,因此,开展国有林场分类指标体系的研究对于国有林场分类经营和管理具有十分重要的现实意义。
我国国有林场分类的现有研究主要集中于国有林场分类依据和分类结果上。分类依据最初主要考虑林场的经营状况和资源状况,如姚庆端认为林场分类应按经营方向、森林培育目标、森林资源状况、经营条件、经营水平、经营规模和自然条件等因素进行划分[1]。此后逐渐将生态因素考虑到国有林场的分类中,如朱永法以生态林面积与总林地面积的比例作为划分标准[2];罗攀柱则将立地条件差、经营效益、生态效益和社会效益作为公益型林场划分的标准[3]。从分类结果看,一是将国有林场分成商品型和公益型,认为应将国有林场分为生态公益型和商品经营型[4];二是在公益型的基础上继续划分,主张将国有林场分为3类:商品经营型、生态公益型、生态经营型[5],将公益型林场分为公益Ⅰ型林场和公益Ⅱ型林场[3]。现有国有林场分类研究中存在两个问题,一是分类依据不足,没有将林场所处的生态功能区位和地区经济因素考虑进去,而两者是影响国有林场经营管理的重要因素;二是没有涉及分类指标体系的系统研究。鉴于此本研究将从国有林场改革的要求出发,在全国主体功能区规划的基础上,考虑资源条件、社会经济条件、经营水平、生态功能、区位条件等因素,研究设计我国国有林场分类指标体系。
1 国有林场分类指标体系设计原则与方法
1.1 指标体系设计的原则
指标体系的建立应符合统计指标理论,以科学性为基础。指标的数据结构应便于后续的数据处理,满足分类方法的要求。参考相关研究[6],确定国有林场分类指标选取应遵循原则以下:
全面性原则:所选指标能够全面的反映国有林场经营特点。包括林场的基本经营状况、森林资源状况、经营条件、生态价值、所处地区经济效益等。
代表性原则:入选的每一指标要能准确反映国有林场某一数量方面的基本特征,是国有林场数量方面的代表性指标。
独立性原则:同一层次的指标之间尽量不相互重叠[7],指标的关联性尽可能小。
可行性原则:指标含义明确,便于量化,各指标可以利用现有统计数据收集方法和渠道获得统计数据。
1.2 几种常用指标筛选方法的比较
指标筛选是指标体系设计的重要环节,既要从众多的或独立、或相关的候选指标中,筛选出全面地反映总体对象的信息的指标,同时所选指标也不能存在冗余的现象,这就要求指标在满足重要性的同时指标间不能存在相关关系。对候选指标筛选的常用方法主要有条件广义方差极小法、极大不相关法、非参数检验方法。
1.2.1 条件广义方差极小法和极大不相关法
如果γp很大,表示Xp很大程度上由X1,X2,…,Xp-1所决定,可以删除。对候选指标依次求其复相关系数,比较其大小,删除复相关系数最大对应的指标,重复此操作,直到获得最终的指标体系。
这两种方法基本思想类似,均是从相关性分析的角度来进行指标选取,这能有效地解决指标间的相关性问题,但也存在一些问题,它们需要事前确定最终保留的指标数,以确定整个指标筛选过程何时终止。此外,这两种方法只以相关性作为指标选取的唯一标准,无法确定剔除指标的重要性水平,很可能造成重要信息的缺失。
1.2.2 非参数检验法
非参数检验法由王璐提出[10],其基本思想是:利用wilcoxon秩和检验和Kruskal- wallis检验对指标进行分类,保证同一子类指标无差异,各子类之间具有显著性差异。当某一子类指标数n=1时,该指标直接保留;当n=2时,采用极大不相关方法,选择复相关系数较小的对应的指标;当n>2时,计算各指标对其他指标的spearman秩相关系数平方和,取最大平方和所对应的指标。
此方法保留下了具有显著性差异的指标,具有显著性差异的指标反映了研究对象不同方面的属性,最终保留下的指标能满足全面性的原则。但是差异显著的指标并不意味着相关性弱,当候选指标间相关性较强时,非参数检验法选取指标的效果并不理想,它在追求信息全面性的同时可能出现指标间的相关性问题。
1.3 基于相关分析和主成分分析的指标筛选方法
对候选指标的选取必然会造成信息的丢失,从而无法完全意义上地满足全面性的原则,理想的指标筛选方法能够在解决相关性问题的前提下,保留重要性水平高的指标。正是出于这种考虑,本文提出了基于相关分析和主成分分析的指标选取方法,相关性关系用相关系数来表示,重要性水平可以由主成分分析得到的各主成分方差贡献率与指标的载荷系数绝对值乘积之和的大小来衡量,这可以克服人为确定指标权重的主观性[11],二者结合使用可筛选出兼具重要性和独立性的指标体系。具体做法如下。
(1)针对每个方面(如本研究的林场经营管理水平)的候选指标进行主成分分析,以每个主成分的方差贡献率为权重与候选指标的载荷系数绝对值乘积之和计算该指标对于反映研究对象信息的重要性水平。以X1,X2,…,Xn中的Xp为例,Xp的重要性水平 =|p1|×Comp.1+|p2|×Comp.2+|p3|× Comp.3……+|pn|× Comp.n,p1,p2,…,pn为Xp的载荷系数,Comp.1 ,Comp.2,…,Comp.n为各个主成分的方差贡献率。当该值接近于零时认为该指标重要性小,从候选指标中删除,剩余指标进入下一步。
(2)对剩下的候选指标采用相关系数法检验指标间的相关系数,以0.3为阀值(弱相关),当某一指标与其他指标相关系数均小于0.3时,该指标直接进入最后的指标体系,剩余指标进入下一步。
(3)存在相关关系的指标再次使用主成分分析,选择重要性水平高的指标进入最后的指标体系,与之相关的指标删除。由此经过“主成分分析—相关分析—主成分分析”3个步骤,既消除了指标间的相关关系,也保留了重要性水平高的指标。
2 国有林场分类指标体系设计
本研究首先根据《全国主体功能区规划》中国家重点生态功能区(限制开发区域)名录和禁止开发区域名录以及国有林场的地理位置,将国有林场划分为重点生态功能区内国有林场、禁止开发区内国有林场和其他区功能区内国有林场,各功能区内的国有林场需承担其公益性职责,满足各功能区的生态要求。国有林场数据来源于国家林业局国有林场数据库。
2.1 候选指标体系设计
现有国有林场分类研究中的一个问题是分类依据不足,只考虑了经营状况(经营水平和经营条件)、资源状况和生态因素,没有将林场所处的生态功能区位和地区经济因素考虑进去,将国有林场按主体功能区规划进行功能分区解决了国有林场的生态功能区位问题,林场所在地区的经济效益指标就应当加入分类指标体系中。行政管理、地理区域和林地状况是导致我国大多数国有林场经营困顿的重要原因[12],将所有这些因素体现于指标体系就得到了国有林场分类候选指标体系。该体系包括林场经营管理水平、林场资源水平、林场经营条件、林场生态及非林产业发展水平、林场所在地区经济效益(见表1)。
表1 国有林场分类候选指标体系Table 1 Candidate classification index system of the state-owned forest farms
2.2 指标体系完善
以重点生态功能区内国有林场经营管理水平指标完善为例,说明基于相关分析和主成分分析指标筛选方法的应用。林场经营管理水平包括职工人数(X1)、职工人均社保支出(X2)、职工人均收入(X3)、职工素质水平(大专学历以上人数占总人数的比例)(X4)、林场总资产(X5)、林场总负债(X6)、林场纯利润(X7)、林场总营业收入(X8)、林场总收入(X9)、林场采伐出材量(X10)。
对上述10个候选指标进行主成分分析。X1的重要性水平 =0.412×Comp.1+0.272×Comp.2+0.245× Comp.5+0.112× Comp.6+0.487×Comp.7+0.340× Comp.8+0.120×Compp.9+0.557×Comp.10,其余指标类似,所得结果见表2。
表2 主成分分析结果(1)Table 2 The results of principal component analysis (1)
从结果看出,候选指标的重要性水平都不接近零,全部保留,这也说明候选指标的选择科学合理。
对10个候选指标求相关系数矩阵,以0.3作为有无相关性的判断标准。由于指标间可能存在非线性因素,所以选择Spearman秩相关系数较恰当[10]。以“1”表示有相关,“0”表示无相关,结果见表3。
表3 相关系数矩阵表Table 3 Correlation matrix
由结果可知,职工人均社保支出(X2)与所有指标不相关,直接进入最终的指标体系。
对剩下的9个候选指标进行主成分分析,结果见表4。存在相关关系的指标,选择重要性水平高的指标进入最后的指标体系。以重要性水平大小为序,林场纯利润(X7)进入最终指标体系,与其具有相关关系的林场总收入(X9)删除;林场总资产(X5)进入最终指标体系,与其具有相关关系的林场职工人数(X1)、林场总负债(X6)、林场总营业收入(X8)、林场采伐出材量(X10)删除;林场职工素质水平(X4)进入最终的指标体系,X3(职工人均收入)与其具有相关性,删除。
表4 主成分分析结果(2)Table 4 The results of principal component analysis (2)
由此重点生态功能区林场经营管理水平方面的指标就由原来的10个减为4个:职工人均社保支出、职工素质水平、林场总资产、林场纯利润。林场资源水平及林场经营条件可参照上述方法进行指标体系完善。而林场所属地区经济效益由于只有一个候选指标,直接进入最终的分类指标体系;林场生态及非林产业发展水平只有2个候选指标,不适合作主成分分析,参考王璐Kruskalwallis非参数检验指标选择的方法[10],对2个指标进行Kruskal- wallis检验,P-value<2.2e-16,2个指标具有显著性差异,且相关性系数为0.105 5,为弱相关,2个候选指标均进入最终的分类指标体系。
2.3 国有林场分类指标体系
禁止开发区域和其他功能区内国有林场均可参照重点生态功能区的方法,由于篇幅有限,这里仅列出禁止开发区、其他功能区以及重点生态功能区3个区域内国有林场分类指标体系的最终结果。由于3个功能区内,国有林场的数据结构不同,所以最终的分类指标体系并不相同(见表5)。
表5 国有林场分类指标体系Table 5 Classification index system of the state-owned forest farms
3 结 论
本研究从国有林场改革的实际要求出发,将林场所处的生态功能区位和地区经济因素引入到国有林场的分类中,从35个候选指标中,针对不同的生态功能区筛选出了一套国有林场分类指标体系,其中一级指标包括林场经营管理水平、林场资源水平、林场经营条件、林场生态及非林产业发展水平、林场所在地区经济效益5个方面;不同的生态功能区国有林场的二级指标数量不同,其中重点生态功能区二级指标17个,禁止开发区二级指标16个,其他功能区二级指标18个。从方法及应用过程看,候选指标数量众多、样本量大,从最终确立的指标体系来看,基于相关分析和主成分分析的指标筛选方法实用性高,具有较好的筛选效果。同时,在基于相关分析和主成分分析的指标筛选方法中,相关性的阀值确定并不唯一,可以根据研究需要进行调整;运用主成分分析方法确定的指标重要性水平还可以用于综合评价或分类中指标权重的确定。
国有林场分类指标体系的建立只是国有林场分类经营和管理的第一步,后续研究应该根据此指标体系对三个功能区的国有林场进行分类,各类型国有林场应结合自身特点和所在功能区的生态要求制订差异性的管理对策,真正实现国有林场管理的因地制宜和分类施策。
[1] 姚庆端.国有林场实行分类经营管理若干问题探讨[J].林业经济问题, 1995(2): 53-56.
[2] 朱永法,魏远竹.国有林场分类经营改革探讨[J].北京林业大学学报, 2001, 23 (2): 61-66.
[3] 罗攀柱,潘 丽,李 思,等.新形势下国有林场的性质、功能和目标探讨[J].林业经济, 2013(7): 16-21.
[4] 贺 超,姜冰润.国有林场非国有化经营模式案例研究[J].北京林业大学学报:社会科学版, 2012, 11(2): 78-81.
[5] 田明华.我国国有林场分类经营改革探索[J].北京林业大学学报:社会科学版, 2009, 8(4): 5-11.
[6] 赵 则,胡希军,蒋艺芳.琵琶寺生态农林园景观资源综合评价[J].中南林业科技大学学报:社会科学版,2013,7(3):17-21.
[7] 吴 鹏,朱 军,崔迎春,等.喀斯特地区石漠化综合治理生态效益指标体系构建及评价——以杠寨小流域为例[J].中南林业科技大学学报, 2014, 34(10): 95-101.
[8] 王硕平,用数学方法选择社会经济指标[J].统计研究,1986(6): 42-46.
[9] 张尧庭,张 璋.几种选取部分代表性指标的统计方法[J].统计研究, 1990(1): 52-58.
[10] 王 璐,庞 皓.综合评价中的指标选择方法[J].统计与决策,2007(1): 58-59.
[11] 李魁明,帅 红,姚罗兰.洞庭湖生态经济区县域经济竞争力评价[J].中南林业科技大学学报:社会科学版,2014,8(3):41-44.
[12] 郑少武.我国国有林场改革中必须考虑的问题[J].林业经济,2012(12): 30-32.
Research on the classification index system design of the state-owned forest farms based on correlation analysis and principal component analysis
XIE Di-bin, HU Ming-xing
(College of Economics & Management, Beijing Forestry University, Beijing 100083, China)
Classified management of the state-owned forest farms is an important content of the reform of the state-owned forest farms,scientific classification criteria is the basis of the classified management, and the research on classification index system of state-owned forest farms has great realistic significance. This paper analyzed the applicability and advantages and disadvantages of several index screening methods, and put forward a new index screening method based on correlation analysis and principal component analysis.Using the method, this paper established the classification index system of the state-owned forest farms after the partition of the stateowned forest farms, the index system includes 5 first class indicators: management level, resource level, management condition,ecological level and non forest industry development level, and many other second class indicators.
the state-owned forest farms; index selection method; correlation analysis and principal component analysis; classification index system.
S750;F307.2
A
1673-923X(2016)08-0141-06
10.14067/j.cnki.1673-923x.2016.08.025
2015-09-16
国家林业局重点项目“典型国有林场森林资源经营管理模式及技术体系”(2012-07)
谢第斌,硕士研究生
胡明形,教授,博士生导师;Email:hmx5416@sina.com
谢第斌,胡明形. 基于相关分析和主成分分析的国有林场分类指标体系设计研究 [J].中南林业科技大学学报,2016, 36(8):141-146.
[本文编校:文凤鸣]