基于SPSS主成分分析的年轮生长气候因素的研究
2018-04-09吉小为
吉小为
[摘 要] 以南京林业大学的某棵水杉为例,采用主成分分析法,分析了树木生长过程中各气候因素间的系统联系,并确定了三个主成分,建立主成分综合模型,得出温度对年轮密度影响较大。在充分考虑各气候因素的条件下简化了影响因素,便于学者更深入地探讨和研究。
[关 键 词] 树木年轮;主成分分析;SPSS气候因素
[中图分类号] S718.5 [文献标志码] A [文章编号] 2096-0603(2018)10-0109-01
树木年轮的生长状态一直是植物学者对树木研究的重要课题。本文采用年轮密度来研究具体气候因素对年轮生长的影响程度,原因在于相对于年轮宽度,年轮密度不仅能够反映更丰富的气候环境信息,而且很少受到生长期的前期气候条件影响,使通过年轮密度分析了解往年气候变化成为可能,从而对树木年轮气候学研究有更加深远的意义。
一、研究方法
主成分分析是多元统计分析中一种常用的方法,在处理多因素变量问题上有一定的优越性。简单来说,它就是对数据的降维处理,通过线性变化的方法将原始的多个因素指标转化为少数几个综合指标,即称为主成分。主成分分析法的运用中首先要将数据写成矩阵形式,便于后续操作。再将矩阵标准化,从而规避各指标间的水平差异,建立变量的相关系数矩阵,判断数据是否适合主成分分析。再计算矩阵的特征值、特征向量、主成分贡献率及累计贡献率,一般取累计贡献率的85%-95%的前n个主成分作为新变量,推断出主成分的个数。再写出主成分的表达式,初步分析结果。最后建立主成分综合模型,得出哪些指标对问题产生重要影响。
(一)数据的筛选与建立
研究表明,影响树木年轮密度生长的气候因素主要由温度、湿度、日照和降水量这四个方面组成。通过对学校植物数据库的研究和筛选,确定了初步研究的气候因素为13个,分别为:平均气温、平均气温距平、平均最低气温、平均最高气温、极端最低气温、极端最高气温、积温、最大日降水量、平均降水量、平均相对湿度、最小相对湿度、日降水量(>0.1 mm)的日数和日照时数。由于近几年数据缺失,提取了某棵水杉1983~2001年19年的年轮密度和各年份对应的气候因素的值。数据跨度时间较长,具有一定的代表性。并将数据以时间升序,以气候因素为横坐标输入Excel表格中,便于后续操作。
(二)SPSS的运算步骤
(1)打开SPSS,点击“打开其他文件”,找到气候因素数据所在的Excel文件,将数据导入初始页面。(2)菜单栏执行:分析—降维—因子分析,打开因素分析对话框。(3)将13个气候因素变量拖至变量窗口,点击“抽取”,选择主成分的方法,采用相关性矩阵,基于特征值且大于1,再点击“继续”回到因子分析的窗口。(4)点击“描述”按钮,进入描述统计的对话框,数据采用原始分析结果,相关性矩阵勾选“系数”“显著性水平”以及KMO和Bartlett的球形度检验。(5)回到主对话框,点击“确定”,在SPSS statistics 查看器查看因素分析的处理结果。
二、检验与分析
(一)KMO和Bartlett球形检验
KMO检验是用于比较原始变量间简单相关系数和偏相关系数的方法,确定数据是否适合进行主成分分析。KMO的取值在0~1之间,越接近1,代表变量之间的相关性越强,原始变量越适合做因子分析;越接近于0,意味着变量间的相关性越弱,原始变量越不适合做因子分析。本文KMO为0.746,因子分析情况为适合,变量间相关性较强,适合做因子分析。
Bartlett球形检验的目的是检验相关矩阵中各变量间的相关性,是否为单位阵,即检验各个变量是否各自独立。若显著性检验结果显示Sig.<0.05时,说明各变量间具有相关性,可以采用因子分析。由检验可见,本文Bartlett检验的Sig.等于0.000,小于显著水平0.05,表明原变量适合做主成分分析。
(二)气候因素的主成分分析
主成分个数的确定原则是主成分对应的特征值需大于1。特征值在某种程度上可以被看成是表示主成分影响力大小的指标。如果特征值小于1,说明该主成分的综合评价力度较低。通过总方差表可以看出,第一主成分为温度因素,第二主成分为降水因素,第三主成分为湿度因素,这意味着能够用这三个主成分包含所有的气候因素。再将上述3个主成分导出载荷进行计算,结果发现:第一主成分中平均气温、平均气温距平、平均最高气温和积温这4个指标大于0.9,这说明第一指标主要包含了这4个因素的信息。同理,第二指标主要包含了最大日降水量、平均降水量、日降水量大于0.1 mm的天数和日照时数这4个变量的信息,第三个主成分主要说明了最小相对湿度这一个变量,三个主成分之间相互没有联系,具有一定的代表性。最后再建立主成分综合模型,计算各主成分的表达式。结果模型显示:平均气温(x6)、平均气温距平(x7)、平均最低气温(x9)、平均最高气温(x10)和积温(x13)的系数大于0.2,对年轮密度生长影响较大。且这五个因素均为温度的相关变量,可以得出对树木年轮密度生长情况影响最大的是温度。
三、结语
本文采用了主成分分析法研究氣候因素对年轮生长的影响,具有一定的价值和现实意义。由气象因素相关矩阵可知,平均气温、平均气温距平、平均最高气温和积温四者的相关系数均大于0.9,具有较强的相关性。若建立进一步的综合因素评价模型,则取其中一个因素即可。通过主成分分析我们得出第一主成分为温度因素,第二主成分为降水因素,第三主成分为湿度因素。大致可以推算出3个主要因子,分别为平均气温、最大日降水量及最小相对湿度,其余10个均为次要因子。根据主成分综合模型可以看出影响年轮密度生长最主要的因素是温度,在一定条件下,温度越高,年轮密度越小。达到了本文在充分考虑各气候因素的条件下简化了影响因素,得到了影响因素主要为温度的研究目的。
参考文献:
[1]齐惠英.一种基于主成分分析和模糊聚类的入侵检测方法[J].科技通报,2012,28(12):51-53.
[2]吴祥定,邵雪梅.中国秦岭地区树木年轮密度对气候响应的初步分析[J].应用气象学报,1994,5(2):253-256.
[3]陈朝晖.基于SPSS主成分分析的大学英语学习动机实证研究[J].科技通报,2014(9):242-245.