林业科研中不同数据缩减方法对群体数据结构的影响
2017-07-24张少伟苗作云马顺兴鲁广伟
张少伟,苗作云,马顺兴,鲁广伟
(1.河南投资集团有限公司,河南 郑州 450008;2.黄河科技学院,河南 郑州450002;3.河南农业职业学院,河南 郑州 450003;4.原阳县农林畜牧局,河南 新乡 453500)
林业科研中不同数据缩减方法对群体数据结构的影响
张少伟1,苗作云2,马顺兴3,鲁广伟4
(1.河南投资集团有限公司,河南 郑州 450008;2.黄河科技学院,河南 郑州450002;3.河南农业职业学院,河南 郑州 450003;4.原阳县农林畜牧局,河南 新乡 453500)
为了研究不同的数据处理方法对方差分析结果的影响,该研究以省沽油6个种源的果实长度为例,研究了直接方差分析法、群体抽样法、分层抽样法、群体抽样求平均法及分层抽样取平均法5种数据处理方法分别对数据结构的影响。研究表明不同的数据处理方法得到排序后求平均值的方法能更好地保留原来群体的数据结构。研究结果可以为林业科学研究的试验设计及数据处理提供参考。
方差分析;多重比较;试验设计
林业由于工作特殊性,经常长期在野外环境艰苦的条件下调查以取得试验数据,调查难度的高低与调查的数据量有直接关系。数据量大,费事费力,但数据量小又难以保证结果的准确性。研究以实际例子探讨几种数据简化处理方法对群体数据结构的影响,以期为科研工作者在试验设计及减轻野外数据获取中提供参考。
1 数据来源
数据源自 2015年底调查三门峡地区省沽油(Staphylea bumalda DC.)6个种源的果实长度。
2 数据处理
用 Excel2007进行数据整理,采用 SPSS16.0进行描述性统计[1-4],数据整理方法如下。
(1)直接分组法:即完全随机抽样法,视种源内150例数据相互独立。
(2)整群分类法:将每个种源的数据随机完全随机分为6组,即群体内有一定变异,群体随机。
(3)分层分类法:将每组的数据进行排序,然后平均分为6组,类似于分层随机抽样,每层内数据变异较小,不同层次间变异较大。
(4)整群分类求平均法:按整群分类法分为 6组,以小组平均值为单位计算。
(5)分层分类求平均法:按分层分类法分为 6组,以小组平均值为单位计算。
3 结果与分析
从描述统计性图(图1)来看,排序后求平均值的方法得到的正态图与原始图形分布更接近,而随机平均得到的正态图则偏态现象明显。说明排序后求平均值的方法能更好的保留原来群体的数据结构。
图1 不同处理方法所得数据的正态分布
3种处理方法得到的数据描述统计如表 1所示,采用不同方法所得各种源平均值均相同,但种源内的标准差及整体标准差均有所降低。但随机平均及排序求平均后,因平均作用,降低了数据的变异幅度,缩小了数值范围,但从数值上来看,排序后再进行平均化,其各项指标与原始数据更为接近。数据经缩减后仍可基本保持原来的变异幅度,但其标准差却显著降低,说明通过适当的数据处理方式可以基本保持数据的原貌。并未因数据求平均而造成缩小其变异性。另外,在求平均值的过程中,随机取值每次组合不同,所以结果变动性较大,而排序后求平均,则能有效避免该现象。
4 结论
不同的数据缩减方法得到的数据结构特征差别较大,分层分类求平均法能更好的保留原来群体的数据结构,因每次都是固定的组合,所以结果固定;而按照整群分类求平均法得到的结果却因每次组合都是随机的,虽然在抽样中完全随机也有一定的代表性,但误差相对较大。
[1] 张文彤,董伟. SPSS统计分析高级教程[M]. 北京:高等教育出版社,2004.
[2] 吴明隆. SPSS统计应用实务[M]. 北京:中国铁道出版社,2000.
[3] 张文彤,董伟. SPSS统计分析高级教程[M]. 北京:高等教育出版社,2004.
[4] 郭志刚. 新编21世纪社会学系列教材:社会统计分析方法·SPSS软件应用[M]. 北京:中国人民大学出版社,2004 .
(责任编辑:王文彬)
S757.2+4
A
1003-2630(2017)02-0013-02
2017-04-15
河南省科技攻关(162102110090);郑州市2015年度科技发展计划(20150271);中牟县技术研究与开发项目(zmkjj20160616)
张少伟(1981-),男,河南安阳人,讲师,主要城市绿化树种选育。通讯作者:马顺兴(1980-),男,河南新郑人,工程师。