APP下载

应用Excel的描述统计功能对土壤化验数据进行汇总分析

2016-07-16刘文波

中国农业信息 2016年4期
关键词:汇总化验对话框

刘文波

(山西省灵丘县农业委员会,大同 034400)



应用Excel的描述统计功能对土壤化验数据进行汇总分析

刘文波

(山西省灵丘县农业委员会,大同 034400)

摘要:测土配方项目的土壤化验数据分析项目多、数据量大,正确的汇总分析方式有助于快速高效的了解土壤的实际状况,而最简单便捷的一种分析方法就是应用Excel的描述统计功能对数据进行分析。

关键词:测土配方项目 土壤化验数据 Excel的描述统计功能

2005年始,全国启动实施测土配方施肥补贴项目,山西各县采集化验数据都在几千或上万组左右,需要做大量的统计工作。传统手工计算费工易错,耗费大量人力。而SPSS、SAS等专业软件虽然方便了资料的统计分析,提高了数据和资料的准确性,但是这些大型专业统计软件价格昂贵,且需要专门技能,不便于基层工作的需要。为了更好、更快地分析应用这些数据,应采用Microsoft Office Excel软件进行分析。

Excel软件价格便宜,内容丰富。既有丰富的内置函数,又有齐全的数据分析功能,简单易学,无需编程,只要在电子表格内输入整理好的数字,利用Excel自动计算功能,就能获得所需要的计算结果。

用Excel进行数据统计描述包括以下几方面:(1)集中趋势测度(集中指标),包括算术平均数,中位数,几何平均数,众数等。(2)数值统计出最小值、最大值、总和、观察数。(3)离散程度测度(变异指标),包括极差(全距)、方差、标准误差(相对于平均值)、标准偏差。(4)数据分布测度,包括偏度系数和峰度系数等。

Excel提供有现成的公式及内置函数可进行这些统计值的计算。如在电子表格内输入一组数字,然后建入函数公式,=COUNT(常数)、=AVERAGE(常数)、=VARP(常数)和=VAR(常数)、=STDEVP(常数)和= STDEV(常数),按回车键,可得到观测数、算术平均数、总体方差、样本方差、总体标准差和样本标准差等。Excel没有标准误差的计算公式,但可用标准差除以样本数即可得到标准误差。

另外,在数据表中,选中某一列,在Excel2007表格界面的下方会自动显示平均值、计数、数值计数、最大值、最小值、求和等统计值,虽然显示方便、快捷,但内容有限,不能满足统计需求。

土壤化验样本数据分析所需的分布区间、标准差等描述样本数据范围及波动大小的统计量,统计标准差需要得到样本均值,这些描述样本数据的常用变量,可以使用Excel数据分析中的“描述统计”分析工具进行汇总统计,一次性得到待分析数据的所有统计参数,方便、快捷、高效。

Excel描述统计函数

以下以Excel2007为例,详细说明如何进行数据的汇总统计。

1 加载Excel2007[分析工具库]

Excel2007数据分析中的“描述统计”功能需要使用 Excel扩展功能,如果尚未安装数据分析,应首先加载Excel2007的[分析工具库],方法如下:

打开Excel2007软件主界面,单击Office按钮,如图1,弹出如图 2 所示的对话框。

单击Excel选项,打开Excel选项对话框。如图3所示。

选择[加载项]选项,在[加载项]选区中选择[分析工具库]选项,单击[转到]按钮,如图3所示。

弹出[加载宏]对话框,选中[分析工具库]复选框,单击[确定]按钮完成设置。如图4所示。

如果计算机中没有安装分析工具,会弹出一个对话框指出计算机没有安装该工具,询问是否要进行安装,单击[是]按钮进行安装。设置完成,可以进行统计分析了。

2 描述统计操作

2.1 操作第1步

登陆并打开“测土配方施肥数据管理系统”,导出“测土配方施肥土壤测试结果汇总表”的标准格式Excel文件(*xls)。

2.2 操作第2步

打开“测土配方施肥土壤测试结果汇总表”进行整理,以便于统计。简洁表头行,删除没必要统计列、无数据列,保证每列中为同一属性数据值。

2.3 操作第3步

选择“数据”-“数据分析”-“描述统计”,单击确定按钮,出现属性设置对话框。如图6所示。

2.4 描述统计属性设置对话框的设置与输入

输入区域:输入原始数据区域,可以选中多个行或列,并注意选择相应的分组方式。本例中选择包括表头在内的整个数据区,分组方式为“逐列”。

如果输入区域的第一行中包含标志项,勾选“标志位于第一行” 复选框;如果输入区域没有标志项,该复选框将被清除,Excel 将在输出表中生成适宜的数据标志。

汇总统计包括平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏斜度、极差、最小值、最大值、总和、总个数、最大值、最小值等相关项目。其中,中位数为排序后位于中间的数据的值;众数为出现次数最多的值;峰值为衡量数据分布起伏变化的指标,以正态分布为基准,比其平缓时值为正,反之则为负;偏斜度衡量数据峰值偏移的指数,反映以平均值为中心的分布的不对称程度,根据峰值在均值左侧或者右侧分别为正值或负值;极差为最大值与最小值的差。

图1 Office按钮

图2 最近使用的文档

图4 可用加载宏

图5 测土配方施肥土壤测试结果汇总

图6 数据分析

图7 输入区域

图8 统计结果部分显示

第K大(小)值为输出表的某一行中包含每个数据区域中的第K 个最大(小)值;在右侧的框中,输入K的数字。如果输入 1,则该行将包含数据集中的大(小)值。

勾选平均数置信度复选框。在右侧的框中输入所要使用的置信度。例如,数值 95% 可用来计算在显著性水平为 5% 时的平均值置信度。

2.5 统计结果

生成统计结果部分显示如图8。

2.6 表格整理

删除重复列,保留合适的小数位数,得到一个完整的数据描述统计表。

猜你喜欢

汇总化验对话框
地质化学化验的误差及成因分析
常用缩略语汇总
浅谈提高油料化验工作效率的几点建议
系统抽样的非常规题汇总
铁矿石化验质量控制对策分析
正常恢复虚拟机
Bootlace Worms’Secret etc.
What Is Beauty?
浅谈VB的通用对话框《CommonDialog》控件的使用
浅谈如何减小煤质化验设备使用中的数据偏差