APP下载

SPSS软件在煤质指标分析中的应用探索

2018-11-16杨青文

科学与财富 2018年28期
关键词:线性回归正态分布

杨青文

摘 要:文章列举了若干使用SPSS软件进行煤质指标分析的案例,通过对统计分析结果的。

关键词:SPSS;控制图;正态分布;线性回归

1 引言

SPSS是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,具有自动统计绘图、数据的深入分析、使用方便、功能齐全的数理统计分析软件。本文以版本IBM SPSS Statistics 19为例,就其在煤质指标分析中的应用进行一些探索。

2 控制图

SPSS支持直接的Excel数据表导入功能,打开SPSS软件,在文件一栏选择打开数据,点开之后在文件类型中选择Excel(*.xls, *xlsx, *xlsm)。

2.1数据前处理

先进入描述统计的频率子菜单,选择变量Mt,统计量选择偏度和峰度,点击确定。看偏度系数和峰度系数,如果均小于1,那么符合正态分布,可以进行下一步控制图分析。

2.2选则过程度量和定义子组

过程度量为全水分,定义子组为批次编号。

2.3设定选项、控制规则

选项sigma的数目为3,最小子组大小为2.不显示由缺失值定义的子组。X条形图、R图、s图的控制规则,勾选所有选项,在实际应用中可根据分析需求确定所需要的控制规则。

2.4绘出控制图

可以观察出倒数两个点以及倒数第四个点是违反规则的异常点,违反规则见下表X条形图规则违反。

3 个点违反控制规则。

3 发热量回归分析与正态分布检验

3.1 数据操作

某矿煤质统计指标;选中描述统计-频率-选择变量Mt、Aar、Ad、Qgr,d、Qnet,ar,统计量选择偏度和峰度,点击确定。看偏度系数和峰度系数,如果均小于1,那么符合正态分布。

对于新矿点:累积6组以上用该模型,6组之前用相近的矿点公式进行诊断。

3.2 线性拟合

正态分布检验完毕,进行线性拟合,参数选择如下:

(1)线性回归统计量。回归系数选择“估计”,选择“模拟拟合度”,残差选择“Durbin - Watson(U)”和个案诊断,离群值填“3”标准差。其他选项均不选。

(2)线性回归绘制。Y(Y)选择DEPENDENT,X2(X)选择DRESID。

(3)线性回归保存。预测值选择“未标准化”,残差选择“未标准化”,预测区间选择“均值”、“置信区间95%”,勾选“包含协方差矩阵”。系数统计、影响统计量、距离等参数不选。

(4)线性回归选项。使用F的概率,进入0.05,删除0.10;勾选“在等式中包含常量”和“按对排除个案”。

3.3 数据分析

Qgr,d与Ad,Qnet,ar与Mt、Aar的拟合结果为:

①Qgr,d = 34.241 - 0.388Ad;

②Qnet,ar = 33.762 - 0.390Mt - 0.390Aar;

以公式②为例:

(1)相关系数检验观察调整R方值,为0.985,非常接近1,表示自变量对因变量的解释很好,能达到98.5%。

a. 预测变量: (常量), 收到基灰分Aar, 全水分Mt。

b. 因变量: 收到基低位热值Qnet,ar

(2)F检验。F检验是对拟合的回归模型整体的方差检验值,观察回归曲线的F检验sig值,如果小于0.05说明整个回归模型有显著作用,F统计量值与Fα(1,n-2)进行比较(显著性水平,一般取0.05),F>Fα(1,n-2),拒绝H0,表明回归效果显著,F≤Fα(1,n-2),接受H0,此时回归效果不显著。

(3)各个自变量的t检验sigma值,t统计量值的正负表示该自变量对因变量的影响是正还是负。|t|>tα(n-2),拒絕H0,回归效果显著;|t|≤tα(n-2),接受H0,回归效果不显著。

(4)计算出Qgr,d = 24.200MJ/kg,实际测量值为Qgr,d = 24.388MJ/kg,相差-188J/g。计算值Qnet,ar = 20.978MJ/kg,实际测量值为Qnet,ar = 21.147MJ/kg,相差-169J/g。

4 结语

煤质指标间其他指标也存在较强的联系,如发热量和水分、挥发分、灰分、硫分、氢值间的关系,碳值与氢值的关系,以及其他,本文只是冰山一角,抛砖引玉。借助SPSS这样强大的数理统计软件,可以以更具体量化的方式去衡量已知的物理关系,并启发帮助我们寻找更多的未知的潜在联系。

猜你喜欢

线性回归正态分布
基于对数正态分布的出行时长可靠性计算
正态分布及其应用
国道公路养护管理与规划研究
企业退休金收支平衡的研究
企业退休金收支平衡的模型分析
正态分布题型剖析
χ2分布、t 分布、F 分布与正态分布间的关系