SPSS软件在煤质指标分析中的应用探索
2018-11-16杨青文
杨青文
摘 要:文章列举了若干使用SPSS软件进行煤质指标分析的案例,通过对统计分析结果的。
关键词:SPSS;控制图;正态分布;线性回归
1 引言
SPSS是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,具有自动统计绘图、数据的深入分析、使用方便、功能齐全的数理统计分析软件。本文以版本IBM SPSS Statistics 19为例,就其在煤质指标分析中的应用进行一些探索。
2 控制图
SPSS支持直接的Excel数据表导入功能,打开SPSS软件,在文件一栏选择打开数据,点开之后在文件类型中选择Excel(*.xls, *xlsx, *xlsm)。
2.1数据前处理
先进入描述统计的频率子菜单,选择变量Mt,统计量选择偏度和峰度,点击确定。看偏度系数和峰度系数,如果均小于1,那么符合正态分布,可以进行下一步控制图分析。
2.2选则过程度量和定义子组
过程度量为全水分,定义子组为批次编号。
2.3设定选项、控制规则
选项sigma的数目为3,最小子组大小为2.不显示由缺失值定义的子组。X条形图、R图、s图的控制规则,勾选所有选项,在实际应用中可根据分析需求确定所需要的控制规则。
2.4绘出控制图
可以观察出倒数两个点以及倒数第四个点是违反规则的异常点,违反规则见下表X条形图规则违反。
3 个点违反控制规则。
3 发热量回归分析与正态分布检验
3.1 数据操作
某矿煤质统计指标;选中描述统计-频率-选择变量Mt、Aar、Ad、Qgr,d、Qnet,ar,统计量选择偏度和峰度,点击确定。看偏度系数和峰度系数,如果均小于1,那么符合正态分布。
对于新矿点:累积6组以上用该模型,6组之前用相近的矿点公式进行诊断。
3.2 线性拟合
正态分布检验完毕,进行线性拟合,参数选择如下:
(1)线性回归统计量。回归系数选择“估计”,选择“模拟拟合度”,残差选择“Durbin - Watson(U)”和个案诊断,离群值填“3”标准差。其他选项均不选。
(2)线性回归绘制。Y(Y)选择DEPENDENT,X2(X)选择DRESID。
(3)线性回归保存。预测值选择“未标准化”,残差选择“未标准化”,预测区间选择“均值”、“置信区间95%”,勾选“包含协方差矩阵”。系数统计、影响统计量、距离等参数不选。
(4)线性回归选项。使用F的概率,进入0.05,删除0.10;勾选“在等式中包含常量”和“按对排除个案”。
3.3 数据分析
Qgr,d与Ad,Qnet,ar与Mt、Aar的拟合结果为:
①Qgr,d = 34.241 - 0.388Ad;
②Qnet,ar = 33.762 - 0.390Mt - 0.390Aar;
以公式②为例:
(1)相关系数检验观察调整R方值,为0.985,非常接近1,表示自变量对因变量的解释很好,能达到98.5%。
a. 预测变量: (常量), 收到基灰分Aar, 全水分Mt。
b. 因变量: 收到基低位热值Qnet,ar
(2)F检验。F检验是对拟合的回归模型整体的方差检验值,观察回归曲线的F检验sig值,如果小于0.05说明整个回归模型有显著作用,F统计量值与Fα(1,n-2)进行比较(显著性水平,一般取0.05),F>Fα(1,n-2),拒绝H0,表明回归效果显著,F≤Fα(1,n-2),接受H0,此时回归效果不显著。
(3)各个自变量的t检验sigma值,t统计量值的正负表示该自变量对因变量的影响是正还是负。|t|>tα(n-2),拒絕H0,回归效果显著;|t|≤tα(n-2),接受H0,回归效果不显著。
(4)计算出Qgr,d = 24.200MJ/kg,实际测量值为Qgr,d = 24.388MJ/kg,相差-188J/g。计算值Qnet,ar = 20.978MJ/kg,实际测量值为Qnet,ar = 21.147MJ/kg,相差-169J/g。
4 结语
煤质指标间其他指标也存在较强的联系,如发热量和水分、挥发分、灰分、硫分、氢值间的关系,碳值与氢值的关系,以及其他,本文只是冰山一角,抛砖引玉。借助SPSS这样强大的数理统计软件,可以以更具体量化的方式去衡量已知的物理关系,并启发帮助我们寻找更多的未知的潜在联系。