桑蚕干茧清洁洁净等级影响因素的多元线性回归分析
2015-03-13袁素荣陈浩国琳琳
袁素荣+陈浩+国琳琳
摘要:
清洁和洁净指标是桑蚕干茧主要的质量指标,也是决定生丝等级的主要项目,研究桑蚕干茧清洁和洁净对桑蚕干茧和生丝清洁洁净等级的影响程度,对提高我国茧丝绸产品质量和推动茧丝行业健康发展等方面有着积极和重要的意义。本文利用近年来的桑蚕干茧公证检验数据和SPSS软件进行桑蚕干茧清洁洁净等级影响因素的多元线性回归分析。
关键词:桑蚕干茧;生丝;公证检验;清洁;洁净;多元线性回归分析
清洁和洁净指标是桑蚕干茧主要的质量指标之一,是构成桑蚕干茧质量要求的重要组成部分,清洁等级和洁净等级的低者决定清洁洁净等级[1]。生丝是以桑蚕干茧为原料茧缫制而成,其丝条上时常会产生颣节,颣节可分为特大颣、大颣、中颣和小颣四种,其中特大颣、大颣、中颣属于清洁范畴,小颣属于洁净范畴[2],清洁、洁净指标是现行生丝标准规定的主要检验项目[3]和决定生丝等级的主要项目[4],所以研究桑蚕干茧清洁和洁净对干茧和生丝清洁洁净等级的影响程度,对提高我国茧丝绸产品质量和推动茧丝行业健康发展等方面有着积极和重要的意义。
1 数据来源
自2007年9月开始,中国纤维检验局组织全国18家承检机构和实验室,在江苏、浙江、山东、广西、重庆和四川等15个蚕茧主产区,严格按照桑蚕干茧公证检验实施办法和操作规程实施桑蚕干茧公证检验工作,公证检验涵盖茧丝交易市场、生产企业和使用企业3个主要环节,截至目前,累计公证检验桑蚕干茧30万吨以上,约占同期全国干茧总产量的20%,积累了一系列完整的检验数据。本分析采用数据为2011年至2013年实施的全部19938个批次的桑蚕干茧公证检验清洁洁净检验结果。
2 建模工具
SPSS(Statistical Product and Service Solutions)统计产品与服务解决方案,是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类[5]。本分析使用IBM SPSS Statistics 19作为建模工具。
3 多元线性回归模型
回归分析(Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。回归分析是建立因变量y(或称依变量,反应变量)与自变量x(或称独变量,解释变量)之间关系的模型。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,称为多元线性回归分析[6]。这里设定两个自变量指标分别为清洁等级x1,洁净等级x2,清洁洁净等级y作为因变量,并建立如下的多元线性回归模型:
y=β0+β1x1+β2x2+ε
其中:β0、β1、β2分别为未知参数;ε为剩余残差,与两个自变量无关,服从N(0,σ2)。
4 回归模型的检验
4.1 创建SPSS文件
将所需的19938个批次的公证检验数据保存在“多元线性回归分析.sav”中,该数据文件的变量、类型及其标签见图1。
图1 多元线性回归分析.sav文件
4.2 回归分析
操作步骤如下:单击“分析”“回归”“线性”,选择“清洁洁净等级”为因变量,“清洁等级”和“洁净等级”为自变量,方式选择“进入”。点击“绘制”,选择X轴是标准化的残差,Y轴是概率,设置输出的图为直方图。分别点击“继续”和“确定”后生成“多元线性回归分析.spv”文件。
4.2.1 模型拟合度检验
模型拟合度检验分析结果见表1。
表1 模型拟合度检验模型汇总
注:a为预测变量:(常量)洁净等级,清洁等级。
由表1可以看出,其R值和调整R方均很接近1,所以其模型拟合度很好。
4.2.2 方差分析显著性F检验
表2为方差分析表。
表2 方差分析表
注:a为预测变量:(常量)洁净等级,清洁等级;b为因变量:清洁洁净等级。
由表2可以看到Sig.值为0.000,显然小于0.05,说明因变量分别和自变量存在真实的线性关系,显著性检验通过。
4.2.3 变量显著性t检验
表3为相关系数表。
表3 相关系数表系数a
注:a为因变量: 清洁洁净等级。
本分析中因变量清洁洁净等级y对两个自变量清洁等级x1和洁净等级x2回归的非标准化回归系数分别为0.055和0.999,对应的显著性检验的t值分别为50.535和3566.193,两个回归系数的显著性水平Sig.=0.000均小于0.05,模型中不存在共线性问题,可以认为自变量对因变量均有显著影响,该模型的拟合度很高,可以用来预测。经观察直方图的形态符合正态分布,我们就可以大体上认为数据的残差是符合正态分布,可以认为因变量呈正态分布,直方图见图2。
图2 因变量直方图
5 结语
综合以上分析,桑蚕干茧清洁洁净等级y与清洁等级x1和洁净等级x2存在良好的线性相关关系,未标准化时本分析的拟合结果为:
y=-0.328+0.055x1+0.999x2
同时可以看出,清洁等级x1和洁净等级x2这两个自变量对因变量清洁洁净等级y的贡献值有所不同,洁净等级贡献率明显高于清洁等级贡献率,即桑蚕干茧的清洁洁净等级主要是由洁净等级决定的。依据制丝工艺理论,生丝清洁成绩主要是由操作不当造成的,而洁净成绩主要是由原料茧的洁净成绩决定的,所以根据本分析和清洁、洁净疵点产生的原因分析,桑蚕干茧清洁成绩不再是反映原料茧本身内在质量的重要指标。
参考文献:
[1] GB/T 9176—2006 桑蚕干茧[S].
[2]陈文兴. 蚕丝加工工程[M].北京:中国纺织出版社,2013.
[3]GB/T 1797—2008 生丝[S].
[4]吴静. 2009年度全国出口生丝质量分析报告[J].丝绸检验,2010,(1):8-13.
[5]张红兵. SPSS宝典[M].北京:电子工业出版社,2007.
[6]马立平. 回归分析[M].北京:机械工业出版社,2014.
(作者单位:袁素荣,江苏省淮安市纤维检验所;陈浩,山东省纤维检验局;国琳琳,山东省泰安市纺织纤维检验所)