APP下载

基于多元线性回归对酿酒葡萄与葡萄酒关系的研究

2016-08-31霍俊爽张若东潘淑霞邰志艳吉林医药学院公共卫生学院

科学中国人 2016年17期
关键词:多元线性回归标准化

霍俊爽,张若东,潘淑霞,邰志艳吉林医药学院公共卫生学院

基于多元线性回归对酿酒葡萄与葡萄酒关系的研究

霍俊爽,张若东,潘淑霞,邰志艳
吉林医药学院公共卫生学院

摘要:本文主要基于多元统计方法分析和研究了酿酒葡萄与葡萄酒关系的问题。最终得到了葡萄酒花色苷与葡萄理化指标的多元线性回归方程。

关键词:多元线性回归;标准化;花色苷

1 引言

酿酒葡萄的理化指标对葡萄酒的理化指标有着重要的影响,本文以2012全国大学生建模竞赛题为例,主要基于多元统计分析方法对酿酒葡萄的理化指标与葡萄酒的理化指标的关系进行了研究。

由于酿酒葡萄的理化指标过多,为了防止数量级较大的数据吞没数量级较小的数据,首先对酿酒葡萄的理化指标进行标准化处理。

2 理论

2.1相关系数

相关分析是描述两个变量间关系的密切程度,主要由相关系数值表示,当相关系数r的绝对值越接近于1,则表示两个变量间的相关性越显著。双变量系数测量的主要使用Pearson相关系数,由于酿酒葡萄和葡萄酒的数据为定距数据,则在进行两者间的相关性检验时用Pearson相关系数[1]来判断,其公式为:

2.2回归分析

多元回归分析是研究多个变量之间关系的回归分析方法,确定变量之间数量的可能形式,并建立如下数学模型:

其中β0为截距项,βi为偏回归系数,ε为残差项。

建立模型,要对模型进行拟合度检验,回归方程的显著性检验就是检验样本回归方程的变量的线性关系是否显著,即能否根据样本来推断总体回归方程中的多个回归系数中至少有一个不等于0,主要是说明样本回归方程r2的显著性。检验的方法用方差分析,这时因变量Y的总体变异系本分解为回归平方和与误差平方和,即表示为:Lyy=Q+U,其中

此外可以用F检验对整个回归进行显著性检验,即Y与所考虑的k个变量自变量是否有显著性线性关系,即公式为:

3 多元线性回归模型的求解

3.1相关系数

表1 红葡萄酒的花色苷与酿酒葡萄个别指标的相关性系数

表2 白葡萄酒的花色苷与酿酒葡萄个别指标的相关性系数

根据相关性的分析,用SPSS做多元线性回归分析,得到红葡萄酒花色苷与葡萄理化指标的线性回归方程[3]为:

其中y表示红葡萄酒的花色苷,x1、x2、x3、x4、x5、x6、x7分别表示酿酒葡萄的单宁、总酚、酒总黄酮、白藜芦醇、DPPH、L、a的含量。通过该多元线性回归方程可研究每1单位的酿酒葡萄的单宁、总酚、酒总黄酮、白藜芦醇、DPPH、L、a的含量的变化所引起葡萄酒花色苷的变化。从而反映了酿酒葡萄与红葡萄酒理化指标的定量关系。

同上可得到白葡萄酒花色苷与酿酒葡萄理化指标的多元线性回归方程为y=0.291x1+0.904x2+0.564。

其中y表示白葡萄酒的花色苷,x1、x2分别代表葡萄白藜芦醇、a。通过该多元线性回归方程可研究每1单位的酿酒葡萄的白藜芦醇、a含量的变化所引起白葡萄酒花色苷的变化。

参考文献:

[1]张杰,基于主成分分析的红葡萄酒评价方法研究[J].东北电力大学学报,2013,6:4146.

[2]黄菲,葡萄酒评价与酿酒葡萄分级的统计研究[J].生物技术世界,2013,4:43-44.

[3]朱家明,葡萄酒质量评价的定量分析[J].宜春学院学报, 2013,35:8-12.

基金项目:吉林省教育厅十二五规划科学技术研究项目(2015393);吉林省科技发展计划项目(20120697)。

作者简介:霍俊爽(1982-),男,硕士,讲师,研究方向:应用数学与统计学。

猜你喜欢

多元线性回归标准化
装配式钢结构住宅标准化设计与应用
国家标准化发展纲要
普惠型托育机构标准化家具设计
标准化简述
谁“捆住”基层的手脚?——泛滥的规范化和标准化
党支部基本组织制度标准化“三字诀”工作法
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究