APP下载

灰关联神经网络在葡萄酒评价中的应用*

2013-09-12于红斌赵永进

微处理机 2013年4期
关键词:关联度葡萄酒关联

于红斌,齐 娜,赵永进

(河南师范大学计算机与信息工程学院,河南 新乡 453007)

1 引言

葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的一种饮料。其质量的优劣主要通过感官品尝和对一系列理化指标的分析来确定。好品质的葡萄酒必定外观澄清透明、色泽自然悦目,具备葡萄的果香、发酵的酒香、陈酿的醇香,口感令人舒畅愉悦、各种香味细腻柔和,有层次感,余味绵长。这些品质的鉴定主要依赖于品酒师的专业水平,而品酒师的感官又是很难用理化数据精确阐明的,葡萄酒品质受品酒师的主观影响难免产生误差。另外葡萄酒最终的质量和葡萄酒中各种成分密切相关,通过对葡萄酒各种成分理化数据的研究分析,加以人工品酒师的专业评判,必定可以相辅相成。

针对葡萄酒的理化数据,可以采用近红外光谱[7]和三维荧光光谱[1]等技术,然而这些技术需要复杂的化学计量学知识,解释困难[1,7]。文献[2]研究了葡萄酒各种成分之间的关系,但并没有给出其与葡萄酒质量之间的明确关系。文献[3]结合多图分析、支持向量机和神经网络多种方法提出了图表示可视化分类方法,该方法依赖于其他多种方法,其在误差和算法时间上并没有明显优势。

在UCI数据库[4]中提供的葡萄酒数据有178组,葡萄酒分为3个等级,受13种成分的影响。数据分析上通常可采用神经网络、支持向量机和回归分析等进行建模[5]。但葡萄酒的各成分不是孤立因素,这些成分相互作用,共同决定葡萄酒的最终质量,因此可以首先对数据进行关联分析,将处理后的数据应用于神经网络,提出了灰关联分组神经网络模型,实验表明,与经典神经网络相比,算法精确度和算法效率都有了较大提高,同时还避免了经典神经网络训练过程中出现的不稳定情况。

2 灰关联神经网络算法模型

通过将灰关联理论与神经网络相结合,对葡萄酒质量进行分析。算法结构如图1所示。

图1 灰关联神经网络

算法首先将数据按灰关联度分析,充分体现出数据之间的相互影响,然后根据具体的数据环境通过人为干预加强或弱化某些因子,从而使得结果更合理。

2.1 多因子灰关联分析

灰关联分析是分析研究各因素之间关联程度的一种有效方法,可分为单因子和多因子两种情况。葡萄酒包含多种成分,可以通过灰关联分析确定各个因子(葡萄酒成分)的关联程度。

假设数据因子集为 X={xi|i=1,2,...,l},如果各个因子数列满足下列条件,则称X为灰关联因子集:

(1)数列xi的数据xi(k)之间具有数值可比性,即指定的xi(k)与xi(t)之间的数值是可以比较的,或相等、或接近、或同数量级等;

(2)数列xi之间具有可接近性,即非平等性;

(3)数列xi之间同级性,及同为正(极大值)极性,或负(极小值)极性,或适中极性。

以灰关联因子集中的一个因子xi(1≤i≤l)为参考数列,以任意因子xj∈X且xj≠xi为比较数列,则二者间的绝对差为:

得到的差数列为 Δij=(Δij(1),Δij(2),...,Δij(n)),则比较数列xj对参考数列xi在第k点的灰关联为:

其中常数α为分辨率系数,于是有xj对xi的灰关联度为:

鉴于数据库中提供的数据相对比较平稳,因此可以取 α 为 0.5[7]。

2.2 主成分确定

一般来说,因子集中各因子都不是孤立的,它们共同作用形成必然结果。以葡萄酒数据为例,葡萄酒的最终等级由13个主要成分决定,这些成分决定了葡萄酒的口感、香气、色泽等,如葡萄酒中的总酚、柠檬酸、酒精度等对感官质量有显著影响[3],在葡萄酒的等级确定中占有重要位置。同时,各成分之间也会相互影响与制约,因此,需要分析成分之间的关联性。要分析两个或两个以上变量之间的因果关系,通常会采用一些相关性分析方法,它不需要区分自变量和因变量,两个或者多个变量之间是平等的关系,通过相关分析可以了解变量之间的关系密切程度。

在葡萄酒的感官质量上,Total phenols(总酚)作用尤其突出[3]。因此,可以将Total phenols做为灰关联因子集中的参考数列,找出和Total phenols密切相关的成分形成第一主成分集合,通过公式(1-3)分析文献[4]中的数据得出与Total phenols关联密切的成分,如表1所示。

表1 其他成分与Total phenols的灰关联度

由表1得出第一主成分集合,由Total phenols和表1中前4种成分构成。原数据集合剔除第一主成分后集合,剩下的成分中以Malic acid(苹果酸)对葡萄酒的感官影响较大[2],同样通过公式(1-3)得出与其关联度较大的几个成分形成第二主成分集合,如表2所示。

由表2分析,形成葡萄酒的第二主成分集合,即由Malic acid和表2中前3种构成。原数据中不包含第一、二主成分集合的形成第三主成分集合,它们对葡萄酒的总体影响最小。

2.3 主成分评价

葡萄酒的质量由各成分决定,通过数据分析,可以将葡萄酒的成分分成3类,每一类在葡萄酒的最终质量中所占比例分别为ω1、ω2、ω3,则葡萄酒最终质量可以由以下公式确定:

表2 其他成分与Malic acid的灰关联度

式中,C1为第i种主成分集合中的各成分,且ω1+ω2+ω3=1,Q 为葡萄酒质量,文献[5]给定Q=1,2,3,式(4)中加号仅表示各成分的一种合成。

3 算法步骤

(1)将文献[5]中数据进行归一化处理,以消除量纲之间的影响。

(2)归一化后数据按每种成分所属主成分集合进行比例协调,即将归一化后数据乘以其所占比例。设定葡萄酒三类主成分在最终质量中的所占比例为ω1=0.5、ω2=0.3、ω3=0.2。

(3)将数据引入BP神经网络进行训练和测试。

4 仿真数据对比分析

构建的BP神经网络采用4层架构,输入层为数据处理后的13种成分,隐层两层,各有4个隐单元,输出层1个单元,为葡萄酒质量等级(数据需归一化)。网络误差设为0.001。在MATLAB下执行该算法10次,将数据[4]中2/3数据进行训练,1/3数据进行仿真测试。表3给出了文中方法与经典神经网络,即直接使用归一化数据而没有进行成分关联分析的神经网络的对比结果。

表3 灰关联神经网络和经典神经网络数据对比

从上表可以看出,文中提出的灰关联神经网络性能和经典神经网络相比,各方面都有了很大提高,特别是在网络训练时间上,避免了经典神经网络出现的不稳定现象(多次实验发现,网络约有10%的不稳定性,即会出现需要较长时间训练达到约定误差的情况),从而极大地缩短了训练时间。

5 结 束 语

通过借鉴灰关联分析理论,对葡萄酒的各个成分进行关联度分析,将13种成分划分为3组,每组数据根据实际生活中的感官质量加以约定,从而使得数据的现实意义更加突出,通过神经网络测试表明,算法对葡萄酒的质量等级划分预测有较好的效果。同时,这种关联分析策略也增加了数据之间关系的透明度,避免了对数据的盲目引用而造成的网络不稳定性。

[1]尹春丽,丁春晖.昌黎原产地干红葡萄酒的三维荧光光谱特征研究[J].分析测试学报,2008,27(6):641-643.

[2]李运,李记明,姜忠军.统计分析在葡萄酒质量评价中的应用[J].酿酒科技,2009(4):79-82.

[3]王金甲,尹涛,李静,等.基于物理化学性质的葡萄酒质量的可视化评价研究[J].燕山大学学报,2012,34(2):133-136.

[4]DONALD BREN SCHOOL OF INFORMATION AND COMPUTER DCIENCES,UNIVERSITY of CALIFORNIA.IRVINE,Center for Machine Learning and Intelligent Systems[DB/OL]:30 -Oct-199512:17[2013 -1 -9]http://archive.ics.uci.edu/ml/machine - learning -databases/wine.

[5]胡瑜,于宝堃,,许国,等.灰色神经网络在城市用水量预测中的应用[J].微电子学与计算机,2012,29(7):142 -145,149.

[6]王文莉,杨俊红.基于灰色理论的铁路客运量预测影响因素优化[J].微电子学与计算机,2011,28(10):164 -167,172.

[7]于海燕.黄酒品质和酒龄的近红外光谱分析方法研究[D].杭州:浙江大学,2007.

猜你喜欢

关联度葡萄酒关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
葡萄酒的产区品牌
“一带一路”递进,关联民生更紧
中国制造业产业关联度分析
中国制造业产业关联度分析
十款葡萄酒与十块石头
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
奇趣搭配
法国葡萄酒何以誉满天下
智趣