APP下载

基于食品类别的消费者食品安全风险感知状态的分类方法研究*

2015-06-01丁周敏李金洲

关键词:分类器准确率神经网络

马 颖,丁周敏,李金洲

(武汉理工大学 管理学院,湖北 武汉 430070)

基于食品类别的消费者食品安全风险感知状态的分类方法研究*

马 颖,丁周敏,李金洲

(武汉理工大学 管理学院,湖北 武汉 430070)

消费者食品安全风险感知是主观感知,其感知结果会与客观风险产生偏差,从而造成不必要的恐慌。因此,针对消费者的风险感知主观状态进行分析,提出了三种感知状态,并运用问卷调查实证研究方法,对不同类别的食品消费者风险感知状态进行了解,然后运用神经网络方法,建立了神经网络分类器,其分类准率极高。这表明,在今后的工作中可以利用该分类器对消费者食品安全风险感知状态进行分类,以便采取切实有效的措施。

食品安全;消费者风险感知;风险感知状态

食品安全是保障民生的最基本问题。但近年来食品安全事件频发,形形色色的食品安全披露信息充斥着各类媒体版面,消费者几乎每一天都能听到、看到有关食品安全的大大小小的信息报道,而每一次食品安全事件曝光后留下的社会反应仍然是“现在还有什么可以吃”的质问,迫使消费者不得不进一步提高对食品安全的关注度和重视程度。通过网络搜索数据的不完全统计,2005-2011年间我国被曝光于网络媒体的影响较大的部分品牌食品安全事件一直呈现上升趋势,分析其原因有二:一是政府采取的部分措施缺乏长效性;二是消费者对食品安全关注度提高,亦导致被揭露的食品安全事件增多。特别是有些食品安全因素一直存在但始终未引起重视之后,因为关注度的提高而逐渐被揭露、曝光,从而引发较大的轰动效应。可见,频频见诸媒体的食品安全事件的报道,说明食品安全问题已成为一个严重的公共政策问题和社会问题,而民众对这些事件的心理反应和行动表明公众对食品安全已经濒临恐慌的地步,这严重影响了我国经济结构调整及和谐社会构建的战略实施。因此,研究消费者食品安全风险感知的量度,建立科学的量度模型界定消费者食品安全风险感知范围,可以为政府、企业采取和制定有效措施提供参考,以保证消费者食品安全风险感知的正确性、恰当性和客观性,减少不必要的恐慌,促进社会和谐稳定发展。

一、消费者食品安全风险感知状态

消费者食品安全风险感知是指消费者对购买、食用食品过程中的风险是如何感知到、感知的程度怎样、感知的内容是什么、这种感知又如何影响其他人等的一种动态过程。消费者食品安全风险感知强调民众的主观感知,与客观风险可能并不一致。也就是说,食品安全风险有的会被消费者感知到,有的则不一定被感知到;消费者感知的风险有的存在,有的实际上并不存在;有的可能被夸大,有的则可能被缩小;同样的风险对不同的消费者可能有完全不同的感知结果,消费者个体只能针对其主观感知到的风险加以反映和处理。因此,如何引导消费者对食品安全风险保持正确、客观的感知就成为政府的重要职责和亟待研究的重大课题。本研究将食品安全风险感知划分为三种状态加以讨论。

其一是风险感知过高状态,即对于某些不存在安全问题的食品,可能由于谣言、误传等信息不对称造成消费者风险感知并夸大其风险,影响该类食品业的发展。如由于不了解转基因食品,受一些利益集团宣传影响,消费者对转基因食品抗拒、恐慌,影响了转基因食品行业的成长,既不利于食品技术的创新与发展,也不利于消费者生活质量的提高,必须采取措施纠正其风险感知。

其二是风险感知过低状态,即对于某些食品存在的不安全因素,特别是传统食品,消费者目前还可能感知不到其风险或轻视其危害,但从长期来看会对消费者健康造成不利。如长期习惯食用的油炸食品、腌制食品等传统食品,会给消费者带来肥胖、糖尿病、中风及某些癌症等病症,但因其美味可口掩盖了对人体的危害,使消费者漠视、低估其风险,因而仍然大量食用,需要采取相应的措施提高消费者对其风险的感知。

其三是风险感知调整状态,即对已发生的食品安全危机事件,在一段时间内或很长时间内一直给消费者造成恐慌感,特别是一些屡禁不绝的食品安全事件,严重危害消费者健康,打击消费者购买信心,影响行业和企业可持续发展,破坏社会和谐稳定。如自2004 年的阜阳劣质奶粉事件后,“毒奶粉”事件不断上演,最终2008年三鹿奶粉“三聚氰胺”事件引发中国奶制品行业的信任危机,但直至2010年仍查出一些涉嫌企业都使用了2008年未被销毁的问题奶粉作为原料。此类事件屡禁不绝,社会影响极其恶劣,必须采取有效措施加以治理,重树消费者购买信心,以恢复市场正常供需秩序。

二、模型设计与数据预处理

(一)模型设计

本研究运用问卷调查,分析不同类型的消费者对不同类型的食品的风险感知情况。参考已有研究[1-5],设计调查问卷并通过网络发放问卷400份,回收问卷400份。研究以食品价值和技术为标准选取三大类食品共10种,即一般的习惯性食用食品,如奶制品、粮油、禽蛋肉等;保健食品,如营养食品、功能食品;新资源食品,如转基因食品。利用调查问卷收集数据,揭示并提炼不同种类食品消费者对其安全风险感知状态的特点。这里涉及三个要素,即消费者、食品、风险感知情况。

要素一:消费者。每个消费者用一组属性来描述,每个属性反映消费者日常购物习惯和消费者本身的个性及背景信息。例如是否经常在超市购物,教育程度,是否是外向型性格等。

要素二:食品。一共有十类,如肉制品、奶制品、营养保健品等。

要素三:风险感知情况。主要分两个方面,即有无风险(频率)和风险的大小(危害性)。

针对以上三个要素建立一个模型,即对给定消费者,能够预测其对各类食品的风险感知情况。即给定一个要素一的描述对所有(或某些指定的)要素二中的食品,预测其要素三可能的答案。有了这样一个模型,就可以对消费者的食品安全风险感知进行预测、分析以及管理。

研究采用的是基于统计的方法,其过程分为两个阶段:第一阶段通过分析大量的数据来建立模型(称为“训练”);第二阶段使用模型对未来的数据进行预测或直接分析拟合的模型得出结论(称为“预测”)。

形式化地来讲,每个消费者用一组属性即一个向量来表示,记做X=(x1,x2,…,xm),每一个xi表示一个属性。要预测的量对于每类食品有两个,即有无风险和风险的大小。这里把不同类型的食品分别独立地看待,有无风险和风险的大小也同样独立地来看。那么每一个要预测的量就是一个数,记做y。对于同一个x,对应的y有10×2=20个。

将每类食品的有无风险和风险大小合并起来考虑,那么对于每类食品来说,要预测出y=(y1,y2)这样两个数。那么,对于同一个x,对应的y就有10个。

(二)数据来源及预处理

本文研究所需数据的来源是调查问卷,问卷主要是选择题。通过调查问卷可以提取消费者的一系列属性,共计48个。这48个属性包括最担心的食品安全问题、是否经常购买某类食品、是否遇到过食品安全问题、遇到的最大食品安全问题是什么(如果遇到过)、购买食品的主要渠道以及年龄、性别等个人基本信息。这48个属性构成了该调查人的x向量;同时每个被调查人也被要求给所有10类食品评估其风险感知情况,这构成了该调查人对所有食品种类的y结果。

首先对问卷的数据进行预处理。对于x的处理,每个二选一的选择题都转化为一个0/1值的属性,而多选题(N选M)转化为N个0/1值的属性,选中的选项赋值为1,没选中的为0。程度性的选择题转化为一个实数值,数值越大表示程度越高,数值越小表示程度越低。排序题的转化方法和多选题类似,区别是排在前面的选项赋值更高,排在后面的赋值低,没有选入排序的选项赋为0,例如第一位的权重为1,第二位为0.7,第三位为0.5。这样就可以把每个被调查人的问卷信息转化为向量x。这一步转化的目的是:一是使得x中的每一个属性能够相对独立地起作用,便于分析每个因素的重要性;二是所有属性转化为统一的形式,便于计算机处理(转化前有不同类型的各种问题,转化后只有一种数值类型的属性)。

对于y的处理,类似于程度性选择题。有无风险有三个档次:经常、偶尔、没有。风险大小也有三个档次:高、中、低。使用两个数值表示这两个方面即可。对于风险有无,数值越大表示越经常会有风险,数值越小表示越没有风险。对于风险大小,数值越大表示风险越高,数值越小表示风险越低。例如使用3,2,1对应经常、偶尔、以及没有;用3,2,1对应高、中、低。使用其他合理数值亦可。由于问卷中没有对三个档次进行量化,也可以将其处理为三个独立的选项,作为普通多选题进行转化。这两种数值化的方法都可以接受。

由于各个问题的选项数量不同,而数值化时采用自然数递增编码,因此为了消除由于输入输出数值的较大差别造成的较大的预测误差,我们对数据进行统一的归一化处理。将问卷数据归一化以后,可以用得到的数据来建立拟合一些预测模型。作为训练数据,利用所有被调查人的x以及对应的y,可以建立x→y的预测模型。得到此模型后,可以分析以下两个问题:

其一,对于特定的人群(其x满足某些条件),预测其y的值(即分析其风险感知情况)。

其二,x中哪些因素对y有重要影响,影响的大小如何,即分析得到的模型本身。

模型及拟合的方法即是针对从x向量预测单个y。这种方法可以推广到更复杂的y的情况。这里y可以是实数值,例如预测0到2的程度值,这类问题称为“回归”(regression)。y也可以是离散的三个档次(必须三选一),这类问题称为“分类”(classification)。回归和分类是机器学习和数据挖掘中的两大类基本问题,二者也有相通的地方。对于回归问题,通过设定阈值也可以进一步转化为分类问题。

三、消费者食品安全风险感知状态的分类

人工神经网络(ArtificialNeuralNetworks,ANNs),也简称神经网络(NNs),是一种模仿动物神经系统行为特征,进行分布式并行信息处理的算法数学模型[6]。网络拓扑结构包含输入层、隐含层、输出层,每层包含若干个节点,依靠系统的复杂程度,通过调整内部大量节点之间的相互连接关系,从而达到处理信息的目的。BP神经网络是一种多层前馈神经网络,该网络的特点是信号前向传递,误差反向传播。在前向传播中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望的输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近预测输出。BP神经网络的拓扑结构见图1。

图1 BP神经网络拓扑结构

图1中,X1,X2,…,Xn是BP神经网络的输入值,Y1,Y2,…,Ym是BP神经网络的预测值,ωij和ωjk为BP神经网络的权值。由图1可知,BP神经网络可以看成是一个非线性函数,网络输入值和预测值分别是该函数的自变量和因变量。当输入节点数为n,输出节点数为m时,BP神经网络就表达了从n个自变量到m个因变量的函数映射关系。BP神经网络分类首先要进行网络训练,通过训练使网络具有联想记忆和分类能力。

(一)计算自变量特征影响度

在调查问卷中,考虑到可能会影响消费者对某类食品风险感知状态的48个消费者的主观因素,并经过预处理综合为影响消费者食品风险感知状态的42个主观特征,并编号为X1,…,X42。根据调查结果按照相同规则对每个特征值进行编码,这样42个特征值就构成一个消费者的特征向量,42个特征向量见表1。

表1 消费者食品安全风险感知状态的特征变量表

如果没有清晰的理论依据,将可能存在把一些不重要的自变量引入BP神经网络,降低模型的精度,尤其是在数据不足的情况下,自变量过多导致网络过于复杂,使得网络学习效果不佳。因此,选择有意义的自变量特征或将自变量预处理之后作为网络输入数据往往是应用神经网络分析预测问题中很关键的一步。Dombi等人提出用平均影响值(MeanImpactValue,MIV)来反映神经网络中权重矩阵的变化情况,MIV被认为是在神经网络中评价变量相关性的最好指标之一,因此本文采用MIV方法使用BP神经网络来筛选变量。

MIV的具体计算过程如下:在网络训练终止后,将训练样本P中每一自变量特征在其基础上分别加/减10%构成新的两个训练样本P1和P2,将P1和P2分别作为仿真样本利用已建成的网络进行仿真,得到两个仿真结果A1和A2,求出A1和A2的差值,即为变动该自变量后对输出产生的影响变化值(ImpactValue,IV),最后将IV按观测例数平均得出该自变量对于因变量——网络输出的MIV。为了便于比较,本研究每个自变量对于20个因变量MIV绝对值的均值AMIV,根据AMIV排序,得到各自变量对网络输出影响相对重要性的位次表,从而判断输入特征对于网络结果的影响程度。

由于BP神经网络的构建受到初始权值的训练集的影响,因此每次计算随机选取260组数据作为训练集,经过10次计算,得到42个自变量特征的平均AMIV值,见表2。

表2 自变量特征AMIV值(保留3位小数)

对AMIV值进行分析,结合问卷调查中的实际问题,我们发现从消费者自身来说,影响消费者食品安全风险感知状态最重要的三个因素是:消费者的性格类型、消费者对购买场所安全性的认知以及消费者性别。

(二)BP神经网络训练与测试

基于BP神经网络的消费者食品安全风险感知分类算法建模包括BP神经网络构建、BP神经网络训练和BP神经网络分类三步,算法流程图见图2。

图2 算法流程图

BP神经网络构建根据系统输入输出数据特点确定BP神经网络的结构。本研究中消费者特征输入信号有42维(未筛选前);输出信号的确定根据以下规则:

首先将食品分为10种,分别是:(1)牛奶、酸奶等鲜奶及乳制品;(2)猪肉、牛肉、羊肉、水产等生鲜食品;(3)原粮、成品粮等粮食及其制品,如面包、馒头;(4)油盐酱醋味精等调味品;(5)方便面、罐头、饼干、果脯等快捷食品;(6)碳酸饮料、果汁、酒类等饮品;(7)水果、蔬菜等果蔬类;(8)腌肉、腌菜等咸酱菜;(9)蛋白质、维生素、鱼油等保健食品;(10)转基因等新资源食品,如转基因大豆及其制品。

图3 分类消费者食品安全风险感知

然后,用未筛选的数据训练BP神经网络。每次在360组数据中随机选择260组数据作为训练数据训练网络,100组数据作为测试数据测试网络分类能力。数据采用(-1,1)归一化,测试准确率见表3。

表3 未筛选自变量特征情况下测试准确率

由表3计算可得出,测试准确率的平均值为49.32%,说明网络仅仅正确分类了一半的测试数据。分析其原因有二:一是训练数据量不足,网络没有得到充分训练;二是自变量特征的输入方式影响了网络的学习。

在获得了42个自变量特征的平均AMIV值后,可以按照特征的AMIV值的大小顺序对自变量进行网络输入,这在训练数据不足的情况下会取得一定效果。另外,可以筛选若干个最重要的自变量特征进行输入。使用不同数量的最重要的自变量特征作为网络输入,得到的测试准确率见表4。

表4 不同数量输入节点下测试准确率

通过表4可知,在按照自变量特征的AMIV值的大小顺序对自变量进行网络输入时,测试准确率与输入节点数量呈现正相关的趋势,而在42个特征全部输入时,测试准确率达到了99.70%。这也说明在训练数据不足的情况下按照一定规律对自变量进行网络输入会提高训练效果。

如上,一个基于食品类别的消费者食品风险感知BP神经网络分类器就构建完成。该模型对于一个新的消费者,可以通过调查得到他的上述42个特征,输入网络进行分类,就可以得到该消费者对于某食品类别的风险感知状态。BP神经网络分类器工作示意图见图4。

图4 BP神经网络分类器工作示意图

例如,对于一个消费者,其特征输入向量为:

X={1,0,1,3,2,0,1,1,2,0,1,3,0,0,2,2,0,2,2,2,3,1,2,3,2,2,2,2,2,2,2,0,0,2,0,2,1,0,2,2,0,0 }

代入所建BP神经网络分类器,得到的分类结果如下:

Y={ 2,2,2,2,2,2,2,2,2,3,2,3,2,2,2,2,2,3,2,2 }

从该输出结果可知,对于全部10类食品,该消费者依次对其感觉有无风险的感知状态为:偶尔、偶尔、偶尔、偶尔、偶尔、偶尔、偶尔、偶尔、偶尔、经常。该消费者依次对其感觉的风险程度感知状态为:中、高、中、中、中、中、中、高、中、中。基于此,政府或企业可以根据不同类食品消费者风险感知的严重程度,决定采取何种措施以及措施的急迫性等。因此,此方法研究得到的结果可以为政府或企业制定具体的食品安全管理政策提供参考依据。

四、研究结论

由表4可知,针对本问题,改进的BP神经网络取得了99.7%的测试集分类准确率,说明在本问题上,神经网络在发现输入输出之间的隐含关系上有很好的表现。此外,本研究曾经选用支持向量机(SVM)分类方法进行研究。支持向量机的理论基础是统计学习理论,更准确地说,支持向量机是结构风险最小化的近似实现。采用上述同样的调查数据,对SVM分类器进行训练,利用测试集数据测试分类器,其测试集准确率见表5。

表5 测试集准确率

从测试集的分类准确率来看,对于输出Y的20个维度,平均分类准确率只有59%,分类准确率低可能是由于训练数据过少、数据维度高、分类模式比较复杂等原因造成的。随后采用遗传算法优化SVM分类器,得到的测试集准确率见表6。

表6 GA优化的SVM分类器测试集准确率

由表6可以得到,利用GA优化参数后的SVM分类器对于测试集的分类准确率在输出Y的20个维度上分类准确率平均提升3.91%,达到61%,测试集准确率提升效果较为明显。但是由于数据量不足以及分类模式的复杂,即使经过GA优化,SVM分类器的分类效果也并不理想,远不如神经网络的99.7%的分类准确率。

因此,本研究构建了BP神经网络分类器,完成了对基于食品类别的消费者食品安全风险感知状态的分类问题。在以后的工作中,可以使用本研究构建的改进型BP神经网络分类器对消费者食品安全风险感知状态进行分类,以便根据不同类型的消费者风险感知状态采取及时、有效的调节策略。

五、对策建议

根据消费者食品安全风险感知的不同状态,政府和企业可以采取相应的措施进行改善,使其风险感知趋于客观和理性,这也将有利于社会的和谐与稳定。

(一)政府加强监管作用

政府的主导体现在政府利用其职权加强对企业生产各个环节的监管,设立明确的监管标准。同时引导企业利用社会化媒体增加生产、制造、销售等等相关环节的透明化。并鼓励媒体和个人加入到监管的队伍之中。

由于食品安全问题是一个专业性极强的问题,为了从生产到销售整个环节有关食品安全问题进行指导,必须建立科学的满足客观需要的监管标准。如果安全标准建立得当,政府、企业、消费者三方就能快速判断出食品存在的问题,确保整个食品行业正常发展。

除了完善的监管制度,引导企业自身良好的运行,政府还不能忽视大众及媒介的重要作用。随着社会化媒体的产生,大众及媒体手中的力量更为壮大,政府应该充分鼓励这些力量发挥作用,形成政府-市场-大众三元结构,三方相互扶持又相互制衡,更有利于整个市场的良性运行。

(二)企业勇于承担社会责任

政府只能起到立法和监督的作用,食品的生产还是得依靠企业自身。企业必须履行自己的社会责任,严格控制自己生产、销售、储存等环节。建立信息披露制度,利用社会化媒体平台增强食品的透明度。企业在进行生产时既要符合政府要求,又要与消费者形成良好的关系,发挥其真正核心的作用。社会责任不仅是企业对社会的责任,更是对自己能长远发展的责任。为实现企业社会责任中最基础、与消费者切身利益相关的责任,企业应该加强对企业内部的管理,确保食品从原材料的获取到最终销售到顾客手中的整个过程,食品都符合国家质量监督部门的要求。对于不符合要求的食品应坚决处理掉。

(三)充分利用社会化媒体手段

随着互联网技术及移动终端技术的迅猛发展及代际跃升,社会化媒体也得到了快速的发展。传统的信息获取渠道电视、报纸、收音机、杂志等已不再是信息获取的主要渠道,取而代之的则是诸如各大门户网站、微博、博客、微信等社会化媒体平台。企业和政府应该把握好社会化媒体的核心功能好好加以利用。政府可以通过社会化媒体平台加强对消费者日常食品安全问题的教育,当问题出现时也可通过社会化媒体将食品安全问题的信息及时发布出去。企业可以利用社会化媒体平台加强对企业的宣传,增加与消费者的沟通,加强对产品出厂后的监管,通过社会化媒体建立企业的良好品牌。

[1]周应恒,马仁磊,王二朋.消费者食品安全风险感知与恢复购买行为差异研究:以南京市乳制品消费为例[J].南京农业大学学报:社会科学版,2014.14(1):111-117.

[2]徐玲玲,山丽杰,钟颖琦,等.食品添加剂安全风险的公众感知与影响因素研究:基于江苏的实证调查[J].自然辩证法通讯,2013(4):78-86.

[3]马 颖,张园园,宋文广. 食品行业突发事件风险感知的传染病模型研究[J].科研管理,2013(9):123-130.

[4]张 振,乔 娟,黄圣男. 基于异质性的消费者食品安全属性偏好行为研究[J].农业技术经济,2013 (5):95-104 .

[5]马 颖,张园园.食品安全事件网络舆情的作用机理:以双汇“瘦肉精”事件为例[J].生产力研究,2013(8):86-88.

(责任编辑 王婷婷)

Classification Method of Consumer Food Safety Risk Perception Based on Food Categories

MA Ying,DING Zhou-min,LI Jin-zhou

(SchoolofManagement,WUT,Wuhan4300700,Hubei,China)

Consumer food safety risk perception has the characteristic of subjective perception,the perception of results will produce deviation and objective risk,which will cause unnecessary panic.The study analyzed the consumer's subjective risk perception and proposed three kinds of perception.Then it took use of empirical research methods of questionnaire to collect data to understand the consumers' perceived risk state of different food categories, and used the method of neural network to construct a neural network classifier where the classification accuracy is very high,in the future, the classifier would be used to classify consumer food safety risk perception in order to take practical and effective measures.

food safety;consumer perception risk;risk perception

2014-10-12

马 颖(1975-),女,山东省烟台市人,武汉理工大学管理学院教授,博士,主要从事风险管理研究;

丁周敏(1989-),男,安徽省池州市人,武汉理工大学管理学院硕士生,主要从事风险管理研究。

国家自然科学基金青年基金(71203171);教育部人文社会科学基金青年项目(12yjczh150);武汉理工大学自主创新基金重点项目(2012-Ib-015)

F272.3;R155.1

A

10.3963/j.issn.1671-6477.2015.02.002

猜你喜欢

分类器准确率神经网络
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
高速公路车牌识别标识站准确率验证法
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于神经网络的拉矫机控制模型建立