APP下载

基于k-means聚类的我国乳制品消费集群研究
——来自全国31个省份乳制品消费数据的分析

2019-12-09杨辉史海青史学伟李翠霞

中国乳品工业 2019年10期
关键词:乳制品省份聚类

杨辉,史海青,史学伟,李翠霞

(东北农业大学a.经济管理学院;b.工程学院,哈尔滨150030)

0 引 言

国民经济迅速发展和生活水平不断提高的同时,人们的饮食结构也在不断改善。饮食消费由以前的解决温饱向现在更加营养健康转化,而提高乳制品消费量是膳食结构优化的重要标志,人们乳制品消费的需求潜力不断提升。在农业供给侧结构性改革及全面振兴奶业背景下,中国城镇和农村乳制品的消费均得到不同程度的发展,消费观念也正在发生深刻变化。

但同时,我国乳制品消费市场的发展仍然有不小的挑战和阻碍。农村乳制品消费的发展不只应该是乳制品消费量上的简单增速,更应该是消费习惯、消费理念和消费行为、环境的等多重要素市场的整合发育。目前,我国城乡二元化的消费特点仍然较显著[1]。有关2018年数据显示,我国城镇居民的奶类消费量为农村消费的2.5倍左右,不同地域和经济发展的城市也有显著差别。相比以前传统牧区为我国主要奶源地和乳制品消费区,饮食传统历史悠久[2],而现代居民更加追求品质和营养均衡,乳制品又发挥了重要作用,所以乳制品消费区域格局发生不小变化[3-4]。

从早先研究来看,研究区域消费的学者主要通过空间相关性、格局分布、影响因素分析等方面进行探究,但是研究乳制品消费的学者较少,通过数学方法进行研究的更是少之又少。鉴于此,本文从数据分析的角度出发,对各省份奶类消费进行量化聚类,从而进行区域化的分析。同时,考虑到中国城镇和农村奶类消费差异显著的特点,本文从两个角度分别进行分析,以求发现实际消费现状,并找出其消费影响机制,为以后各地区的乳业进一步发展提供理论参考。

1 我国乳制品消费集群的文献综述

通过查阅相关文献资料发现,研究我国有关乳制品消费的学者很多。也有一些学者利用模型对乳制品消费进行实证研究和预测,分析我国乳制品消费现象的深层次原因,如何忠伟[5]通过模型预测城市和农村居民乳制品消费趋势变动,得出我国乳制品消费在未来一段时将会缓慢增长,面临消费升级的情况。Chen M[6]通过建立基于Solow-Swan模型的模型进行了产业集群与内蒙古乳业发展的相关性的实证研究。研究证明,提高产业集聚度可以促进内蒙古乳业的发展。石明明[7]从消费行为的差异、空间建构与分布、信仰、观念、社会等级等以空间维度和消费黏性来分析我国消费低迷的深层原因。Joe Bogue[8]使用偏好映射和分层聚类,对消费者对一系列全脂和较轻乳制品的偏好的问题进行了探究。

然而从各省份集群或区域间不同等方面分析的可参考文章较少。其中一些学者利用一定数据对乳制品消费的区域特征和集聚做了一定的研究,发现存在消费集聚的现象,程长林等[9]指出中国乳制品消费有明显的区域特征,研究发现收入、公里里程、GDP等正向影响,而发生质量安全事件及基尼系数的扩大会反响影响格局的扩大。胡美娟等[10]研究了江苏省消费区域格局的演变,运用空间探索分析法得出江苏省消费水平有南边高,北边低的集聚分异格局。孙爱军[11]针对各省的农民消费水平问题,基于各省市的面板数据,发现各省农民消费存在着空间区域集中的特征,农民的收入和消费的价格指数在空间上有明显的趋同性,存在空间集聚效应。施海波,栾敬东[12]研究了2002-2011年中国居民乳制品消费有关问题的地区差异问题。研究表明:收入、消费习惯、乳制品的价格对东、中、西部地区城镇表现出明显的区域差异性。成小平,刘瑾[13]指出中国乳制品产业的空间集聚特征明显,区域主要集中东北、华北和内蒙古地区,资源禀赋条件是基础性特征,市场需求有重要的影响,产业区域非均衡发展推动乳制品产业格局聚集演变,历史产业基础也有重要的影响。尹希果[14]通过研究居民消费与经济增长收敛性关系,基于空间面板数据得出消费水平及消费增长率是地区经济发展差异的来源。

上述研究说明了我国整体存在乳制品消费区域集聚的现象,但没有系统完整的研究说明我国各省的乳制品消费集聚问题,本文力求通过来自全国31个省份乳制品消费数据,完整分析我国乳制品消费集聚问题。鉴于此,本文试图从城镇和农村两个方面进行探究,深入阐释区域消费集聚影响机理,并构建k-means聚类模型,从消费集聚视角下发现我国各省下乳制品消费互动关联的逻辑规律,指出当前乳制品消费中存在的地区差异性问题,并对各个重要的影响因素进行分析,并发现实际区域消费格局并找出其消费影响机制,以期推动中国乳制品消费的新增长及快速发展。

2 数据来源与模型建立

本文以全国31个省份的相关数据为研究对象,数据均来自中国奶业年鉴和中国统计年鉴2017(两者统计口径一致)。鉴于中国各省乳制品消费存在内在相似与联系,同时考虑到中国城乡之间乳制品消费的显著差距[15],并且各城镇及农村从不同层面影响乳制品的消费,本文进一步构建基于城镇和农村两角度下的k-means聚类模型,将乳制品集群分为城镇和农村两部分别研究,阐释各省消费的关联机理,并剖析其整体影响因素。

2.1 城乡经济二元论

如今人们的生活水平不断提高,乳制品消费量也随着逐年上涨。据AC尼尔森数据,2017年我国乳制品消费量实现爆发式增长,一改之前连续3年下降的态势,实现消费量同比增长11.86%。乳制品消费显著复苏,其中三四线城乡增速明显高于一二线城市。但是中国社会二元化特征明显,城乡间消费水平不平衡情况突出,城镇与农村居民乳制品消费仍有较大差距,一直以来的城乡二元化有较大影响,城镇人口目前仍然是我国乳制品消费的主体,三四线城乡消费水平仍低,未来提升空间可观。随着现代化的推进和一系列措施的实施,我国城镇消费群体仍具有一定的消费提升空间。同时,农村乳制品消费增长更不容小觑。

2.2 区域经济不平衡发展理论

区域经济发展的不平衡,指在区域分布上,资源的分布存在不平衡的发展现象。交通比较便利、资源较为丰富、产品富饶的地区经济发展相对较快;反之亦然。区域经济不平衡发展的问题如果忽略不采取措施的话,将会阻碍我国城镇化及工业化的步伐。同时,区域经济不平衡发展对我国乳制品消费的影响也很显著,主要变现为消费区域差别的影响。

以北京和上海为代表的城市,经济较为发达,乳制品消费基本饱和,而许多经济不够发达地区却刚刚发展。还有西藏牧区、内蒙古、黑龙江等传统牧区,虽然有较为久远的乳制品饮食习惯,但是经济发展水平低,乳制品消费与其他省份相比仍然相对较低。因此,联系区域经济不平衡发展和乳制品消费的区域差异,针对区域提出解决的办法,探索缩小区域间乳制品消费差异的办法,对我国乳制品消费进一步提升具有不可替代的作用。

2.3 k-means聚类模型的建立

对乳制品消费集群研究,运用k-means聚类模型[16],首先从本文研究的31个乳制品消费省份中随机选择k个省份的对应数据为参考对象,选出的每个省份代表一个聚类的质心。将剩下的省份,按照该省份的数据与各聚类质心之间的间距,将其合并到与之最类似的集群中去。之后,再计算所选的聚类的新质心。经过上述操作的重复,直到准则函数满足条件。

目前大多数使用的是平方误差准则函数,公式如下:

E是特定的数据集中所有对象的误差平方和,P是一个对象,mi是聚类ci的质心,如下:

本文使用欧氏距离平方中的Ward法进行距离的分析,Ward法的计算公式如下:

3 模型的求解

3.1 城镇居民乳制品消费的聚类分析

本文依据2016年的数据,包括各地区城镇居民人均可支配收入、居民人均消费支出、人均主要食品消费量统计(奶类)、城镇居民人均主要食品消费量、恩格尔系数5个变量作为分析对象,通过spss19对我国31个省份的城镇居民乳制品消费特征进行研究,以发现集群效应(见表1)。

3.1.1 类数的确定

在聚类分析中,本文根据spss19处理后得出的聚类表数据,以“类别数”作为横坐标,“聚合系数”作为纵坐标,绘制折线图如图1所示。

图1 城镇居民乳制品消费聚合系数图

根据图1中的聚合系数曲线可知,类别数从1降到2、3再降到4的过程,更改K值让整体聚类结构有很大改变,这意味着新的聚类数量让算法有更大的收敛空间,这样的K值不能反映真实的类别数。而当K=4后再增加K,平均距离的下降速度显著变缓慢,这意味着进一步增加K值不再会有利于算法的收敛,同时也暗示着K=4是相对最佳的类别数。

表1 城镇居民乳制品消费聚类表

3.1.2 Ward聚类结果分析

由图2可以看出Ward聚类中显示,31个省份城镇居民乳制品消费服从4类格局:

(1)安徽、江西、湖北、广西、湖南、吉林、黑龙江、贵州、云南、海南这11个省份属于第一种格局。这类格局在地域上遍布中国,大多数处于我国偏远地区,黑龙江等地虽然奶业发展相对有优势条件,但和其他省份共同特点是经济不够发达,限制乳制品的消费,消费水平普遍偏低[17]。

(2)福建、广东、浙江、重庆、四川、天津、西藏属于第二种格局。这7个省(市)城镇居民乳制品平均消费相对较低,大多处于我国中部、沿海地区,经济发展相对发达,但是乳业发展相对缓慢。也没有传统的消费和饮食习惯,广东、浙江比较典型。

(3)河北、宁夏、山西、河南、陕西、青海、甘肃、内蒙古、新疆、辽宁、山东、江苏分布于第3种格局。这12个省份大部分位于我国西部、西北和中原地区,受传统和饮食文化的影响,乳制品消费相对较高,但经济并不是很发达。

图2 城镇居民乳制品消费Ward聚类结果

(4)北京、上海这两个地区属于第4种格局。经济很发达,同时城镇化水平高,居民的营养健康消费意识较强,所以乳制品消费相对较高。

通过以上分析来看,我国城镇居民乳制品消费大体分为4种,拥有不同的特征,现代化水平和经济的发展对乳制品消费有积极的影响,同时饮食文化对其也有很大的影响。对于经济相对发达,乳制品消费也达到一定水平的地区来说,应该从消费升级和餐饮结构调整方面寻求新的突破。对于广东、浙江、福建等地区经济发展很好,但乳制品消费程度较低的地域,要加大政策宣传和加快乳业的发展提升这些地区的乳制品消费水平。

3.2 农村居民奶类消费的聚类分析

本文同样依据上述的数据分析,对各省份的农村居民人均可支配收入、居民人均消费支出、人均主要食品消费量统计(奶类)、城镇居民人均主要食品消费量、恩格尔系数5个变量进行研究,通过spss19对我国31个省份农村乳制品消费进行研究,得到聚类结果(见表2)。

3.2.1 类数的确定

根据图3中的聚合系数曲线图可知,当类别数为4时,折线的下降趋势趋缓,故可将类别数设定为4。

3.2.2 Ward聚类结果分析

由图4可以看出Ward聚类中显示,31个省份农村居民乳制品消费服从4类格局。

(1)吉林、黑龙江、辽宁、湖北、河北、宁夏、山西、陕西、河南、青海、内蒙古、山东、新疆这13个省份为第一种格局。这些地区种,东三省相对其他省乳业有一定发展,但经济水平低,农民收入不高,其他省不具备乳业发展的优势,乳制品消费也相对较低。

(2)广西、云南、贵州、甘肃、海南为第二种格局。这几个省份地域基本都位于偏远南方,农民收入微薄,尽管海南相对发达,但共性农村都没有传统牧区及乳制品消费习惯,所以消费水平低。

表2 农村居民乳制品消费聚类表

图3 农村居民乳制品消费聚合系数图

(3)重庆、四川、福建、广东、安徽、江西、湖南、西藏为第3种格局。虽然这8个省份的农村地区现代化水平不高,农民收入相对不高,但乳业养殖相对有所发展,有乳制品消费的习惯。

(4)上海、浙江、北京、江苏、天津属于第4种格局。这5个省(市)的经济发达、城镇化水平普遍高,农民收入水平和生活质量高,居民的营养健康消费意识较强,所以乳制品消费相对较高。

图4 农村居民乳制品消费Ward聚类结果

对农村的居民来说,乳制品消费也大体分为4种,具备不同的特征。随着乡村城镇化和人口数量的增长,农民收入的提高[18],越来越注重对乳制品的消费,但是相较城镇居民还有较大差距,乳制品消费意识普遍偏低,传统消费习惯仍然有很大的影响。要改善农村的经济现状,改变农村居民的消费理念,让消费者认识加深,培养消费习惯。

4 研究结论及优化路径

上述分析结果揭示了我国居民乳制品消费的集群形成过程中各个因素的不同影响。目前,乳制品消费服从四类格局:第一类是以上海、北京等为代表的高消费区,经济发达,居民重视乳品摄入。

第二类是以内蒙古、东北等为代表的传统消费区,乳制品消费相对经济发展不匹配。第三类是以河南、河北等中北地区的消费传导区,乳品消费有一定的潜力,并未发掘完善。第四类是以海南、广西等为代表的低消费区,长期以来消费市场薄弱。基于以上结论,本文认为,可以从以下几个方面刺激消费者对乳制品的进一步消费:

第一,加强宣传及引导乳制品消费,继续深化乳业振兴战略,优化乳制品高消费区结构,争取有新的突破,同时改善低消费区低迷险现状,引导居民重视膳食健康,注重乳制品的消费,养成乳制品消费习惯。施海波[12]就从研究发现来看,前期消费习惯对当期的消费有重要的影响作用。乳业振兴离不开消费终端的拉动作用,要深刻发掘低消费区的消费潜力,同时争取在高消费区有新的突破。

第二,消费习惯很大水平上取决于收入的高低。因此,要促进经济的发展,增加居民收入,尤其是经济欠发达地区,中西部地区的乳制品消费潜力巨大,但是消费潜力不等于消费需求,要将潜力转化为需求,必须提高硬实力,提高居民尤其是农村地区的收入水平,缩小区域消费格局的差距。

第三,乳品企业要多研发功能性乳制品,走创新发展之路。现在消费者越来越重视健康饮食,乳品作为健康食品,龙头乳企在市场中渗透率增加,逐步进入大好的发展势头。随着乳品消费升级、逐渐高端化的趋势越来越明显,乳品企业要抓住发展的契机,大力发展突破性产品。

第四,在提高农村和三四线城市城镇化水平尤其是中、西部地区城镇化水平时,应该促进消费水平和城镇化的共同发展,继续推进各地区消费终端设施的建设,如超市、网络生鲜乳点、便利店等。通过改善消费环境,提高乳制品的产品质量,方便居民对乳制品的购买。

第五,政府要加强质量监管,建立完善的体系,大力推进“优质乳工程”,增强消费国内者乳制品消费的信心,吸引产业链各环节的利益相关者,促使利益相关者目标的一致性,严格监管从生产源头到消费者终端的追溯链安全事件,避免质量安全的隐患。

整体来看,乳制品消费已经是大众不可或缺的食品,受不同地域的不同乳制品消费习惯和行为制约,可以预见,未来中国乳制品消费依然有很大的增长空间。同时,近几年以来三四线城市棚改货币化加速推进,助力居民实际购买力及消费水平迅速提升,成为消费复苏的重要因素,有望向城镇居民消费水平看齐。

猜你喜欢

乳制品省份聚类
谁说小龙虾不赚钱?跨越四省份,暴走万里路,只为寻找最会养虾的您
2018年1~2月乳制品产量同比增长8%
基于DBSACN聚类算法的XML文档聚类
通过乳制品源头控制提高原料奶品质的措施
杜马斯燃烧法快速测定乳制品的含氮量
图形在乳制品包装设计中的应用分析
基于改进的遗传算法的模糊聚类算法
一种层次初始的聚类个数自适应的聚类方法研究
因地制宜地稳妥推进留地安置——基于对10余省份留地安置的调研
自适应确定K-means算法的聚类数:以遥感图像聚类为例