基于K-means聚类的河北省乳制品消费偏好集群分析
2021-06-29石晓雨唐晓雨王肖丽孙雅茗齐子萱张艳新
石晓雨,唐晓雨,王肖丽,孙雅茗,齐子萱,张艳新
(河北农业大学渤海学院,河北 黄骅 061100)
我国乳制品市场成熟,机遇与挑战并存,2018年乳制品销售量3 099万t,同比增长1.0%,发展势头良好,同时面临升级慢、多样性差等问题。部分学者通过定量分析对乳制品消费偏好和特点进行了研究,汤颖梅等[1]运用实证数据从人均乳制品消费量、乳制品增长速度、地区差异、不同收入群体分析了乳制品的消费特点,并提出乳制品消费的未来发展趋势;朱增勇等[2]通过IDF和世界奶业消费、贸易数据分析了2000年以来世界奶制品消费中,酸奶、甜点和奶饮料呈上升趋势;贾琪[3]运用联合分析法,对黑龙江地区消费者的液态奶口味和品牌消费偏好进行研究发现,消费者消费偏好具有一定的差异;张巍等[4]从均衡价格理论和消费者剩余理论出发,构建以消费者绿色偏好为中心的乳制品定价模型。还有学者对乳制品消费进行了集聚和区域分析,杨辉等[5]运用K-means聚类模型将我国31个省份划分为四大区域;吕裔良[6]运用区位基尼系数和专业化指数测量我国31个省份乳制品产业集聚表现,指出内蒙古自治区形成了乳制品产业集群,并且发现集群发展有助于乳制品区域发展。程长林等[7]通过空间计量模型对我国省域乳制品供给和需求进行集群分析,黑龙江和内蒙古为高聚集区,浙江等地区为乳制品低聚集区;成小平等[8]指出我国乳制品产业区域集聚效果明显,东北和内蒙古地区集聚效果尤为突显,并发现资源禀赋、市场需求、区域产业非均衡发展政策和历史遗留下来的产业基础促进了乳制品产业空间集聚;姜冰等[9]研究我国2005~2010年乳制品加工业集聚程度变动情况,乳制品加工业在南方集聚程度低,西北、东北等地区集聚程度高,且乳制品加工业集聚程度出现下降趋势。河北省是我国畜牧业大省,而乳业发展起点低、起步晚,具有很大的发展潜力。以河北省11个地区调研数据为基础,选取需求偏好影响因子,运用运用K-means聚类模型,分析该地区乳制品消费偏好集群效应;同时分析不同群体消费需求偏好,为河北省乳制品行业发展提出对策建议。
1 数据来源
河北南北跨度较大,各地区的自然资源、基础设施建设、经济发展速度差异较大。2020年2月,对河北省11个地级市发放《河北省乳制品消费者行为偏好》调查问卷320份,回收有效问卷273份,有效率为85.31%(表1)。问卷内容包括被访者基本概况(年龄、收入水平、所在地区等)、乳制品包装喜爱、乳制品价格、乳制品品牌喜好、经常购买的乳制品种类等。
表1 河北省11个地级市调研数据Table 1 Survey data of 11 prefecture-level cities in Hebei Province
2 研究方法
2.1 确定聚类指标
基于实地调研情况,根据文献,最终确定河北省人均月收入、乳制品包装类型、乳制品价格、乳制品关注重点、乳制品品种、乳制品品牌6个指标进行聚类分析。
2.2 构建K-means聚类模型
采用SPSS23.0软件中的K-means聚类模型对河北省乳制品消费需求进行系统分析。K-means聚类模型按照各样本之间的距离,将样本集划分为K个簇。让簇内点的距离尽量小,簇间距离尽量大。分别采用准则函数E公式(1)和Ward公式(2)~(3)确定样本间距离。
其中,Ci:当前的第i类,x:第i个观测值,d(Ci,x):Ci与x之间的距离。
其中,NK:当前聚类水平第K类中的观测个数,NL:当前聚类水平第L类中的观测个数,当前聚类水平第K类、第L类中的均值向量,DKL:第某一聚类水平第K类和第L类之间的距离。
其中,NK、NL、NM分别为第某一聚类水平第K类、第L类、第M类中的观测数,DJK表示第某一聚类水平的第J类和第K类之间的距离,DJL表示第某一聚类水平的第J类和第L类之间的距离,DJM表示第某一聚类水平的第J类和第M类之间的距离。
3 结果与分析
3.1 河北省奶制品销售偏好
通过对273位被访者的数据进行汇总发现,55.78%的被访者年龄为20~30岁,44.32%的被访者年龄>51岁;34.07%的被访者月收入3 000~5 000元。72.89%被访者认为乳制品价格偏高;37.36%的被访者注重乳制品新鲜程度,34.07%的被访者注重乳制品干净卫生;41.76%的被访者选择消费纸盒包装乳制品(表2)。
表2 被访者基本概况及乳制品消费喜好Table 2 Basic information and dairy consumption preferences of interviewees
3.2 不同年龄群体奶制品消费偏好聚类分析
3.2.1 年轻群体 绘制聚合系数折线图(图1),当K=4时,是聚合曲线下降速率的转折点,即此时再增加类别数,收敛不会发生明显变化,K=4为合适类别数。其中人均月收入、乳制品价格、乳制品侧重点、乳制品品牌其P值分别为0.007、0.000、0.011、0.039(表3),说明调研数据差异性显著,可以进行聚类分析。将河北省11个地区年轻群体乳制品消费偏好划分为四大类,根据各个变量的聚类中心(表4),围绕其中心对数据进行聚类分析。运用Ward对11个地区年轻群体乳制品消费偏好进行聚类(图2)。
图1 河北省年轻群体乳制品消费偏好聚合系数图Fig.1 Convergence coefficient of dairy consumption preference of young groups in Hebei Province
3.2.1.1 第一类别。第一类别有保定和石家庄地区,经济发展速度快,年轻群体人均月收入5 000~8 000元,属于高收入群体。调研数据显示,该地区年轻群体认为目前乳制品价格处于合理区间,在日常消费过程中需求更加多样化,会有高蛋白、新鲜程度较高、营养价值高、包装精美的乳制品(如奶酪、巴氏奶以及鲜牛奶等)消费需求,该地区经济的快速发展会促使乳制品尤其是高端乳制品市场需求的快速增长。
3.2.1.2 第二类别。第二类别有邢台和张家口地区,经济发展较好,年轻人对乳制品的消费需求不充分。由于该地区社会和经济发展较第一类别地区有一定差距,导致乳制品不是年轻人日常生活的必需品,且处于简易包装(塑料袋)乳制品消费阶段,消费产品单一,侧重乳制品的食用性功能。
表3年轻群体乳制品消费偏好ANOVA表Table 3 ANOVA table of dairy consumption preference of young group
表4 最终聚类中心Table 4 Final cluster center
图2 年轻群体乳制品消费偏好Ward聚类结果Fig.2 Ward clustering result of dairy consumption preference of young group
3.2.1.3 第三类别。第三类别有沧州和衡水地区,经济相对发达,年轻群体以盒装乳制品、保鲜奶类消费为主,注重乳制品的乳脂含量。该类别年轻群体对乳制品需求较多,当地的乳制品市场发展较好。
3.2.1.4 第四类别。第四类别有承德、邯郸、廊坊、秦皇岛、唐山地区,年轻群体对乳制品的消费需求不高,大多购买塑料包装乳制品,侧重乳制品的食用性功能。该地区的乳制品市场发展缓慢。
3.2.2 老年群体乳制品消费偏好聚类分析 绘制聚类系数折线图(图3),当K=4时,是聚合曲线下降速率的转折点,即此时再增加类别数,收敛不会发生明显变化,K=4为合适类别数。其中河北省人均月收入、乳制品包装类型、乳制品价格、乳制品侧重点、乳制品品种、乳制品品牌6个指标的P值分别为0.398、0.004、0.000、0.001、0.006、0.314(表5),说明数据差异显著,可以进行聚类分析。将河北省11个地区老年群体乳制品消费偏好划分为四大类,根据各个变量的聚类中心(表6),围绕其中心对数据进行聚类分析。运用Ward对11个地区老年群体乳制品消费偏好进行聚类(图4)。
图3 河北省老年群体乳制品消费偏好聚合系数图Fig.3 Convergence coefficient of dairy consumption preference of elderly group in Hebei Province
3.2.2.1 第一类别。第一类别有保定、唐山、石家庄、廊坊地区。该地区老年群体更注重乳制品的卫生安全,以纸袋包装的常温奶品消费为主;普遍认为乳制品价格偏高。
表5老年群体乳制品消费偏好ANOVA表Table 5 Anova table of dairy cnsumption preferences of elderly group
表6 最终聚类中心Table 6 Final clustering center
图4 老年群体乳制品消费偏好Ward聚类结果Fig.4 Ward clustering result of dairy consumption preference of elderly group
3.2.2.2 第二类别。第二类别有秦皇岛地区。该地区老年群体更加注重乳制品的乳脂含量,以酸奶消费为主;普遍认为乳制品价格偏高。
3.2.2.3 第三类别。第三类别有邢台、沧州、衡水、承德地区。该地区老年群体更加注重乳制品的卫生安全,以纸盒类保鲜奶消费为主;普遍认为乳制品价格偏高。
3.2.2.4 第四类别。第四类别有邯郸、张家口为地区。该地区老年群体更加注重乳制品的乳脂含量,以纸盒类的复原乳产品消费为主;普遍认为乳制品价格偏高。
4 主要结论与对策建议
4.1 主要结论
运用K-means聚类模型对河北省11个地区不同年龄群体乳制品消费偏好进行聚类分析,得到以下主要结论:
(1)不同地区年轻群体乳制品消费偏好差异较大。经济因素是影响年轻群体消费的主要因素,经济发展迅速、收入水平较高的石家庄和保定地区,年轻群体对乳制品品质需求和个性化需求提出了更好的要求;经济发展状况较好的邢台、张家口地区,年轻群体奶制品个性化需求较小,购买品种上较为单一;经济相对发达的沧州、衡水地区,年轻群体更加侧重乳制品的乳脂含量,且对乳制品需求较多,包装购买多样,乳制品市场发展前景广阔;经济发展水平落后的承德、邯郸等地区,年轻群体对乳制品的消费需求不高,乳制品市场发展缓慢。
(2)不同年龄群体乳制品消费偏好差异较大。老年群体较年轻群体而言,接受新事物、新产品能力较弱,在乳制品的种类和品牌消费上较为稳定;普遍认为各类乳制品价格偏高,多侧重消费纸盒类、简易包装类产品,注重营养元素、乳脂含量较高乳制品的消费,在一定程度上影响老年人的乳制品消费市场。
4.2 对策建议
4.2.1 创新乳品发展,实现精准定位 针对年轻群体对乳制品的个性化、多元化消费需求,提升乳制品的创新能力和新产品开发能力,开发功能性乳制品,实现个性化服务模式,满足当下快节奏的消费需求。针对老年群体消费特点,研发性价比高的适用于老年群体消费的产品,以提高其购买力。
4.2.2 发展经济,提高居民收入 收入水平决定消费水平,因此要带动区域消费,必须加快地方经济建设与发展,提高居民的人均收入水平。只有大力发展地方经济,提高居民生活水平,增加个人收入,才会增加乳制品消费,从而拉动振兴河北奶业发展。
4.2.3 加强监督管理,保证乳品供应链安全 食品安全与公众的切身利益息息相关,已成为社会发展中备受关注的问题。政府要加强乳制品质量检测与监管,厘清现有的交叉职能,明确各个环节的责任。进一步明确乳制品供应链各主体的奖惩制度,建立乳制品全程溯源体系,对乳制品的供应链进行必要的全程跟踪、追溯,全方位增强奶牛养殖场和乳品企业的社会责任意识。企业要严格监管冷链物流系统,从而保证乳制品的质量安全。