APP下载

基于异源数据聚类分析比较的衡阳卷烟市场品牌培育策略选择研究

2023-11-01朱博王雄峰黎赔肆刘颖璇

中国民商 2023年9期
关键词:聚类分析

朱博 王雄峰 黎赔肆 刘颖璇

摘 要:论文对来自衡阳市烟草公司零售终端和入户访谈两个不同渠道异构数据的一致化处理后,再对两份数据分别进行了二阶段聚类分析,发现两份数据聚类的结果具有高度相似性,表明以衡阳市烟草公司获得的任意来源数据进行市场细分具有很高的可靠性。然后,以聚类结果为基础,发现不同细分市场消费者在卷烟品牌偏好和品牌培育活动参与上存在显著差异,进而结合以前研究的证据,并依据每个细分市场消费者特征、品牌参与活动经历,提出了深化品牌培育活动的建议。

关键词:异源异构数据;品牌培育;聚类分析

卷烟品牌培育是近10多年来各地烟草商业公司持续关心的重要问题,早期思路是借鉴其它领域的营销模式应用于卷烟的品牌培育,后来强调基于卷烟品牌个性化设计的品牌培育,慢慢形成了具有卷烟消费特征的培育模式,如卷烟品吸活动。衡阳市烟草公司近年来也一直在推进卷烟品牌培育的研究和实践,主要涉及三个方面:一是除了培育本土的白沙和芙蓉王品牌外,也重视省外卷烟品牌培育体系的研究;二是进行卷烟精准营销问题的探索,利用零售终端的数据将区域内投放市场的卷烟品规划分到“俏、紧、平、松、软”五类状态,构建了基于20个细分市场的精准投放模型,为卷烟精准投放提供建议;三是探索了不同品牌培育模式对新品牌推广的促进作用。但是目前尚未有将上述三个方面综合起来深化品牌培育问题的研究,即缺乏从精准化视角,探讨省内、省外不同品牌的培育模式的选择研究。

本文尝试通过对不同来源数据的聚类分析,对衡阳市卷烟消费者进行画像细分,并针对不同细分市场不同品牌提出合适的品牌培育措施。

一、问题提出

目前关于卷烟消费精准化研究的一个主要思路是通过数据的聚类分析对消费者进行画像,以此为依据来设计有关策略。这类研究面临的一个共同难题就是同一市场不同来源数据带来的画像结果不一致,如有文献为了解国内各城市卷烟消费者特征,通过线上调研获取国内12个城市卷烟消费者消费行为数据,发现由于各城市经济水平、人口密度和区位优势不同,各城市卷烟消费者画像存在明显差异。更为普遍的是,随着互联网等技术的快速发展,卷烟消费者的数据来源越来越多,数据的构成差异可能千差万别,这种多源异构的数据导致数据的管理和分析越来越困难。特别是基于不同来源数据进行的独立分析,会有不一样的消费者细分市场结果,从而导致难以做到真正的精准营销。虽然目前有一些文献探讨多源异构大数据的管理问题,但是对于如何有效利用传统渠道获得的多源异构数据进行融合分析尚未得到充分研究。

多年来衡阳市烟草公司通过不同的渠道来源获得了卷烟消费者数据,如通过零售终端微信扫码填写调查问卷、进行入户调查、通过布局品吸机收集数据等方式累积了大量的消费者数据。这些不同來源的数据所依赖的测量变量以及变量的分类等并不总是一致,如调查消费者日均吸烟量上,有的来源是直接收集消费者日均吸烟具体数量(如每天8支,数据属于定距数据),有的收集的是一个区间数据(如每天10支以下,属于定序或定类数据)。要利用这些多源异构数据进行聚类从而对消费者进行画像,存在两个关键问题:一是如何将不同来源不同结构的数据一致化,同时要保证不同来源数据分布不一样(即保证数据原有多样性特征);二是如何判断不同来源数据聚类分析结果具有一致性或可以融合。

本文将围绕上述两个关键问题,通过对异源数据的一致性处理和聚类分析比较,得出更加可靠的消费者画像,从而为卷烟市场开展更精准的品牌培育模式提供建议。

二、数据来源与处理

(一)数据来源

从目前衡阳市烟草公司数据来源来看,一些来源的数据量还不够充分,地区分布还不均衡,如通过品吸机收集的数据因为品吸机布点的时间较短数据量不多,布点地区差异导致一些县市区缺乏数据,不具有代表性。因此,本文仅关注两个成熟渠道数据来源,即零售终端微信调查获得的数据和入户访谈获得的数据。

数据来源1:零售终端数据是消费者在零售端购买香烟时自愿通过扫码微信填写有关问卷获得的,数据包括消费者人口统计特征(性别、年龄和学历)、消费行为特征(卷烟消费的数量、价格和月均支出)和消费意愿有关数据(如品牌培育参与、推新接受意愿等),初步筛选获得7760份有效数据。

数据来源2:入户访谈数据是采取分层抽样的方式,由专业调查人员深入衡阳市本级和7县1区、区县下设的乡镇街道、乡镇街道下设的社区或村开展访谈调查获得,与零售终端调查内容相似,数据包括消费者人口统计特征、消费行为特征和消费意愿有关数据,初步筛选获得1820份有效数据(依据每一份数据调查人员和复核人员的签名确保数据的可靠性)。

(二)数据一致性处理

(1)样本筛选标准一致化。两份数据均调查了消费者是否每天都吸烟,其中回答“否”,则意味着被访者属于偶尔吸烟行为,但是这个偶尔的频率与行为无法统一,如有的可能是每两天抽一次,有的可能是每周抽一次,有的是自己主动抽,有的可能是在特定场合被动抽,这导致很难保证同批样本一致性,因此两份数据均只保留了回答每天都吸烟的人。另外,统一了缺失数据处理,因为两份数据变量测量方式不同,不宜对缺失数据进行补值,因此删除了两份数据中有缺失值的所有样本。最终得到了2704份零售终端数据和495份入户访谈数据。

(2)同一变量不同数据尺度的一致化。一方面是消费者行为数据测量尺度的差异需要一致化,零售终端关于消费者日均吸烟数量、价格和支出均是以分段形式的定性数据,入户访谈这三个数据则均采取消费者直接填写具体数量的定量数据,前者数据尺度等级低,后者尺度等级高,由于高等级数据包含低等级数据的特性,因此将后者三个变量数据按照前者数据的等级分别转化为分段形式的定性数据,日均吸烟数量分为5个等级(10支及以下、11-20支、21-30支、31-40支、41支及以上),价格(11元以下、11-25元、26-50元、50元以上)和月支出(500元以下、500-999元、1000-1999元、1999元以上)分为4个等级。另一方面,消费者人口统计特征的变量虽然均采取的是分段数据,但是两份数据的分段方式不一样,如零售终端数据年龄分为6段,入户访谈数据年龄分为11段,考虑到11个分段的某些段样本很少,因此按照前者分6段的方式,统一进行了数据的分段(18-25岁、26-35岁、36-45岁、46-55岁、56-65岁、65岁以上)。学历统一分为小学及以下、初中、高中/中专、高中以上4个层次。

(三)数据分布差异性比较分析

通过上述数据的一致性处理后,需要判断两份数据是否具有同样的样本结构分布(如学历构成、年龄构成是否一致),如果两份数据样本分布一致则意味着两份数据性质完全相同,则无法达到利用多源数据的不同属性的优势。为此,需要对两份数据样本分布的差异性进行检验。本文从消费者人口统计特征的性别、年龄和学历,消费行为特征的卷烟消费的数量、价格、月均支出和消费者品牌偏好意愿(一致性化处理将众多品牌偏好一致化为白沙、芙蓉王和省外烟)7個变量角度对两份数据的分布差异进行检验。由于这些变量均是分类或排序数据,因此采取卡方检验来进行两个数据来源总体分布比例是否相等的检验,结果显示7个变量在两份数据上的总体分布比例均存在显着差异,详情如表1所示(两份数据同一变量之间无0频数交叉单元格,无单元格期望频数小于5,因此全部采取Pearson卡方检验的结果)。

三、消费者画像

借助SPSS两阶段聚类方法,以前述消费行为特征和人口统计特征变量为聚类依据,分别对两份数据进行聚类分析,从而对样本进行画像细分,并对两份数据的细分结果进行详尽比较,以确定衡阳市整个卷烟消费者的细分市场,为下一步的品牌培育策略选择提供依据。

聚类分析的结果见图1和图2,图中的“大小”和“输入”行数据是软件输出原始数据,“说明”行的文字是依据聚类结果中每一类消费者样本分布的详细数据(详细分析的数据可向作者申请查看)总结概说后在软件中输入的。从结果可以看到两个来源数据的聚类结果有4个明显的相似性。

(1)两个数据来源的聚类变量重要性(图中颜色深浅加以区别)非常类似。直观来看除了学历重要性以外,两个聚类其它变量重要性排序是一样的。按照聚类变量重要性,设置两个排序变量,分别代表每个数据来源的6个聚类变量重要性,计算两个排序变量的相关性(变量重要性的一致性检验),得到两个排序变量的Kendall's tau-b数值为0.6,在0.1水平上存在显著相关(P值为0.066)。

(2)软件自动聚类输出的两个来源数据的最优聚类均是4类,聚类的效果虽然不是非常优良,但是也可以接受。

(3)每个聚类样本数量分布没有明显差异。8个聚类类型中样本占比最高的是32.9%,最低是19.2%,与期望占比25%的差均没有明显的差异。

(4)一个数据来源的聚类在另一个数据来源聚类中可以找到非常类似的对应类别。

入户访谈样本聚类1与零售终端样本聚类2匹配,主要特征为样本女性较多、年龄偏低、学历较高,吸烟量较少、价格适中、消费支出低,该聚类可以称之为“高知猎奇”细分市场;入户访谈样本聚类2与零售终端样本聚类4匹配,主要特征为样本年龄偏大、学历偏低,价格偏低、支出偏低、日均吸烟量没有明显特征,该聚类可以称之为“高龄低端”细分市场;入户访谈样本聚类3与零售终端样本聚类3匹配,主要特征为样本无女性、无初中以下学历、中年人为主,中等吸烟量和价格、无月支出1000元以上样本,该聚类可以称之为“中端男性”细分市场;入户访谈样本聚类4与零售终端样本聚类1匹配,主要特征为样本年龄、学历、吸烟量、价格、支出均偏高,该聚类可以称之为“高量高端”细分市场。

由此可见,虽然数据来源不一样,但是聚类分析结果有较高的一致性,说明衡阳卷烟市场对任意数据来源聚类分析的结果具有较高的可靠性,可以此为依据开展有关营销活动。

四、细分市场的品牌偏好与培育方式选择

(一)细分市场的品牌偏好

通过对两个来源的数据聚类分析,得出了4个具有独特人口统计特征和消费行为特征的细分市场,那么每个细分市场消费者的品牌偏好是否具有显著差异呢?本文利用聚类分析时生成的聚类成员变量(4个类别)与品牌偏好(3个品牌,白沙、芙蓉王和省外烟)变量交叉表进行卡方检验来分析每个细分市场消费者对不同品牌的选择是否具有明显的偏好差异。结果显示零售终端样本的4个聚类消费者的品牌偏好(Pearson卡方为412.504,P值为0.000)和入户访谈样本的4个聚类消费者的品牌偏好均存在显著差异(Pearson卡方为166.837,P值为0.000)。进一步分析发现:“高知猎奇”市场消费者主要偏好芙蓉王品牌(55%),偏好白沙品牌的也不少(41%),也有部分低价省外烟的偏好者;“高龄低端”市场消费者明显偏好白沙品牌(63%),偏好芙蓉王品牌的较少(31%);“中端男性”市场消费者没有明显的品牌偏好;“高量高端”市场消费者特别偏好白沙品牌(81%),另外高价省外烟的消费者将近一半分布在该市场。

(二)细分市场的品牌培育方式选择

1.细分市场品牌培育模式现状分析

为给每个细分市场选择合适的品牌培育活动,先要借助交叉表的卡方检验来分析目前市场消费者参与过的品牌培育活动情况。衡阳卷烟市场目前有品吸、品牌推介和扫码三种主要品牌培育模式(有极少样本表示参加过其它类型的活动,但未注明是什么活动,因此把这部分样本删除),组合起来共有8种品牌培育活动参与情况(详情见表2)。卡方检验显示不同细分市场参与品牌培育的模式存在显著差异(Pearson卡方为63.169,P值为0.000)。

2.细分市场品牌培育模式发展建议

根据本文作者们的前期研究和表2目前的现状,提出以下品牌培育模式选择建议:

第一,针对没有参与过任何品牌培育活动的消费者,依据每个细分市场的特征优先加强品吸活动的推广,不具备开展品吸活动条件的可以考虑开展扫码和品牌推介活动。表2数据说明目前4个细分市场没有参加任何品牌培育活动的消费者比例都较高(每个细分市场该数值比例均在1/3以上,低端和高端市场该数值比例超过了40%),而我们的前期研究发现任何品牌培育活动可以促进消费者接受新品牌的意愿,其中品吸活动比品牌推介和扫码活动更有效,因此对于没有参加过任何品牌培育活动的消费者应优先考虑吸引他们参与品吸活动。以“高量高端”市场为例,该市场具有高学历、高吸烟量、高价格和高支出以及明显偏向高端高价位白沙品牌和高端高价位省外卷烟的特征,那么品吸机布局的地点和卷烟品种配置就要符合这类市场的需求特征。比如说可以考虑在南岳机场和一些高端消费场所布点,配备高端高价位白沙和省外卷烟。

第二,前期研究还发现,过多的参与品牌培育活动会抑制消费者对新品牌的接受意愿,因此对参加过品牌培育活动的消费者,要设计针对性的应对策略。首先,对已经参加过3种类型培育模式的消费者不要再考虑开展任何品牌培育活动。其次,对于参加过其他品牌培育活动,但没有参与过品吸活动的消费者,可以开展品吸类型的品牌培育活动。最后,对于参加过品吸活动的消费者,不宜再针对性开展其它品牌培育活动。

五、结论与展望

(一)结论

本文通过对衡阳卷烟市场一致化处理后异源异构数据的聚类分析,发现不同数据来源的聚类结果具有高度的相似性,说明任意来源数据均可用来开展市场细分及其对应营销策略研究,并结合本文作者们前期研究探索了每个细分市场的品牌培育模式选择的深化策略。得到以下几点结论:

(1)对于传统结构化程度较高的异源异构消费者数据可以通过适当方式进行一致化处理,从而加以比较分析。

(2)传统的只通过对某个来源数据聚类分析进行市场细分有一定的不可靠性,但是通过异源数据的比较分析予以佐证。如果异源数据分析结果差异很大,则需要重新设计和收集数据。

(3)卷烟市场品牌培育模式要依据细分市场的特征、品牌偏好和消费者以往培育活动经历综合考虑。

(二)展望

(1)本文分析的两个来源的数据事先并没有按照统一的设计模式和收集方法获得,具有异源异构的特征,但数据本身的结构化程度非常高,可以采取传统方法一致化,然后对于结构化程度极低的异源异构大数据来说,如何融合和一致化仍是需要深入探索的问题。

(2)本文提出了依据细分市场的特征来选择品牌培育模式,指明了每个细分市场大致的品牌培育方向,但限于时间和尚未实践探索,未来的研究需要更加细化讨论如何具体开展品牌培育,并通过实践优化和选择更合适的品牌培育模式。

参考文献:

[1]蒋丽雯,王雄峰,刘颖璇等.大数据下的卷烟市场状态评价方法[J].电脑知识与技术,2022,18(20):10-12.

猜你喜欢

聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
新媒体用户行为模式分析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究