零售行业消费者购买行为的细分与预测
2023-02-18薛宇辰广东农工商职业技术学院财经学院
薛宇辰 广东农工商职业技术学院财经学院
引言
本研究的目的是调查消费者的购买行为以及过去的经历可能对决策过程产生的影响,并通过建立一种数据挖掘模型来对消费者进行细分。本研究的实证结果表明,根据Luo(2014)和Chan(2004)的工作改编的基于消费者促销倾向和信息获取的行为测量可为消费者细分提供较为准确的参考。
在消费者行为理论中,消费者的需求、动机与购买行为之间的关系基本可以表述为:消费者的需求加上外部刺激会激发购买动机,在购买动机的驱动下,消费者为了满足自身需求而进行购买。促销是一种重要的外部刺激。消费者在生命周期中进行品牌选择时对促销有不同的看法和反应,因此应将促销倾向作为细分消费者行为的关键指标。
此外,消费者内在的多样性寻求倾向也与消费者的探索和利用行为有关。利用行为在本文中被定义为“根据对市场的了解来最大化决策的效用”,探索行为被定义为“利用机会扩展市场知识”。消费者了解和储存的市场背景知识越多,在做出选择之前搜索的信息就越少。了解这两种测量对消费者的影响,以及消费者探索和利用行为之间的权衡,有助于预测他们的多样性寻求行为,从而了解消费者行为演变。
一、方法
(一)IRI数据集
IRI数据集包含11年的美国超市营销数据,包括产品特征数据、消费者交易数据和人口统计数据。本研究选取了牛奶市场交易层面的面板数据和周UPC(商品通用条码)层面的商店数据进行分析。为了识别与促销相关的动态选择行为的演变,选取了连续4个年度的数据集。理论上,较新的数据可以提供更多的价值和准确性,但是第8年到第11年的数据中,每年都有很大比例的缺失数据,而消费者的多样性寻求倾向和促销倾向的测量要求有足够的每年交易记录来进行计算,因此,本研究选择了从第4年到第7年的数据。其次,需要根据消费者的购买记录对数据集进行筛选,确保有足够的数据用于测量促销倾向和多样性寻求倾向。根据标准最终选择了连续4年每年至少有12次购买记录的1127名消费者,购买记录总数为187871条。
(二)行为测量
1.促销倾向
第4年到第7年牛奶市场数据集包含产品级别的促销活动信息,包括广告、展示摊位和降价。乳制品作为快速消费品保质期短,需要缩短销售周期。消费者对促销的反应是制定营销策略的一个关键指标,因为它提供了短期的强烈刺激,可以直接导致消费者的购买行为。用“促销流行度”作为促销倾向的代表,Luoetal.(2014)将其定义为购买促销产品占当期全部购买的百分比,使用公式1计算:
公式1:促销流行度
当使用选定的数据集进行操作时,第一步是创建一个名为促销响应的新变量。当F、D、PR(来自商店数据集,代表Feature、Display和PriceReduction标志的变量)的值分别为NONE、0、0时,促销响应的代码为0。在这种情况下,代码0表示不响应促销活动。当F、D、PR的值是除了缺失数据之外的任何其他值时,代码1表示对促销活动的积极响应。使用VBA通过统计代码1的出现次数来计算促销流行度,该代码表示一段时间内购买促销产品的次数,然后将该数字除以消费者在该期间的购买总数得到最终结果。促销流行度仅基于一年的交易量进行计算。促销流行度越高,表明消费者购买促销产品的倾向性越高。
2.多样性寻求倾向
多样性的寻求是人类获取信息的内在动机。在市场营销中,多样性寻求倾向会导致消费者的探索和利用行为,并且这两种行为会随着消费者对产品市场的了解程度而改变。
本文采用了Luo(2014)对广义信息熵论进行调整后的信息价值测量方法。消费者的多样性寻求行为取决于他们对产品市场的了解(Heilmanetal.,2000)。
I(M)p代表消费者尝试过的牛奶品牌数量与牛奶市场中品牌总数之比。使用公式2衡量消费者对产品市场的了解程度:
公式2:关于产品市场的知识
公式3:单位信息价值
通过购买行为获取的信息的价值可以通过量化的消费者对产品市场的知识乘以对应的单位信息价值来计算,如公式4所示:
以下是将此测量方法应用于本研究时的一些假设:
1.牛奶市场的知识只有通过购买和品尝不同的品牌才能获得,因为在食品市场,消费者需要先尝试才能知道味道。
2.选定的消费者在第4年首次进入牛奶市场。
(三)客户细分
在统计学中,聚类被定义为无监督的分类,即在没有关于样本分类的先验知识的情况下学习,细分被认为是有监督的分类,因为该过程是根据已知的甄别对总体进行细分。但在市场营销中,聚类和细分之间的区分较模糊,因此可以将它们视为同一概念。
图1 行为细分结果
促销倾向,以促销的流行程度计算,是指消费者对促销活动的态度。促销流行度值低表示消费者不购买有促销的品牌,可能是因为怀疑在售品牌的质量,这部分消费者可以被贴上“促销厌恶”的标签,而促销流行度的高值可以识别倾向于购买有促销活动的品牌的消费者,这部分消费者可以被贴上“机会主义者”的标签。至于以购买信息价值衡量的多样性寻求倾向,购买信息价值低的消费者被视为“利用者”,购买信息价值高的消费者被视为“探索者”。
由于促销的流行度和信息的价值间的显著相关性水平在第4年数据集中仅为0.011(表明没有相关性),基于这两个测量值的聚类是合理的。出于谨慎的原因进行了变量转换,因为促销流行度和信息价值的偏度分别为0.85和-0.7,经验法则表明,如果偏度大于1.0(或小于-1.0),则分布将及其不对称。
在导入SASEnterpriseMiner之前,将所有4年数据集以6:4的比例随机分成学习和评估数据。选择第4年的学习数据作为训练数据,而将其他数据用作评估数据。SASEnterpriseMiner使用K-Means方法分配观察值。本文根据测量值将合适的聚类数设置为四个,并根据图探索的结果选择完全替换算法作为种子初始化方法。其余数据集是基于从第4年学习数据中生成的聚类进行处理的,因为该聚类结果符合假设,并且它们中的每一个都有相当明确的边缘,这是可信结果的标志。
三、结果
(一)行为细分和标签
细分市场1的消费者对促销的反应率很高,这意味着他们倾向于购买正在促销的品牌。但是,他们通过购买获得的信息价值相对较低,这表明他们可以标记为“机会主义的利用者”,他们利用促销持续购买喜爱的牛奶品牌,而不尝试新的替代品牌。
细分市场2的消费者具有中低促销流行度,这表明他们更愿意购买不进行促销的品牌,这可能是因为促销活动会损害品牌在他们心中的形象,例如,他们可能会怀疑促销品牌的质量不佳。此外,消费者拥有较高的购买信息价值,这意味着他们受到多样化寻求倾向的驱使,更倾向于购买不同的品牌以探索市场。基于上述行为特征,这部分消费者可以被标记为“厌恶促销的探索者”。
细分市场3的消费者应被标记为“机会主义的探索者”,因为他们在促销流行度和购买信息价值方面都具有很高的值。他们热衷于开拓市场和购买新品牌,对促销活动非常敏感。
细分市场4包含促销流行度、信息价值都相对较低的消费者。低信息价值表明消费者更愿意利用他们已知的知识,而不是购买新品牌。他们倾向于反复购买其喜爱品牌中未进行促销的那部分。该细分市场中的典型消费者可以被描述为“厌恶促销的利用者”。他们同样看重品牌质量和品牌忠诚度。
(二)模式识别
通过绘制和比较连续两年数据集的马尔可夫链来识别消费者行为演变模式,在相应的学习和评估数据集中行为模式都表现出相似的变化,这证明了模式的稳定性。
虽然大多数消费者在每两年的进化中都保持在同一细分市场,但在马尔可夫链中也发现了一些行为的变化。在具有高促销响应率特征的消费者中,“机会主义的利用者”转变为“机会主义的探索者”的比例分别为12.4%、22.7%和6.8%。在具有厌恶促销特征的消费者中,利用者演变为探索者的比例分别为13.4%、17.3%和4.6%。
通过比较马尔科夫链可以清楚地识别出两种模式。第一个模式可以描述为无论消费者是喜欢促销的机会主义者还是厌恶促销者,他们中的利用者都倾向于转为探索者以扩大他们对市场的品类知识,这也是出于多样性寻求倾向。
第二种模式是,“机会主义利用者”和“促销厌恶利用者”之间存在双向转变,“机会主义探索者”和“促销厌恶探索者”之间也存在这种双向切换。需要注意的一点是,从整体上看,促销厌恶者转变为机会主义者的比例要高于机会主义者转变为促销厌恶者的比例。这反映了一个现象,即消费者倾向于往对促销敏感的方向转变。
(三)信度和效度检验
在本文中,通过使用两种不同的方法对保留样本重复进行聚类分析来评估细分结果的可靠性,根据细分大小、聚类标准和均方根标准差确定的两种结果之间的一致性程度非常相似。此外,同样的方法(完全替换法)用于四年内两个不同的数据样本,即学习数据集和评估数据集,结果也显得非常相似。因此,可以得出结论,该分析通过了可靠性测试。
四、结论和建议
零售商应针对不同的消费者群体制定特定的营销策略。在四个细分群体中,“机会主义的探索者”可能是零售商最喜爱的消费者,因为这一群体的消费者热衷于通过购买不同品牌来开拓市场,并且他们会被促销品牌所吸引,这使得他们成为通过各种促销活动来推广新品牌的完美目标。“机会主义的利用者”可成为下一个目标,因为即使他们倾向于购买某些品牌,也会有中到高的促销响应度。因此,可以通过进一步的分析找出机会主义者忠于哪些品牌,并对这些品牌进行促销以增加销售额。同时,不应忽视“厌恶促销的探索者”,因为他们也更喜欢探索市场,他们对促销不敏感的原因可能是促销有时与质量差有关,尤其是在牛奶市场,鲜奶的保质期很短,其他乳制品的保质期限相对较短。在这种情况下,零售商可以改变营销策略,以推广质量最好、价格较高的新品牌,从而实现利润回报率的最大化。最后,“厌恶促销的利用者”在牛奶市场上获得了足够的品类经验,从而培养了对某些品牌的品牌忠诚度,针对性的营销策略应注重消费者保留,不断提供新鲜乳制品,而不是考虑促销活动。
如果我们只将消费者分为两类,即市场探索者和市场利用者,出于不同的原因均应该提供促销。对于探索者来说,促销活动将激励他们以较低的成本尝试新的替代品,而对于利用者而言,促销活动应侧重于他们反复购买的品牌,以扩大销售额。
鉴于本文所确定的行为演变和各细分市场之间的行为变化百分比无法得到强有力的验证,使用这种动态模型无法完全预测消费者未来的购买行为。因此,需要使用本文提到的算法(促销倾向和多样化寻求倾向)来建立预测模型对消费者的购买行为进行预测。未来的研究应侧重于使用IRI数据集概括不同市场中的行为演变。