APP下载

基于关联规则算法的汽车市场精确营销分析研究

2022-05-28

贵阳学院学报(自然科学版) 2022年1期
关键词:项集数据挖掘规则

李 洋

(合肥城市学院 管理工程系,安徽 合肥 230071)

我国经济的发展极大地促进了汽车市场的发展。据报道,在2020 年,我国的汽车销量占据全球汽车市场的32%,汽车市场的竞争也越来越激烈。精准营销是指根据现有资料进行分析,进而制定面向购买可能性较强的客户的策略[1]。许多学者对精准营销策略的应用进行了深入研究,如银行客户的精确营销,及基于大数据分析的房地产销售[2-3]。基于大数据挖掘实现精准营销,提升市场服务,有利于汽车企业合理配置市场资源,提升市场竞争力[4]。因此,研究基于关联规则算法中的Apriori 算法构建汽车市场数据挖掘模型,根据数据挖掘结果进行分析,从而实现汽车企业的精确营销。研究结果表明:该模型具有较高的精度和实用性。

1 基于数据挖掘的汽车市场精确营销

1.1 基于Apriori 算法的数据挖掘模型

数据挖掘技术能够从大量的数据中挖掘出有价值的信息,从而提高信息的利用效率。利用数据挖掘,能够对商务信息进行有效处理,进而获取到一些容易忽略但非常重要的信息,进而为商业决策提供数据支撑和依据[5-6]。数据挖掘的基本流程如图1 所示。

图1 数据挖掘的过程

目前,关联规则算法是实现数据挖掘最常用的算法之一[7]。关联规则能够从大规模的数据集中,找到数据隐藏特征之间的相关性,进而根据一种因素的显现来预测和寻找到另一种因素的显现。因此,关联规则被广泛应用于购物篮问题,以分析顾客的消费习惯、消费意向以及不同商品之间的联系[8-9]。关联规则算法的基本步骤如下:设X={x1,x2,...,xn}为数据集中所有属性的集合,Y={y1,y2,...,yN}则表示每一个实例的集合,且每一个实例都具有唯一性的标示符,则任意实例yi所包含的项集都是X 的一个子集。其中项集是指属性的集合。设A 和B 都是项集,且A 和B 之间有关联,设样本A 为先导,样本B 为后继,那么A 和B 的关联规则蕴含表达式可表述为A→B的形式。关联规则的数量十分庞大,因此需要利用支持度(Support)与置信度(Confidence)来对关联规则进行筛选和过滤。

A→B的支持度计算方式如公式(1)所示。

式(1)可描述实例集Y 中同时包含A 和B 的实例集比例,即任意实例同时包含A 和B 的概率。A→B的支持度计算方式如公式(2)所示。

式(2)能够表示在确定包含了A 的实例中出现Y 的概率。在利用关联规则算法进行数据挖掘时,需要预先设置两个阈值,即最小支持度与最小置信度[10-11]。若项集A 满足公式(3),那么A 就是一个频繁项集。

在式(3)中,Min_Support表示最小支持度。在频繁项集中得到的关联规则,若满足公式(4),则称之为强关联规则。

在式(4)中,Min_Confidence表示最小置信度。在基于关联规则的数据挖掘中,找出数据库中的频繁项集和强规则能够有效地减少对数据库的扫描时间,从而提高数据挖掘的效率。Apriori 算法是最常用的关联规则算法之一,采用逐层搜索迭代的方法,主要包含了两个步骤:首先是Apriori 算法通过迭代更新来寻找频繁项集,且每一次迭代都会扫描数据库,以避免频繁项集的遗漏;其次,对于在迭代过程中寻找到的频繁项集,通过计算找到满足最小置信度的规则,即强规则,进而生产关联规则[12]。Apriori 算法通过扫码数据库中样本的支持度,找出频繁k-项集的集合K1;在下一次迭代过程中,利用频繁项集集合K1 寻找(k+1)-项集的集合K2;依此类推,找到频繁项集集合K3、K4、...,直到没有新的频繁项集集合产生,则算法结束。利用这种方式,能够避免对数据库中所有项集的支持度进行计算,进而减少Apriori 算法对数据库进行扫描所消耗的时间与空间,提高了数据挖掘的效率[13]。根据上述内容,可构建汽车市场数据挖掘模型,对汽车行业的大数据进行深度挖掘,进而调整汽车企业的营销策略,实现精准营销。

1.2 数据挖掘模型在精准营销中的应用

一些学者认为,顾客的购物行为主要受到4种因素的影响,时间、渠道、顾客及营销信息。当上述4 种因素均达到顾客的期望值,则营销目标的达成概率会大幅度提高。基于此,提出精确营销的概念,基于科学管理,利用人工智能等现代信息技术来挖掘并分析客户的心理、行为,从而合理地定位并细分市场,并针对目标客户群体进行制定差异化与针对性的营销策略,以更好地增加企业效益。精准营销的大致结构如图2所示。

图2 精准营销大致流程

在汽车行业的精确营销中,数据挖掘技术的作用有客户消费分析、客户价值评估、发掘客户的相关需求、提供相关服务和产品、分析并挽留流失客户等。以某汽车公司C 企业为例,C 企业的数据库中保存有大量的原始客户购车数据,这些原始数据有23 个维度,包括了客户ID、客户姓名、年龄、居住地、客户类型、客户从事工作、消费原因、消费目的、销售渠道、销售日期、汽车型号等属性。数据库中的样本数据均源于真实的购车行为,因此根据这些样本数据进行数据挖掘和精确营销具有较高的可靠性。对精确营销而言,数据库中的样本数据冗余信息和属性较多,因此需要对数据进行预处理,如降噪、转换和清理[14-15]。结合实际情况进行分析并预处理后,样本数据的结构见图3。

图3 样本数据结构

根据图3 所示对样本数据进行数据挖掘,分析样本数据中不同维度的属性的不同属性值所占的比例,可获取汽车销售市场的地区饱和程度。将地区与其他属性的数据进行交互统计和分析,以及各地区消费者的购买因素、消费偏好和促销手段偏好等信息,进而实现精准营销。如将属性值为东北地区的数据与购买因素交互,可获取东北地区消费者的购买因素占比;与车型交互,则可获取东北地区消费者对C 企业旗下生产的车型偏好。根据这些信息,可制订合理的营销策略,实现精准营销。

2 基于关联规则算法的精准营销效果

2.1 Apriori 数据挖掘模型的训练效果分析

常用的数据挖掘算法有k-means 算法、遗传算法(Genetic Algorithm,GA)、粒子群优化算法(Particle swarm optimization,PSO)以及Apriori 算法。研究采用Apriori 算法构建模型来进行数据挖掘。模型的训练效果,会直接影响到数据挖掘效果和效率,为验证Apriori 算法的挖掘性能和挖掘效率,分别利用上述算法构建k-means 汽车市场数据挖掘模型、GA 汽车市场数据挖掘模型、PSO汽车市场数据挖掘模型以及Apriori 汽车市场数据挖掘模型。对C 企业数据库中的样本数据进行预处理,将经过预处理的样本数据用于模型的测试,对比几种模型达到目标精度所需要的迭代数量。几种模型的测试情况如图4 所示。

图4 几种模型的训练效果

从图4 中可看出,在采用相同的样本数据对上述4 种模型训练后,Apriori 汽车市场数据挖掘模型在迭代了187 次后达到目标精度;而k-means 汽车市场数据挖掘模型需要迭代756 次才能达到目标精度,比Apriori 汽车市场数据挖掘模型多569 次;GA 汽车市场数据挖掘模型需要迭代697 次才能达到目标精度,比Apriori 汽车市场数据挖掘模型多510 次;PSO 汽车市场数据挖掘模型在迭代962 次后达到目标精度,比Apriori汽车市场数据挖掘模型多799 次。以上结果表明,Apriori 汽车市场数据挖掘模型的训练效率要显著优于其他几种汽车市场数据挖掘模型,性能比其他模型更加优秀。

2.2 Apriori 汽车市场数据挖掘模型的挖掘效果

汽车市场数据挖掘模型的数据挖掘效果,关系到汽车市场精准营销的营销策略制订,及精准营销的效果。将经过预处理的10000 条样本数据,输入到上述训练好的k-means 汽车市场数据挖掘模型、GA 汽车市场数据挖掘模型、PSO 汽车市场数据挖掘模型以及Apriori 汽车市场数据挖掘模型中,对比几种模型对挖掘数据的属性及属性值的分类正确率,对比几种模型的数据挖掘效果,如表1 所示。

表1 几种模型的数据挖掘效果对比

通过表1 可看出,Apriori 汽车市场数据挖掘模型对样本数据的属性维度分类正确率为97.1%,总共挖掘时间为25 s,均比其他模型优秀;而k-means 汽车市场数据挖掘模型对样本数据的属性维度分类正确率为92.1%,比Apriori 汽车市场数据挖掘模型低5%,总挖掘时间为31s,比Apriori 汽车市场数据挖掘模型多6 s。PSO 汽车市场数据挖掘模型对样本数据的属性维度分类正确率为91.7%,比Apriori 汽车市场数据挖掘模型低5.4%,总挖掘时间为35 s,比Apriori 汽车市场数据挖掘模型多10 s。GA 汽车市场数据挖掘模型对样本数据的属性维度分类正确率为91.6%,比Apriori 汽车市场数据挖掘模型低5.5%,总挖掘时间为29 s,比Apriori 汽车市场数据挖掘模型多4 s。以上结果说明,基于Apriori 算法构建的汽车市场数据挖掘模型准确率更高,性能更优秀,更适用于汽车市场的精准营销。

2.3 基于数据挖掘的精准营销实证分析

将经过预处理的样本数据输入到训练好的Apriori 汽车市场数据挖掘模型中,并将地区与车型两个维度的属性进行交互统计,以进行实证分析。地区与促销手段之间的交互统计如表2 所示。

表2 地区与促销手段之间的交互统计

从表2 中能看出,C 公司在华东地区的销售额最多,这表明在华东地区的汽车市场已经趋于饱和状态,因此只需要维持现状;而在西北地区和东北地区的销售额占比极低,分别占5.1%和3.2%,这表明这两个地区的市场开发程度不够,可以适当投入资源开拓市场。总体而言,促销手段中的员工推销手段促成的交易最多,销售额占比为34.1%,其次则是老顾客介绍与推广,分别为27.4%和24.0%、因此,C 企业需要在各个区域加强市场推销。此外,还需要经常联系老顾客,重视顾客的意见。提升售后服务质量,以提升顾客的消费满意程度,进而使老顾客自愿介绍新顾客,最终增加销售额。同时,C 企业还需要加强推广手段,如电视推销、海报广告等,提升自身汽车品牌的知名度。

3 结语

基于汽车消费者大数据挖掘来实现精准营销,有利于提高顾客满意度,提升汽车企业的市场竞争力,最终提升企业的销售额。结果表明:Apriori 汽车市场数据挖掘模型的挖掘效果较好,具有较高的实用性。研究未对营销策略进行详细分析,需要日后深入研究。

猜你喜欢

项集数据挖掘规则
撑竿跳规则的制定
数独的规则和演变
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
让规则不规则
TPP反腐败规则对我国的启示
一种基于Hadoop的大数据挖掘云服务及应用
高级数据挖掘与应用国际学术会议