影响电动汽车目标客户销售策略的综合评价模型
2022-05-17徐可莹张婧怡
徐可莹 张婧怡
1. 北京交通大学 北京 100080;
2. 北京邮电大学 北京 102200
引言
本文通过分析某汽车公司3款品牌电动汽车,销售部门邀请目标客户对汽车体验后得到了各项数据[1]。因所提供的数据出现问题数据,通过数学建模做好数据清洗工作,指出异常值和缺失数据以及处理方法,对数据做描述性统计分析,研究出不同品牌电动汽车的销售影响因素,最终建立不同品牌电动汽车的客户挖掘模型,使销售部门制定较好的销售策略。
1 目标客户体验数据异常值处理
本文采用2021年第二届全国大学生“华数杯”数学建模竞赛C题所提供的各项数据。某汽车公司推出3款品牌电动汽车,销售部门邀请了目标客户进行体验。满意度数据有a1-a8,个人信息数据有B1-B17,因所给的数据发现许多问题数据,它会影响后续数据挖掘工作,导致抽取模式错误和导出规则的偏差[2],通过SPSS统计图形做好数据统计和分析,以目标客户对于不同品牌汽车8个方面满意度进行比较,以品牌类型为因子进行分组分析。
用SPSS软件绘画箱线图,箱线图提供了一个识别异常值的标准,即大于或小于箱线图设定的上下界的数值即为异常值,箱线图选取异常值比较客观,在识别异常值方面有一定的优越性。以下为目标客户对3个品牌的汽车的8个方面的满意度箱线图。由于得出的异常值数量有些多,所以决定将一般异常值留下而把偏激异常值(图中带*号的数据)剔除。缺失值的处理:B7的问题为“请问您有几个孩子”,可推测得到,该列的缺失值为0。
图1 SPSS软件绘画箱线图
2 模型建立与求解
2.1 主成分分析
主成分分析法是把原来多个变量划为少数几个综合指标的一种统计分析方法,变量太多,会增加分析问题复杂性,用较少的新变量代替原来较多的旧变量,并使这些新变量尽可能多地保留原来变量所反映的信息。目标客户购买电动车的影响因素有a1-a8和B1-B17,且局部因素对电动汽车的销售影响较小,数目过多难以树立指标之间的关联,不仅会增加工作量还有可能对评判结果产生影响。通过采取主成分分析法对影响因素降维,减小影响因素的数量,确定各个因素的主成分。
2.2 模型建立方法
式中:P-主成分;Xi愿意购买电动车的客户个人特征信息;Xip-愿意购买电动车的客户的满意度评分。
2.2.2 构造样本阵,对样本阵元进行如下标准化变换:
2.2.3 对标准化阵Z求相关系数矩阵:
2.2.4 解样本相关矩阵R的特征方程:
得p个特征根,确定主成分按:
确定m值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m解方程组Rb=λjb,得单位特征向量。
2.2.5 将标准化后的指标变量转换为主成分:
U1称为第1主成分,U2称为第2主成分...... Up称为第p主成分。
2.2.6 对m个主成分进行综合评价。对m个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。
2.2.7 计算主成分贡献率及累计贡献率[3]。
主成分累计贡献率为:
一般取累计贡献率达85%~95%的特征值λ1,λ2,...,λm所对应的第1,第2......第m(m≤P)个主成分。
计算主成分载荷,其计算公式为:
得到各主成分的载荷后,进行下一步计算,得到各主成分的得分,贡献率越大的因素对是否购买电动汽车的影响越大,对全部的25个影响因素分析得到13个主要成分,为a1﹑a3﹑a4﹑a6﹑a8﹑B2﹑B3﹑B4﹑B5﹑B7﹑B12﹑B13﹑B16。
在这次体验中有49位客户购买了体验的电动汽车。买品牌1为23人,买品牌2为15人,买品牌3为11人,购买品牌1人数最多,品牌3人数最少。分析购买客户信息,研究出不同品牌汽车的销售影响因素。品牌1为对电池﹑安全性满意度高,居住市中心﹑家庭总人口多的中级职员购买;品牌2为对汽车经济性﹑操控性满意度高,且居住年限长﹑房贷少的中级技术客户购买;品牌3为对汽车配置满意度高﹑只有1孩﹑家庭可支配收入高的高级技术人员购买。
2.3 神经网络的预测分析
对所给出的15名待判定不同品牌购买客户,预测统计客户购买电动车的可能性为输入,把原来目标客户的体验数据作为输出,利用神经网络算法,建立预测模型,该模型的流程为:分析→神经网络→多层感知器→选定因变量﹑因子﹑协变量→神经网络预测。
通过主成分分析法删除不重要的指标,对指标赋权[4],但因为这样有一定主观性,因此进一步采用BP神经网络算法对所赋权重进行测试调节,最终利用神经网络基础上的预测模型,预测15个目标客户是否购买的数据,通过所预测的数据,与原来体验电动汽车客户相比较,判断出有真实购买电动汽车意愿的客户。
用SPSS绘制ROC曲线,曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值,其假阳性和假阴性的总数最少。通过分析,本模型得到相关的对应关系,如图2所示。
图2 ROC Curve图
AUC就是曲线下面积,因为是在1×1的方格里求面积,AUC必在0~1之间,AUC值越大,正确率越高。求得不同购买意愿下的AUC值都为0.927,十分接近于1,故该预测模型效果是比较好的。以上可知利用这些方法得到的模型具备一定的可信度。利用该预测模型对15个客户的购买数据进行预测,与实际值相比较,预测见下表:
表1 品牌电动车预测
选择贡献率大于85%的,最后我们根据该模型,预测15个客户购买品牌1的客户1个,购买品牌2的客户1个,购买品牌3的客户0个。
2.4 各个变量的重要性分析
根据神经网络模型可得到各个变量重要性,可知B15﹑B16﹑a1﹑a3﹑a2的重要性占比很大。
图3 变量重要性排序
3 结束语
用SPSS软件绘画箱线图发现异常值,将一般异常值留下,偏激异常值剔除,按照8个方面的满意度,以品牌类型为因子进行分组分析,最终得到客户对不同品牌汽车的满意度比较分析。对购买了电动汽车的客户进行数据分析,通过采取主成分分析法对影响因素降维,确定各个因素的主成分,研究出不同品牌电动汽车销售影响因素。通过采取神经网络算法建立预测模型,预测出客户购买电动汽车的可能数据,再根据神经网络模型可得到变量重要性,对没有购买电动汽车的顾客实施营销策略优化。充分证明建立在主成分分析法计算基础上的典型相关模型,与实际紧密联系,通用性较强。建立的预测模型具有自适应能力,容错性强,能很好地处理非线性复杂系统。