基于智能数据分析的电动汽车目标客户销售策略优化研究
2021-01-06杨浩然
杨浩然
摘要:本文应用了pandas算法对附件进行数据清洗,建立基于熵权法的权重分析模型分析因素对不同品牌电动汽车的销售的影响,从而得出目标客户购买电动汽车的可能性。首先需要对数据进行数据清洗,将数据分为两个部分,利用Excel对各项指标的进行均值计算,然后用ACSI模型进行满意度分析,构建满意度的数学关系式,筛选出所有有意愿购买电动汽车的客户,将各品牌销售的综合分数则作为因变量,建立基于熵权法的权重分析模型,权重越大,则评分越高,得出a1,a2,B12,B13,B15,B17等因素对不同品牌电动汽车的销售有影响,其中B17的权重最大,其影响则为最大。
关键词:pandas 法;熵权法;相关性分析
1 引言
汽车产业是国民经济的重要支柱产业,而新能源汽车产业是战略性新兴产业。大力发展以电动汽车为代表的新能源汽车是解决能源环境问题的有效途径,市场前景广阔。但是,电动汽车毕竟是一个新兴的事物,与传统汽车相比,消费者在一些领域,如电池问题,还是存在着一些疑虑,其市场销售需要科学决策。
2 问题分析
针对该问题,首先需要对数据进行数据清洗,应用 Python 的强大的 pandas 处理,找出异常值,利用均值插值法对异常值进行处理,同时将 B7 的空值全部取值为 0。我们将数据分为两个部分,分别是汽车的满意度打分,一个是问卷调查数据,将数据进行处理后,进行均值处理,然后进行满意度分析,最后利用 spss 进行描述性统计分析。筛选出所有有意愿购买电动汽车的客户,然后导入 spss 进行相关性分析得出的相关性,然后根据相关性分析的结果,筛选出 11 个影响因子,然后根据这些影响因子建立基于熵权法的权重分析模型,对影响各品牌销售的进行综合评分,因子的权重越大,则对评分影响就越大,分析各个因子的权重,得出影响各品牌销售的因素。
3 数据清洗与分析
附件中的数据有异常值与缺失值,所以我们需要对数据进行处理。我们首先需要对数据进行数据清洗,应用 Python 的强大的 pandas 处理,找出异常值,利用均值插值法对异常值进行处理,同时将 B7 的空值全部取值为 0。我们将数据分为两个部分,分别是汽车的满意度打分,一个是问卷调查数据,将数据进行处理后,进行均值处理,然后进行满意度分析,最后利用 spss 进行描述性统计分析,可以得出部分异常值如下所示:
4 满意度分析
我们应用 ACSI 模型进行满意度分析,首先构建满意度的数学关系式:
分析 a1-a8 的每列打分的平均值,以及这 8 列的总体平均分,其数学描述如下:
我们应用 Python 进行编程计算得出的结果如下表所示:
根据表 2可得,三个品牌在群众中的满意度分别是 77.45%,77.37%,78.54%,由此可以得出 3 品牌的满意度更高。
5基于熵权法的权重分析模型
本文选用熵权法对一级指标进行权重的确定。首先这十个影响因子的数据,对各个危险因素的重要性进行评价与测度,以熵权法进行权重[4]的计算,主要步骤与计算逻辑如下:
由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要进行标准化处理,即把指标的绝对值转化为相对值,从而解决各项不同质指标值的同质化问题。
另外,正向指标和负向指标数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于正向负向指标需要采用不同的算法进行数据标准化处理:正向指標
6 结论分析
表2可得,a1,a2,B12,B13,B15,B17 等因素是对 Q 存在影响的,则 a1,a2,B12,B13,B15,B17 等因素对不同品牌电动汽车的销售有影响,其中 B17 的权重最大,为 0.46,其影响则为最大。
参考文献:
[1]欧阳元东,基于 Python 的网站数据爬取与分析的技术实现策略[J],电脑知识与技术 . 2020,16(13).
[2]Python 数据分析中的数据整理探讨[J]. 张向伟. 电子世界. 2021(11)
[3]基于 Python 的数据分析[J]. 李俊华. 电子技术与软件工程. 2018(17)
[4]张 虹、庄文英,基于创新能力的小微企业活力指数体系研究[J],Business Management,商业经济研究 2019 年 16 期
[5]张军.算法设计与分析[M].清华大学出版社.2011.8.P100-P215