电子商务客户流失的DBN预测模型研究
2022-06-09周婉婷赵志杰王加迎韩小为
周婉婷,赵志杰,刘 阳,王加迎,韩小为
1.哈尔滨商业大学 计算机与信息工程学院,哈尔滨 150028
2.哈尔滨商业大学 黑龙江省电子商务与信息处理重点实验室,哈尔滨 150028
大数据时代下,电子商务的快速发展使得行业之间的竞争愈发激烈,客户对产品与服务信息获取渠道越来越多,电子商务企业面临着产品同质化严重、同行竞争加剧,从而导致新增客户获取困难、成本增加等行业问题。同时,电子商务市场不同于传统线下市场能获取到稳定客源,客户流失量较高。因此对于电子商务市场而言,维护好留存客户,保持客户忠诚度,降低客户流失率是当前面临的主要问题。电子商务客户流失预测可以帮助商家预测流失趋势,构建适合电子商务数据特性的影响因素指标体系,有针对性地提出挽留措施,提高商家利润,因此,电子商务客户流失预测是电子商务领域的一个重要研究方向[1]。
一般传统线下的客户关系主要靠契约维持,而电子商务中的客户关系属于非契约关系,致使客户流失的可能性增加。针对电子商务非契约的不稳定环境,学者通常将客户流失当作二分类任务,选取当下流行的机器学习模型及其集成方法解决预测精确度问题。然而在上述模型与方法中学者通常使用全数据输入模式进行方法比较从而忽视了不同类型客户的流失预测情况。目前,针对于客户流失原因的研究,学者们遵从Farquhar提出的七大主题处理流失问题,对电子商务客户流失具有的随机性、时变性等变化特性关注不够。
本文将UCI数据库的电子商务零售数据集分为活跃和非活跃用户两类。通过考察电子商务零售的数据特性,结合客户流失相关研究,优化传统RFM理论模型,以构建较为全面的电子商务客户流失因素体系。采用深度信念网络(deep belief networks,DBN)实证模型对电子商务客户流失进行预测,以提升模型预测性能。最后,提取DBN模型的权重矩阵,计算电子商务客户流失影响因素的相对强度,为不同类型电子商务客户流失原因提供合理解释,以便为企业进行客户管理提出有针对性的建议与策略。
1 客户流失相关研究
客户流失预测是利用客户记录的历史数据对潜在的流失客户进行判断的过程[2]。客户流失的研究自20世纪90年代兴起之后便一直深受国内外众多学者的广泛关注。目前,客户流失研究主要集中于电信、金融等行业,而电子商务作为互联网快速发展所衍生的行业,也受到了学者们的青睐。
国内外学者对于客户流失的影响因素和流失的原因进行了大量的研究,Farquhar等讨论了美国银行业的客户获取和客户保持之间的平衡问题,提出客户价值、最大化信息等七个主题是处理好二者关系的基础[3]。Meer等以荷兰某网上银行为研究对象,发现点击流是研究客户保持的较好方法[4]。文献[5]从社交网络的视角出发,利用自我网络的相关理论,在电信行业中,构建了个体的度、联系强度、个体的信息熵三个自我网络特征变量。
根据客户流失发展历程和智能化程度的高低,许多机器学习模型及其集成方法在客户流失预测中得到成功的应用,如决策树[6]、支持向量机[7]、改进神经网络[8]等。文献[9]根据铁路零散客户流失的特征,为提高客户流失的准确性与高效性采取了C4.5决策树方法进行仿真预测。Gordini等利用支持向量机开发出针对B2B电子商务行业量身定制的客户流失预测模型[10]。Amin等针对于不同公开可用的电信技术数据集,基于距离因子的分类器确定性估计概念提出了一种新颖的客户流失预测方法[11]。
综上所述,对客户流失预测模型构建,研究方法多样,但预测模型准确率有待进一步提升。文献[12]为了验证DBN算法在分类上存在更好的性能,使用UCI上的多个数据集进行对比实验,实验结果表明DBN算法比传统的SVM、KNN等神经网络的分类准确度更高。DBN算法是神经网络的一种,既可以用于非监督学习,也可以用于监督学习,因此模型可以不受时间、数据形式等的限制。基于电子商务流失数据集中冗杂的时间数据以及复杂的客户群体之间的特征选取,DBN算法可以运用BP层在预测领域中的优势提升电子商务客户流失预测的准确度,并通过训练其神经元间的权重,可以让整个神经网络按照最大概率来生成训练数据,并直接得到特征之间的权重大小确认电子商务客户流失的影响因素。对客户流失因素选择,学者们大多基于传统电信、银行等线下实体店进行研究,鲜有研究考虑电子商务数据的时效性及客户群体划分情况,探讨电子商务客户差异性带来的影响。因此,本文从客户活跃角度出发,将客户分为活跃与非活跃两类,优化传统RFM模型,确定影响因素指标体系。采用DBN方法构建电子商务客户流失预测模型,并利用DBN模型的权重矩阵,计算权重系数,对比分析不同类型电子商务客户流失因素的差异。以帮助企业尽可能吸引具有潜在价值的客户,提升保留客户的现有价值。
2 电子商务客户流失预测模型构建
2.1 基于改进RFM的电子商务客户流失理论模型构建
在客户关系管理上RFM模型理论是一种重要的客户价值分析模型,1994年RFM模型首次被美国数据库营销研究所Hughes提出[13],被广泛应用于客户关系管理领域中。RFM模型由R(recency)、F(frenquency)及M(money)三个重要指标组成。R表示客户最近一次购买的时间间隔。从企业的角度考虑,最近才购买过产品、服务的客户是最有可能接受再次购买行为的客户,吸引一名购买时间间隔短的客户所花费的成本远小于吸引一名购买时间间隔长的客户。R值越小则表明客户在近段时间内有过交易行为,客户的依赖性较高。F表示客户单位时间内进行的消费次数。对于商家而言,购买的频率越高则表明客户对产品或服务的满意度越高、客户的忠诚度也越高。F值越大,客户再次购买的意向越高。M表示客户在一段时间内消费总金额。对于企业来说,购买金额越高则表示客户的价值越高。M值越大,表明客户最有可能在未来一段时间内产生更高的价值。
考虑电子商务客户冲动购买心理及进入商家的时间长度,结合学者对客户价值的研究,除RFM模型中频率(F)、时间间隔(R)、金钱(M)指标外,还引进了客户购买的最大金额(MM)、进入店铺的时间长度(L)、购买天数(D)以及购买的概率(G)。其中,进入店铺的时间长度指客户在观察期内第一次消费的时间距离客户最后消费时间的长度,概率是指客户在已消费的天数中平均每天购买的次数。本文构建的RFM模型假设如下:
时间间隔(R):客户在观察期间第一次消费的时间距离观察期最后一次消费时间长度(流失期限中);
频率(F):客户在单位时间上购买的次数;
金钱(M):客户在观察期消费的总金额;
最大金额(MM):客户在观察期消费的最大金额;
进入店铺的时间长度(L):客户在观察期后第一次消费时间距离客户最后消费的时间长度;
购买天数(D):客户在观察期总消费天数;
概率(G):客户在观察期内消费的天数中平均每天购买的次数。
RFM电子商务客户流失理论模型见图1。
图1 RFM电子商务客户流失理论模型Fig.1 Theoretical model of RFM e-commerce customer churn
2.2 基于DBN的电子商务客户流失预测实证模型构建
DBN是深度学习方法中的一种常用模型,是一种融合了深度学习与特征学习的神经网络。DBN网络结构是由若干层受限玻尔兹曼机(restricted Boltzmann machine,RBM)和一层BP组成的一种深层神经网络[13]。DBN结构如图2所示。
图2 DBN结构示意图Fig.2 DBN structure diagram
DBN训练过程由预训练和微调构成,数据首先由输入层输入到网络结构中,生成一个向量V,通过权重值W传给隐藏层得到H,单独无监督训练每一层RBM网络,确保特征向量映射到不同特征空间,最后由BP网络接收RBM的输出特征向量作为它的输入特征向量,反向传播网络自顶向下将错误信息传播给每一层RBM,微调整个DBN网络,进行有监督的训练,最终得到网络中的权重以及偏置。
2.2.1 受限玻尔兹曼机
RBM是1986年由Smolensky提出的一种可通过输入数据集学习概率分布的随机生成神经网络。RBM模型是包含一种可观察变量(v)和单层隐藏变量(h)的无向概率图,RBM只有两层神经元,它是一个二分图,两层间的单元相互连接,层内的任何单元之间不存在连接。RBM结构见图3。
图3 RBM结构示意图Fig.3 RBM structure diagram
RBM是一种基于能量的模型,任何两个连接的神经元之间都有一个权重W来表示连接权重Wij,Wij表示可观察变量单元i和隐藏变量单元j之间的权重,观察层与隐藏层分别用v和h来表示,则连接权重与偏差决定的观察层变量v和隐藏层变量h的联合配置能量如下[14]:
其中,ai是可观察层单元的偏置,b j是隐藏层单元的偏置,Wij为可观察层单元与隐藏层单元之间的连接权重,基于能量函数的可观察层和隐藏层可以得到概率分布[15]:
其中,Z为配分函数的归一化常数,即所有参数下的能量之和,该函数累加所有可观察向量和隐藏向量的可能组合。
RBM中的每层中的神经元只存在两种状态0或1,给定任意层中的各神经元的状态,可以得到可观察层神经元和隐藏层神经元的状态概率如下[14]:
根据Hinton在2002年提出的对比散度,可知参数的变化规则如下[14]:
2.2.2 BP神经网络
BP神经网络是一种多层的前馈神经网络,其输出结果采用的是前向传播,误差采用反向传播方式进行的。BP神经网络是含有输入层、隐藏层和输出层的三层神经网络结构[16]。具体如图4所示。
图4 BP神经网络结构图Fig.4 BP neural network structure diagram
BP神经网络由上一层神经元连接到下一层神经元时可以接收到上一层神经元传递来的信息,并经过“激活”将接收到的值传递给下一层。对于误差的反向传播是从下一层神经元传递给上一层神经元,一次性调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置。
3 实验结果及分析
本文主要运用拐点理论确定流失期限,利用客户购买天数确定个体的活跃度阈值,将其分为活跃与非活跃用户两类。对数据进行集成、归一化等预处理操作,提升数据质量。优化RFM模型,确定影响因素,结合DBN方法,构建活跃与非活跃客户的流失预测模型。着重分析活跃客户流失及非活跃客户不流失的影响因素权重大小,提出挽留建议措施,进而帮助企业更好地进行客户关系管理,增强客户依赖性,减少客户流失,获取更大的利润。电子商务客户流失预测流程主要包括3个步骤:数据来源及预处理,优化RFM模型和DBN模型的客户流失模型构建及影响因素权重计算。具体如图5所示。
图5 电子商务客户流失预测流程图Fig.5 Flow chart of e-commerce customer churn prediction
3.1 数据来源与预处理
3.1.1 数据来源
本文数据集来自于加利福尼亚大学机器学习UCI数据库(http://archive.ics.uci.edu/ml/datasets.php),数据集中包含2010年12月至2011年12月(包括这一个月)真实的在线零售客户数据。一共包括7个原始数据属性,主要由客户标号、商品单价、购买数量、生成交易的日期等组成。从该数据集中首先删除2010年至2011年期间只存在一次购买行为的客户数据,其次选取真实进行在线零售的840位客户进行电子商务客户流失研究。
针对结构化的数据所存在的缺失值、数据噪声、标准不规范等问题,本文对原始数据采取数据清洗、集成等预处理操作。将840位客户都存在首次购买行为的时间段设为观察期,根据数据集可知本文研究客户流失的观察期为2010年12月到2011年3月,共计4个月。在观察期间内将同一客户不同时间段购买的多条数据整合成一条数据,将原始数据中的157 510条数据整合成840条数据。通过整合变换原始数据集中的属性生成新的属性维度,如一位客户在观察期内存在n天不同的数据,则这位客户的购买天数为n;在观察期内这位客户的最终购买时间减去最初购买时间得到客户购买的时间间隔;在观察期内购买天数中购买的最大金额为最大金额等。具体维度介绍见2.1节。数据集最终选取共840名客户进行实验。电子商务零售业部分数据集如表1所示。
表1 电子商务零售业部分数据示例Table 1 Some examples of e-commerce retail data
3.1.2 客户流失期限确定
客户流失期限的确定一直是电子商务客户流失关注的问题,电子商务客户流失管理是基于非契约的客户关系,客户未与商家签订契约,存在着随时进入市场随时退出市场的可能。对于电子商务的客户而言,电子商务的客户消费习惯存在着周期性,当客户首次消费之后,存在着一段时间的无消费周期,但在未来的某一时间若还会出现消费行为,则代表客户回购,若未出现消费行为,则代表客户没有回购,客户彻底流失,其中首次购买后无消费的周期则为流失期限,具体见公式(8):
客户流失期限的长度与客户的回购率成反比,本文设定了不同时期的流失期限长度进行客户回购率的统计,并观察客户回购率随客户流失期限的增大时的收敛速度,本文以“月”为单位设定流失期限,根据不同流失期限回购率的变化曲线,使用拐点理论进行流失期限的设定,如图6所示。
图6 流失期限与回购率示意图Fig.6 Schematic diagram of churn period and repurchase rate
拐点理论是指X轴上的数值增大时Y轴上的数值随之变化,直到到达某个点时,Y轴变化的程度明显减少,则称为“拐点”。由图所知,随着流失期限增大,用户回购率一直降低。当流失期限为4个月时,回购率降低幅度明显减小。因此,设置4为拐点。
根据拐点理论知,客户流失期限为4个月,具体表现在2010年12月至2011年3月之间有过购买行为,且连续4个月间未发生购买行为的客户,称之为客户流失。
3.1.3 客户活跃阈值确定
选取2010年12月到2011年3月份的所有客户的数据,统计这4个月中消费者消费的天数,绘制漏斗图,具体如图7所示。
图7 客户活跃漏斗图Fig.7 Customer active funnel diagram
运用客户购买的天数这个属性加以漏斗图与其转化率可以解决客户是否活跃的问题。如图所示,购买天数大于等于3天的时候,转换率大于50%,且与购买天数大于等于4天的转换率差别不大,所以确定活跃的购买天数为3天及以上,将数据分为了活跃与非活跃两大类,活跃用户为购买天数大于等于3天的客户群体,非活跃用户为购买天数小于3天的客户,将数据集划分成活跃用户群体380位,非活跃客户用户460位。
3.1.4 数据归一化
基于活跃与非活跃用户的数据存在稳定的标化趋势,并未具有极端的最大值与最小值。为了确保数据的有效性,将整合的数据经过活跃划分后进行最大最小值标准化处理,使得数据便于比较。对原始数据进行了收缩转变,让数据转换成区间[0,1]中的值,其中属性的最大值为max,最小值为min,X′为X标准化之后的值,公式如下[17]:
3.2 DBN实证模型参数及结构设定
根据DBN流失预测模型的构建,将活跃用户数据集中380位客户以及非活跃用户数据集中460位客户导入各自的模型中,运用Matlab工具,得出活跃用户数据集模型的精确率为93.16%,非活跃用户数据集中的模型的精确率为78.7%。分别得到7×13×2的网络结构以及7×7×2的网络结构。
3.2.1 DBN实证模型参数选择
DBN模型是一种生成型的神经网络模型,其组成部分包括三层即输入层、隐藏层和输出层。客户流失模型中将优化后的7个指标作为输入层的神经元节点数,输出层神经元节点数就是目标是否流失。其中X1为时间间隔(R)、X2为客户进入商家的时长(L)、X3为购买频率(F)、X4为购买概率(G)、X5为消费总金额(M)、X6为最大消费金额(MM)、X7为消费天数(D);y1为客户流失、y2为客户非流失。
DBN模型隐藏层的选择至关重要。增加隐藏层可以适当地降低网络误差,提高精度,但同时会使得网络复杂化,增加了网络的训练时间导致出现“过拟合”的倾向。因此,本文设置1层隐含层进行训练。
将优化得到的RFM模型中的7个指标作为输入层输入到DBN网络结构中,可知DBN输入节点数n为7,输出类别l为2,根据Kolmogorov定理[18]计算隐藏层神经元个数m,公式如下:
通过公式可确定隐藏层节点数m=[4,5,6,7,8,9,10,11,12,13],对两组数据分别训练DBN模型,共2×10组实验。通过活跃与非活跃数据集实验结果对比确定单层隐藏层节点数。
客户流失函数设置为隐层和输出层神经元激活函数。DBN可分批次进行训练,每批次训练数据由训练集样本数和训练批次共同决定,即每批次训练数据为训练集样本数据与训练批次的比值,对于活跃与非活跃的数据集来说,数据样本不同,则每批训练数据不同,活跃数据集的每批训练数据为95次,非活跃数据集每批训练数据为115次,最大网络循环次数为1 000次。学习率的值设置为1,动量因子的值设置为0,这些值包含在RBM训练参数中。BP训练参数包括学习率,其值设置为2,动量因子,其值设置为0.9。将两组预处理后的数据集按1∶1的比例分成训练集与测试集输入DBN模型中。
3.2.2 DBN实验结果分析
设置并调整参数后,构建优化RFM与DBN电子商务客户流失预测模型。活跃用户的DBN实验结果如表2。
表2 活跃用户DBN实验结果Table 2 DBN experiment results of active users
从表2中可知,在活跃用户中DBN隐藏层为13层时,实验误差最小,准确率最高达到93.16%;由表中可知将活跃用户的单层隐藏层节点数设置为13时,实验结果最佳。输出层为流失与非流失,得到一个7×13×2的网络结构图如图8所示。
图8 活跃用户DBN结构Fig.8 DBN structure of active users
从表3中可知,在非活跃用户中DBN隐藏层为7层时,实验误差最小,准确率最高达到78.7%;由表中可知将非活跃用户的单层隐藏层节点数设置为7时,实验结果最佳。得到一个7×7×2的网络结构如图9所示。
表3 非活跃用户DBN实验结果Table 3 DBN experiment results of inactive users
图9 非活跃用户DBN结构Fig.9 DBN structure of inactive users
3.2.3 DBN与其他预测方法对比
为进一步验证DBN模型对活跃客户细分的电子商务客户流失预测模型的准确度,本文运用了随机森林、SVM、贝叶斯神经网络以及BP神经网络四种预测方法进行了对比分析。具体实验结果如表4所示。
表4 五种预测模型的准确率Table 4 Accuracy of five prediction models %
由表4可知,对于活跃用户群体细分后的预测准确率方面,DBN预测模型无论是活跃用户还是非活跃用户的准确率都高于随机森林、SVM以及BP神经网络。而对于贝叶斯神经网络而言,DBN预测模型中活跃用户的准确率远高于它,但对于非活跃用户群体来说贝叶斯神经网络的准确率略高于DBN模型。综合活跃与非活跃用户客户流失模型的准确率,DBN模型相比于经典的流失预测模型而言更加有效。
3.3 电子商务流失客户影响因素权重分析
经由DBN预测电子商务的客户流失可以评估每个输入变量与输出变量之间的关系,得出每个变量之间的权重值,可由以下公式直接得出每个输出层变量的最终权重[19]:
其中,Wki表示第k个隐藏单元和第i个输入单元之间的权重;W jk表示第j个输出单元和第k个隐藏单元之间的权重。RS ji是第i个输入变量和第j个输出变量之间的相对强度。
本文主要研究活跃客户的流失,非活跃客户的非流失原因,故运用RS ji统计量计算优化后的RFM模型中各变量权重,活跃用户中影响客户流失的各因素权值如表5所示;对于非活跃用户中影响客户未流失的各因素权值如表6所示。
表5 活跃用户中影响客户流失的因素权重Table 5 Weights of factors affecting customer churn among active users
表6 非活跃用户中影响客户未流失的因素的权重Table 6 Weights of factors affecting customer churn among inactive users
根据表5可知,活跃客户中的流失与购买频率、消费天数、最大消费金额、消费总金额、客户进入商家的时长以及客户购买概率成反比。根据影响因素权重的大小可知,消费总金额是影响活跃客户流失的最主要因素,权重最大为0.147 9;其次为客户的消费频率,权重为0.134 5;第三为客户进入商家的时长,权重为0.116 3。其余四个影响因素的重要程度排名依次是客户的最大消费金额、客户的购买概率、客户的消费天数和客户购买的时间间隔。
对于优化的RFM模型中同是表示时间间隔的客户购买时间间隔以及客户进入商家的时长而言,活跃客户群体更关注的是客户进入商家的时长,对电子商务客户而言,客户可以随时进入商家的店铺,也可以随时流失。但对活跃的客户群体来说,客户进入商家的时长(L)权重系数为负,表明了进入商家时长越长的活跃客户,则对商家存在一定的依赖性,时间越长忠诚度越高,则客户越不容易流失。对于模型中同是表示频率的购买频率与购买概率而言,负向影响活跃客户的流失,说明频率对于活跃客户的流失存在抑制作用,因为购买频率越频繁则减少了客户转移商家的风险,节省了转移成本,在活跃客户购买频率越高,依赖性越强的情形下,客户就自动减少成本,以至于减少流失。就模型中表示金额的消费总金额与最大消费金额而言,对于活跃客户的流失存在显著影响,消费总金额(M)的权重最大,系数为负,因此对于活跃客户来说其流失的最大影响因素为消费金额。消费总金额越大说明了客户对于商店的满意度越高,信赖度越高,对商家建立了一定的客户忠诚,有利于商家保持活跃客户。
对企业而言,活跃客户是企业的核心客户,但活跃客户中依旧存在着流失现象。帕累托原则表示,不同价值的客户对企业的利润贡献度不同,企业80%的利益来源于20%有价值的客户。为挽留活跃用户中流失的高价值的客户,由分析结果可知,企业应首先关注活跃客户中客户的总购买金额、消费频率以及进入商家的时长。基于上述因素,为挽留客户,企业首先应对流失客户提出个性化金融服务,刺激其消费并提高购买总金额,其次,对客户进行会员等级登记,根据会员等级的高低推出个性化商品折扣促销,保持流失客户的消费频率。
根据表6可知,非活跃用户中的未流失客户与购买频率、消费天数、消费的最大金额、消费总金额以及购买概率成正比,与客户购买的时间间隔成反比。根据表中权重大小可知,购买频率是影响活跃客户流失的最主要因素,权重最大为0.758 1;其次为客户购买的时间间隔,权重为0.069 2;第三为消费天数,权重为0.048 7。其余四个影响因素的重要程度排名依次是客户消费总金额、客户进入商家的时长、客户消费最大金额和购买概率。
在非活跃客户研究客户非流失问题中对于优化的RFM模型中对比同是时间因素的客户购买的时间间隔、客户进入商家的时长和消费天数,可知对于非活跃客户而言,影响客户非流失的显著影响因素为客户购买的时间间隔和客户消费天数。其中客户购买的时间间隔(R)负向影响非活跃客户的非流失,客户消费天数(D)正向影响非活跃客户的非流失,说明了在非活跃客户群体中,客户购买的时间间隔越短,消费天数越多,其非流失率越高。就模型中表示频率的客户购买频率和客户购买概率而言,虽两者都正向影响客户的非流失率,但是对比权重大小可知,就频率因素而言,客户购买频率(F)显著正向影响非活跃客户的非流失率。对于模型中表示金额的消费总金额以及最大消费金额而言,两者对非流失率都存在正向影响,但对比两者权重大小可知,消费总金额相对而言影响强度大于最大消费总金额。而对于最大消费金额而言,非活跃客户存在一定的冲动消费,在冲动消费期间客户对商家存在短暂的客户满意,在此段时间过后,客户存在着流失的风险,故对于非活跃用户而言客户的非流失率并未特别关注客户的金额因素。在非活跃客户群体中,对于购买频率越高、时间间隔越短、消费天数越多的这类潜在有价值客户可期发展成活跃客户。
对企业而言,非活跃客户群体中的非流失客户是企业的潜在有价值客户。根据Rosenberg和Czepiel对客户价值的调查研究报告可以得出,开发一个新客户所需的花费,相比较对于一个老客户的维护费用,前者是后者近六倍的成本[20]。对于发展这部分潜在有价值客户,由结果分析可知,企业应该关注非活跃用户中客户购买频率、客户购买的时间间隔以及客户消费天数。企业对这类客户,刻画其用户画像,了解客户的偏好,采取有针对性地对其推送感兴趣商品的措施,提高其购买频率以及购买天数,以期发展为活跃客户。
4 结语
根据Reicheld的研究可知,如果能够将客户的流失率降低5%,就会给企业带来至少1/4的利润增长[21]。一个有价值的老客户比一个新客户对于商家而言,利益更大。本文针对传统客户流失预测模型全数据导入的局限性,提出了一种优化RFM理论模型与DBN实证模型,预测电子商务客户流失情况,研究活跃客户流失及非活跃客户未流失的影响因素。实验结果表明:(1)本文考虑到电子商务数据时变性特点及电子商务客户本身的不稳定性,优化了传统的RFM模型,构建了更全面的电子商务客户流失影响因素指标体系,探讨了各影响因素的重要性。(2)通过实证研究,对比分析5种客户流失预测模型,DBN模型原理清晰,准确率高、效果好,在电子商务客户流失预测模型中凸显出较好的优势。(3)本文基于活跃用户流失和非活跃用户不流失的独特视角,对比分析了不同类型用户的影响因素,探讨了用户差异造成的影响,为企业针对不同类用户制定有效的管理策略提供参考,进而提升客户忠诚度,获得企业利益。