带缺失值的顾客满意度指数的测评

2013-09-03赵富强

统计与决策 2013年14期

关键词：补法均值权重

赵富强

（天津财经大学，天津 300222）

带缺失值的顾客满意度指数的测评

赵富强

（天津财经大学，天津 300222）

文章通过对国内外顾客满意度指数模型的对比及我国的现状分析，提出顾客满意度指数测评的拓展模型，模型对感知质量潜变量细化为感知产品质量和感知服务质量。在此基础上对带缺失值的顾客满意度指数测评步骤进行研究。针对该拓展模型，基于均值插补法，提出一种新的缺失值处理方法－分类均值插补法，该方法先对被调查对象问卷中的满意度字段按照分值进行分类，然后对同类中的缺失值用该类的平均值替代。

顾客满意度；PLS算法；缺失值；均值插补

0 引言

瑞典、美国、欧洲、挪威等国家相应建立了自己的顾客满意度指数测评模型最具代表性为SCSB、ACSI和ECSI[1]。国内对指数模型的研究起步较晚，虽然也提出了几种顾客满意度指数模型，但未考虑不同行业应用不同的测评模型，未能对模型中的潜变量感知质量进行细化；同时，在进行顾客满意度调查时，研究人员得到的实际数据往往存在丢失的问题，很少有学者考虑对缺失值进行处理。缺失值表现为三种方式[2,3]：单变量缺失、单调缺失型和任意缺失型。缺失值的处理方法主要包括删除法、插补法和最大似然估计法[4]等。在文献[5]中，Lohmöller’s PLSX对缺失值的处理采用了删除法和均值插补法。不同的缺失值处理方法各自的优缺点和适用范围，哪种方法适合顾客满意度指数测评模型也值得深入研究。

1 顾客满意度指数测评拓展模型构建

顾客满意度指数测评拓展模型中包括七个潜变量：顾客期望、感知质量、感知价值、顾客满意度、顾客抱怨、顾客忠诚和企业形象。企业形象为外生变量，其余的六个潜变量为内生变量，顾客满意度测评拓展模型的路径图如图1所示。其中：ξr潜（隐）变量，ξ6为潜自变量（外生变量），其他为潜因变量（内生变量）；xrt为显变量（观测变量，r=0,1,2,3,4,5,6），即为ξr的指标，t为潜变量对应观测值的个数(t=1,2…kr，kr为第r个潜变量对应观测值的个数)；LXr分别为潜变量ξr的PLS估计值。

顾客满意度指数测评的一级指标为上述的七个潜变量，各个潜变量对应的显变量为二级指标，三级指标定义为问卷中二级指标对应的各个问题，顾客满意度测评指标体系见表1。

图1 顾客满意度测评拓展模型路径图

表1 模型中的潜变量与测度指标

2 求解带缺失值的顾客满意度指数

顾客满意度指数模型中，ξr为潜（隐）变量，ξ1为潜自变量（外生变量），其他为潜因变量（内生变量）；xrt为显变量（观测变量，r=0,1,2,3,4,5），即为ξr的指标，t为潜变量对应观测值的个数(t=1,2…kr，kr为第r个潜变量对应观测值的个数)，LXr分别为潜变量ξr的PLS估计值。

求解带缺失值的顾客满意度指数步骤如下：

⑴异常值处理

所谓异常值是被调查顾客在回答问卷时，由于各种原因而选择了“不知道”、“拒绝回答”以及“超出数值范围”等选项时系统默认的值。问卷采用10分制，从1分到10分供被调查者选择，且只能选择一个。对被调查者不知道或拒绝的回答，在数据库里进行了标识（98表示不知道；99表示拒绝；101表示从来不购买）。这些数据在进行处理时按照缺失值处理。

⑵数据标准化

使得样本值的均值为0、方差为1；

⑶缺失值处理

首先对数据库里面的缺失值（在数据库里标记为NaN）用0代替；然后，如果一个潜变量对应的全部显变量样本值都缺失，那么该样本无效，即估计该潜变量时采用成对删除法；如果一个潜变量对应的显变量样本值部分缺失，那么缺失值的处理采用“分类均值插补法”。该插补方法通过对被调查对象问卷的分值分析，选取满意度字段进行分类，满意度的分值从1到10分，共分为十个类别，同类中的缺失值进行均值插补。分类均值插补法与均值插补法均方根误差如表2所示[8]，通过实证得出分类均值插补法优于均值插补。

表2 预测结果与实际数据的均方根误差

⑷利用PLS算法反复迭代得到潜变量估计值

需要指出的是，含多个潜变量结构方程模型的块结构设定原则是假定块内每个指标分别与对应的潜变量存在线性关系。模型设定详细步骤在此不在给出。

其中，πrt为指标 xrt的载荷系数(测量模型系数)，εrt为残差，πrk0为截距值。

含多个潜变量结构方程模型的内部关系设定原则是内部关系应该构成一个线性因果链系统。

νr为残差；权重关系利用信息交换过程中的部分信息估计潜变量值。任何一个潜变量均可以通过其指标变量的加权和来估计，而权重则由所选择的权重关系来确定。对路径模型中潜变量ξr的符号权重和定义为Ur。假设与ξi邻接的潜变量是ξj。

PLS算法求解步骤如下：

步骤1：迭代估计权重和潜变量，从步骤4开始，循环执行①至④，直到满足迭代条件；

步骤2：①内部权重

步骤3：估计路径系数和载荷系数

步骤4：估计定位参数。

至此，整个PLS算法求解完成。

⑸求出顾客满意度指数

根据第四步求得的权重系数，计算出顾客满意度指数。

3 顾客满意度测评拓展模型应用及评价

3.1 拓展模型应用及评价

以某汽车公司为研究对象，顾客满意度测评拓展模型包含7个潜变量：顾客期望ξ0、感知质量ξ1、感知价值ξ2、顾客满意度ξ3、顾客抱怨ξ4、顾客忠诚ξ5和企业形象ξ6，17个显变量；数据的收集采取网上调查的方式进行，参与网上调查的用户为225位，因此样本量为225。x52表示价格敏感度，包括两部分：价格上涨和价格下降，x52最后取值价格上涨+25或价格下降－25；表中的98、99、101用符号“NaN”替换，表示缺失数据；对原始数据标准化处理，设定权重迭代条件的初始值。最后求出顾客满意度指数值。由上求出PLS路径模型的各项参数后，下面对该模型的合理性进行评价。模型评价主要分为对测量模型的评价和结构模型的评价，前者包括信度分析、效度分析，后者主要是对路径系数的分析。对七组变量分别做主成分分析，求得的第一主成分特征值大于1和第二主成分特征值小于1；C.alpha、DG.rho都大于0.7，七组变量的单一纬度检验都显然通过，符合单一纬度条件。测评标准化因子负荷处于0.63-0.82之间，所有概念的AVE值都处于0.74-0.92之间，均大于0.5，这表明本文所设计的量表具有良好的内敛效度。各解释潜变量对其相应的潜变量的R2值均大于0，表示模型具有一定的解释能力，可接受。模型的拟合优度用GoF=0.7，表明该模型的拟合效果可以接受。

表3 权重最终迭代结果

表4 权重最终迭代结果

通过对迭代过程中权重系数ω的计算结果分析可以得出：只要权重的初始值不全为0，最终迭代结果就不会受到影响；只要调查样本相同、迭代中止条件相同，即使初始权重ω的值不同，但在第四次迭代时权重已经收敛于一定数值；也就是说整个迭代过程是收敛的，不同的权重初值可能会影响迭代过程中的权重值和迭代次数，但最终的迭代结果是相同的。基于Java开发的SmartPLS软件包括三种权重模式：质心、因子和路径[6,7]，处理同样的样本到收敛的迭代次数分别为9、13和13，本系统仅需要5次。因此，基于PLS路径模型的顾客满意度测评系统提高了对模型分析处理速度；在结构模型系数、潜变量估计值相关系数、权重系数及测量模型系数等方面与SmartPLS具有一致性。

3.2 拓展模型测评结果

通过测评系统分析计算，可以得到各潜变量之间的标准化路径系数，如表4所示。

由上述实证分析及评价各参数结果，网上调查网民对该食品公司的顾客满意度产品具有以下特点：

（1）顾客满意度与感知质量、感知价值、企业形象和顾客期望都是正相关。但感知质量对顾客满意度的相关性最强0.6171，其次为感知价值0.2997和企业形象0.2183。说明使得用户对该公司产品满意的首要任务是提高产品的质量，其次是产品的价格；顾客期望对顾客满意度的影响不大。

（2）顾客满意对顾客忠诚直接影响β53=0.6888，间接影响为β43β54=0.07132，表明顾客满意对顾客忠诚度间接影响不大，而直接影响很强。

4 结论

通过对国内外顾客满意度指数模型的对比及我国的现状分析，提出了顾客满意度测评的拓展模型；模型对感知质量潜变量进行了细化，分为感知产品质量和感知服务质量。基于该拓展模型，可以对既提供产品也提供服务的企业（例如：汽车公司或家电企业等）进行带缺失值的顾客满意度指数测评；基于均值插补法，提出分类均值插补的缺失值处理方法，该方法较均值插补法有效；最后，以某汽车公司为研究对象，对构建的顾客满意度测评拓展模型进行实证分析和评价，验证了模型的信度、效度和适合度等，测评结果是满意和有效的；但论文提出的缺失值处理方法仅与均值插补法进行了比较，未能考察其他缺失值处理方法，这是今后需要进一步研究的内容。

[1]Fornell C.，刘金兰.顾客满意度与ACSI[M].天津：天津大学出版社，2006.

[2]Wang Q H,Rao J N K.Empirical Likelihood for Linear Regression Models under Imputation for Mossing Response[J].The Canadian Journal Statistics,2001,29.

[3]Allison,Paul D.Missing Data Techniques for Structural Equation Mod⁃els[J].Journal of Abnormal Psychology,2003,112.

[4]Fatukasi,O.Kittler,J.Poh,N.Estimation of Missing Values in Multi⁃modal Biometric Fusion[J].Biometrics Theory Applications and Sys⁃tems,2008.

[5]Tenenhaus,M.,Vinzi,V.E.,Chatelin,Y.M.,Lauro,C.PLS Path Model⁃ing[J].Computational Statistics and Data Analysis,2005,48(1).

[6]Lohmöller,J.-B.Latent Variable Path Modeling with Partial Least Squares[M].Heidelberg：Physica-Verlag,1989.

[7]Ringle,C.M.,Wende,S.,Will,A.SmartPLS-Version 2.0.Univer⁃sität Hamburg[Z].Hamburg,2005.

[8]MohammadMehdiPourhashem,ManouchehrKelarestaghi,Mir Mohsen Pedram.Missing Value Estimation in Microarray Data Using Fuzzy Clustering and Semantic Similarity[J].Global Journal of Com⁃puter Science and Technology,2012，10(2).

F275

1002-6487（2013）14-0025-03

国家自然科学基金资助项目(70672027)

赵富强（1974-），男，河北涉县人，博士研究生，讲师，研究方向：信息管理与信息系统。

（责任编辑/亦民）