APP下载

社会网络意见领袖对客户间接价值的影响

2017-10-10潘蕊周静关蓉

商业研究 2017年9期
关键词:意见领袖社会网络回归分析

潘蕊 周静 关蓉

内容提要:从社会网络理论出发,通过对国内某移动通讯运营商提供的用户之间通话和短信数据以及消费记录的分析,提炼出用户通话网络与短信网络的结构特征,对网络结构变量进行主成分分析与聚类分析,并将现有客户分为不活跃用户、中等活跃用户和意见领袖,将客户的价值分为直接价值与间接价值,探究意见领袖对客户间接价值的影响。回归分析表明意见领袖的作用主要体现在提升客户间接价值上,其个人消费金额(直接价值)与其他消费者并无显著差异。但是,由于其在网络中所处的地位和活跃程度,使得与意见领袖间接联系的消费者的消费金额有了显著提高。这一研究结论表明衡量客户价值应以个人的消费额度为基础,而且一个客户的价值还应该包含他的社会关系价值;为了稳定广大客户长期在网,通信服务业要注重对意见领袖的识别和维护,他们具有加固网络联系的作用。

关键词:社会网络;客户间接价值;意见领袖;主成分分析;聚类分析;回归分析

中图分类号:F272;C939 文献标识码:A 文章编号:1001-148X(2017)09-0028-05

收稿日期:2017-03-16

作者简介:潘蕊(1985-),女,辽宁大连人,中央财经大学统计与数学学院副教授,经济学博士,研究方向:高维数据分析、网络结构数据统计建模;周静(1989-),本文通讯作者,女,哈尔滨人,中国人民大学统计学院讲师,管理学博士,研究方向:客户关系管理、社会网络分析;关蓉(1985-),女,南宁人,中央财经大学统计与数学学院讲师,管理学博士,研究方向:复杂数据分析。

基金项目:国家自然科学基金青年项目,项目编号:11601539;国家自然科学基金重点项目,项目编号:11631003;中央高校基本科研业务费专项资金“中央财经大学科研创新团队支持计划”资助;中国人民大学新教师启动基金项目,项目编号:17XNLF08。

随着社交媒体(如Facebook,Twitter,WeChat等)的蓬勃发展,每个人都处于不同的社会网络(social network),扮演着不同的社会角色,而且与网络中的其他人有着各种各样的联系。由大大小小的网络所构成的社会,不仅包括网络中的个体(node),还有这些个体之间的相互关系(relationship),社会网络中的个体通过某种关系相互联系,个体间的关系是网络中资源传递的枢纽[1]。对通信运营商来说,用户无疑是最重要的资产。本文所要研究的问题是基于移动电话用户的通信行为,主要是如何识别高价值用户,并且保留住这部分用户;如何通过分析用户在网络中的地位对其通信行为的影响而识别出具有价值的客户,并最终在客户管理层面给通信运营商提供一些建议。

一、研究数据的选取与网络结构变量

消费者的偏好和决策不是独立形成的,而是会受到其他消费者的影响,无论这种影响是正面的或是负面的,都会对消费者的决策以及后续的选择起作用[2]。社会网络分析方法中有很多刻画网络特征的指标,通过对这些指标的分析可以更好地理解网络中个体之间的联系。

(一)数据介绍

本文的数据由国内某移动通讯运营商提供,研究的个体全部来自该运营商的客户,他们是来自国内某大学同一学院的学生,样本量为n=104。数据当中记录了这些个体在一个月的电信消费金额(单位:元),主要是由通话和短信所产生的费用构成,记为Yi,i=1,…,104。图1是消费金额的直方图,从中可以看到有两个个体的消费金额超过了150元,大部分个体的消费金额集中在50元附近,我们将消费金额视为客户的直接价值。

除了消费金额,还记录了这些消费者在当月每天互相通电话和发短信的行为,这部分数据被用于构建本文研究的网络结构。本文构造了两个矩阵:X1和X2,它们都是104×104维的矩阵,分别代表通话和短信网络。所有符号的上标都用来区分两个网络,1代表通话网络,2代表短信网络。如果在当月用户i给用户j打过电话,那么X1ij=1,否则X1ij=0。如果用户i给用户j发过短信,那么X2ij=1,否则X2ij=0。为了方便起见,让X1和X2的对角元素都等于0,这样的矩阵称为邻接矩阵或者关系矩阵(adjacency matrix)。注意到X1和X2可以是非对称的矩阵,这意味着尽管用户i给用户j打过电话,但是用户j并不一定给用户i打过电话,两个网络的结构是存在一定差异的。

图1 消费金额直方图

(二)网络结构变量

为了描述每个个体在两个网络中所起到的作用以及所处的地位,现在介绍各种网络变量的基本概念和计算方法。

1.点(node,individual,actor):网络中的每个个体被称为一个点,数据中的每个消费者都是一个点。

2.边(edge,relationship):當网络中的某两个个体产生了某种联系之后就形成了一条边,如果个体i给个体j打过电话,相应的X1ij=1,他们之间就存在一条边,也就是说他们之间产生了“打电话”关系,值得注意的是边是有方向的。

3.点的度数(degree):对于非对称邻接矩阵来说,点的度数分为输出度数(out-degree)和输入度数(in-degree)。简单来说,个体i的输出度数就是以i为起点的边的数量,其输入度数就是以i为终点的边的数量。以通话网络为例,个体i的输出度数就是i给多少人打了电话(即呼出电话数),其输入度数就是多少人给他打了电话(即呼入电话数),可以利用邻接矩阵非常容易算出每个个体的输出和输入度数。以通话网络为例,个体i的输出和输入度数分别为:

D1Oi=∑j≠iX1ij,D1Ii=∑j≠iX1ji。

如果某一个体的输出和输入度数都为0,可称其为孤立点,因为他与网络中的其他个体没有任何联系。输出度数大的点被称为信息的发送者,而输入度数大的点被称为信息接收者。度数越大的点在网络中越活跃,因为他与网络中的很多个体都会有直接的联系,从而在网络中可以起到非常重要的作用。类似的,也可以在短信网络上定义输出和输入度数。endprint

4.网络的密度(density):网络密度就是这个网络中所观测到的边的数量与这个网络可能形成的所有的边的数量的比值,这个数值介于0到1之间,密度越大说明网络中个体的联系越紧密,可以通过计算网络的密度而对网络中个体联系的疏密程度有一个大概地了解。

5.点的接近中心度(closeness centrality):从一定程度上,点的度数反映了每个个体在网络中的活跃程度,度数大的点更有可能处在网络的中心位置,起到传递信息的重要作用。但是,在计算某个点的度数时只考虑与这个点有直接联系的那些点属于衡量点局部性质的统计量,而点的接近中心度考虑了每个点能够到达的所有的点更接近全局的概念。

假设从个体i出发经过一些没有重复的点还有边,能够到达个体j,他们之间便形成了一条路径。值得注意的是从i到j可能存在不止一条路径,每条路径都可以计算其长度,也就是这条路径包含的边的数量。我们将最短路径的长度定义为从i到j的距离,记为dij。对于个体i,将他能够到达的点的数量记为Ii。点的输出接近中心度(out-closeness centrality)的一种定义如下(以通话网络为例):C1Oi=I1i/(n-1)∑j≠id1ij/I1i。

仔细观察接近中心度的公式,发现分子是个体i能够到达的人的数量占总人数的比,分母是个体i到能够达到的人的平均距离。类似的,将能够到达个体i的点的数量记为Ji,仍然以通话网络为例可以得到输入接近中心度的公式(in-closeness centrality):C1Ii=J1i/(n-1)∑j≠id1ji/J1i。

同理,每一个体在短信网络中的输出(输入)中心度的公式分别为:

C2Oi=I2i/(n-1)∑j≠id2ij/I2i,C2Ii=J2i/(n-1)∑j≠id2ji/J2i。

如果Ii(或者Ji)取值为0,也就是个体i不能到达任何其他个体(或任何其他个体无法到达个体i),相应的输出(输入)接近中心度取值为0。注意到,输出(输入)接近中心度最小取值为0,最大取值为1。接近中心度越大的个体,到达其他点(或其他点到达他)的平均距离就越短,说明他与其他个体互相传递信息的效率越高。因此,点的接近中心度在一定程度上反映了个体在网络中的中心地位。

6.中间中心度(betweenness centrality):网络中有很多的点并不能直接相连,而是需要经过某些路径到达彼此,处于路径上的点在一定程度上起到了某种控制和传递作用。如果某个点处于很多路径上,说明其他的点之间的联系依赖这个点,那么其在网络中有很大的影响力,处于非常重要的中心地位,我们视这种点为“中介”。点的中间中心度就能够帮助我们很好地衡量这种影响力。这里采用最常用的Freeman(1979)[3]的定义,用j和k代表两个不同的个体,gjk表示从j到k的最短路径的条数。现在考虑另外一个个体i,如果i处于j到k的最短路径中,我们说j到k的最短路径经过i,用gjk(i)表示最短路径中有多少条是经过i的,那么个体i的中间中心度定义如下(以通话网络为例):

B1i=∑j≠kg1jk(i)/g1jk。

类似的,我们可以定义短信网络中个体的中间中心度,B2i=∑j≠kg2jk(i)/g2jk。这样定义的点的中间中心度取值在0和n-1(n-2)之间。如果取值为0,说明某个点没有在任何最短路径中出现。如果取到最大值,说明某个点出现在所有其他点的最短路径中。在下文中所报告的都是标准化的中间中心度,中间中心度越大的点越有可能决定着网络中信息的传递的方向和效率,它们在网络中也就处于非常重要的地位。

在定义了以上变量之后,现将这10个变量的描述统计列在表1当中。从表1可以得到以下结论:第一,对于输出和输入度数来说,通话网络较比短信网络在5个度量上的取值都要偏小。例如通话网络的输出(输入)度数的均值是455,而短信网络的相应的取值是696,这说明个体在短信交流方面要比通话更为频繁。第二,类似的,对于输出(输入)接近中心度来说,也能观察到类似于输出(输入)度数的结论,这都说明该样本的个体在短信网络的表现更为活跃。第三,对于中间中心度来说,短信网络的中间中心度的最大值要高于通话网络,但均值和中位数相对较低。

二、数据的主成分分析

在进行主成分分析之前先将10个变量进行标准化,使得每个变量的均值为0,方差为1,这样做相当于使用相关系数矩阵来进行主成分分析。在选取主成分个数的时候使用Kaiser准则,保留特征值大于1的主成分,得到两个主成分,对应的特征值分别为704和112,这两个主成分对应的系数见表2。从表2中不难看出所有变量在第一主成分上的系数相差不多,可以将第一个主成分看成是所有变量的平均水平,也可以理解为用户在两个网中的总体表现。在第二主成分上发现和通话网络相关的变量的系数为正,而和短信网络相关的变量的系数为负,这说明第二主成分刻画了通话网络和短信网络的对比。

再进一步计算所有个体在两个主成分上的主成分得分。由于第一主成分代表的是所有网络变量的平均水平,也就是用户在两个网络中的整体表现。在第一主成分上得分较高的个体,其在两个网络中总体表现活跃;第二主成分代表的是两个网络的对比,在第二主成分上得分绝对值较高的个体,他们在两个网络中表现差异很大。为了进一步对个体进行区分,我们利用所有个体的两个主成分得分进行聚类分析,这里采用了k均值聚类的方法,通过伪F统计量的取值来决定类别的个数,最后将个体分为3类(类别为2到5时,伪F统计量的取值分别为:1256,1370,1291和1204,在类别为3时达到峰值)。我们将所有个体在两个主成分上的得分以及类别描绘在图2中,每个类别比较有代表性的个体编号也显示在图2当中。

图2 根据主成分得分得到的类别

图2实心点、空心方块和空心倒三角分别代表3个不同类别,第一个类个体,在第一主成分上得分基本都小于0,说明他们在两个网络中的活跃程度很低;他们在第二主成分上得分绝对值也不算很高,说明其在两个网络中活跃程度都偏低。这类客户以13、29、67号个体为代表,总共有39人。第二类个体在第一主成分上得分要高于第一类,说明其总体活跃程度较高,在第二主成分上得分与第一类相似。这类客户以55、68号个体为代表,总共有50人。第三类个体非常值得关注,他们在第一主成分上得分非常高,说明其总体活跃程度很高;在第二主成分上的得分绝对值也很高,说明其在两个网络中表现差异很大。例如43号个体,在通话网络中的活跃度要远远高于其在短信网络中的,而2、9、11号个体在短信网络中的表現要比通话网络中的活跃很多,以他们为代表的第三类客户总共有15人。endprint

由此,可通过网络结构变量将消费者分成了三类,将第一类消费者视为“不活跃”群体,将第二类消费者视为“中等活跃”群体,将第三类消费者视为“极度活跃”群体。这里面最值得关注的是第三类消费者,他们在网络中处于中心位置,属于意见领袖。虽然这类消费者是极度活跃的群体,但是其在两个网络中的表现差异很大。

三、数据的回归分析

现将消费金额的对数值作为因变量,根据消费者被分成三个不同的类别而构造两个哑变量D1和D2。当消费者属于第一类时,两个哑变量同时取值为0;当消费者是第二类时D1取值为1,D2取值为0;当消费者是第三类时D1取值为0,D2取值为1。具体的回归模型如下:

lnYi=β0+β1D1i+β2D2i+εi(1)

其中εi是误差项。(1)式的回归结果见表3。

从表3可以看到回归模型的F没有通过检验,也就表明模型(1)并不显著。这说明在网络中活跃程度不同的消费者的消费金额并没有显著差异,意见领袖的直接价值与其他消费者并没有显著差别。

现在定义一个新的变量Yi,对于每个消费者i来说,Yi就是他在当月有联系的所有个体(包括通话和短信)的消费金额的总和。我们将Yi视作个体i的间接价值,其数值大小能反映了个体所联系的所有人的消费情况,于是我们建立了模型(2):

lnYi=β0+β1D1i+β2D2i+εi(2)

更具体地说,如果某个个体在网络中非常活跃,那么网络中就会有很多个体与他产生联系,他的间接价值就会很高,其回归结果见表4。

从中可以看到回归模型(2)的全模型F检验是显著的,判决系数达到566%。另外,所有系数的估计都是显著的。β1和β2的估计值的符号和大小说明意见领袖所带来的间接价值最高,其次是第二类消费者,最低的是第一类消费者。所以,消费者的网络地位会在一定程度上影响其消费行为。

具体来说,虽然意见领袖(第三类)的消费金额与其他两类没有显著差异(见表3),但是他所带来的间接价值要显著高于其他两类客户。这也就说明,研究电信消费的时候不能只考察消费者的直接消费金额,更不能认为消费金额高的消费者价值就高,消费金额低的就没有价值;相反,我们要关注消费者在网络中所处的地位以及其活跃程度。因为网络中的意见领袖,虽然消费金额不一定很高,但在网络中起到非常关键的作用,有着很高的社会关系价值。所有的消费者会因为意见领袖而联系得更加紧密,信息的传递也会更加有效率。因此,意见领袖会带来很高的间接价值,在分析客户价值的过程中不能忽略他们的作用。

四、研究结论

首先,研究数据刻画了两个不同的网络,分别是通话和短信网络。两个网络存在着显著差异。从各种网络变量的取值来看,个体在短信网络中的活动更为频繁,这符合当代人的行为习惯,尤其对于大学生来说,发短信更是普遍的行为,而非打电话。

其次,我们通过聚类分析而将网络中的个体分成了三类,分别是“不活跃”、“中等活跃”以及“意见领袖”这三个群体,意见领袖在网络中起到最重要的作用,他们使得网络中个体之间的联系更加紧密,信息的传递也更加有效,这类个体可以说是网络中的“粘合剂”。但是,在第一部分的回归当中我们发现这三类个体的消费金额没有显著差异,意见领袖的直接价值和其他消费者并没有显著差别。

最后,我们定义了用户的间接价值,间接价值体现了用户在网络中的影响力。从第二部分的回归结果中发现意见领袖的間接价值高于那些不活跃的个体,这就说明在衡量客户价值的时候除了要考虑客户自身带来的直接价值外,还应该考虑由于社会网络关系而带来的间接价值。

五、管理启示

对于通信运营商,基于上述结论给出了如下一些建议。

首先,把握大学生消费行为特点,重视集团短信营销方案。对大学生群体而言,更偏好于使用短信交流,对短信沟通的需求更强。目前,通信运营商对语音业务的营销考虑更多,对短信业务的营销考虑较少,对学生的短信套餐都是两部式定价,没有考虑短信网络的因素。因此,运营商还可以考虑如何在校园市场优化短信业务的营销方案。

其次,关注社会关系网络,正确衡量客户价值。通信行业衡量客户价值是以个人的消费额度为基础的,并据此制定营销方案。但是,一个客户的价值还应该包含他的社会关系价值,特别是对于通信服务而言,正确衡量一个用户价值既要计算他的直接价值,还要计算他的间接价值。

最后,为稳定广大客户常期在网,要注重意见领袖的识别和维护。一个客户忠诚于某个运营商既可能因为自己的偏好,也可能是因为受周围人群的影响,意见领袖有加固网络联系的作用,可以起到类似粘合剂的作用。因此,识别出意见领袖,稳定他们通信网络中非常有利于维护整个通信网络的稳定。

本文的研究也存在一定的局限性。首先从样本上看只考虑了某高校某一学院的通信网络,样本量较小,但优点是可以最大程度的观测到全网的结构。在未来的研究中希望可以扩大样本量,研究更大规模的网络中用户的行为是如何受到社交网络变量影响的。其次,随着社交软件的发展,短信已不再是唯一的即时通信工具,如现在有更多的年轻人使用微信作为日常主要的交流工具,遗憾的是运营商无法记录到用户使用社交软件的行为,无法构建基于社交软件的用户网络关系也就无法探讨该网络结构对人们的消费行为有何影响。所以,如果未来可以在这方面有所突破也将会是对现有研究的一个有力补充。最后,受数据收集的限制,本文考虑的变量也十分有限,未来的研究可以考虑增加更多的变量,来丰富研究结果。

参考文献:

[1] Wellman, B. and Berkowitz, S.D. (eds). Social Structures[M].Cambridge: Cambridge University Press,1988.

[2] Duncan, J.W., and Dodds, P. S. Influentials, Networks, and Public Opinion Formation[J].Journal of Consumer Research,2007,34(4):441-458.

[3] Freeman, L.C. Centrality in Social Networks: I. Conceptual Clarification. Social Networks, 1979, 1.endprint

猜你喜欢

意见领袖社会网络回归分析
传播学视角下应用型专业思想政治教育有效性研究
城市新移民社会适应与社会网络协同模拟框架研究
微博动员、维权倡议与记者的利益表达机制
旅游目的地合作中网络治理模式研究
新形势下高校网络文化建设管理机制研究
微信营销意见领袖培养现状研究
基于变形监测的金安桥水电站坝体稳定性分析
企业管理中社会网络的运用及相关问题阐述
森林碳汇影响因素的计量模型研究
河北省城镇居民人均可支配收入与消费统计分析