APP下载

电子商务平台下的竞争产品市场结构研究

2019-12-16范梦婷刘洪伟高鸿铭何锐超

广东工业大学学报 2019年6期
关键词:购物车可视化聚类

范梦婷,刘洪伟,高鸿铭,何锐超

(广东工业大学 管理学院 广东 广州 510520)

竞争性市场结构的准确识别是企业经营管理中竞争战略的核心[1]. 竞争性市场结构能指出在特定的市场结构下企业竞争行为的选择,以实现利润的最大化. 虽然管理者可以通过分析自身的相对滞后的产品销售数据或市场份额报告来了解竞争状态,但这并不能了解公司主要竞争对手是谁以及市场竞争结构的问题. 在实践中,管理者可以相对轻松地将一些同行参与者作为他们的竞争对手,但很难以有效的方式评估与各自竞争对手的竞争程度,或者在充满活力的市场环境中,甚至无法以传统方式检测隐藏的竞争对手. 为了解决这一问题,应考虑特定市场中每个竞争对手与其他竞争对手的关系[2]. 分析和可视化竞争任务的主要挑战是产品类别中竞争产品的数量不断增加. 传统的数据收集方法,如调查和扫描仪面板,对于包含数百种产品的产品类别是不可行的,也不能及时揭示真正的市场竞争结构. 另外传统的竞争分析研究使用了关于品牌转换的信息[3]、考虑集[1]、在线搜索[4]和论坛帖子[5],仅揭示有限数量产品之间的竞争关系.

为了反映产品或品牌的实时竞争市场结构,管理者要求进一步了解竞争力程度,但目前这方面的研究较少. 本文提出一种新的方法来对竞争对手进行竞争力程度分析,选择基于产品介入的点击流数据作为竞争力度分析的数据源. 获取了京东平台上消费者在线浏览的点击流数据. 点击流研究最活跃的领域之一是理解和对电子商务网站访问者的在线购买行为进行建模,归因于消费者的个人层面与计算机交互所体现的丰富信息[6-7],可以利用这些行为来研究焦点产品的实时竞争市场结构. 本文发现消费者产品介入行为,如对产品点击、将产品添加到收藏夹,以及将产品加入购物车的频率与产品在相应市场中的竞争地位呈正相关. 具体而言,本文利用Kmeans模型聚类和随机多维尺度(MDS)降维的方法,估计多维变量空间中的产品位置,使竞争关系可视化. MDS处理后的水平轴上显示了产品的市场份额(即产品销售). 结果表明购买率较高的产品彼此接近,不太可能购买的产品则放置在较远的位置. 而越靠近的产品竞争强度就越大,因此很容易识别市场上的主导产品及企业供应链每个产品的竞争优势.本文研究的目的是利用消费者对产品介入行为与品牌或产品相关的点击流数据去分析产品市场销售额,通过估计产品的位置来可视化产品竞争市场结构. 用消费者对产品介入行为直接实时地反映整个产品的市场竞争结构.

从管理角度来看,本文针对电子零售商提出了3个重要而实用的特征. 首先,它包含一种基于跟踪数据的方法. 它使电子零售商能够以经济有效的方式对消费者浏览行为进行深入分析,该方法比调查方法更可靠. 因此,企业可以了解以产品为中心的行业竞争结构,揭示了其产品中典型的浏览模式. 这种可视化还帮助他们识别最频繁浏览点击的竞争产品集. 其次,本文提出的模型具有广泛的适用性. 本文模型虽然只运用了中国大型在线零售商京东(JD.com)的其中一类产品的在线点击流数据,但该方法还适用于京东上销售的其他许多产品类别. 本文方法还可以应用于其他几家大型在线零售商,如Walmart.com的产品浏览或站点导航数据等. 最后,由于使用调查方法较昂贵,消费者浏览行为和销售方面的有用数据往往很难找到,使获取多个类别的产品数据具有挑战性,本文方法的一个优点是只使用可公开获取的点击流数据,因此文中提出的研究消费者产品介入行为的描述性方法是有效的.

1 文献综述

1.1 竞争力分析

掌握竞争和竞争市场结构是企业战略管理决策的核心. 企业制定良好的竞争战略是至关重要的. 为了绘制和分析竞争性市场结构,以前的研究依赖于从扫描仪面板和调查中收集的数据,例如Erdem[3]使用扫描仪面板数据建立动态市场结构模型,以分析果汁、洗涤剂和人造黄油品牌之间的竞争关系. DeSarb等[8]通过在公共市场映射中复制每个产品来可视化竞争关系. 这不足之处在于调查数据受到消费者认知能力的限制[4],并且调查既昂贵又耗时,也不能实时反映行为,竞争产品的数量一旦增加,这样的任务会更加困难,也不能及时揭示真正竞争的市场结构.

最近,Web技术的发展促进并鼓励用户在线生成数据. 假设竞争对手经常在这些网络资源上被提及. 研究人员转向在线消费者搜索和品牌或产品相关的用户生成内容,试图分析竞争关系和竞争市场结构. Kim等[4]考虑亚马逊相机上汇总客户搜索数据,将全球竞争不对称可视化为市场份额的代理,使用不同的气泡大小表示消费者搜索产品的频率,但缺点在于它们使决策者仅可视化所有产品的整体竞争力,而不是任何2种产品之间的竞争分析. Netzer等[5]将汽车上的用户生成内容从在线讨论论坛转化为竞争性市场结构. Lee等[9]根据产品属性和品牌在网络客户评论中的相对位置数据,对市场结构进行分析和可视化. 这些传统的竞争分析研究使用了在线搜索以及论坛帖子等用户生成内容且仅揭示有限产品之间的竞争关系. Nam等[10]用户生产内容的社交标签中挖掘品牌特征,构建基于特征的品牌竞争关系图,分析不同产品之间的竞争关系. Bin 等[11]发现网络市场比线下市场有更强的同质性和竞争性,都是受到消费者搜索行为和品牌偏好的显著影响. 这些现有研究极大地促进了基于网络数据的竞争性智能分析. 但大多数都专注于确定谁是竞争对手,而竞争力程度尚未得到充分发掘,竞争力分析的有效性需要提高,其他类型的消费者对实时大量产品的介入行为数据值得进一步探索,以支持竞争力分析.

1.2 产品介入

介入的概念可以追溯到20世纪40年代早期的社会心理学. 随后,又结合品牌理论、风险理论、广告等多种营销概念进行研究. Zaichkowsky[12]认为介入的定义是一个人基于内在的需求、价值和兴趣感知到的对象的相关性. Laurent和Kapferer[13]假设介入是多维的,有许多共同的维度. 产品介入通常被定义为消费者基于消费者的内在需求、价值观和兴趣对产品类别重要性的持久认识[14]. 比如消费者对产品的点击、收藏、加入购物车等行为. 理论家将消费者行为分为2部分:低介入消费者行为和高介入度消费者行为[13]. Sang等[15]发现,对于具有高享乐主义特征的产品,无论介入购买决策的程度如何,顾客满意度和需求的主要影响都会被发现. 对于低享乐主义特征的产品,只观察到顾客满意度的主要影响,并通过参与购买决策来调节顾客满意度. 目前产品介入更多应用在互联网上营销和产品广告宣传,例如研究高介入度产品的横幅广告方面,点击率是首选衡量标准,点击率增加了高介入度产品的积极品牌态度和品牌购买意愿. 消费者对产品的介入描述性行为的一个来源就是点击流数据,点击流定义为互联网用户在线行为的记录,它由Web服务器或第三方服务收集[16].点击流研究带动了一种新的研究潮流,在多个学术领域和实践领域都是被关注的热点. 点击流数据揭示了网上消费者在网上的冲浪行为,现有的点击流研究大多致力于建立消费者网上购物行为的模型,不但深刻理解网上消费者的行为,还通过产品的市场销售额分析间接反映同行业间的市场竞争. 本文的点击流数据是通过消费者在大型京东商城的产品介入行为,如点击、浏览、收藏、加入购物车等生成的一系列以产品为对象的数据.

2 数据分析

2.1 数据

描述消费者点击行为特征和购物车选择行为的数据集来自中国主流电子商务零售商之一的京东.由于京东有许多不同类别的零售商品,如服装、手机等,本文随机选择一类零售产品数据集进行分析. 此数据集是2016年4月1日00:00:00~2016年4月16日00:00:00的JD.com用户Web日志,共有928 154个交互式行为记录. 数据记录表示用户与计算机之间向产品级别的交互. 同时,在此期间收集用户加入收藏夹、添加到购物车和购买产品等信息,这些信息均由京东提供. 该数据集包括12 231名消费者,他们浏览了124个品牌和4 304个产品库存单位. 变量的定义如表1所示.

如表2所示,其中12 231名消费者在京东平台浏览产品最多进行了17 717次点击,产品的平均浏览点击数为135.3次. 根据数据分析,在4 304个产品中,被消费者加入购物车的产品最大数量达到296个,数量在10~15个的比例最高,表明这些产品受关注高. 标准差(Standard Deviation)能客观准确地反映一组数据的离散程度,通过统计表2可看出,加入购物车、添加收藏与购买变量的标准差指标数值很小,说明变量值越集中,平均数代表性高. 由于点击、加入购物车、添加收藏数量很大,如点击次数最大达到17 717,因此采用这些变量的对数目的是去量纲化,并向每个用户浏览产品变量中添加1以避免对数为0.

表 1 变量的定义Table 1 Definition of variables 次

表 2 变量统计性描述Table 2 Statistical description of variables 次

2.2 VIF检验与共线性诊断

由于变量之间可能出现相关性,为了避免多重共线性问题,本文对4 304个产品的点击、加入购物车和添加收藏这3个变量的对数进行多重共线性检验,本文使用的一种检验方法是方差膨胀因子(Variance Inflation Factor, VIF),VIF是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比. 该方法通过检查指定的解释变量能被其他全部解释变量所解释的程度来检测多重共线性,VIF具体步骤如下.

设原方程为

首先,xi(i=1,2,3)对原方程(1)中其他全部解释变量进行最小二乘法(Ordinary Least Square, OLS)回归,例如i=1,回归方程为

x1=α1+α2x2+α3x3+ν.

其次,计算VIF,公式为

最后VIF 检验的结果见表3. 可知3个变量的 VIF均小于 10,得出各变量之间没有共线性问题存在.

表 3 多重共线性检验Table 3 Multicollinearity test

3 竞争产品可视化建模

3.1 多维尺度标记法(Multidimensional Scaling Technique,MDS)

对于包含少量产品的市场,竞争市场结构可以通过将点映射到二维空间来相对容易地可视化,其中每个点代表单个产品. 然而,当竞争产品的数量增加时,这些产品的图形表示很快就会形成一团密集的点,使得到的映射难以辨认[5]. 虽然可以增加第3个维度来减少这种影响,但三维表示是应尽可能避免的,因为它会使观看和解释变得复杂[17]. 为了简化分析3个交互行为(点击、收藏、加入购物车),获取该3个行为数据有效特征并寻求数据集竞争强度特性的低维数据集合,本文使用一种常见的非线性降维方法即多维尺度方法来获得关联矩阵的低维表示. 因此可以通过MDS映射的二维空间展示多个产品之间的联系,利用平面距离来反映研究产品之间的相似程度,生成一张能够看出这些产品相关性的感知图,即竞争市场结构图.

本研究数据中,产品数为4 304. 每个产品可用N维向量表示,即P=(x1,x2,···,xN). 定义一个距离函数的集合,其中 δPi,Pj是第i个产品Pi和第j个产品Pj之间的距离. 于是有

由表2统计分析得到的点击、收藏、加入购物车多维变量通过MDS建模得到二维尺度分析图(见图1).图1表示了基于3个交互行为(点击、收藏、加入购物车)统计量的产品分布图,图中2个产品的欧氏距离表示在二维空间中2点之间的真实距离,根据距离大小判断在各个产品之间的竞争强弱关系,二维尺度分析图的欧氏距离公式为

其中d表示2个产品之间的距离,xi为点的横坐标,yi为点的纵坐标.

图 1 降维图Fig.1 Dimension reduction diagram

3.2 K-means聚类分析

为了反映产品之间的竞争激烈程度以及了解主要的竞争对手,随着京东商城产品类别中的竞争产品数量不断增加,消费者实行点击浏览产品行为的点击流数据也逐渐累积庞大,分析和可视化竞争市场结构工作则变得越来越具有挑战性,那么有必要针对大量的实时数据进行聚类. 对不同产品的数据集的聚类分析可以表示不同的行为模式,从而揭示产品的需求状态类型[18].

本文采用点击、收藏、加入购物车3个产品介入的变量构建聚类指标体系,由于K类产品之间的竞争力程度存在不确定性划分,用轮廓系数(Silhouette Index)评价K簇聚类的优劣,选出最优的聚类簇数K值来划分产品之间竞争力程度相接近的类别. 簇的凝聚度(Cohesion)、分离度(Separation)、轮廓系数的值越大,表示聚类效果越好,其定义为

其中,N表示数据集中所有产品,对于第i个元素xi,计算xi与其同一个簇内的所有其他产品距离的平均值,记作a(xi),用于量化簇内的凝聚度;b(xi)指xi到其他簇中所有产品的平均距离的最小值,用于量化簇之间的分离度. 轮廓系数|sk| ≤1,若轮廓系数sk接近于-1时,表示xi产品更应该分类到另外的簇而非本簇;若sk近似为0,则表明产品数据集合X中不存在自然簇,当中的产品是服从随机分布的;若sk趋近1,表明xi非常接近其所在簇而远离其他簇,簇内紧凑,聚类效果比较好.

因为K取值太大易失去解释性,K应取值在[2,8],如图2所示,用手肘法[19]判断轮廓系数与K的关系,可以看出K=4时是曲线的拐点即肘部,另外K在(2,4)区间时轮廓系数值急剧下降,K=4之后曲线变动缓慢,新增加的簇没有使所有簇之间形成显著性差异. 因此本文将点击、收藏、加入购物车3个变量分为4类(K=4)更为合适.

图 2 轮廓系数与K的关系Fig.2 Relationship between Silhouette Index and K

3.3 结果分析

考虑到量纲差异带来的模型估计偏差问题,本文利用ln(原始变量+1)方式聚类. 原始变量x包括:点击(x1)、加入购物车(x2)、收藏(x3),具体公式如为

其中x′表示原始变量通过公式(6)规范化后的新变量,聚类结果如图3所示. 该图是基于图1的MDS降维结果将产品分为K=4类的可视化图,另外维度1上能清晰地对产品进行划分,4种不同颜色代表4种分类,每类中的节点表示不同的焦点产品.

为体现用户的真实点击行为,将数据x′还原成原始变量x,得到的产品聚类分析结果如表4所示.

根据表4的产品聚类分析,可以看出京东商城市场的上千个产品被点击、加入购物车、添加收藏的数量每组都在逐步递增,分别对应图3中 MDS的维度1右侧方向,即红→绿→蓝→紫,特别是紫色组(即Group 4),其产品无论是通过点击次数(6.919),还是加入收藏夹次数(1.268)或添加到购物车次数(3.113)都远超过前3组,表示消费者对产品介入的程度在不断提高;同时可以发现表4聚类后的最后一列其产品销售量也逐渐上升,并且第4组的产品销售份额也远3超过前3组,因此,本文将MDS的水平轴与产品的竞争优势联系起来. 可以发现,消费者对产品介入的程度会对焦点产品的产品销售产生正向影响,即竞争优势轴(即MDS处理的横轴维度1)直接揭示了产品销售与消费者对产品的介入程度呈正相关.同时可以得出产品分布在维度1右侧的值越大,产品的市场份额越高,它在竞争市场中的主导地位就越大,即竞争程度越大. 对于分布在不同类中的特定品牌的产品,在MDS处理的横轴维度1上,可以了解某一企业品牌产品的竞争市场结构图以及该企业供应链中每种产品的竞争优势;MDS处理的纵轴维度2上,在同一组的竞争优势轴,可以采用欧氏距离计算公式(4)计算两点间距离的具体数值,根据距离数值大小判断在各个产品之间的竞争强弱关系,距离越小,表明K-means聚类后同类产品(包括不同品牌)的竞争强度越接近,在这种情况下,分布在维度1右侧的企业竞争力越大. 另外根据距离计算结果,可以将竞争对手的级别进行划分.

图 3 基于交互行为的产品可视化Fig.3 Product visualization based on interaction behavior

表 4 产品聚类分析Table 4 Product cluster analysis 次

4 结论

基于上述过程,可以使用点击流数据构建的Kmeans模型和MDS降维来可视化从一个产品到另一个产品的竞争力. 因此,每个竞争对手与自己的业务实体竞争的程度可以从消费者对产品的介入行为如点击、收藏等进行衡量,这对策略规划很有帮助. 应该注意的是,竞争力程度是相对的,这意味着它们衡量由给定产品集合的特定市场环境中的竞争动态.一旦确定了一组有关产品,所提出的方法可用于量化每个产品的竞争程度或竞争优势.

本文使用K-means聚类和MDS建模解决研究问题. 用可视化方法能更深入了解产品竞争强度水平,可视化企业的竞争对手和企业产品链的竞争强度,扩充了运营管理的研究. 通过消费者浏览行为和基于电商平台的实时点击流数据,分析产品介入与产品竞争优势之间的关系. 结果表明,消费者对产品介入的程度会对焦点产品的竞争优势,即产品的市场份额或产品销售产生积极影响,这为介入理论在人机交互领域的研究做了补充. 对于管理者而言,可视化结果可以帮助企业制定良好的竞争战略规划,优化企业内部供应链的设计,缩短竞争强度较低的产品链,增加用户关注度较高的产品.

本研究也存在一定的局限性,如仅用一个京东商城平台的其中一类产品进行实验,其结果不具有普遍性,未来的工作可能侧重于整合其他数据来源来扩展研究,例如消费者行为的主观感知数据.

猜你喜欢

购物车可视化聚类
基于CiteSpace的足三里穴研究可视化分析
思维可视化
被疫情改变的购物车
基于CGAL和OpenGL的海底地形三维可视化
基于K-means聚类的车-地无线通信场强研究
“融评”:党媒评论的可视化创新
推购物车购物
购物车里的“时间线”
基于高斯混合聚类的阵列干涉SAR三维成像
清空购物车了吗!