基于复杂网络的电商平台商品竞争识别研究
2024-05-10刘玉林连辰馨
刘玉林,凌 洁,高 蕾,连辰馨
(1.南京航空航天大学 经济与管理学院,江苏 南京 211106;2.安徽商贸职业技术学院 电子商务学院,安徽 芜湖 241002)
随着中国电商产业的飞速发展,居民的消费习惯正在进一步向线上渠道倾斜。国家统计局数据显示,2021年全国网上零售额为13.09万亿元,较上年增长11.31%,电商及其衍生产业的发展,已经成为构建国际国内双循环经济格局的重要支撑。对于企业经营管理而言,电商产业的快速发展使企业在迅速掌握电商平台商品竞争态势,高效识别竞争对手以及监测竞争变动等方面面临新的挑战,部分学者和企业管理人员对此展开了相关理论和实证方面的探讨。Ramun e建立了电商竞争力理论框架,通过对电商多样性的分析,提出了电子商务竞争力概念模型,包括四个级别:公司级别、行业级别、国家级别和全球级别[1];金永生等提出了基于生态学的外来企业入侵理论,发现市场环境对企业竞争会产生不对称影响[2];张琳琳等基于发电市场不同竞争模式,探讨了多个非对称电商的策略性问题[3];王宝义总结了中国电商二十年的发展历程,发现行业整合和协同发展成为电商竞争基本态势[4];Rosenzweig等从供应链战略视角,构建、开发和测量了B2B卖家的竞争能力,定义和衡量了B2B卖家竞争的显著基础设施能力,包括技术技能、变更处置、冲突管理、市场敏锐度等[5];张昊分析了电商商品促销定价机制及其对竞争的影响,并以京东、苏宁和国美三大电商4000多项家电产品为实证案例,说明高低交错的调价方式显著提升了促销效果[6];吕魁等引入差异化转化成本分析和实证分析研究小公司在惠买定价上的竞争状况,发现小公司虽然活跃用户少但是惠买利润高这一现象[7]。
随着大数据在电商产业的快速渗透,部分学者开始将大数据算法引入电商企业竞争的相关研究。Wu Pei等通过大数据分析来探索电子商务物流的商业模式,尤其是基于关联规则算法揭示了资源依赖在电商竞争中的作用[8];孙瑞丽等以ebay平台数据为研究对象,通过改进支持向量机算法识别电商行业竞争对手[9];夏名首基于余弦相似度,计算产品布局相似度和销量规模相似度,并建立了电商产品竞争图 谱,以此识别竞争对手[10]。
随着复杂网络技术的兴起,部分学者对电商产业中的网络关系进行了研究,进一步解释电商产业的发展和运行。Xiao Bing通过复杂网络可视化识别电商核心顾客关键节点,发现复杂网络技术能够减少信息不对称给消费者带来的逆向选择风险[11];逯宇铎等通过复杂网络理论对电商物流网络进行抗毁性研究,发现电商物流网络是无标度网络,存在关键节点[12];孙军艳等通过复杂网络技术,分析了B2C电商供应链网络度分布以及集聚系数,发现该网络具有高聚集性和较强的鲁棒性[13]。
综上所述,已有文献在电商企业经营管理的理论及实证方面,开展了丰富且深入的研究,特别是随着电商大数据的爆发式增长,引入复杂网络算法开展电商商品竞争识别研究展现出了明显优势:一方面复杂网络算法融合了大数据技术,通过大量的节点及其分布、拓扑性质指标等较好地表达了电商竞争特性;另一方面复杂网络技术具备较强的可视化功能,能够帮助研究人员更好地观察、分析和探索电商竞争状态,但是现有复杂网络技术在电商竞争分析研究中,尚未有以电商平台中以店铺作为节点,店铺与店铺之间的竞争关系作为连接构建复杂网络的尝试。因此,本文提出在电商商品竞争研究中以店铺为节点,店铺与店铺之间的竞争关系作为连接,引入复杂网络算法研究电商商品竞争识别,以期在竞争对手识别、竞争态势判断等方面为相关领域的研究提供更多借鉴。
二、研究方法
复杂网络是利用事物及其主要关系建立节点和连接,并在网络拓扑性质基础上研究结构、关系和演化的方法。汪小帆等总结了复杂网络技术在Internet网络、电力与交通网络、生物网络、经济与金融网络、社会网络、科研与教育网络等领域的突出应用,归纳了复杂网络具备易于处理事物连接关系,擅于通过度和度分布等指标进行特性研究的共性特点[14]。在电商平台中,店铺提供商品、制定销售价格,经营同一种商品的店铺必然存在竞争关系,同时,由于消费者对价格的敏感性,价格相同或者趋近的商品竞争关系将更加激烈,因此,将价格进行分区,在不同价格区间上研究店铺的直接竞争关系更有意义。在构建复杂网络时,店铺和价格区间等均可以作为节点,以店铺与价格区间的铺货关系、店铺与店铺在某个价格区间的竞争关系等建立节点连接。具体方法是:首先对价格进行分区,统计不同价格区间上店铺销量;其次计算店铺之间的余弦相似度,在设定阈值对余弦相似度阈值化后,构建店铺竞争网络;最后通过K-壳分解法等对店铺竞争网络特性进行分析,以此为基础探讨电商平台中商品之间的竞争关系。
(一)价格分区—销量向量矩阵
电商平台中的商品价格为连续性变量,对商品价格进行分区(或离散化)后的价格段定义为价格区间,根据价格区间和店铺节点,制作店铺与价格区间关联矩阵,具体形式见表1。其中pj表示价格区间,ni表示店铺代码,qij表示店铺ni在价格区间pj铺货商品销量的总和。
表1 店铺与价格区间关联矩阵表
(二)余弦相似度
余弦相似度是通过计算两个向量的夹角余弦值来评估相似度,在电商竞争中常用于衡量两个店铺的竞争相似性。夏名首通过余弦相似度计算在不同价格分区下店铺销量相似度,提出了基于经验阈值划分的竞争圈分析模型[10]。余弦相似度计算公式表示为
(三)店铺竞争网络
如果店铺和余弦相似度超过设定值,则可以阈值化建立节点连接,阈值计算公式表示为
其中:w表示店铺ni和nj的阈值化值。当wij=0时,表示店铺ni和nj不建立节点连接关系;当wij=1时,表示店铺ni和nj建立节点连接关系。表示店铺ni和店铺nj之间的余弦相似度值,a为设定的阈值。需要说明的是,由于店铺ni与自身没有相似度值,故wii定义为0。店铺ni和nj确定余弦相似度阈值后,形成店铺节点邻接矩阵,见表2所示。
表2 店铺节点邻接矩阵
将表2导入Gephi软件中,绘制店铺竞争网络模型图(图1)。制作复杂网络图时,配置了节点度颜色以及连接线颜色、宽度,以达到合理展示网络形态直观分析的效果。店铺竞争网络中节点连接表示店铺ni与店铺nj存在竞争关系。
图1 店铺竞争网络模型
(四)K-壳分解法
在专利网络中,K-壳分解法通常用来分析和揭示网络的层次结构,以及识别有影响力的节点。Konstantinos等通过K-壳分解法绘制了专利引文网络中的壳层结构,发现一些度较高的节点位于非常低的壳层中[15]。Carmi等使用K-壳分解法研究了网络拓扑结构,发现网络拓扑结构内部存在部分连接良好的子网络结构[16]。具体而言,K-壳分解法的层次划分方式为:首先,将度为1的节点以及与这些节点相连的边去除,去除后如果网络中出现新的度为1的节点,再进行第二轮度去除,反复迭代,直到网络中不再有度值为1的节点出现,此时被去除的节点以及它们之间的连边成为网络1-壳。同样,接下来继续操作度为2的节点剥离,直到不再有度值为2的节点出现为止,此时这一轮被去除的节点及它们之间的连边成为网络2-壳。依此类推,直到网络中每一个节点都被划分到相应的K-壳中,最终得到网络K-壳分解结构。具体过程如图2。
图2 K-壳网络结构迭代过程
三、实证分析
(一)数据准备
选取天猫电商平台碧根果进行复杂网络视角下电商商品竞争实证分析。首先,在天猫电商平台页面搜索框中,以“碧根果”为唯一关键词进行搜索,选择店铺展示方式,运用八爪鱼采集器采集数据,数据集特征主要包括店铺序列号、店铺名称、店铺属地、相关商品数量等;其次,转换天猫页面搜索结果的展示方式,选择以“大图”方式显示“碧根果”的商品搜索结果,再次运用八爪鱼采集器采集数据,数据集特征主要包括店铺名称、商品名称、商品售价、商品重量(以天猫页面已有的显示数据为准)、月成交额等。对两次采集的数据集进行数据清洗后,最终确定店铺数量341家,相关商品695件,截至2020年12月31日商品销售量共696704件,同时对两个数据集按照相同店铺名称进行数据聚合。
(二)店铺竞争网络构建
由于在数据集中商品价格为连续性变量,可以根据前述研究方法,对价格进行分区。采用非监督离散化方式,以10元间隔等宽离散方法[17],将0~100元价格进行等宽离散,形成0~10元、10~20元、20~30元等价格区间,由于100元以后在售商品数较少,故设置100元以上为开放价格区间。上述离散操作将商品价格共分为11个价格区间。
1.店铺销量价格分区
通过编写Python程序判断店铺在不同价格区间的商品销量数据,得到店铺销量与价格区间关联矩阵,具体见表3。表3中的具体数值表示店铺在对应价格区间上铺货商品销量的总和。
表3 店铺销量与价格区间关联矩阵
2.店铺竞争相似度计算
将表3数据导入python程序中,设计余弦相似度计算程序,基于价格分区下销量数据计算店铺之间的相似度值。将相似度阈值设定为0.6,等于或者超过阈值的店铺对之间建立节点连接,未达到阈值的店铺对之间不具有竞争关系,因此不建立节点连接。店铺之间相似度阈值化后结果见表4。表4中1表示店铺节点n2和n4建立节点连接关系,0表示店铺节点不建立节点连接关系。需要说明的是,阈值是根据管理决策的需要而设定的,高阈值下建立的节点连接为高强度竞争关系,低阈值下建立的节点连接为低强度竞争关系。
表4 店铺—店铺相似度阈值化值(部分)
3.店铺竞争网络分析
将阈值化后的表4导入Gephi软件,合理设定节点、边线、布局等功能,制作天猫电商平台碧根果店铺竞争网络图(图3)。
图3 天猫电商平台碧根果店铺竞争网络
图3显示,天猫电商平台碧根果店铺形成了一个超大的竞争网络,其中包含339个店铺节点,占电商店铺节点的99.4%,仅有2个节点独立竞争网络之外,说明电商平台碧根果商品竞争基本上“无处不在”。使用模块化系数衡量碧根果店铺竞争网络的特性聚类和度量连接强度,取值区间为[0,1],当模块化系数为0时不存在竞争网络社团,随着模块化系数增加,竞争网络社团结构越来越清晰。碧根果店铺竞争网络模块化系数为0.643,说明已经形成的竞争网络社团之间连接强度较高,结构清晰。下面进一步采用K-壳分解探究碧根果店铺竞争网络内部竞争社团状况。
(三)竞争网络中竞争社团分析
根据分解后形成的子网络分布,在图3中用虚线圈出相对集中的店铺节点,每一个虚线圈代表一个竞争社团,碧根果店铺竞争网络内部出现了10个竞争社团,具体从竞争强度、竞争圈层和竞争战略等层面对竞争社团展开详细分析。
1.竞争强度分析
根据表5的统计数据,天猫电商平台碧根果店铺竞争网络10个竞争社团的店铺节点数、网络密度等均有不同的表现,竞争强度也存在较大差异。其中,竞争社团1由95个节点组成,是碧根果店铺竞争网络中最大的社团,网络密度为1,为完全竞争网络,表明该社团中竞争已达到最激烈的程度,社团中任意两个店铺节点均存在竞争关系,例如竞争社团1中的店铺节点n14百草味旗舰店,与社团中其他94个店铺均存在高强度的竞争关系。竞争社团3由80个节点组成,网络密度0.994,比较接近完全竞争网络,竞争强度较为激烈,但相较社团1有所缓和,例如店铺节点n203三只松鼠旗舰店与n130良品铺子旗舰店均为社团3中的成员,它们与社团中绝大多数店铺都存在竞争关系。竞争社团2和4在节点数量规模上处于30到50的中等区间,网络密度同为1。其中店铺节点n134林之源旗舰店是竞争社团2的代表性成员,店铺节点n139楼兰蜜语旗舰店是竞争社团4的代表性成员。竞争社团5到10在节点数量规模上处于30以下区间,除竞争社团6的网络密度为0.985外,其余竞争社团的网络密度均为1。
表5 竞争社团拓扑性质统计
总体而言,不论竞争社团的节点规模大小差异,其网络密度均为1或者接近1,说明在天猫电商平台碧根果店铺竞争网络中,竞争社团内部表现出高强度的竞争关系,而竞争社团之间的边连接较少,说明竞争社团之间表现出低强度的竞争关系,因此准确划分竞争社团是识别竞争关系强度的有效方法。
2.竞争网络竞争社团层次分析
对竞争网络进行K-壳分解后,再进一步按照网络外层、中层和深层对竞争社团进行划分,具体见图4所示。
图4 K-壳分解下的网络竞争社团层次
图4清晰地展现了不同竞争社团在天猫电商平台碧根果店铺竞争网络中所处的竞争圈层。通过观察K-壳值的大小,能够看出不同电商平台商品业态的竞争状况,K-壳值越大,表明竞争网络层级越大,竞争程度越强,竞争的复杂性越高。碧根果店铺竞争网络的深层竞争社团包括竞争社团1和3,分别位于K-壳值=93和K-壳值=76的层级中,竞争社团1处于竞争网络的最深层,是整个竞争网络中的核,代表了天猫电商平台碧根果的业态竞争状况。竞争社团2、4和9处于竞争网络的中间层,竞争程度较强,竞争的复杂性较高。处于竞争网络最外层级的竞争社团包括竞争社团5到8和10,相对而言,网络最外层级的竞争社团商品之间的竞争程度一般,竞争的复杂性较弱,随着网络由深层向外层延伸,竞争关系逐渐递减,K-壳值的分布进一步印证了天猫电商平台碧根果的竞争形势。
3.竞争战略分析
根据价格分区和销量分区,对竞争社团进行区分,能够描绘不同竞争社团的经营状态,帮助电商企业了解整个行业竞争业态,为企业竞争战略提供决策依据。图5为天猫电商平台碧根果店铺竞争网络的价格—销量二维经营状态图。
图5 竞争社团的价格-销量二维经营状态图
图5显示,碧根果店铺竞争网络中,各竞争社团在价格—销量二维经营状态图中呈现出高度规律的分布状态。竞争社团1占据p20-p30价格区间的高销量竞争方位,这一价格也是消费者较为青睐的低价区域,虽然在这一特定的价格区间里处于该竞争社团的店铺具有较强的业绩优势,但从前文的竞争层次分析可知,该社团的竞争也是最激烈的,将其定位为“低价格高销量高竞争”业态;竞争社团3与竞争社团1的竞争方位类似,唯一不同的是其铺货的价格区间为p30~p40,是更有挑战性的中等价格区域,将其定位为“中价格高销量高竞争”业态;竞争社团2占据p10~p20元价格区间的中销量竞争方位,对比竞争社团1,其竞争性虽然减弱,但销量也相应下降,将其定位为“低价格中销量中竞争”业态;竞争社团4与竞争社团2的竞争方位类似,不同的也是价格区间,处于中等价格区域的p40~p50元价格区间,将其定位为“中价格中销量中竞争”业态;竞争社团9、10、7、8、6、5分别 对应着p50~p60、p60~p70、p70~p80、p80~p90、p90~p100、p100以上等价格区域,从前文分析来看,这些竞争社团的共同特征之一是竞争态势相对缓和,从销量来看,也无一例外都处于低销量区域,而且较为均匀地分散于不同的价格区,将其定位为“高价格低销量低竞争”业态。从以上分析可知:中、低价格区吸收了绝大部分的竞争,同时也回馈了绝大部分的销量;而高价区虽然竞争较为缓和,但市场本身回馈的销量也有限,拉低了店铺由于规避竞争而转向这一类竞争社团的心理预期。从店铺的角度来看,它们需要充分考虑价格、销量、竞争三者之间的博弈关系,或者在原有的竞争社团里做大做强,或者转向其他的竞争社团,以追求更低的竞争、更高的销量或者更高的单位利润。
四、结论与讨论
通过构建价格分区—销量向量矩阵,计算电商平台经营商品店铺之间余弦相似度,构建店铺商品竞争网络,并通过K-壳分解法划分网络竞争社团,分析电商平台商品竞争强度、竞争结构和竞争状态,证实基于复杂网络开展电商平台商品竞争识别的有效性,帮助电商企业在行业快速发展与经营方式不断变革的挑战下,迅速掌握电商平台商品竞争态势,高效识别竞争对手,提升企业经营管理水平。
以天猫碧根果商品为例展开实证研究,通过复杂网络技术识别该类商品存在的竞争态势,得出以下结论:第一,天猫碧根果店铺形成了一个模块化系数为0.643的超大竞争网络;第二,碧根果店铺竞争网络可以划分为10个竞争社团,网络密度均为1或接近1,表现出高强度的社团内竞争关系,社团间的边数较少,体现出低强度的社团间竞争关系;第三,通过K-壳分解,可以将10个竞争社团进一步划分为网络外层、网络中层和网络深层,竞争社团1和3的K-壳值最高,处于竞争网络中核,竞争强度最高,随着竞争网络由深层向外层延伸,竞争关系逐渐递减;第四,通过构建竞争社团的价格—销量二维经营状态图,进一步识别了不同竞争社团所处的“价格—销量—竞争”三维区间,有效帮助商家根据所处的竞争方位准确识别竞争对手。
研究中还存在以下需要改进的方面:第一,仅考虑了商品的静态价格数据,没有引入价格变动参数,未能针对价格变动曲线构建更为复杂的竞争网络;第二,仅考虑了常规的电商竞争,对“双十一”、“618”等特殊电商销售时间节点没有进行单独分析。总体而言,本文基于复杂网络技术识别电商平台商品竞争关系的研究,提供了一个全新的视角和有效的识别方法,希望能获得更多相关领域专家学者的关注,对这一问题进行更深入的探究。