APP下载

基于Group Lasso 对数线性回归的智能手环评论数影响因素分析

2022-02-04王黎明沈梦琦

关键词:手环对数店铺

王黎明,沈梦琦

(1.南京财经大学 红山学院,江苏 南京 210003;2.南京信息工程大学 数学与统计学院,江苏 南京 210044)

随着智能化商品越来越受社会各界关注,出于对自身健康、生活以及娱乐的关注,智能穿戴市场发展迅速。据IDC 数据显示,近几年,智能穿戴设备仍将保持高速度发展。截止到2021 年,智能穿戴设备的出货量达2.82 亿只,2022 年到2026 年智能手环的CAGR(复合增长率)将达21%,市场容量达到462 亿美元。智能手环具有健康管理、运动记录等强大的系统支持功能,凭借其大众化的定位和高性价比,占据智能穿戴设备的主要市场份额。然而,据百度搜索指数显示,智能手环的新闻头条量在近几年一直保持下降趋势,表明人们对智能手环的关注度降低。智能手环也面临着严峻的挑战:首先,同质化严重,缺少创意亮点;其次,进入市场壁垒低,导致竞争对手过多;最后,情感化缺失、定位模糊和功能堆砌,易导致放弃使用智能手环的流失率提高。面对智能穿戴产品竞争激烈的市场环境,提高商品的评论量和审视智能手环的真正用户偏好显得尤为重要。随着我国电商行业发展迅速,消费模式逐步由线下转为线上,线上消费者的购物决策主要依据产品的功能介绍和评论内容。为此,本文以京东商城为平台,进行智能手环评论量的因素分析,以期为企业研发人员提供可靠的参考指标,提升用户体验,提高企业的市场竞争力。

一、文献综述

关于智能手环,金英伟(2017)、刘丰(2020)、张琰(2017)对智能手环的创新技术方面进行研究,认为商品内在属性和创新感知价值两个方面的设计更能吸引消费者的目光[1-3]。王林(2017)、何晓龙(2016)、蒿莹莹(2019)、苏水军(2018)从运动功能角度分析,采用实验法、数理统计等方法检测数据的有效性,发现智能手环监测结果具有不同范围的误差[4-7]。杨梅(2020)、姚湘(2018)等以老年人的角度去研究智能手环的设计,大致从商品设计、用户体验、人机交互和实际生产四个方面,有针对性的提出在智能手环设计方面要有操作简便易懂、具有轻巧实用性、字体要清晰等特点[8,9]。

随着研究深入,学者们对智能手环购买意愿进行分析,并对评论进行在线挖掘。吴江等(2017)通过LDA 在线评论主题挖掘,分析得出用户更关注智能手环的功能与外观设计[10]。李奕等(2018)采用联合分析法构建用户偏好量化模型,对智能手环的造型要素、功能要素和交互方式方面提出改进意见[11]。赵杨(2017)研究网站界面设计对消费者购买可穿戴设备意愿的影响,发现网站界面的信息丰富度对消费者购买意愿有正向影响[12]。Meiyuan JENG 等(2020)通过手段—目的链(MEC)和阶梯式访谈法,构建“等级价值地图”,分析老年人的感知价值,认为在功能和社会价值方面有提升空间[13]。Lianghong WU(2016)等发放问卷的形式进行用户满意度调查,发现品牌和功能最受用户关注,同时价格和评价是影响用户使用意愿的重要因素[14,15]。

综合以上研究,本文以智能手环评论数为研究对象,建立基于Group Lasso 的对数线性回归模型,预估该类产品的未来市场情形。本文创新之处主要表现在:(1) 以评论量为因变量,作为衡量智能手环发展的一个重要指标,分析市场上的主要智能手环产品评论量的影响因素并建模预测,可更好把握智能手环市场的发展方向。(2) 使用变量选择方法Group Lasso 来选取评论量的重要影响因素可将智能手环的类别变量所有属性作为整体进行选择。

二、模型构建

(一)研究数据

本文通过八爪鱼采集器工具,爬取京东商城智能手环商品的数据信息来研究电商客户需求。去除无效数据信息后,共509 条有效数据。评论数量是智能手环商品的重要属性,直观上可以看出用户对该类智能手环商品的关注程度,因此,本文将评论数量作为因变量。自变量由三方构成,分别为:商品自身属性、商品功能属性以及所属店铺属性,具体变量说明见表1。

表1 变量说明

(二)研究方法

本研究建立基于Group Lasso 的对数线性回归模型对智能手环信息进行挖掘,分析智能手环评论量的影响因素,具体研究框架见图1。

图1 研究框架示意图

先用八爪鱼采集器收集智能手环数据信息,删除缺失数据。将评论量作为因变量,商品自身属性、功能属性和店铺属性作为自变量,识别自变量的标签属性。描述性分析对评论量的因素影响,绘制箱线图和栅栏图等直观地表现自变量和评论量的关系。最后,进行模型分析。将自变量中的分类变量转变为虚拟变量,形成新的自变量集合。利用Group Losso 筛选出影响评论量的重要组变量,将Group Lasso 选择出的重要组变量带入对数线性回归模型探究影响智能手环评论量因素的具体数值关系。模型分析具体方法如下:

1.数据预处理

2.基于Group Lasso 的对数线性回归模型

虚拟变量处理后,如将所有自变量代入对数线性回归模型,可解释性差。我们考虑采用Group Lasso 进行变量选择。Group Lasso 估计方法针对系数组创新性地提出了二范数惩罚,可将虚拟变量组作为整体选取出来[16]。

在线性回归模型中,Y是因变量,X是解释变量,则Group Lasso 估计为

三、结果与分析

(一)描述性分析

从图2 中可以看出智能手环的评论量主要分布在60000 条之内。另外,图中存在少量“高评论,低频数”的智能手环,可能是一些性价比很高的商品。根据智能手环评论量呈右偏特点,对评论量取对数,为后续的图表分析和建模起到重要作用。为分析影响智能手环评论数的因素,先描述性分析智能手环自身属性、功能属性和所属店铺属性对评论量的对数影响。

图2 智能手环评论量频数分布图

1.商品自身属性

(1)价格、品牌与评论量关系

由图3 箱线图可知,智能手环的价格主要集中在500 元以下;从评论量来看,300 元以下的智能手环的评论量最多。散点图显示,智能手环价格越高,评论量就越低(价格和评论量对数的相关系数为-0.49,p<0.01),这符合价格与评论量之间的反向关系,大多数消费者会愿意选择购买价格便宜的商品。

图3 智能手环价格对评论量的影响(左:箱线图;右:散点图)

本文选择了六个具有代表性的品牌,其他的品牌都归在“其他”类中。从图4 看出,小米、华为、荣耀和dido 的评论量相对较大。其他几个品牌的评论量差异较小,间接反映智能手环商品存在较严重的同质化现象。从评论量的分布状态来看,dido 和荣耀等品牌评论量分布两极化,可见同一品牌的智能手环商品之间也有着明显的差异。

图4 品牌对评论量的影响

(2)防水等级、充电方式、触控方式、屏幕类型与评论量的关系

从图5 中发现:防水等级越高,商品评论量就随之增高(50 米以上防水的商品数量少,参考意义不大);使用传统座式充电器的智能手环的评论量比较高,主要是目前商品多数采用座式充电器,符合消费者的充电行为习惯;具有多点触控的智能手环评论量大,因为多点触控操作更便利;具有AMOLED 屏幕类型的智能手环评论量最高且商品数量最多;相比之下,具有TFT 和LED 屏幕类型的商品的数量少且评论量很低,可能因为该类型屏幕厚,需要背光,较为费电。

图5 商品自身属性对评论量的影响

2.商品功能属性

(1)血压、AI 语音功能与品牌

目前不支持血压监测功能智能手环占据多数,以荣耀、华为和小米为典型(图6)。因为这些品牌受众群体是青年,对血压监测的功能需求不大。相比之下,普利邦、ZPPSN 等国外品牌商品基本都具有此功能,其产品定位基本是高端市场,具有价格高、性能强的特点。同时绝大多数的智能手环是不支持AI 语音功能,主要由于AI 语音功能在市面上出现时间短,许多技术还不完善,高性价比产品不具备此功能。

图6 血压、AI 语音与品牌关系(左:血压;右:AI 语音)

(2)心率监测、健康功能与评论量的关系

图7 可知除2000 元以上产品之外,智能手环评论量呈现“实时监测>都可>手动检测>不支持”的特征,反映消费者更喜欢具有实时监测功能的智能手环。图8 显示在同价格区间的智能手环当中,健康功能有3 种的智能手环的评论量更高,更容易获得消费者的喜爱。以心率监测和健康功能为条件,总体上价格和评论量对数呈负相关,说明消费者在选购商品时,价格是重要因素。当健康功能为“4 种”时,价格和评论量不相关,表明当消费者注重高端体验时,价格因素的影响会弱化。

图7 以心率监测为条件的价格和评论量对数的栅栏图

图8 以健康功能为条件的价格和评论量对数的栅栏图

3.所属店铺属性

由于商品评价、物流履约和售后服务三者分布相似,以商品评价为例分析,有评价的商品数量较多且评论量分布较分散,而无评价的商品虽少但评论量稍高(见图9)。产生该现象的主要原因可能是有评论的店铺没有将评论进行高评价、中评价和低评价的区分,使消费者不易区分商品好坏,从而产生不同的购物欲望。

图9 店铺商品评价属性对评论量的影响

(二)模型分析

1.数据预处理

在建立模型之前,因变量Y 是评论量的对数,首先对自变量数据进行处理。所属店铺属性中物流履约、售后服务与商品评价的数据是一致的,因此只需分析商品评价即可。除价格是连续型变量外,其余变量均是分类变量。对连续型变量价格取对数,其余分类自变量进行虚拟变量处理。共20 组72 个虚拟变量。在回归分析中为消除多重共线性,剔除虚拟变量的最后一组。最后,自变量20 组共52 个虚拟变量。

2.Group Lasso 变量选择

数据预处理后存在较多的虚拟变量,应用Group Lasso 将相关虚拟变量作为组进行整体保留或剔除在模型中。当λ=0.09 时,EBIC 值最小,得到的解稀疏。处理后得到系数压缩为零的解释变量12 组共38 个,非零解释变量8 组共14 个,包括价格、触控方式、血压监测、心率监测、运动模式、支付功能、店铺星级、商品评价8 个变量。

3.对数线性回归模型

通过Group Lasso 得到8 组重要变量(14 个虚拟变量)后,建立对数线性回归模型研究对智能手环评论量的影响因素。回归结果如表2 所示,回归模型的修正R2为0.5,说明模型拟合效果较好。

表2 模型估计结果

商品自身属性。(1)价格:对数价格的系数为-0.764,在α=0.001 的条件下显著,说明价格对数值与评论量之间存在着显著的负向关系。这种现象主要由两方面导致。第一,消费者青睐购买性价比高的商品。第二,价格低的产品往往是商家进行促销活动的商品,商家会加大广告宣传的力度引起消费者的兴趣,从而增加商品的销售数量和讨论量。(2)触控方式:触控方式的单点方式和多点方式的回归系数为负值,分别是-0.176 和-0.675,基准组是“其他方式”。单点方式在α=0.1 的显著性水平下不显著,多点方式在α=0.001 的条件下显著。这说明与基准组相比,具有“多点”触控方式的智能手环评论量对数下降0.675 个单位。

商品功能属性。(1)血压监测:与“既可实时监测又可手动监测”相比,实时监测的回归系数为0.861,手动监测的回归系数为-0.930,均在α=0.01的条件下显著。这表明:消费者更愿意购买具有实时监测功能的手环。(2)心率监测:与“既可实时监测和手动监测”相比,手环只具有实时监测或者手动监测的回归系数分别为1.48 和0.764,各自通过α=0.001 和α=0.1 的显著性检验。实时监测心率的手环更容易受到消费者的喜爱。(3)运动模式:运动功能为“10 种以下”和“11~20 种”手环的回归系数均为正值,“10 种以下”在α=0.1 下显著,而“11~20 种”在α=0.1 的显著性水平下不显著。这可能因为,对于普通的消费者来说具有10 种之内运动模式的智能手环已满足需求。(4)支付功能:与支持支付功能的相比,不支持支付功能使得评论量对数平均减少0.845 个单位。这可能因为,扫码支付功能已经成为当代支付方式的主流,厂家可以提高对支付功能的设置来实现商品销量的提高。

所属店铺属性。(1)店铺星级:与店铺星级“无”相比,店铺星级为“有”的回归系数为-0.586,在α=0.01 的条件下显著。回归系数呈现负值的原因可能是有星级评价的店铺的星级个数没有进行具体的区分。(2)商品评价:与商品评价“无”相比,商品评价为“有”的回归系数为-2.311,在α=0.001的条件下显著。有评价的店铺回归系数呈现负值的原因可能是没有将商品好评和差评分开进行分析。

四、结论和对策

Group Lasso 回归结果表明:第一,商品自身属性方面。价格与评论量呈负相关,价格越高,评论量越少。第二,商品功能属性。智能手环有手动和实时心率监测功能,对关注身体健康的消费者来说更有吸引力。智能手环运动模式有10 种以内,针对日常运动的普通消费者来说就能够满足需求。手环具备支付功能有助于提高评论量,吸引消费者。第三,所属店铺属性。店铺星级和商品评价回归呈现负相关,主要是星级和有评价没有进行具体的细分,使消费者难以区分是好还是坏,从而导致评论量减少。

基于研究结论,给出以下对策:

厂商对产品分别进行低端和高端的开发研究,满足不同的市场需求,占据市场销售的份额。针对低端智能手环,厂商需提升产品的性价比,注重产品功能的实用性和精准性开发。针对高端化智能手环,厂商可以将产品的外观形状、腕带材质、制作工艺等方面进行高端化开发,进军高端市场使智能手环能够成为具有社会身份标签趋于珠宝奢侈品的“智能珠宝”。厂商可以将智能手环的消费者进行细分。为青少年消费者设计炫酷高颜值的外观、能够记录日常运动功能的智能手环;为中老年消费者设计健康功能强大且灵敏度高的智能手环。

店铺需要对产品智能手环进行分类管理。店铺网页设计可按按照产品的主要推广功能进行分类,以此帮助用户精准了解产品特性,增加店铺的关注度。店铺管理者对消费者购买的产品和服务要及时的进行询问,改善售前、售中和售后服务,从而提高店铺星级。店铺激励用户评价商品,挖掘用户对商品的反馈信息,及时处理与改进,从而提高用户忠诚度。

猜你喜欢

手环对数店铺
含有对数非线性项Kirchhoff方程多解的存在性
老店铺杂事
指数与对数
指数与对数
苏轼的店铺
对数简史
疯狂编辑部之智能手环
红手环志愿者服务团欢迎您的加入
学习监测手环
麦开:放弃智能手环