APP下载

短生命周期类电子产品的用户需求挖掘研究

2021-09-28张亚菲敬露艺

软件导刊 2021年9期
关键词:电子产品生命周期顾客

张亚菲,申 彦,敬露艺

(江苏大学 管理学院,江苏 镇江 212013)

0 引言

随着科技的不断发展,电子产品大量涌现,为人们的学习、工作和生活提供了极大便利。一些电子产品企业为了抢占先机、赢得市场,不断提高产品迭代速度。电子产品生命周期的不断缩短,不仅导致了市场需求的不稳定,也给生产企业准确挖掘用户需求带来了极大挑战。

虽然目前有关短生命周期类电子产品用户需求的研究有很多,但大多集中在借助历史销售数据对未来用户的产品需求数量进行预测方面。对于产品设计部门而言,产品需求数量并不能反映顾客对产品特性的需求,因而无法为产品设计提供参考。如今电子商务的普及使得越来越多用户倾向于在网上购物,并产生了大量的用户生成内容(User Generated Content,UGC)。以用户在线评论为代表的UGC,相较于传统获取困难、代表性不强的市场反馈而言,不仅获取方式简单,而且包含了用户具体的功能性需求,可成为企业相关部门了解用户详细、动态需求的重要来源。由于在线评论是UGC 中的典型代表,因此以下内容不再对UGC 与在线评论进行区分。如何利用在线评论内容挖掘用户需求,以丰富短生命周期类电子产品功能性需求挖掘方面相关研究?基于此,本文旨在解决如下两个问题:①如何从在线评论中快速、准确地挖掘用户对短生命周期类电子产品的需求;②如何确定用户需求的优先级。

为此,本文以UGC 中的短生命周期类电子产品的在线评论为数据源,通过构建短生命周期类电子产品用户需求挖掘框架对用户产品需求进行挖掘。首先,利用LDA 从在线评论中提取产品特征主题,并使用SnowNLP 对提取到的特征主题进行情感极性分类;然后,利用多元逻辑回归模型和Kano 模型实现短生命周期类电子产品用户需求的分类与排序。该研究框架以在线评论作为输入,克服了传统需求获取方法在时效性和准确性方面的不足,有助于企业相关部门快速了解产品优缺点、获取用户需求,从而更有针对性地进行产品优化。

本研究的主要贡献如下:

(1)提出一种结合传统管理分析方法和大数据分析方法的用户需求获取框架,大大提高了用户需求挖掘效率。

(2)以UGC 为数据源,大大提高了用户需求挖掘的时效性和准确性。

(3)利用Kano 模型划分并确定了用户需求类别及其重要程度,为企业相关部门的决策制定提供参考。

1 相关研究

1.1 短生命周期电子产品与用户需求研究

短生命周期产品是指生命周期短、时效性强、更新换代快、价格变化快的产品,包括体验型产品(如电影)、电子产品(如移动终端、平板电脑)等[1]。目前,针对短生命周期电子产品的研究大多从销量预测方面出发。如李杰等[2]针对移动终端设备生命周期短、销量波动大、销售预测困难等特征,构建用于移动终端设备销量预测的s-bass 模型;刘朝霞[3]利用马尔可夫过程模型预测短生命周期产品的市场需求,并以M 公司手机产品为例,通过模型得出该款手机的潜在市场占有率。然而,这些研究只在销量层面进行产品数量上的需求预测,而缺乏对影响产品销量的用户功能性需求的关注。因此,为提高产品销量,相关企业和部门有必要寻找一种有效的用户功能需求挖掘方法,以准确、快速地挖掘用户的功能性需求,并争取在最短时间内对用户需求作出响应。

1.2 顾客价值研究

早在20 世纪末,美国的Lauteborn 就提出以顾客为中心,重视满足顾客需求的顾客价值4C 理论。自此,企业为了更好地生存与发展,纷纷在新产品开发过程中提高顾客参与度,并逐渐将产品设计主体从制造商向顾客转变,而这种转变为企业带来的巨大收益也使得顾客价值得到了广泛认同[4]。据麻省理工大学斯隆管理学院的调查,约有60%~80%的民用新产品的成功开发得益于顾客[5],该结论在哈佛大学商学院有关消费者在新产品开发中发挥作用的调查中也同样得到了印证[6]。国内类似的调查研究也有很多,如彭艳君等[7]在研究零售业新产品研发时发现,要在基于时间竞争的环境中获得竞争优势,企业必须在新产品研发整个过程中考虑顾客价值,强调了顾客参与的重要性;岳秋荧[8]以线上零售为对象,对顾客参与、服务质量和持续使用意愿进行调查研究,也发现了顾客参与对线上零售的重要影响。由此看来,顾客参与决定了产品价值,因此只有始终以顾客为主体,从顾客角度出发,才能为企业带来更大价值。

1.3 用户需求研究

作为各个行业发展的起点和归宿,用户需求始终是国内外学术界的研究热点。在国外,Li 等[9]在移动云计算应用服务中,基于移动顾客资源需求实现了云服务提供商资源配置成本的最小化。在汽车行业中,Xiao 等[10]根据顾客需求构建的SUV 汽车造型评价模型不仅为SUV 的形成性评价提供了理论依据,而且为设计者的设计工作指明了方向。同样地,相关研究在旅游业、建筑业、电商行业等领域也得到了广泛关注。如Batman 等[11]在对土耳其某旅游地区的需求调查中发现,游客在选择景区时会优先选择更为安静的文化旅游;Wood 等[12]针对绿色医院设计调查问卷,以识别出顾客的主要关注点来完善绿色医院的设计;Xu等[13]利用信息熵理论构建基于顾客需求自适应的随机游走模型用于商品推荐,有效满足了顾客对产品新颖性的需求。尽管现有的用户需求获取方法很多,但在处理大批量数据方面仍存在一定不足。因此,亟需寻找一种更科学、有效的方法进行用户需求挖掘。

1.4 UGC 相关研究

随着移动电话的普及,用户在网上购物的频率越来越高,并在网络上留下了大量用户生成内容(UGC)。作为UGC 的典型代表,在线评论不仅包含了消费者对商品或服务质量的真实感知,而且反映了某个产品或某项服务实现用户某种愿望的程度[14]。因此,在线评论不仅成为消费者选择、购买产品或服务的依据[15],而且成为产品设计与改进的重要参考,为企业带来了巨大的商业价值[16-17]。为快速获得短生命周期类电子产品的用户需求,以适应用户需求的不断变化,有必要以在线评论作为短生命周期类电子产品用户需求挖掘研究的数据源。

2 用户需求挖掘研究

为及时、准确地获取用户对不同种类短生命周期类电子产品的需求,把握影响用户满意度的本质,为企业相关部门的战略制定指明方向,本研究提出基于UGC 的短生命周期类电子产品用户需求挖掘研究框架。以电商平台上用户对相关产品的在线评论为数据源,首先利用八爪鱼在线网络信息采集工具抓取相关评论,并对抓取到的评论进行预处理;其次,利用LDA 并结合电商平台产品分类标签获取评论中用户关注的关键主题词,同时利用SnowNLP 对各主题维度进行情感倾向分类;之后,借助多元逻辑回归模型分析各主题维度不同情感倾向对用户评分结果的影响;最后,结合Kano 模型对用户需求进行分类与排序,从而为企业相关部门优化产品提供指导。具体流程见图1。

Fig.1 Framework of user demand mining for short life cycle electronic products图1 短生命周期类电子产品用户需求挖掘框架

步骤1:数据采集与预处理。本研究数据主要来源于京东电商平台中某手机产品的用户评论,使用网络信息采集工具——八爪鱼采集器进行在线评论信息的爬取。采集的每一条记录包括评论内容、评论时间和评分,并利用采集器进行初步去重处理。

为减少噪音,需要对得到的评论数据进行过滤。过滤的评论数据主要有:①评论字数少于或等于2 个字符的评论,这种评论一般为顾客的直接情感流露,不包含顾客对手机特征的情感信息,如“不错”“很好”等,其表达了顾客对手机的总体情感倾向,但并不能得出对手机某个特征的情感倾向,需要删除;②只含有非中文字符的评论数据,这种评论没有实际意义,也需要删除。将预处理后的数据保存,以进行下一步研究。

步骤2:产品特征主题提取与情感分类。该步骤的主要目的是得到手机产品评论中顾客主要关注的产品特征主题及相应的情感分类结果。主要包括以下两部分:

(1)产品特征主题提取。利用LDA 对预处理结果进行模型训练,得到在线评论的特征主题列表。由于提取的主题中可能存在一些意思相近的词,因此为得到更可靠的结果,需要对近义词进行合并,同时结合电商平台和在线社区的评论标签信息,实现特征主题的半自动化提取。用I表示特征主题总数,用Ji表示第i 个特征主题中频繁出现的词语数,则第i 个特征主题记作fi=其中,wordij表示第i个特征主题中第j个频繁出现的词语(i=1,2,…,I),(j=1,2,…,Ji)。

(2)产品不同特征主题情感分类。利用目前使用较为广泛的自然语言处理技术——SnowNLP 进行情感分类。用R表示在线评论总集合,即R={R1,R2,…,RL},其中Rl表示第l条在线评论表示第l条评论中属于第i个特征主题的评论(l=1,2,…,L;i=1,2,…,I)。为了得到首先需要将Rl按照标点进行子句划分,然后根据子句是否包含某个特征主题的主题词,得到评论子句所属主题fi,最后对上述评论子句进行SnowNLP 情感分析得到情感值表示第l条评论中第i个特征主题fi的情感倾向其 中*∈{Pos,Neg}。为分别得到顾客正向情感和负向情感对顾客评分的影响,需要将连续型情感值转换为离散型情感值,见式(1)。

其中,l=1,2,…,L,i=1,2,…,I。

步骤3:获得用户对各个特征主题情感倾向对于用户评分的影响。目前大多数已有研究都假设顾客满意度(顾客评分)服从高斯分布,并且是顾客对评论中提到所有特征主题情感的线性组合[18]。因此,在该步骤中使用多元逻辑回归模型衡量顾客对不同特征主题的情感倾向对于顾客评分的影响。具体做法为:首先将上一步骤中得到的顾客对每个特征主题的情感倾向信息转换为只包含0 和1 的(I* L)矩阵。其中,I为主题总数,L为评论总数。然后分别将矩阵和评分数据代入多元回归模型中进行训练,最终得到不同特征主题的不同情感倾向对顾客评分的整体影响(或重要性权重)其中表示第i个特征主题的正向情感倾向在顾客评分中的权重表示第i个特征主题的负向情感倾向在顾客评分中的权重。

步骤4:用户需求分类与排序。已有研究证实,每个顾客关注的特征主题可根据Kano 模型划分为5 类。

(1)期望型:如果此类需求得到满足,顾客满意度会显著提升;如果此类需求得不到满足,顾客不满意度也会显著提升。

(2)魅力型:如果此类需求得到满足,顾客满意度会显著提升;如果此类需求得不到满足,顾客不满意度不会提升。

(3)基本型:如果此类需求得到满足,顾客满意度不会提升;如果此类需求得不到满足,顾客不满意度会显著提升。

(4)反向型:如果此类需求得到满足,顾客的满意度会降低;如果此类需求得不到满足,顾客满意度会提升。

(5)无差异型:不管需求是否得到满足,顾客的满意度和不满意度都不会提升。

3 实验与结果分析

3.1 实验环境

本研究的实验环境为:AMD 瑞龙R5 3500U 的CPU,12G 双通道内存,500G 硬盘。操作系统为Win10,实验工具为网络数据爬取工具八爪鱼V8.1.8、Python 集成工具Ana⁃conda3 和统计工具Excel。

3.2 数据采集与预处理

本文以华为Mate30 智能终端为研究对象,从京东商城上采集用户在线评论和评分数据。选取智能终端为研究对象的原因是:作为短生命周期类电子产品的典型代表,智能终端设备的生命周期越来越短,用户对其的需求也不断变化,符合本文对短生命周期类电子产品的定义。因此,本文选取国产手机中的华为Mate30 智能终端作为研究对象。

京东商城作为国内电子商务网站中最受消费者欢迎的网站之一,不仅为已购买用户提供了开放式评论和满意度五星评级功能,而且对用户虚假评论和默认评论设置了单独的识别机制,以保证评论数据的真实性和有效性。因此,本研究以京东商城为数据源获取平台,并利用该平台上用户生成的大量评论数据和评级数据作为用户需求挖掘的数据源。

在数据采集与筛选方面,本研究以“华为Mate30 手机”为关键词,通过网络信息采集工具“八爪鱼采集器”从京东商城上抓取了4 313 条在线评论和评级数据,经去重等预处理后共得到样本数据4 248 条。

3.3 实验结果及分析

3.3.1 产品特征主题提取与情感分类

(1)产品特征主题提取。本研究根据电商网站和在线社区平台上有关智能终端的常用标签及专家知识,将智能终端的产品特征主题精简为11 个类别:Topic1(系统)、Top⁃ic2(内存)、Topic3(外观)、Topic4(拍照)、Topic5(电池)、Topic6(屏幕)、Topic7(价格)、Topic8(安全)、Topic9(网络通讯)、Topic10(娱乐)、Topic11(配件)。详细的特征主题分类结果见表1。

Table 1 Results of LDA feature topic classification表1 LDA 特征主题分类结果

(2)情感分类。使用SnowNLP 对每条评论进行不同特征主题的情感分类,然后利用式(1)得到不同特征主题的情感分类结果矩阵。以表2 中的3 条用户在线评论为例进行情感分类后的结果见表3、表4。

Table 2 Examples of user online comments表2 用户在线评论示例

Table 3 Examples of emotion matrix of different feature topics under positive emotion表3 正向情感下不同特征主题情感矩阵示例

Table 4 Examples of emotion matrix of different feature topics under negative emotion表4 负向情感下不同特征主题情感矩阵示例

3.3.2 用户对各特征主题的情感倾向对用户评级的影响

分别以正向和负向情感下各个主题特征的情感矩阵为自变量,以用户评级(1 表示好评,0 表示差评)为因变量,建立不同情感下的多元逻辑回归模型见表5、表6,得到不同情感倾向下不同主题对顾客满意度的重要性权重见表7。

Table 5 Examples of multiple logistic regression model parameters under positive emotion表5 正向情感下的多元逻辑回归模型参数示例

Table 6 Examples of multiple logistic regression model parameters under negative emotion表6 负向情感下的多元逻辑回归模型参数示例

Table 7 Weights of different topics on customer satisfaction under different emotions表7 不同情感下不同主题对顾客满意度的权重

3.3.3 用户需求分类与排序

将不同特征主题在不同情感倾向下的权重代入Kano模型,根据Kano 模型的定义对不同特征主题进行需求分类与排序。根据Kano 模型定义可知,在这11 个主题中,“安全”“网络通讯”为魅力型需求,“系统”“内存”“外观”“拍照”“价格”“配 件”均为期望型需求,“电池”“娱乐”为基本型需求,“屏幕”为反向型需求。

根据需求特征和原理,对于魅力型需求,当顾客需求得到满足时,顾客满意度会急剧上升。5G 时代的到来,给用户带来了前所未有的快速上传、下载的体验,并成为了用户满意度提升的关键。另外,针对市面上出现的信息安全问题,华为推出双重生物识别技术,为用户的信息安全提供了双重保障,从而为用户满意度的提升奠定了基础。因此,对于“安全”“网络通讯”这两个魅力型需求,企业相关部门可在控制成本的基础上不断强化该特征,以增强自身竞争力。

如今智能终端用户更多地关注“内存”大小及“系统”流畅度,内存越大,系统越流畅,用户满意度越高,反之,内存越小,系统越不流畅,则会导致用户满意度降低。对自身外在形象的注重,也造成很多手机用户非常关注手机的“外观”与“拍照”功能。5G 网络的出现虽然给用户带来了方便,但应用5G 网络价格高昂,也使用户对手机的满意度大打折扣。另外,不单独赠送手机配件也成为了目前商家的主流选择,但许多手机用户仍希望商家赠送手机配件,并对不赠送手机配件的商家表示不满。因此,对于期望型需求中的“价格”和“配件”特征,企业需要在控制成本的情况下,最大限度地促使其向魅力型需求转换,从而形成自身的竞争优势。

在智能终端层出不穷的现在,“电池”“娱乐”不再成为吸引顾客的主要因素。因此,对于“电池”“娱乐”这类基本型需求,企业在满足该类需求的同时,要避免对其关注过多。而对于反向需求——“屏幕”来说,全新的曲面屏设计虽然新潮,却不符合大多数用户使用习惯。因此,相关企业需要综合考虑该特征存在的必要性,在兼顾新屏幕样式的同时,在必要时可对该特征进行优化。

4 结语

作为顾客的真实反映,UGC 逐渐成为企业进行顾客需求挖掘的有力工具。在产品生命周期不断缩短的现在,根据短生命周期产品时效性强、更新换代快、需求不确定性强等特点,依据顾客价值理论,如何从顾客生成的在线评论中及时、准确地挖掘顾客需求成为研究热点,有着重要的理论与实践意义。本文通过借助LDA、SnowNLP、多元逻辑回归和Kano 模型,构建了一个基于用户在线评论的短生命周期类产品需求挖掘框架。该框架利用LDA 并结合各大平台网站的产品相关信息得出顾客关注的主题维度,并利用SnowNLP 进行某个主题的情感分析计算,使用多元逻辑回归建立不同特征主题的不同情感类别对顾客评分的影响关系,得出不同主题在不同情感倾向下对顾客满意度的重要性权重,实现了在线评论的Kano 需求分类与排序。从实验结果来看,本文提出的模型是有效的。然而,本文仍然存在一些不足,如数据来源较为单一,只选取了京东商城的用户生成内容作为数据源,未来可采集更多网站的数据信息进行更全面的分析。

猜你喜欢

电子产品生命周期顾客
“一站式”服务满足顾客
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
帮孩子减少对电子产品的迷恋
企业生命周期及其管理
我国小型废弃电子产品的回收模式
以顾客为关注焦点
顾客是我们的上帝品质是顾客的需求