APP下载

考虑用户情感波动的产品迭代设计与改进

2022-09-21姜凤珍张嫣轩

关键词:关注度蓝牙满意度

姜凤珍,张嫣轩

(青岛理工大学 管理工程学院,山东 青岛 266520)

随着大数据、社交媒体等信息技术水平的提高,制造企业的外部环境变化迅速,市场竞合关系复杂,产品更新迭代周期逐渐缩短[1]。企业进行产品迭代是以较低成本、较短周期进行产品再开发的策略,也是快速提高市场占有率、延续产品生命力的方法之一。李全升等[2]也指出在前瞻型市场中,基于持续改进的迭代式创新更容易创造新的价值机会。在实体企业的经营生产上应引入迭代思维,迭代式需求获取可为传统实体产品的设计与生产提供新的思考方式[3]。目前实体企业中的迭代创新尚处于实践阶段,需要进一步进行理论和方法的抽象与归纳[4]。

迭代式创新应以需求为导向,传统的需求分析,如层次分析法[5]、TOPSIS和专家群决策[6]等,由于时间空间的限制,会使得用户参与度低,调研范围小、主观性较强等。目前,数据驱动的研究可有效弥补传统研究方法在客观性和效率方面的缺陷[7]。麦肯锡的经典报告也指出,挖掘和分析顾客需求大数据对于支持产品需求分析与设计活动极其有益[8]。利用结构化文本数据可以快速、有效地挖掘有价值的顾客需求[9]。杨程等[10]基于手机产品的大量评论,计算各属性评价指标得分,制定下一步的迭代方案;黄晟青等[11]为将在线评论中用户体验信息准确应用于产品迭代设计中,从分离视角综合运用数据挖掘技术构建了一个用户需求挖掘模型;胡珊等[12]通过从评论信息中获得的实时需求与模糊Kano模型相结合,确定用户需求重要度排序,用重构的方法得到数据驱动的产品迭代创新的设计方法;张公让等[13]为更好地紧跟客户需求,通过语义网络特征关联分析、tf-idf词频分析、情感词典分析等多方面深入剖析评论文本。张国方等[14]以用户需求为导向,通过质量屋(QFD)的构建,将采集到的有价值网络数据转化为工程设计指标,确定产品设计方向。

文献描述,为更好地获取需求实现产品的快速迭代改进,多数研究本质上是通过评论数据挖掘用户对产品特征的观点,缺少时间角度的考虑,缺乏前瞻性[15]。文本评论的影响具有一定的时效性和动态性[16],可构建模型预测用户需求随时间的变化。关于传统统计计量预测模型,其精确性在预测宏观经济指标GDP数值上得到了很好的验证[17];也有学者运用改进后的LDA模型对舆情主题演化进行更细粒度、更合理的划分,结合ARMR模型对事件的情感观点进行精细分析预测[18];Yuan等[19]精确提取消费者对产品的情感,从而结合时间序列提高销售预测性能。以上研究更多聚焦于导致情感发生变化的因素,并未将客户关注度和情感值联合考量。

为使设计人员在设计过程中能够更加准确地识别顾客的需求并能够更高效地进行迭代产品的改进,本文主要从大量用户文本评论中获取消费者的需求变化趋势,挖掘其中的有效信息,从而加强与用户之间的沟通交流;应用改进后的时间序列变化模型,探索用户关注度和情感倾向的动态变化以及二者之间的相互影响,对其波动进行合理预测,形成基于用户评论数据的建议、推断和决策,以此为产品设计提供理论依据和改进方向。以蓝牙耳机为研究对象,对用户在互联网上发布的在线评论,采用文本挖掘技术开展相关研究,深入市场分析,多维度为快速迭代产品的改进提出辅助建议。

1 研究方法

本文将文本挖掘技术和时间序列分析模型结合起来,通过对文本评论中相关属性特征词的提取,计算用户对产品属性的关注度和情感值,预测下一时刻或周期的关注度和情感值。其中,关注度可以体现用户对产品属性的重视程度,情感值可以说明用户对产品属性是否满足,将两者同时加入预测模型中,探究评论情感值是否对产品关注度预测产生影响,对产品迭代设计改进提出建议。研究流程如图1所示,可总结为以下四个步骤:

图1 研究流程图Fig.1 Research flow chart

1)数据收集与结构化:对爬取到的评论数据进行预处理,应用LDA主题模型从中提取产品属性特征词[20],进行主题特征归纳,去除无用词,扩充词义相近的词,并形成词典。

2)有用评论筛选:根据产品属性词典对文本数据进行有用筛选和分类,找出特征-时间的对应文本,为分析提高精度、内存利用率,提供可靠的基础数据。

3)情感值量化:利用SnowNLP类库对商品评论的情感分数进行量化计算,求出联合产品属性关注度的情感优化值。

4)时间序列分析与预测:统计不同时间段的产品属性特征的关注度和正、负面情感值形成时间序列数据,动态分析其变化趋势,采用自回归时间序列方法对情感值的变化进行可视化演示。

2 考虑消费者关注度的产品情感预测及分析改进过程

2.1 产品属性词典的构建

目前,蓝牙无线耳机作为热门电子产品,客户需求量大、种类众多、更新换代速度较快,所以选取无线蓝牙耳机作为分析对象。通过Python 爬虫框架编写程序,以销量排序爬取天猫无线蓝牙耳机近10个月的在线文本评论,共计9 000余条,起止时间为2020年7月到2021年4月,节选了部分评论语料见表1。为降低内存存储量和提高后续数据分析的精确度,对获取的数据进行预处理,规则如下:删除长度过短的评论,不包含对本研究有用的信息;删除重复出现的广告类评论;删除包含过多表情乱码类的评论。

表1 部分评论语料Tab.1 Part of comment corpus

识别评论中聚焦的产品属性,可以帮助制造企业了解消费者关注的产品特征。大部分的产品属性都是名词[21],所以首先采用词性标注法,将分词后的名词和名词短语进行整合,运用LDA主题模型(LDIA)进行产品属性抽取。通过计算主题之间的平均相似度确定使主题结构稳定的数值K[22],经半监督学习总结得到了9个属性词集合。手动检查语义相关词表达的9个隐含主题,确定其所代表的产品属性。

其中每个属性主题集合包含主题向量中权重较高的属性词,可以从一定程度上解释和描述产品的属性特征, 同时使用tf-idf算法提取关键词, 生成图2词云图,人工监督是否有遗漏的属性词,根据产品特殊性对词典进行补充,从而完善属性词典,见表2。

图2 高频词云图Fig.2 High frequency word cloud

表2 产品属性词典Tab.2 Product attribute dictionary

2.2 产品特征情感计算

为了解如今市场上蓝牙耳机的总体情况,将文本信息量化表示用户对产品的关注度和满意度。本文使用基于贝叶斯模型的SnowNLP作为情感计算器,是一种基于电商评论为训练文本的语义解析库。为提高分类准确度,在原本训练模型的基础上扩充所采集到的正面与负面样本。通过人工标记的验证方法,根据9∶1比例将数据分为训练集和测试集,经实验该分析库的分类准确率达到81%。所以使用新的数据训练情感分析模型判断用户评论的情感倾向,得出两类情感的倾向概率。概率值的取值范围在0~1之间,越接近1代表评论文本情感越积极,越接近0则表示情感越消极。通过计算第n个产品属性所有评论情感的均值Qn,确定用户对这个产品属性的情感值。定义Pn为产品第n个属性特征的情感倾向概率,计算公式为

(1)

评论中出现了对产品属性的评价,即代表了用户对这个产品属性的观点看法或喜爱偏好,通过与情感值相结合,优化得出顾客对该产品属性的满意程度。对SnowNLP情感倾向的判断结果进行分类,将每条文本评价的情感值Qni(i=1,2,3,…,tn)与临界值0.6比较,统计Qni>0.6的评论数量,记为num,tn表示第n个属性的总评论数,计算该产品属性的情感满意度Vn:

(2)

全时间周期产品属性关注度及情感值见表3。

表3 属性关注度及情感值Tab.3 Attribute attention and emotion value

关注量tn表示第n个产品属性的评论个数(n=1,2,…,9),即评论中出现了对该产品属性的评价,代表了用户对这个产品属性的关注。

为了进一步分析用户对产品属性关注的演化趋势,引入时间维度的特征分析。将分类得到的9个产品属性对应的关注量,按时间排序分片段处理,以16 d单位时间划分为18个片段,再对每个时间段下的关注量运用式(3)进行数理统计,节选部分数据见表4。

表4 节选时间段下的属性关注量Tab.4 Attribute attention in each time period

(3)

在特征-时间多维度下,对每个产品属性特征的关注量形成可视化展示,如图3所示。由图3可以看出,蓝牙耳机的9个属性特征关注量波动幅度较大,且产生波动时间大致相同。可以推断该变动是由平台或者厂家的促销活动引起的销量增长,从而使关注量同幅度的变动。为了消除销量这一因素的影响,将关注量转化为第j个时间间隔内的关注度Cij,tij为在第j时间区间内第i个产品属性的关注量,tj为该时间区间内9个属性关注量的总和,

图3 属性关注量趋势Fig.3 Attribute focus trend

(4)

根据结果绘制可视化图形如图4所示,可以明显看出各个属性关注度时间序列的变化波动趋势较图3平缓,两两之间比较波动时间点有明显差别,说明消费者会对不同产品属性产生不同的需求偏向。

图4 属性关注度趋势Fig.4 Attribute attention trend

由表3可知,用户满意度最高和最低的产品属性分别是外观和通话,为了更好地探究购买用户对这两种属性满意度随时间变化的趋势,对特征-观点文本语句加入时间维度进行结果分析。将这两属性对应的消费者情感满意度按照评论时间的先后次序排列起来,则得到对应的用户情感所构成的一条情感时序序列:Sent={sent1,sent2,sent3,…,senttn},同样以16 d为单位时间进行分组得到新的情感序列senttime={(e1,s1),(e2,s2),…,(ej,sj)}(j=18),用式(1)、式(2)计算每个时间片段内的用户情感平均值和满意度,可视化表示如图5所示。

图5 消费者满意度趋势Fig.5 Consumer satisfaction trend

图5以两个具有代表性的产品属性为例,消费者对蓝牙耳机的外观属性满意度始终较高,且波动幅度不大。说明在这一阶段内市场上对产品外观的设计已经趋于成熟,极大程度地迎合消费者审美需求。而从通过属性的情感满意度来看,随时间变化先回落后又小幅增强,但从整体上看其满意度都处于一个相对较低的水平。这只能说明消费者对蓝牙耳机的通话的态度随时间变化满意度始终不高。企业制造商应结合用户需求进行市场调研,重新确定通话这一产品属性的生产设计。

2.3 产品属性关注度及情感倾向预测

为进一步掌握用户对于产品情感关注度的发展动态以及转移规律,使生产制造商设计产品功能特征时能够迎合市场需求,将上文产品属性关注度的分析统计结果代入ARMR模型进行训练预测。设时间序列X={X1,X2,…,Xt},ARMR模型时间序列中某一时刻的数值与前p个时间序列的数值和前q个进入系统的随机扰动有关,并由此来预测下一时刻的数值。设Xt受到前p个时间序列数值影响的自回归过程为

Xt=η1Xt-1+η2Xt-2+…+ηpXt-p+et,

(5)

式中:η1,η2,…,ηp为自回归系数;et为误差项。误差项et在不同时期具有依存关系,其移动平均过程表达式为

et=μ1εt-1+μ2εt-2+…+μqεt-q+εt,

(6)

其线性方程为

(7)

基于ARMR模型的预测算法流程如图6所示。

图6 ARMR模型算法流程Fig.6 ARMR algorithm flow chart

ARMR模型针对平稳时间序列建模,所以选取产品属性关注度时间序列进行初步处理分析,经ADF单位根检验,结果显示拒绝存在单位根的假设,说明序列平稳,可以进行建模;对未通过检验的非平稳序列进行差分操作,直至通过检验为止。节选部分序列ADF单位根检验见表5。

表5 部分序列ADF单位根检验Tab.5 ADF unit root test for part of sequence

计算自相关函数(ACF)和偏相关函数(PACF)获取ARMR模型的阶数p和q,通过Statemodels包对ARMR(p,q)进行拟合,结合最小信息准则(AIC)对不同(p,q)组合下的AIC值进行计算,取AIC(p,q)的最小阶数作为ARMR(1,1)建模参数。

将产品属性关注度的计算结果分为训练集和测试集两部分,训练集时间序列数据代入模型进行训练拟合,拟合效果如图7所示。根据图7的预测数据,以蓝牙耳机续航度和音质为例具体分析,可以看出续航度的关注度比较低且随着时间变化在一定范围内波动;而音质的关注度在前三个月较高,但在双十一大促销活动期间呈现小幅度下降后持续保持平稳。用户对音质属性的关注度在时间序列内始终高于续航度的,说明用户对这两种功能实现的需求较为固定,对蓝牙耳机的音质、音量性能相对重视;并且在短期时间内,用户对蓝牙耳机功能属性的关注点并没有出现较为明显的转移。针对这种情况,相关企业在蓝牙耳机产品的开发设计过程中,应对续航度和音质这两个属性功能都加以重视,并且在音质的研发上投入更高的比重。用户对降噪、灵敏度、通话等其他产品特征关注度较低,且趋势平稳,所以在这些功能需求上得不到满足时,不会立刻降低客户对该产品的总体满意度。

(a)续航度真实值vs预测值

为了进一步验证预测结果,本文通过计算平均绝对百分比误差MAPE和平均绝对误差MAE,得到音质属性关注度的MAPE值为11.83%,MAE值为0.032 3,续航度属性关注度的MAPE值为8.93%,MAE值为0.020 5等。由此可知,尽管实验数据规模庞大且数值较小,经测试平均误差率不超过10.38%。证明ARMR模型能够有效模拟在线评论情感影响下的用户关注度演化规律并预测其发展和转移趋势。从本文对蓝牙耳机的分析来看,该类型产品在市场上仍然处于需求量较大阶段,消费者对不同产品属性的需求关注度在小范围内波动且趋于平稳。

3 结论

本文根据购物平台大量在线评论内容,对互联网高频更新迭代产品的设计及改进提出了混合分析预测模型,得出结论如下:

1)将机器学习算法与监督学习方法相结合,提取出用户关注度较高的9个主题特征,如续航度、音质、降噪、舒适度等。其中文本情感分类的准确率提升到81%,有效获取了属性特征、情感倾向的演化趋势。

2)经过数据分析得到,企业制定的相关营销策略可引起购物平台的用户评论总数量较为剧烈的波动,但对于蓝牙耳机各个独立的产品特征关注度影响不大,仅在活动促销季后存在小幅度波动,说明消费者对产品的需求出现了转移,制造企业需对此变化更加重视。

3)通过指标优化计算产品属性满意度,在降噪、通话等属性设计方面用户满意度较低,且随时间推移小幅增强后回落,说明这是设计改进的重点。

4)该方法有一定的普适性,可应用于其他电子产品的设计应用。

研究结果表明,本文所结合的时间序列模型可以准确地分析消费者对产品的关注和情感,进一步分析动态变化趋势背后所隐含的价值信息。

(1)观察产品属性关注度的变化,结合企业生产的实际情况,分析引起此类波动的深层原因,及时调整产品设计方案;

(2)企业可以对比新一代产品发布时间前后消费者对产品属性满意度的变化情况,衡量此次迭代升级是否达到预期目标;

(3)通过联合整体分析多个产品属性特征满意度的实时变化趋势,挖掘内部特征间的关联,系统解决迭代过程中的问题。

本文方法可以帮助企业了解该产品目前的市场需求和产品所处的研发周期,对企业的生产计划和管理决策的实现具有较重要的现实意义。

猜你喜欢

关注度蓝牙满意度
蓝牙音箱的直线之美
16城市公共服务满意度排行
浅谈如何提升脱贫攻坚满意度
明天村里调查满意度
简单、易用,可玩性强Q AcousticsBT3蓝牙音箱
适合自己的才是最好的 德生(TECSUN) BT-50蓝牙耳机放大器
雄安新区媒体关注度
全国两会媒体关注度
暴力老妈
浅析社会大众对留守儿童的关注度