APP下载

融合主题挖掘与情感分析的用户体验设计方法研究

2023-12-13

甘肃科技 2023年11期
关键词:特征词国家图书馆文创

王 威

(成都航空职业技术学院图书馆,四川 成都 610100)

0 引言

用户体验是人们对已使用的客体的主观感受、认知印象和回应,是衡量产品质量或服务质量的重要标准之一。同时,用户体验分析还是开展用户研究、发现用户需求与提出方法的有效策略,是开展改进型创新和颠覆性创新的重要手段[1]。但是受限于用户体验的主观性和分散性,产品或服务的供给方通常难以便捷、准确地感知潜在的用户痛点,难以挖掘隐藏在众多用户体验中的用户需求。因此,高效、准确地进行用户体验分析对推进产品或服务创新具有重要意义。

1 用户体验分析方法设计

为挖掘用户意见、感知用户态度,从而了解用户需求,研究设计了一种融合主题挖掘与情感分析的用户体验分析方法。该方法主要分为3步:数据收集与预处理、主题挖掘和主题情感分析,其技术路线如图1所示。

图1 用户体验分析方法技术路线图

1.1 数据收集与预处理

数据收集与预处理是用户体验分析的基础,通常分为3个步骤:

(1)用户意见收集是指通过各种渠道征集回收用户对产品或服务的评价、建议等描述信息。常见的用户意见回收方法有互联网平台UGC(用户生成内容:User-generated Content)爬取(如电商平台和网络论坛等)、用户意见反馈表收集和用户回访等。

(2)数据清洗是指对收集到的用户意见进行筛选、去重、整理,降低无意义数据干扰,使数据具有良好的可操作性,以便后续处理。

(3)文本分词是指将文本语言切分成词语的过程,也是中文自然语言处理的重要过程。根据不同精度分为基于词典匹配分词法、基于理解的分词法和基于统计的分词法,常用工具有结巴分词、HanLP和FoolNLTK等。得到分词结果后还需结合停用词表(如哈工大停用词表和百度停用词表等)去除无实际意义的词。去除停用词时也可根据实际需要补充完善或自建停用词表,并适当合并同义词。

1.2 主题挖掘

主题挖掘技术是文本挖掘领域中新兴的一种用于对具有代表性的词、短语或句子进行自动标注和抽取的技术[2],主要用于处理和分析海量信息,发现文档中的核心主题,实现对信息的有效处理和深层次利用[3]。首先,在数据收集与预处理的基础上,对用户意见进行主题挖掘需要提取文本特征词。文本特征提取是通过量化文本中提取的特征词以描述文本信息的过程,是文本挖掘的重要环节[4],常用的文本特征提取方法有词频法、TF-IDF(Term Frequency-Inverse Document Frequency)法和Word2Vec词向量法等。其次,将提取的文本特征词进行聚类,常用的文本特征词聚类方法有共词网络法(如CiteSpace、Vosviewer、Ucine和Pajek等工具)和基于主题概率模型法(如LDA主题模型)。在主题聚类时应注意最佳聚类主题数量的确定,确保每个聚类块具有较高的内聚性、各聚类块间具有较低的耦合性。最后,分析聚类结果、归纳解释聚类主题。

1.3 主题情感分析

进行主题情感分析前,应先将用户意见文本切分为单句(通常以标点符号为标志),再依据主题挖掘结果将单句划分至主题,然后对每个主题进行情感分析。情感分析是利用自然语言处理、数据挖掘算法等对文本语言进行情感判断,从而把握文本意见观点、态度的计算研究[5]。目前,情感分析方法主要包括基于机器学习的情感分类法和基于情感词典的语义分析法[6]。通过对各个主题的用户意见进行情感分析,可以清晰地感知用户在各个主题上的情感倾向,从而了解用户对不同主题的满意程度。

2 实证研究

为验证文章所提出的用户体验分析方法,选取天猫商城“国家图书馆旗舰店”文创产品作为研究对象。通过挖掘用户评论主题、分析用户情感倾向,为国家图书馆文创产品的开发和运营提出建议。

2.1 数据获取与预处理

研究利用Python编程语言,通过网络爬虫技术,从天猫平台“国家图书馆旗舰店”收集到174种文创产品在线评论7 869条。由于评论文本中存在重复、无关、信息量少等无效信息,无法直接挖掘和分析,研究对原始数据进行了预处理。首先,通过Python编程和人工剔除重复评论和无关评论;其次,使用结巴分词对评论进行分词和词性标注;最后,通过构建和完善停用词典、词性判断去除无意义评论。最终得到有效评论5 140条、有效词汇5 134个、总词频20 749次。

2.2 主题挖掘

研究选用的主题聚类方法是词频统计、共词聚类和人工归纳相结合,主要分为3步:文本特征词提取、文本特征词聚类、文本主题归纳。首先,使用TFIDF法提取评论集的特征词;其次,将评论文本特征词看作文献关键词,将其转换为Web of Science导出格式(特征词填入“DE”字段),利用CiteSpace软件的关键词聚类功能进行在线评论特征词聚类;最后,结合高频特征词和聚类结果人工归纳在线评论主题。

2.2.1 文本特征提取

TF-IDF法提取文本特征词,是以某个词对文本的重要性来判断该词是否能够成为文本的特征词。具体计算方法如下:

经计算,得到国家图书馆文创产品用户在线评论文本特征词表,词频前20的特征词见表1。表1中,特征词主要集中在产品质量、做工、设计、用途(如“朋友”“送给”等词)、价格、物流、卖家、客服和体验(如“感觉”“很好”“好看”等词)等主题,表明用户对国家图书馆文创产品的评价主要围绕这些话题展开。

表1 国家图书馆文创产品用户在线评论高频特征词Top20

2.2.2 主题聚类

文章将词频在10 以上的高频特征词应用CiteSpace关键词聚类功能进行聚类并绘制高频特征词聚类图谱,如图2所示。CiteSpace聚类结果的合理性通常通过Modularity(模块值Q)和Silhouette(轮廓值S)来评估,一般当Q>0.3时,认为聚类结构是显著的,当S>0.5时,认为聚类就是合理的。研究中的Q=0.854 4>0.3,S=0.962 2>0.5,表明文章的高频特征词聚类显著且合理。

图2 国家图书馆文创产品用户在线评论高频特征词聚类图谱

聚类共提取出包括“#0送给”“#1适合”“#2材料”“#3客服”“#4质量”“#5更好”“#6退货”“#7产品”“#8质感”“#9朋友”“#10颜色”“#11入手”“#12打开”和“#13设计”14个聚类标签。聚类图谱中,每个聚类标签都由多个紧密联系的特征词组成,且各类之间互相联系。为方便对图2聚类图谱进行分析解读,导出各聚类模块规模、轮廓值和主要主题词,详细信息见表2。

表2 国家图书馆文创产品用户在线评论高频特征词聚类信息

2.2.3 主题归纳

为进一步归纳国家图书馆文创产品用户在线评论主题分布,还需对特征词聚类结果进行梳理和总结。首先,由于聚类“#7产品”侧重于用户对国家图书馆文创产品的整体描述,因此,将该主题下“材质”“外观”“品质”“物流”等核心特征词划分至相应聚类中;其次,将聚类主题词表(表2)中部分词特征词进行适当调整,修正聚类结果;最后,在聚类主题词表中补入相关主题的高频特征词。最终,文章结合特征词聚类结果和高频特征词将国家图书馆文创产品在线评论主题归纳为3类:产品设计、产品品质和商家服务,如图3所示。

图3 国家图书馆文创产品用户在线评论主题归纳

(1)产品设计。结合主题聚类和评论文本分析发现,用户对国家图书馆文创产品在产品设计方面的讨论主要围绕在5个话题展开:①文化寓意。作为国家图书馆文化创意产品,文化内涵不可避免地成为用户关注焦点。②产品用途。产品实用性是用户对国家图书馆文创产品购买意愿的重要影响因素之一。③产品细节。内容、尺寸和装帧等产品细节既是国家图书文创产品设计的重要体现,也是其作为一般商品的评价指标。④社交属性。在产品设计中融合文化内涵的国家图书馆文创产品经常作为礼品出现在社交场景中。⑤颜色外观。用户对国家图书馆文创产品文化属性的感知通常源于其极具艺术性的颜色或外观。综合来看,用户对国家图书馆文创产品设计的总体期待是——兼具文化内涵与实用价值。

(2)产品品质。在国家图书馆文创产品的用户在线评论中,关于产品品质的评价主要集中在4个主题:①质量与价格。用户对国家图书馆文创产品的质量、价格和做工进行评价,衡量该产品是否值得购买或再次购买。②产品材料。部分用户关注国家图书馆文创产品材料、材质等影响产品品质的因素。③产品工艺。部分用户关注国家图书馆文创产品的制作工艺。④产品质感。产品质感是国家图书馆文创产品设计和制作的综合体现,是用户对国家图书馆文创产品整体样式、档次和风格的主观感受。综合以上4个主题的特点,在产品设计的基础上,用户更关注国家图书馆文创产品设计的完成度及最终呈现的品质。

(3)商家服务。用户在该主题中的讨论主要表现在4个方面:客服服务、物流服务、营销策略、开箱体验。其中,客服服务和物流服务是电商评论中较为常见的主题,前者主要包括客服回复的及时性、态度和解答问题的专业性等话题;后者主要包含物流的服务态度、时效性、包装质量和运输等方面。“营销策略”主题下用户评论主要反映了用户对国家图书馆文创产品在产品描述和营销活动等经营策略方面的关注。而“开箱体验”主题表现了用户在收到国家图书馆文创产品实物的第一感官体验,反映的是实物和用户期待之间的落差感,是商家服务带给用户的特殊购物体验。综上,用户对国家图书馆文创产品商家服务的评价范围与一般电商评论较为相似。

2.3 情感分析

文章选择经评论数据预训练的SnowNLP库进行在线评论情感分析。SnowNLP库的情感分析取值表达为“这句话代表正面情感的概率”[7],情感分值分布在区间[0,1]内,分值越接近于1,表示该评论情感倾向越积极,反之则越消极。首先,以标点符号为标识将国家图书馆文创产品用户在线评论切分成短句,并划分至相应主题;其次,使用SnowNLP分别计算“产品设计”“产品品质”和“商家服务”3个主题用户情感分值;最后,分别计算各主题0.5分上下的评论比例和平均情感分值(表3),并绘制各主题情感分值区间图,如图4所示。

表3 用户在线评论主题情感分值分布

图4 国家图书馆文创产品主题情感分布区间图

在产品设计方面,由表3可知,用户对国家图书馆文创产品满意度较高,平均情感分值达到0.745分,其中超过0.5分的评论占86.4%。在图4中,情感分值分布于(0.5,1.0]的评论数量占比随情感分值上涨而增加,且情感分值大于0.8的评论比例较高,说明大多数用户对国家图书馆文创产品的产品设计比较满意,愿意给予积极评价。

在产品品质方面,用户评论的平均情感分值为0.683,其中75.3%评论情感分值超过0.5分。尽管整体上看,用户评论文本情感呈积极倾向,但是消极评价(24.7%)的比例较“产品设计”主题(13.6%)高出近1倍。结合产品品质特征词来看,用户评论中出现频次较高的消极评价词语为:“瑕疵”“坏了”和“褪色”等,说明国家图书馆文创产品在产品品质控制方面有待提升。

在商家服务方面,用户评论的平均情感分值远低于另外两个主题,仅为0.531分,其中超过0.5分的评论仅占相关评论的56.6%。此外,图4中关于商家服务的评论情感分值分布更加直观地表明国家图书馆文创产品商家服务用户满意度较低,且两极分化严重。结合评论文本发现,关于“商家服务”主题的消极评价主要集中在3个方面:一是商家在与用户沟通过程中未能及时满足用户需求,如咨询和退换货等问题;二是用户对产品实物与商家描述存在的差异表示不满;三是物流服务质量不高,如服务态度、时效性和快递包装等。

基于以上用户体验分析,文章从产品设计、产品品质和商家服务3个方面对国家图书馆文创产品提升用户体验提出改进建议。

(1)优化产品设计,塑造品牌价值。当前国内公共图书馆文创产品与其他文化机构文创产品相比,种类极为相似、产品类型趋于同质化,产品的功能和外观形态缺少创新性,具有深层次内涵和意蕴式设计的产品数量较少。因此,国家图书馆在进行文创产品设计时,应以文化价值为主导,充分发挥自身文化职能优势,借鉴现代设计学理念,注重文化内涵和实用价值的统一,致力于打造图书馆文创精品、塑造图书馆品牌价值。

(2)严控产品品质,提升用户体验。在主题挖掘和情感分析中,国家图书馆文创产品用户重视文创产品质量、材料、工艺和质感等影响产品品质的因素,尤其是产品质量,评论中出现了部分负面评价。因此,要确保文创产品品质,国家图书馆必须做好“守门员”,扼守影响产品品质的重要关口,严格控制文创产品品质,切实提升用户体验,确保产品设计中的文化内涵能以最好的状态呈现,保护国家图书馆品牌的口碑。

(3)提升服务水平,回应用户诉求。在国家图书馆文创产品用户在线评论“商家服务”主题情感分析中,消极评价较多,口碑两极分化严重。因此,国家图书馆文创产品运营团队应切实提升服务水平,将图书馆“用户为中心”的服务理念引入文创产品运营服务中,主动融入市场环境,积极响应用户诉求,扎实推进服务质量提升,发扬图书馆人的服务精神。

3 结语

如今,创新已经成为社会发展和进步的重要驱动力之一。应用创新要求“以用户为中心”,不断挖掘用户需求、优化用户体验,为用户提供更优质的产品和服务。文章以天猫平台“国家图书馆旗舰店”为例,通过挖掘用户评论主题,分析用户对各个主题的情感倾向,剖析了用户对国家图书馆文创产品的需求点和期待点。经过验证,融合主题挖掘与情感分析的用户体验分析方法在感知用户体验、挖掘用户需求方面具有良好的效果,对商家的创新活动具有指导意义,对其他用户体验研究具有借鉴价值。

猜你喜欢

特征词国家图书馆文创
陶溪川文创街区
国家图书馆出版社重点图书
国家图书馆藏四种古籍编目志疑
《岁寒三友文创海报》
“不落灰”的文创
铧芯文创
基于改进TFIDF算法的邮件分类技术
中国国家图书馆藏西夏文《不空羂索神变真言经》考论
产品评论文本中特征词提取及其关联模型构建与应用
国家图书馆藏吴奕杂剧二种略考