数据挖掘技术在电商情感规律分析中的应用研究
2021-04-13张书月
张书月
摘要:电商的兴起逐步改变现代人购物的方式,目前,随着电子商务市场的发展壮大,竞争压力也逐渐变大,电商平台以及商家都面临极大的竞争压力。对于电商而言,除了保障产品质量外,如何精准把握用户的需求是影响自身发展的关键性因素,大数据技术的优势在于可以通过对海量用户信息数据的挖掘分析,把握用户的购物体验以及实际需求,可以为调整和改进营销策略提供有价值的参考。本文简要对数据挖掘技术及其优势进行阐述,并具体探讨数据挖掘技术在电商情感规律分析中的应用。
关键词:情感分析;电商;数据挖掘技术;应用
目前,我国的电商经过最初的红利期之后,基本进入了平稳发展的阶段,这一阶段由于电商平台以及商家数量的增加,市场竞争更加激烈,稍有不慎就会被市场淘汰。电商平台要获得发展,其需要吸引更多的商家入驻以及用户注册;商家要获取更高的利润,则需要提高销售量。而这些问题归根结底是要如何准确把握用户的动向,只有了解用户的需求才能实现精准营销,从而才能使电商平台的用户数量以及商家的盈利增加。要解决这一问题,就要求电商必须要充分利用获取的数据资源,从中挖掘出有价值的信息,通过这些信息分析不同用户的需求,从而为其提供更加优质的商品或者服务。
1 数据挖掘技术概述及优势分析
1.1 数据挖掘技术
数据挖掘技术本质上是一种处理数据的技术,是从海量、不完整的、随机的以及模糊的数据当中,提取出隐含的有价值的知识或者信息[1]。应用数据挖掘技术需要根据数据信息的类型选择合适挖掘技术,其中比较常用的技术包括统计技术、遗传算法、连接分析、给予历史的分析、关联规则、决策树、回归分析、概念描述、粗糙集、神经网络、概念描述以及模糊集等。
1.2 数据挖掘技术的优势分析
近年来,随着信息产业的快速发展,所产生的数据资源呈指数增长,而要将这些数据资源转化为有价值的知识或者信息,就需要使用某种工具对这些数据资源进行识别与分析。数据挖掘技术就是一种利用多种数据分析工具在大量数据资源中识别有价值信息的技术手段,利用数据挖掘技术可以寻找出数据之间潜在的联系,发掘出其中被忽略的因素,是现阶段解决海量数据分析与处理问题的重要技术手段[2]。
电商平台的用户信息以及与之相关的数据是电商的主要数据来源,对于电商而言,用户每天所产生的数据信息规模极为庞大,其中既包含对电商发展有价值的数据信息,也有无价值的数据信息,电商要留存這些数据资源需要付出较高的成本,如果无法有效识别这些数据信息当中有价值的部分,无疑会大幅增加电商运营成本,对于电商长期发展不利[3]。
数据挖掘技术的优势在于可以通过对用户的购买记录、访问时间、浏览记录、浏览内容以及在每个商品停留的时间等信息分析出用户潜在意愿表达以及当下现实需求,从而充分把握用户需求,制定出针对性的营销策略。通过这种形式可以将商品浏览者转化为购买者,可以有效提升商品销售量,并且也有助于优化用户的购物体验,提高用户满足度,增加用户对于品牌的忠诚度,对于电商平台长远发展有积极作用。此外,对于电商而言,数据挖掘技术可以将原本无价值的数据信息转化为有价值的资源,不仅可以为营销活动提供参考以及有价值的建议,同时也能剔除掉其中无用的数据信息,降低电商的运营成本,提高其经济收益。
2 数据挖掘技术在电商情感规律分析中的应用
数据挖掘技术是宏观层面的概念,要具体到实际应用当中,其根据实际需求不同,需要采用不同的挖掘技术,在电商情感规律分析中一般主要采用关联规则、聚类分析、演化分析以及分类和预测这几种技术。
2.1 关联规则
如果两个或者两个以上的变量中存在着某种规律性,即称之为关联,具体可以分为时序关联、因果关联以及简单关联。进行关联分析的主要目的是寻找数据库当中隐含的关联规则,由于在分析之前对于数据库当中数据之间的关联性并不清楚,即使了解也存在一定的不确定性,而通过关联分析得出的关联规则可信度更高[4]。对电商平台数据库中的数据关联性进行分析,可以发掘两个或者两个以上商品之间有价值的关联,比如购物车分析以及购买记录分析,通过分析可以发现大部分用户在购买某种商品的同时也会购买另一种商品,比如购买面包时大概率会购买牛奶。这种关联在很大程度上反映出了用户的消费习惯,如果电商平台通过关联分析明确了用户的这种消费习惯,就可以有目的的将两种或者两种以上商品捆绑销售,从而增加商品销售量以及盈利水平。
2.2 聚类分析
这也是数据挖掘技术在实际应用当中比较常用的技术手段之一,其基本原理是将数据集合分为若干类别或者若干簇,并使每个类别或者每个簇当中的数据呈现出最大程度的相似,使不同类别或者不同簇当中的数据呈现明显的区别,进而挖掘出数据集当中新颖的、可理解的以及有价值的数据分布。电商平台中具体的应用主要有两种,分别是页聚类与用户聚类,其中页聚类是把页面内容相关网页构成一个网页组,一般多用于搜索功能以及帮助功能,当用户搜索某种商品或者服务时,可以为用户提供更多的信息或者选择。用户聚类是把购物喜好具有相似性的用户归到一起,以便有针对性地为用户提供浏览建议或者定制浏览内容,以实现精准营销。聚类分析的价值在于可以为用户提供更为便捷的搜索服务和浏览服务,不仅可以强化广告效果,同时也能优化用户购物体验,充分满足用户的需求。
2.3 分类和预测
预测也可以称之为基于历史的分析,即根据指示经验寻找数据库当中相类似的情况,并将与这种情况相关的信息用于在当前的案例当中。预测一般首先会寻找和档案案例相似的邻居,然后利用这些邻居对新数据进行分类和估值,使用预测有三个主要问题,寻找确定的历史数据;决定表示历史数据的最有效的方法[5];决定距离函数、联合函数和邻居的数量。在电商平台中通过对用户以往购买记录以及浏览记录的挖掘分析,可以在很大程度上预测用户在当前阶段或者下一阶段的购买倾向,从而把握用户的需求变化,以提供精准的商品或者服务。分析是将数据库党总的数据映射至既定的类别上,其可以反映出同类别事物的共同性质以及不同事物的差异性特征,其特点在于可以搭建数据分类模型,将数据库中的数据进行分类。这种方式多与用户聚类结合使用,可以精准实现对用户的分类,不同群体的购买需求存在明显差异,利用分类模型可以对用户群体进行进一步的细分,而并不仅仅是以男女或者老幼区分用户。用户细分不仅可以实现精准投放,同时也有助于延伸产业链条。
2.4 演化分析
演化分析主要是描述研究对象或者行为随着时间推移而变化的规律或者趋势,并据此搭建数据模型,演化分析包括序列模式匹配、时间序列数据分析以及给予类似性数据分析。演化分析的核心内容是分析数据之间的因果关系或者时间关系,从在某种程度上预测研究对象下一阶段的变化[6]。对于电商平台而言,可以采用这种方式对用户的购买记录进行挖掘分析,以序列模式匹配为例,比如在某个时间区间,用户先购买了商品1,随后购买了商品2,最后又购买了商品3,则商品1、商品2、商品3就形成了一个序列,若这个序列出现的频率比较高,则表明三者之间存在某种联系,基于此,可以预测用户下一阶段的消费意向,进而适时调整营销策略。
3 基于数据挖掘技术的电商情感分析工作流程
数据挖掘技术是一个相对宏观的概念,其又可以细分为多种不同的技术,这些技术的应用场景各不相同。在电商情感规律分析中,针对不同的需求需要采用不同的数据挖掘技术,但是其工作的流程基本一致,大致可以分为四个环节,分别是数据采集、数据预处理、数据挖掘以及结果显示,具体如下所述。
首先是数据采集,目前而言数据采集主要分为隐式采集与显式采集两种方式,其中隐式采集是采集用户在浏览或者购物过程中留存在数据库中的相关信息,比如购物记录、浏览记录等等,不需用户自行输入。显式采集是采集用户在平台或者系统中输入的信息,比如性别、年龄、所处区域以及商品评价等等,需要用户自行输入。
其次是数据预处理,这指的是对采集的数据进行清洗,以解决数据当中存在的冗余、缺值以及数据值不一致等相关问题,以便进行下一步数据挖掘操作。比较常用的数据预处理方法包括数据集成、数据清洗、数据归约以及数据变换等。经过预处理可以有效提高数据挖掘的准确性。
再次是数据挖掘,此环节主要是根据实际需求选择相应的数据挖掘技术,从海量的数据信息中提取或者识别其中有价值、新颖以及可理解的数据信息,从而分析出用户当前或者下一阶段的购物需求以及用户的购物体验变化等。常用的数据挖掘技术包括关联规则、聚类分析、回归分析、差别分析以及演化分析等。
最后是结果显示,这一环节包含两方面,一是将数据挖掘的结果进行整理归纳,从中得出对于目前更有价值的信息,以便有针对性的调整当前的营销策略;二是根据数据挖掘的结果,对用户进行定向营销,即选择恰当的时机以及恰当的方式通过电商平台向用户推荐相应的商品或者服务,从而有效,滿足用户的购物需求,进一步优化用户的购物体验。
4 结语
综上所述,合理运用数据挖掘技术,可以实现对海量数据资源的有效利用,可以帮助电商平台对用户的情感变化、消费意愿进行分析,进而准确把握用户的需求,有针对性的调整营销策略,使用户获得良好的购物体验,并充分满足用户需求。这对于电商的长远发展具有重要作用。事实上,这会逐步建立良性循环,电商利用数据挖掘技术可以优化用户体验,吸引更多用户浏览或者购买,在此过程中又会获得新的数据信息,从这些新的数据信息中又可以发掘出新的有价值的东西,为电商提供更多价值的信息,最终用户的购物体验不断优化,电商收益不断增加,可以实现双赢。
参考文献:
[1] 石国燕,马坤.浅析数据挖掘在电子商务中的应用——以淘宝网为例[J].大众投资指南,2018(17):131-132.
[2] 蒋桂黎.基于数据挖掘与智能计算的情感数据分析与心理预警系统[J].电子设计工程,2020,28(7):45-49.
[3] 苏兵杰,周亦鹏,梁勋鸽.基于XGBoost算法的电商评论文本情感识别模型[J].物联网技术,2018,8(1):54-57.
[4] 李涵昱, 钱力, 周鹏飞. 面向商品评论文本的情感分析与挖掘[J].情报科学,2017,35(1):51-55.
[5] 霍红,张晨鑫.考虑信息熵的在线评论特征观点词对购买意愿的影响[J].商业经济研究,2018(23):67-72.
[6] 张娜,柳运昌,王若男.基于文本情感分析的社交媒体数据挖掘[J].河南城建学院学报,2019,28(5):74-79.
【通联编辑:李雅琪】