APP下载

web数据挖掘在电商商品推荐的应用

2019-02-10

福建质量管理 2019年24期
关键词:页面数据挖掘关联

(北京物资学院 北京 101149)

一、引言

数据挖掘是随着数据库和人工智能技术的发展来的一种全新信息技术,尤其是现今处在大数据时代,电子商务的蓬勃发展为商业网站等营销平台带来越发白热化的竞争,而其中数据量庞大而知识匮乏的问题愈演愈烈。

在这种情况下,进行网络交易活动的商家越发需要具备较强的客户信息挖掘、管理、组织以及利用能力,从而实现与客户维护、客户关系管理、客户满意度营造有关的一系列工作的进展。而实现这一系列目标的一个重要的途径,便是进行有效的数据挖掘从而解决商家在电子商务发展过程中的瓶颈问题,帮助其在激烈的市场竞争中取得优势。对于当前的商业领域,数据挖掘已经成为备受关注的辅助决策工具,商家的业务发展趋势、发展前景、决策制定的正确性以及竞争地位的有利与否,都与其数据挖掘系统的有效性与实用性直接相关。因而能否做好这一环节成为电子商务运营商越发重视的课题。

二、数据挖掘与电子商务相关内容

(一)数据挖掘的定义

Web数据挖掘,简称Web挖掘,是由Oren Etzioni在1996年首先提出的,是数据挖掘和Web应用研究相结合的领域。Web数据挖掘具有综合性和交叉性的特征,它所涉及的技术是多方面的,包括数据挖掘、计算机技术、Web技术、数据库技术、统计学、人工智能等多方面领域的技术,Web数据挖掘技术是各种技术在网络环境下的相互融合。

(二)Web数据挖掘的流程

1.数据源的收集

数据收集方式之一便是建立服务日志,将用户在访问时通过页面请求所产生的信息全部记录下来。另一种数据收集的方式便是客户端采集方式,它在功能上比服务器数据采集更具有优势。客户端数据采集的方式可以通过远程代理的方式来实现,即通过客户端的远程代理,直接向服务器发送客户的访问行为及访问时间信息等。

Web挖掘的数据源主要有两种形式的来源,一是储存于Web上的各类文档,二是用户的相关访问数据。在Internet环境当中,Web服务器可以自动收集客户的浏览信息并以日志文件的形式进行保存。

2.数据的预处理

数据的预处理主要是指对网络日志预处理后得到的数据与相关后台数据进行匹配,形成数据挖掘库,也就是我们通常所说的网络购买者特征仓库,所得到的信息将会被进行归纳、总结。遵此原理,不同模块中的信息都可以进行抽取、清洗[8]。

3.数据的挖掘阶段

在数据的预处理流程完成以后,就要进行所获得的信息的转化,使其成为多维数据模型中的星型模式,Web数据挖掘的挖掘阶段可举例为如下步骤:确立目标样本;获取特征信息;获取网络信息;信息特征匹配。

(三)电子商务的定义

电子商务是指用Internet和WWW通过电子信息传输进行的各种商务活动的过程,其中电子商务网站模块主要由商品展示模块、在线购物模块、支付模块、评论模块、卖家/买家管理模块、搜索模块等组成。

(四)电子商务的分类

根据电子商务所涉及的对象和商品内容,我们可以将电子商务细分为八种,分别是B2B、B2C、C2C、C2B、F2C、B2Q和O2O模式,其中市场应用最主流是B2B、B2C、O2O、C2C四种模式。

三、Web数据挖掘在电子商务中的应用

(一)电子商务中Web的挖掘的数据资源

对电子商务网站进行Web挖掘时,数据来源具有类型多、数据量大、非结构化等特点。通过对这些数据源进行Web挖掘,能够发现隐藏在数据中的模式信息,进而了解用户行为,对其进行预测性分析,从而转化为商业价值。

1.Web服务器端网页数据及日志文件

在电子商务网站系统中,每个商品都是以Web页面的形式呈现给用户。它们主要是用于记录用户访问的相关信息,同时也是Web挖掘的一个重要来源。

2.代理服务器端数据

代理服务器相当于在Web服务器和用户浏览器之间充当缓存功能的作用,这样可以减少web服务器的信息流量并加快Web页面的运行速度。对代理服务器进行Web挖掘,可以发现隐藏在数据中的用户行为模式信息,了解用户的访问模式,并且预测性的分析判断,进而能挖掘有潜在价值信息。

3.查询数据

查询数据是用户在查找自己需要的信息时,在服务器端产生的记录,是Web站点在服务器上生成的典型数据。

4.Web页面链接关系

假如一个Web页面被很多页面所引用,则该页面被认为是一个关键页面,这也是商家和企业所需要的知识模式,可以采用Web爬虫来挖掘这类知识模式。

5.用户注册信息

用户注册信息指用户在Web页面上输入并提交给服务器相关信息。为了提高挖掘的准确度,用户的个人背景信息在Web挖掘中和访问日志被集成在一起。

(二)电子商务中Web的挖掘过程

挖掘不是一个无人干预的自动从数据中发现知识的算法,而是一个分为多步骤的挖掘过程。其主要步骤如图所示:

图1 数据挖掘的过程

把Web挖掘的思想和方法应用到电子商务中去,通过对用户访问行为、内容和频度的分析,就可以得到关于群体用户访问行为的信息。利用这些挖掘到的有价值的信息,电子商务网站可以有针对性的开展商务活动。

(三)聚类分析在电子商务中的应用

1.个性化服务的重要性

随着电商规模的发展,个性化服务作为一种崭新的智能信息服务提供方式,使得以往电商平台主导的购物体验方式转变为客户主导。通过数据挖掘技术根据顾客浏览行为留下的后台服务器日志进行挖掘,能够更好地理解用户,找出用户群体的行为规律以及用户隐藏的购买兴趣,根据这些挖掘出来的知识制订针对性的服务内容和策略,按照用户的个性化需求主动提供推荐服务,能够提高电子商务网站商品交叉销售能力和用户忠诚度的同时得到潜在客户。个性化服务已成为提高电商市场占有率的利器。

2.聚类分析模型

聚类分析的目的是将具有相似消费行为模式的客户聚集。在一个簇中,交易数据库中记载了客户每次交易购买的商品。通常一个客户在商务网站上有多次交易行为,因此,需要将一个客户多次的交易记录合并为一条记录,用来反映该客户的消费行为。电子商务网站对客户的消费行为进行挖掘生成记录数据并合并,再合并后的数据集合提交给聚类分析模块.将客户群划分为不同的簇。

图2 基于聚类分析的推荐系统模型

3.电子商务网站用户簇的划分

对于电子商务模式的个性化服务,应该建立在电商网站用户分类的基础之上,通过后台对其购买记录的挖掘,判断顾客所在的分类簇,在网站上现给他们展示符合其购买习惯和需求的商品。

针对电子商务的购物模式,其消费群体可以划分为以下几类:

①第一次购买的消费者。浏览者已经确定其所购买的目标商品,因此会通过站内的搜索引擎通过关键字直接定位到相关商品,会仔细地浏览其商品详细信息。

②经常网购的消费者。他们在商品浏览上会更具有针对性,而且也会注意到商品的销量排行、评价排行以及促销优惠信息,并且会根据其促销信息买一些自己暂时用不到的商品。

③正在比价的消费者。这类顾客的浏览模式是集中于浏览同类商品,通过不断地比较挑选性价比最高的商品。

④随便看看的消费者。这些浏览者基本上没有明确的购买商品目标,只是简单地点击商品浏览打发时间,碰到自己特别中意并且价格实惠会有一定的可能购买,但几率比较小,不是购买主力军。

⑤信息收集的消费者。这些浏览者主要是收集大量商品信息,为以后购买商品积累经验。

这是划分客户群体的基础,在了解各个群体购买习惯的基础之上就可以针对不同群体的客户开展相应的促销方式。以便实现电子商务对顾客的个性化提供相应的服务。

基于聚类分析方法,识别电子商务用户行为,能够在海量的、不规则的电子商务用户行为数据中发现潜在用户行为的数据模式,从而揭示出电子商务用户行为数据中隐藏的规律,为电子商务发展提供有效的用户营销决策,提升电子商务市场竞争力。

(四)关联分析在电子商务中的应用

1.关联分析和CRM

CRM即客户关系管理,企业通过运用CRM技术有效地管理公司和客户之间的关系,最终目的是为了扩大销售额,占领更大的市场份额及获取更多的经济效益。数据挖掘作为强有力的数据分析工具,面对电商的海量数据在管理和分析CRM的优势已经凸现出来。

关联分析最主要的现实应用即为广泛被熟知的“啤酒和尿布”的故事,关联分析在电子商务中最主要的应用主要体现在购物篮的分析中。这种影响有两种方式,即正面影响和负面影响。可以利用关联分析对顾客的购买行为模式进行数据挖掘,针对顾客在浏览电商网站进行购物时在后台服务器中留下了的访问信息,对这些历史数据进行关联分析,可挖掘出顾客的购买行为模式。进而可以从中发现对于提高电子商务网站中商品交叉销售率的知识和规率,提高网站的销量。

2.关联规则的发现

当客户访问某一网页时,一般会通过兴趣词条搜索出相关的兴趣网页通过链接继续访问,这种关联产生的数据如果能够按照某种策略进行挖掘分析,统计出客户访问某些页面及兴趣关联页面的比率,就可以很好的组织站点,实施有效的市场策略。为此,需要对页面的节点、节点间的链接、兴趣节点及兴趣节点之间的关联进行说明和定义,找出它门之间的关系。页面节点可以定义为一个二元组(t,s)。页面的链接可以表示为三元组(S-node,L,T-node),其中S-node为源页面节点,L为源页面节点和目标页面节点的链节点,T-node目标页面节点。对兴趣节点及兴趣节点之间的关联定义如下:

设I={i1,i2,……,in}为项目集,其中{i1,i2,……,in}为项目,表示电子商务网站中的商品集合。则兴趣节点可定义为二元组(i,right),简记为N(i),其中i∈I,right为i项目的权重。兴趣节点的联系称为兴趣关联规则,用三元组(N(is),right,N(it))表示,其中right表示由兴趣节点N(is)转到兴趣节点N(it)的权重,00.5时,客户选择浏览该节点的机会就很大。由于兴趣关联规则很多,因此可以将所有兴趣关联规则的集合表示为Rule。从Rule中找出有价值的规则作为兴趣知识库中的知识,当客户再次访问时,就可以从兴趣知识库的兴趣关联规则中找出相关的项目,从而判断客户可能进行的访问链接。

3.关联分析后的商品推荐

通过关联规则数据挖掘结果组织商品展示方式,不但可以提高电商的交叉销售额,也可以让顾客体验到更好的购物服务。

根据顾客的需求周期,运用关联规则数据挖掘,可以从中发现常驻客户,电商可以通过客户的购买规律进行一些促销返利活动使他们更加青睐在这一电商网站进行网购。同时也达到了客户关系的良好维护。

实现针对电子商务的个性化服务,提高顾客购买体验服务质量顾客的购买习惯不是一成不变的,会随着时间而发生改变,互联网信息时巧客户偏好的不断改变,因此要不断地进行关联规则数据挖掘快速掌握客户购买习惯的改变,并且及时调整应对策略,才能紧跟时代把握客户需求。同时电商可以通过CMR管理使用关联规则数据挖掘技术对客户历史浏览记录信息所挖掘的知识,预测市场潜在消费需求,及时调整相应服务以做出相应的正确决策。

基于关联规则技术的电子商务用户资源管理通过对后台海量信息的数据挖掘可以发现隐藏其中的知识,电商可以对其制定针对性的营销方式,给网购客户提高相应的个性化服务,促进管理创新和技术创新,最终能够帮助电商提高销售额和市场占有率。

四、总结与展望

本文首先阐述了数据挖掘和电子商务的相关知识,包括数据挖掘的功能和技术,电子商务的分类和发展,然后将数据挖掘应用到电子商务中的以数据挖掘技术进行了详细阐述,将以数据挖掘主要用到的关联规则法和聚类分析法进行了简单介绍。

本文初步运用挖掘的思想,分析了电子商务的日志,得到了一些有用的规则。这对于扩大数据挖掘在电子商务中的应用具有十分积极的意义。相信随着研究工作的不断深入,将为这方面的研究工作献出更多的力量。

猜你喜欢

页面数据挖掘关联
刷新生活的页面
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
“一带一路”递进,关联民生更紧
奇趣搭配
基于并行计算的大数据挖掘在电网中的应用
智趣
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
Web安全问答(3)