APP下载

Web使用挖掘在电子商务个性化服务中的应用

2010-08-15萍乡高等专科学校王立平刘艳玲

中国商论 2010年25期
关键词:日志页面数据挖掘

萍乡高等专科学校 王立平 刘艳玲

南昌理工学院 黄斌

Web使用挖掘在电子商务个性化服务中的应用

萍乡高等专科学校 王立平 刘艳玲

南昌理工学院 黄斌

阐述了目前研究最深入的Web数据挖掘技术—— Web使用挖掘,Web使用挖掘在电子商务服务中的应用价值,提出了基于使用挖掘的电子商务推荐系统,详细分析了电子商务个性化推荐系统的模式和步骤。

Web使用挖掘 电子商务 应用

互联网和电子商务市场的迅猛发展,使电子商务管理者收到越来越多大量无序的用户资源信息。如何对这些信息进行有效挖掘和组织利用,了解客户的特征、兴趣,发现潜在的客户等等,如何分析和理解用户Web日志来获取更具表现力的知识,以指导商业决策行为,成为电子商务经营者和管理者关注的问题。 Web使用挖掘技术可以从海量的结构化和半结构化的数据中提取潜在的有用信息与知识,通过挖掘相关的Web访问日志记录并分析其中规律,发现用户访问Web页面的模式,识别用户的忠实度、满意度、使用习惯,进而发现潜在用户,最终提升企业的服务水平、增强服务竞争力。因此,Web挖掘技术为解决上述问题提供了有效途径,它在新兴的电子商务服务领域具有重要的意义。

1 Web数据挖掘

数据挖掘(Web Data Mining)起源于20 世纪90 年代中期,推动其诞生、发展的众多原因中,对商业数据背后潜在知识的迫切需求和人类分析信息的有限能力之间日益增加的矛盾是其根本动因。[1]Oren Etioni在1996年首次提出了Web数据挖掘这一概念,他认为Web数据挖掘就是数据挖掘在Web中的应用,是从大量的Web文档和服务中自动发现潜在的、有用的模式或信息。我国广大学者也一致认同这个说法,将Web数据挖掘看成是数据挖掘技术在Web环境下的应用,是从大量的Web文档集合和在站点内进行浏览的相关数据中发现潜在的、有用的模式或信息。根据数据挖掘的行为不同,Web 数据挖掘可以分为Web内容挖掘、Web结构挖掘和Web使用挖掘三类。

2 Web使用挖掘与推荐系统

Web使用挖掘也称Web日志挖掘,是通过挖掘相应站点的日志文件和相关数据来发现该站点上的浏览者和顾客的行为模式。具体来说,是从用户的网络行为中抽取用户感兴趣的模式, 通过对用户浏览网站记录数据(包括IP地址、访问页面、访问时间等)、日志进行收集、分析和处理,建立用户行为和兴趣模型, 并利用这些模型来理解用户行为, 从而改进站点结构,包括数据准备、模式识别和模式分析等过程。Web使用挖掘是数据挖掘在Web上的应用,是对Web访问的挖掘。当前,Web使用挖掘已经成为分析网络客户行为最好的方法。作为目前研究最深入的Web使用挖掘技术正逐渐在电子商务领域得到更加广泛的应用,比如Web日志文件的分析、个性化服务(如电子商品推荐系统)、电子商务网站优化等方面。在Internet电子商务中,将Web使用挖掘应用于电子商务,主要是通过分析客户访问服务器上的日志文件,研究电子商务产生的有关客户的访问模式、兴趣爱好、习惯、特征等方面的不确定性数据。可以说,Web使用挖掘主要通过分析和探究Web日志记录中的规律来识别电子商务的潜在客户,提高用户信息服务的质量并改进Web服务器系统的性能和结构;从用户访问Web的记录中挖掘用户的兴趣关联规则,统一存放于兴趣关联知识库之中,以便进一步预测用户的行为,从而加快用户获取页面的速度,提升用户的服务体验。因此,Web使用挖掘可以很好地解决用户访问行为建模和用户访问行为预测等关键问题,可以帮助个性化信息服务的实现。今后,随着电子商务和Web数据挖掘技术的不断发展,利用Web使用挖掘更加深入、全面地研究日志中体现的各种用户行为,比如用户浏览网站的来源网站、访问的时间、访问的地址、对每一个网页的停留时间、对商品单击次数、是否将商品放入购物车、是否有购买行为等,找出并分析用户浏览模式、兴趣、特征等规律,挖掘其中隐含的关系、模式和趋势,进而发现更具有规律性的、更有价值的知识,甚至预测其发展是电子商务领域的崭新课题。推荐系统就是根据用户的个人喜好、使用习惯推荐相关信息和商品的程序,因此,它非常适合用于电子商务领域。一般来说,推荐系统在电子商务活动中的作用可以归纳为以下几点[2]:(1)把浏览者转变成购买者;(2)增加交叉销售量;(3)个性化的服务;(4)提高客户忠诚度。从个性化服务的角度来看,电子商务推荐系统可以实现与用户进行直接交互,模拟销售人员推荐商品给广大用户,满足用户需求,帮助用户快速找寻出所需商品和相关信息。从不同角度来理解电子商务推荐系统是不同的。对广大用户而言,电子商务推荐系统是通过挖掘收集的大量信息,包括用户的访问行为、访问习惯、访问内容等浏览信息,提取用户的各种特征,获取用户访问Web的模式和规律,动态地调整页面结构,用户可以获得关于商品和信息的主动推荐,获得满足个人需求的个性化服务。对于广大企业而言,企业需要通过获取用户的浏览、访问规律,为确定顾客消费的生命周期提供有效依据,为制定合适的、有针对性的营销策略,为进一步优化网站结构和服务方式提供有效依据。

3 基于Web使用挖掘的电子商务推荐系统

电子商务推荐系统是指根据用户的兴趣特点向用户推荐其感兴趣的信息。基于Web使用挖掘的电子商务推荐系统可以根据用户模型寻找出相应信息,或者寻找具有类似兴趣的用户群后相互推荐的相关信息。这种电子商务系统所采用的是一种通过挖掘信息寻找用户的服务模式,可以减少用户搜集、获取信息的时间,提高用户浏览效率。基于Web使用挖掘的电子商务推荐系统根据功能的不同可划分为数据预处理、数据挖掘和推荐三个模块。

(1)数据预处理阶段:此阶段包括数据清洗、用户识别、会话识别、路径补充、事务识别等过程,是进行Web使用模式挖掘的第一步。

(2)模式挖掘阶段:通过关联规则、聚分类技术、路径分析技术等算法进行模式挖掘。电子商务推荐系统主要采用事务聚类算法和用户浏览模式挖掘算法。因为事务聚类算法充分考虑了用户访问页面的顺序性,保证了聚类的结果更为精确[2]。而用户浏览模式挖掘算法则将页面兴趣度用页面的访问时间、页面的大小、

页面访问次数来表示,在此基础上利用Web访问矩阵挖掘用户偏爱路径[3]。

(3)推荐阶段:在线获取用户浏览、访问等各种信息,结合用户配置文件来执行推荐算法,不仅完成推荐页面的计算与生成,还将这些推荐结果发送给客户端浏览器。具体而言,这个阶段具体包括以下几个步骤:

①给当前用户分配一个惟一的标识,并记录当前用户的访问序列。

②获取与分析用户访问页面的信息,推荐引擎生成候选页面集,或根据用户访问页面情况重新匹配浏览、访问序列,生成新的推荐页面。

③将候选页面的推荐度从高到低进行排序,把相关链接和页面描述增加到推荐页面中。

④通过http服务器发送推荐页面到客户端浏览器。电子商务推荐系统的模式挖掘阶段也可以称为离线部分,模式挖掘阶段则可以称为在线部分。离线模块包括数据预处理和总体使用特征获取。即通过挖掘算法产生知识或规则并以某种形式存储在媒质中,为在线模块提供支撑,所以离线模块是在线模块的支撑模块。离线模块和在线模块的处理过程没有很大区别,通过两模块的相互作用,此系统可以获得更实时、更合理、更符合用户需求的推荐集并呈现给广大用户。而离线部分和在线部分的区分,也使得该系统能够适应海量数据,提供一种更具伸缩能力和更快实时响应速度的个性化推荐服务。同时,由于运用了Web挖掘技术,在某些特殊情况下也能实现高质量的个性化推荐服务比如使用数据比较少,或Web站点内容变化比较频繁的情况等等。结语Web挖掘可以处理大规模的数据量,并且自动跟踪用户访问行为,这正好适合电子商务个性化服务的要求。随着互联网的发展和电子商务的日益普及,人们对于对Web使用记录的日益重视,Web使用挖掘在电子商务中的应用将更加广泛和深入,如何深入和扩大Web使用挖掘的研究与应用将是今后几年的研究课题。

[1] Olaru C,Wehenkel L.Computer applications in power[J].Data Mining,1999,12,(3):19~25.

[2] 黄晓斌.网络信息挖掘[M].北京:电子工业出版社, 2005.

[3] 业宁,李威.等.一种Web用户行为聚类算法[J].小型微型计算机系统,2004,25(7):1364~1367.

F724.6

A

1005-5800(2010)11(b)-145-02

猜你喜欢

日志页面数据挖掘
刷新生活的页面
一名老党员的工作日志
答案
探讨人工智能与数据挖掘发展趋势
扶贫日志
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
雅皮的心情日志
游学日志
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议