WEB数据挖掘在电子商务中的研究应用
2013-03-19刘金勇
刘金勇
(四川大学计算机学院 四川 610064)
0 引言
在日益激烈的电子商务企业竞争中,对用户的竞争是关键因素,因此如何更好地掌握用户需要,根据用户喜好为用户提供个性化的服务就显得至关重要。下面,我们就从电子商务平台的数据资源、WEB数据挖掘的分类、WEB数据挖掘的方法及WEB数据挖掘能够为电子商务带来何种影响几个方面来探讨WEB数据挖掘在电子商务中的应用。
1 电子商务平台中的数据资源
WEB数据挖掘是针对数据进行分析统计的,首先要有数据,电子商务平台中存在大量的数据信息,这些数据都是WEB数据挖掘的数据源。
首先是电子商务系统中商品的信息,电子商务系统中的商品成千上万,每件商品都有它各自的参数和价格等信息,每一个商品都是以WEB页面的方式向用户展示的,因此商品的信息实际上也就是WEB页面信息,这类信息可以帮助分析页面之间存在的隐藏关系,从而为页面定秩,优化页面结构;其次就是用户的信息,用户的信息既包括用户在电子商务网站注册时留下的信息,同时也包括用户的购买记录(也就是用户的订单信息)、用户搜索商品的记录和用户访问过的页面等等行为信息,这类信息可以帮助分析用户的喜好,从而预测用户未来的购买行为;第三是页面之间存在的超链接关系,相似的页面之间通常存在着超链接,这种结构信息能够为搜索引擎提供重要的排序依据;最后就是服务器数据,包括服务器日志、错误日志和Cookie日志,通过这些日志文件可以分析服务器的运行状态,从而优化系统,提高服务器的运行效率和响应速度,使用户获得良好的用户体验。
2 WEB数据挖掘的分类
数据挖掘就是从大量的数据中提取或挖掘知识,WEB数据挖掘是数据挖掘在万维网上的应用。通常WEB数据挖掘分为WEB内容挖掘、WEB结构挖掘和WEB使用挖掘三类。
WEB内容挖掘是指从WEB页面数据中发现有用的信息,从资源查找的角度来看WEB内容挖掘的任务是从用户角度出发提高信息质量和帮助用户过滤信息,从数据库角度来看WEB内容挖掘的任务是对WEB上的数据进行集成和建模,以支持对WEB数据的复杂查询;WEB结构挖掘是对WEB的链接结构进行分析,WEB页面中的链接中也包含了非常有用的信息,通过分析WEB页面之间的链接关系,确定WEB页面在搜索结果中出现的次序,提高搜索结果的准确度,WEB结构挖掘的常用算法有PageRank算法和HITS算法;WEB使用挖掘是为了分析用户和行为,以改进系统构成,为用户提供个性化的服务,通常靠分析用户的访问记录、访问日期和配置信息等数据分析用户行为。
3 电子商务系统中WEB数据挖掘的过程
在电子商务系统中进行WEB数据挖掘分为数据准备、数据挖掘和结果表达与解释三个步骤。
数据准备就是准备数据挖掘所需要的数据源。首先要从数据库中抽取数据,这些数据包括商品页面、用户评价、用户的购买记录和浏览搜索记录等等,然后对这些数据进行一定的清理,清除无用的数据,保留有用的数据,并按合理的格式进行存储。
数据挖掘阶段则对数据准备阶段产生的有用数据进行实质性的分析建模工作,首先根据数据的特征确定一个合理的假设,然后建立相应的数学模型,再选取合适的工具或算法来验证假设,进而发现隐藏在数据间的有价值的信息。
结果的表达与解释就是对数据挖掘所发现的模式和知识进行解释,对于数据挖掘阶段发现的有用信息,解释产生这些信息的原因,了解各因素相互作用的内部原理,从而挖掘出最有意义的信息,提交给决策者,决策者据此对即将发生或可能发生的事件进行预测,为决策者制定正确的市场战略提供参考借鉴。
4 电子商务系统中的WEB数据挖掘技术
电子商务系统中的WEB数据挖掘技术主要有路径分析、统计分析、关联规则、序列模式、分类规则和聚类分析六种。
4.1 路径分析
路径分析是通过分析用户访问网站的次数和频率等记录在服务器日志中的信息,确定出用户频繁访问的路径。
4.2 统计分析
统计分析主要用于改进站点的设计,提高性能和安全性。对系统正常运行时用户的访问频率、驻留时间、会话时长、非法访问或是不正出错的路径等等进行统计分析,可以发现系统设计中存在的问题,从而改进设计,提高系统性能,增强系统安全系数,保障系统安全平稳高效运行。
4.3 关联规则
关联规则就是为挖掘不同事件之间存在的联系和规则,如用户购买商品A的同时也购买了商品B,也就是说购买商品A的同时也会购买商品B,即A与B存在关联关系,通过这种关系,电子商务站点可以在用户购买商品A时向用户推荐商品B,即减少用户过滤信息的负担,又能增加了销量。
4.4 序列模式
序列模式是就事件在时序上存在的先后关系,如用户先购买商品A后,过一段时间后又购买了商品B。通过序列模式分析可以预测用户的行为,如当用户购买某商品后在适当的时间内再向用户推荐有针对性的产品,根据对用户行为的预测进行针对性的优化,为用户提供个性化、人性化的服务,既使客户满意又获得最大收益。
4.5 分类规则
分类规则主要是为了根据事物的属性和行为等对事物进行分类,如在电子商务系统中可以根据不同的年龄段和不同的地区进行分类。
4.6 聚类分析
聚类分析是根据特定的规则对未分类的记录进行归类。通过聚类分析可以使运营者更加了解用户的需要,更加准确地预测用户的行为。
5 WEB数据挖掘在电子商务中的应用
将WEB数据挖掘与电子商务相结合,能够极大提高电子商务企业获取信息和管理信息的能力,帮助电子商务企业降低运营成本,作出正确的商业决策,争取更多的客气,开拓更加广阔的市场。
5.1 电子商务中运用WEB数据挖掘,有助于电子商务企业维系老客户,挖掘新客户
通过WEB数据挖掘,电子商务企业可以了解用户的喜好,调整WEB页面的内容,针对用户的喜好为用户提供个性化的服务,使用户获得更好的体验,从而获得更高的客户满意度,延长用户在网站的停留时间,最终达到留住老客户的目的;通过对访问网站的新用户进行分析,挖掘出潜在客户,针对潜在客户进行宣传推广,从而吸引新的客户,开辟新的市场。
5.2 电子商务中运用WEB数据挖掘,有助于电子商务企业制定正确市场战略,获取最大销量
电子商务企业运用WEB数据挖掘技术对各项商品的销售数据进行深入挖掘, 可以了解商品的销售情况变化,对下一阶段商品的销量做出预测,从而合理地管理库存,合理采购商品,防止出现库存过剩和库存不足等影响企业正常运行的因素。
5.3 电子商务中运用WEB数据挖掘,有助于电子商务企业确定用户群,精准投放广告
通过WEB数据挖掘技术,电子商务企业可以充分了解用户的真正需求,了解某类客户真正需要哪一种商品,同时也能够充分了解用户的消费用力,精确地为每种商品定位潜在的用户群,从而向这些用户投放广告,在不引起用户反感的情况下取得最好的宣传效果,提高广告投放的回报率。
5.4 电子商务中运用WEB数据挖掘技术,有助于电子商务企业提高点击率,完善系统设计
电子商务企业能够通过WEB数据挖掘技术挖掘用户的行为记录等信息,为系统设计者提供改进依据,完善系统的设计。例如当用户浏览某个页面时,预测用户可能会对哪些内容感兴趣,可以会希望浏览哪些页面,动态地将这些页面的超链接放在当前用户浏览的页面中,使用户可以方便地找到自己想要的内容,减少用户过虑信息的负担,使用户获得较满意的使用体验,同时网站也能获得较高的点击率,延长客户在网站停留的时间。
6 结束语
电子商务是一种基于网络平台的现代化商业模式,其前景广阔,发展势头强劲,而WEB数据挖掘技术能够帮助电子商务企业统计分析企业积累的大量数据,从中挖掘出有价值的信息,为企业决策提供支持。本文介绍了如何将WEB数据挖掘与电子商务相结合,WEB数据挖掘能够使得电子商务管理更加智能化,服务更加个性化,但是WEB数据挖掘与电子商务的结合还存在许多问题,这些问题的解决还有待于我们进一步的探索与发现。
[1]邱明虹,何跃.从Web日志中挖掘用户兴趣路径算法改进.[J].计算机工程与应用.2008(26):17-19
[2]鲁俊,孙永鸿.基于电子商务应用的Web数据技术研究.[J].电脑知识与技术.2009(21):29-31
[3]戴菲.数据挖掘技术在电子商务中的应用.[J].电脑知识与技术.2011(21):15-17
[4]刘锋华. 浅析Web数据挖掘在电子商务中的应用[J]. 经营管理者. 2009(14):33-35