电子商务平台中的Web数据挖掘应用探讨
2014-03-22王芳
摘 要:文章对Web数据挖掘技术的简要介绍、Web数据挖掘的过程、电子商务平台中Web数据挖掘技术的应用情况以及Web数据挖掘在电子商务中的作用分析四个方面的内容进行了详细的分析和探讨,从而详细的论述了我国电子商务平台中的Web数据挖掘技术的应用情况。
关键词:电子商务平台;Web数据挖掘技术;应用研究
1 Web数据挖掘技术的简要介绍
1.1 Web数据挖掘的定义。所谓的Web数据挖掘就是指借助于数据挖掘技术在Web服务和Web文档中获取我们所需要的信息,其是一项结构较为复杂的综合性技术,涵盖了计算机语言学、人工智能、数据挖掘技术、数据库、Web技术以及统计学等众多的领域。与传统的数据挖掘技术所不同的是,Web数据挖掘主要的研究对象是以非结构化文档或是半结构化文档为中心的Web,它们的内容和表示是相互交织的,并且没有统一的模式,用语义信息也无法精确的描述出这些数据内容,要想在结构上对这些数据进行描述就必须依靠HEML语法。
1.2 Web数据挖掘的分类。(1)Web结构挖掘。超文本文档相互之间是有着紧密的联系的,所以,WWW在可以显示出文档内容的同时,也可以显示出它们之间的关联关系所代表的内容,对页面进行排序时如果能够很好的应用这些信息,就能够找到有重要应用价值的页面。其根本的作用就是要发现Web结构和页面结构,这样就能够准确的对页面进行聚类和分类,从而找到我们需要的页面;(2)Web内容挖掘。这类Web挖掘技术就是指对Web上富含的大量文档信息进行有效的总结、聚类和分类,对其关联性进行详细的分析,并进行相应的趋势预测,一直到最后获得有价值信息的过程。Web上的数据可以有文本、图形、视频、图像以及声音等多种类型,也可以是结构化的数据或是无结构的自由文本,其主要有Web多媒体挖掘和Web文本挖掘两类;(3)Web使用挖掘。此类挖掘技术是指分析用户访问过的Web的历史记录,掌握用户的浏览习惯和兴趣,预测用户可能发生的浏览行为,从而为其提供个性化的网络服务。
2 Web数据挖掘的过程
2.1 Web资源搜集。此过程就是借助于蜘蛛和爬虫等网页抓取工具来在电子商务网站上搜集用户使用的页面信息,用户请求的页面就是游览页面,其是由脚本、图片和框架等部分组成的。
2.2 预处理。此过程就是在原始数据中集中的除去那些可能对挖掘效果带来负面影响的或是与挖掘过程无关的数据的过程,另外也会适当的删除数据的属性,最后应留下与挖掘过程相关的数据属性。
2.3 特征抽取。此过程就是指对Web文本的内容进行分析、聚类、分类和过滤的过程,其对知识发现以及准确的发现用户的浏览兴趣模式都是有着重要的影响。
2.4 模式发现。采用这种技术所发现的知识模式以及自动的发掘模式,既是对整个文档集合的趋势和结构所进行的藐视,同时也是对上一级文档的含义所进行的描述和概括。
2.5 模式评价。此过程就是对所产生的模式进行质量评价的过程,质量过关时,就应将这一知识模式存储下来,质量不符合要求时,就应进行新一轮的挖掘,直到改进过关为止。
3 电子商务平台中Web数据挖掘技术的应用情况
3.1 路径分析技术。这是一项寻找用户经常访问路径的技术,总体来说,其就是简化路径的过程,对Web服务器中文件和日志中的用户访问站点的次数进行详细的分析,从而找到经常访问的路径,帮助使用用户以最快的速度找到其所需要的产品或是信息。在用户访问某网站时,过多的中间页面势必会降低消费者的浏览兴趣,也提高了网站的维护成本,而这项技术就是有效的分析超链接之间的联系以及网站各个页面之间的联系,掌握访问次数最多的页面,将其它无太大使用价值的删除。
3.2 聚类分析。在市场细分时经常要用到聚类分析技术,将市场有效细分的依据就是顾客特征模式和购买行为的相似性,细分后应针对每一个市场都制定有针对性的营销策略。在电子商务平台上,我们应将有相似特性的用户数据和信息整理到一起,总结和归纳出他们的相似需求和喜好,为用户提供个性化的电子商务平台上的服务,为他们提供有建设性的购买建议,既提高了网络营销的效果,同时也培养了用户的忠诚度。
3.3 分类。此项技术既可以用于破产预测和划分顾客类别的工作中,也可以用于预测哪些购买人群对于赠券和邮寄产品信息等促销手段是感兴趣的。如果是商业性质的网站,分析用户的访问模式和相应的客户信息,就可以总结出用户所访问网站的特征,分类完成后,我们就可以掌握每一类客户的兴趣爱好,也能够发现潜在的购买客户,从而为每一类提供个性化的网络服务,并开展有针对性的商务活动。
3.4 关联分析。这项技术是一类在海量的数据或网络信息中找到项集之间关联性、项集的频繁模式以及因果结构和相互关系的技术,采用这项技术能够清楚的掌握用户的购买喜好和购买习惯,从而制定出电子商务网站上的商品摆放策略和捆绑营销策略。举例来说,在淘宝网站上的运动服装的页面上,既会有运动服装和运动鞋,同时也会有袜子、手套和帽子等配套产品的图片链接,消费者就可能一起购买,这对提高网站的销售量是有着明显的作用的。而优化网站结构的关联分析技术则能够找到网站中各种文件之间的关联性,也能够找到隐藏数据之间的相互联系,简化用户的浏览信息,并且用户当前的购买行为提供推荐,挖掘出各类购买群体之间访问页面的关联性,不断的优化设计电子商务网站。
4 Web数据挖掘在电子商务中的作用分析
4.1 提高用户满意度并发现潜在消费者。采用Web数据挖掘技术,通过对用户Web日志的挖掘,就能够准确的掌握用户访问Web页面的普遍模式,对Web日志的规律加以分析,就可以轻易的识别出用户的满意度、喜好、需求以及忠诚度,同时也能够发现潜在的消费者,增强了电子商务网站的服务竞争力,对提升站点的销售业绩也是有着积极的促进作用的。
4.2 提供个性化的服务,更加商务和智能。针对每一个用户的浏览站点的历史记录,了解他们的浏览习惯和购买兴趣,同时对每一个用户进行建模,记录用户的基本信息并分析其购买需求和使用习惯,这样在电子商务网站中,为每一个用户都提供更具针对性的个性化服务。在分析潜在消费者已经访问过的商品页面的内容后,应向用户提供大量的同类产品的链接页面,这样方便用户进行对比和选择,用户各个层次购买需求都能够得到很好的满足。
4.3 优化网站的结构。采用Web数据挖掘技术,对于提升所建设的网站以及所设计的服务器的合理性也是十分有利的,同时也可以更好的组织和设计Web主页,比如帮助改进分布式网络系统的结构,提升其设计的性能,在有高度相关的網站之间提供更加有效并且快速的访问渠道;另外,也可以帮助商家制定更准确的市场营销策略。
通过以上的论述,我们对Web数据挖掘技术的简要介绍、Web数据挖掘的过程、电子商务平台中Web数据挖掘技术的应用情况以及Web数据挖掘在电子商务中的作用分析四个方面的内容进行了详细的分析和探讨。作为一个拥有海量数据信息资源的大型数据库,如果在电子商务平台中能够较好的应用Web数据挖掘技术,准确的掌握其工作的规律和模式,对商家制定正确的商业策略会提供重要的支持和保证。当然,我们也应不断的完善Web数据挖掘技术,其在电子商务平台上有着广阔的发展前景,商家所建设的电子商务网站将更加的科学和合理,增强了商家的市场竞争力,并为消费者提供更加个性化的服务。
参考文献
[1]夏火松.数据仓库与数据挖掘技术[M].北京:北京科学出版社,2009.
[2]郭晓晨.电子商务中的Web数据挖掘应用研究[J].长春理工大学学报,2012.
[3]鲁俊.基于电子商务应用的Web数据挖掘技术研究[J].电脑知识与技术,2009.
[4]张冬青.数据挖掘在电子商务中应用问题研究[J].现代情报,2007.
作者简介:王芳(1982-),女,籍贯:安徽肥东,青岛大学毕业,助教,研究方向:数据挖掘,数据库。