浅谈网络数据挖掘在电子商务中的应用
2009-09-05郑明
郑 明
摘要:电子商务是一种计算机网络信息技术,通过电子交易手段来完成金融、物资、服务和信息等价值交换,快速而有效地从事各种商务活动的新方法。
关键词:网络数据挖掘 电子商务 应用
0 引言
在电子商务模式下,商品的采购者都需要通过Web方式与商品的供应商及其合作者之间建立信息流的交互,但最先进的搜索引擎也只能找到Web网址的1/3网页,并且Web是无结构的、动态的,页面相当复杂。人们从成千上万的Web站点中找到有用的数据就变得比较困难。网络数据挖掘技术是克服这些缺点的最理想的工具,是一个有效的途径,利用数据挖掘技术可从Web中获取人们感兴趣的,潜在的有用模式和隐藏的信息,并可对数据进行分析,预测未来。如何把Web上的数据转换生成为有趣的知识模式的需求,激发了数据挖掘技术在Web上的应用,同时这种挑战性的工作也吸引了众多人的关注,成为数据挖掘领域的活跃主题。
1 网络数据挖掘的概念和分类
数据挖掘是一门受到来自各种不同领域的研究者关注的交叉性学科。网络数据挖掘就是从大量的Web文档和Web活动页中发现、抽取感兴趣的、潜在的有用模式和隐含的、事先未知的、潜在的信息。网络数据挖掘是对数据挖掘的一种新的应用。但不同于传统的数据挖掘。其主要区别在于:传统的数据挖掘的对象局限于数据库中的结构化数据。并利用关系表等存储结构来挖掘知识。而网络数据挖掘的对象则是半结构化或非结构化数据。网络数据挖掘技术的分类:一般而言,网络数据挖掘可分为3类:Web内容挖掘、Web 结构挖掘和Web使用记录挖掘。
1.1 Web内容挖掘:Web内容挖掘可以看作对基本搜索引擎所完成工作的扩展。多数搜索引擎是基于关键字的,Web内容挖掘超出了基本信息检索的范围。使用象概念层次、同义词、用户信息以及分析网页之间的链接等技术可以合引擎的效果得以改进。传统的搜索引擎使用看爬虫搜索和搜集信息,用索引动手术存储网页信息,使用查询处理为用户提供快速、准确的信息。
1.2 Web结构挖掘:Web结构挖掘可以看作是为万维网(或者其中的一部分)的组织建立一个模型。模型可以用来对网页分类或者为网页建立相似性度量。
1.3 Web使用挖掘:Web使用挖掘的研究对象是Web使用数据或者Web日志。Web使用挖掘可以应用于多种不同目的。通过分析一个用户访问的网页序列,可以得到用户的简档信息,从而可以帮助实现个性化。使用网站挖掘,可以评估网页的质量和效果。
2 电子商务中的Web数据挖掘
电子商务中的网络数据挖掘的过程一般由3个主要的阶段组成:数据准备、挖掘操作、结果表达和解释。电子商务中的网络数据挖掘数据的方法分为以下5种:
2.1 路径分析:它可以被用于判定在一个Web 站点中最频繁访问的路径。还有一些其它的有关路径的信息通过路径分析也可以得出。通过路径分析,可以改进页面及网站结构的设计。
2.2 关联规则的发现:关联规则就是为了发现事物之间的意义的联系和规则。进行Web上的数据挖掘。构建关联模型,可以更好地组织站点,减少用户过滤信息的负担。例如,用关联规则技术,我们可以发现:如果客户在一次访问行为中,访问了页面/company/product1时,一般也会访问页面/company/product2。得用这些关联模型,我们可以更好地组织站点,减少用户过滤信息的负担。
2.3 序列模型的发现:序列模式分析的侧重点在于分析数据间的前后或因果关系,就是在时间有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式。发现序列模式能够便于电子商务的组织者预测客户的访问模式,对客户提供个性化的服务。例如:若AT&T股票连续上涨两天且DEC股票不下跌,则第三天IBM股票上涨的可能性为75%;现比如,在/company/product1上进行在线定购的顾客,有60%的人在过去15天内也在/company/product4处下过定单。
2.4 分类规则的发现:数据分类是基于数据的某些属性的值进行的。数据分类方法很多,最为典型的是基于决策树的分类方法。它是从实际数据中构造决策树,是一种有指导的学习方法。得到分类后,就可以针对这一类客户的特点展开商务活动,提供有针对性的个性化的信息服务。比如,在电子商务中通过数据挖掘后,发现在/compqny/product2进行过在线订购的客户中有60%是20-30 岁生活在大中城市的年轻人。得到分类数据后,就可以针对某一类客户展开商务活动,提供有针对性的个性化的信息服务。
2.5 聚类分析的发现:聚类分析法输入集是一级未标定的记录。其目的是根据一定的规则,合理地划分记录集合,并用显式或隐式的方法描述不同的类别。在电子商务中通过聚类具有相似浏览行为的客户,使管理员更多地了解客户,提供更适合、使客户更满意的服务。
3 网络数据挖掘在现代电子商务中的应用
电子商务的产生,改变了企业的经营理念,给社会的各个行业带来了巨大的变化,将成为引导经济发展的新潮流。数据挖掘的应用将极大地提高企业获取信息的能力,使企业信息资源的价值得到充分地体现。它有利于促进企业开拓市场,优化企业资源,提高企业的经营效率和管理水平,为企业资源计划(ERP)、客户关系管理(CRM)、产品数据管理(PDM)和商业信用评估等提供有效的技术途径。
3.1 我们可以通过数据挖掘来理解顾客行为。我们可以利用访问者的行为将其分为三关,分别为“no custom”、“visitor once”、“visitor regular”,并依据它们的一些公共属性,决定分类的关键属性及相互间关系。此后就可以对一个新的访问者进行正确的分类,然后从它的分类判断这个新可后是否有利可图,是否可作为潜在的客户来对待。在电子商务中,通过数据挖掘我们可以了解客户的浏览行为、知道客户的兴趣及需求所在,并根据需求动态地向客户做页面推荐,调整Web 页面,提供特有的一些商品信息和广告,以使客户满意,从而延长客户在自己网站上的驻留时间。
3.2 Web数据挖掘技术可以提高着眼点的效率。Web设计得不再完全依靠专家的定性指导来设计网站,而是要根据访问者的信息特征来修改和设计网站结构和外观。着眼点上页面上内容的安排和连接就如超级市场中物品的货架摆布一样,把具有一定支持度和信任度的相关联的物品摆放在一起。
3.3 通过网络数据挖掘,公司可以分析顾客的将来行为,容易评测市场的投资回报率,得到可千的市场反馈住处从而大大降低公司的运营成本,以此评估电子商务的成功与否。
4 结束语
网络数据挖掘很好地解决了从数据到知识转化的问题,现在世界上的主要数据库厂商纷纷开始把数据挖掘功能集成到自己的产品中。作为电子商务成功的重要因素,它必将成为一种关键技术。虽然Web数据挖掘中的技术标准和安全性问题还有缺憾,但是随着现代科学技术的高速发展这些问题会得到完满的解决。电子商务将会得到飞速的发展和普及,让我们拭目以待。
参考文献:
[1]林豪锵.电子商务实务[M].北京:中国铁道出版社.2005.
[2]邹显春.电子商务与Web 数据挖掘[J].计算机应用.2001.21(5):21-23.
[3]郭崇慧,田凤占,靳晓明.等译.Dunham M H.数据挖掘教程[M].北京:清华大学出版社.2005.