基于电子商务数据挖掘技术的研究与应用
2015-07-06徐杰
徐杰
摘要:本文基于电子商务系统,运用数据挖掘技术,研究在电子商务中数据挖掘问题。根据电子商务系统中数据挖掘的特性,阐述了电子商务中数据源、数据的具体挖掘过程、常用数据挖掘技术和应用。
关键词:电子商务;数据挖掘;数据挖掘技术;应用
一、引言
基于Internet的电子商务迅猛发展,要实现整个电子商务(买卖)过程中的电子化、数字化和网络化,各企业经营者在电子商务活动要大量的收集数据,然后把这些商务数据转换成有效的信息,增加企业潜在的价值。数据挖掘技术是一种新的商业信息处理技术,在电子商务系统中利用数据挖掘技术为企业收集大量的信息,分析并提取有用的数据信息,便于企业营销策略有针对性地调整,提高企业管理和创新能力,提升客户服务效率。
二、电子商务中数据源
1、服务器日志数据。当客户访问电子商务站点时,与访问相关的日志数据会在服务器上自动产生然后以文本文件的形式在服务器上存储起来。例如客户浏览过的页面和关注的商品等生成日志数据。
2、搜索数据。指客户在电子商务站点上搜索信息时,在服务器上生成的一种搜索信息数据。例如,客户在线搜索某些产品或某些商务活动信息时,就会在服务器的访问日志上存储这些搜索信息。
3、在线市场数据。指客户购买物品信息、电子商务站点信息、商品信息等主要的数据存储于传统的关系数据库中,便于数据的关联分析。
4、站点页面数据。在电子商务站点上,客户访问页面上的图片、文本、图像等内容以及页面之间超级链接关系而形成的信息。
5、客户注册数据。指客户在电子商务站点页面上注册会员时,通过页面输入、提交给服务器的用户信息。在数据挖掘的过程中,将客户注册信息与访问日志集成,可以让数据挖掘的准确度大大提高,更进一步对客户进行了解。
三、电子商务中数据挖掘的具体过程
1、准备阶段。首先,根据数据挖掘的目标选择相应的目标数据,依据客户的需求从原始数据库中提取一组有用的数据。其次,对该数据进行数据类型转换、冗余记录消除等操作,最后,有针对性地对数据进行处理。
2、数据挖掘阶段。根据定义的问题对数据挖掘的任务和目标加以确定。分三步完成:第一步,选择最契合的数据挖掘方法,如分类分析、关联规则等;第二步,建立数据模型和参数,利用现有数据测试模型;第三步,应用该模型得到挖掘的结果。即数据的挖掘过程是根据人们预先设计好的“模型”来对分析、处理和预测数据的过程。
3、解释和评价阶段。根据上述阶段所得到的数据信息,经过仔细的分析和评估,剔除冗余和无关的信息,不满足用户要求的需要重复上述挖掘过程。然后对所挖掘的知识进行解释,便于用户理解和使用。
四、电子商务中的数据挖掘技术与方法
1、关联规则。在电子商务系统中,利用关联规则分析并挖掘出各数据之间的相互关系。例如,采用关联规则技术在商品推荐子系统中发现算法,根据用户当前的购买习惯向该用户进行商品推荐。关联规则推荐算法分为关联规则形成和推荐形成二个阶段。商品推荐子系统先根据关联规则对当前客户没有浏览的商品进行推荐度计算,再根据推荐度的大小,推荐未浏览的商品给当前客户。
2、神经网络。神经网络是模拟人脑神经元结构构建的非线性预测模型,对数据进行模式识别。在电子商务中,利用神经网络来解决商务数据复杂度的问题,建立在自学习数据模型的基础之上,对商务活动数据进行分类和回归处理。它以MP模型和Hebb学习规则为基础,形成具有信息分布存储和非线性映射特性的模型,建立多种神经元网络,处理电子商务中的数据挖掘技术问题。
3、聚类分析。聚类分析是运用样本中各事物之间性质进行比较,将性质相近的归在一类中,性质差别较大的分在不同的类中。电子商务中市场细分经常会用到聚类分析法,这样就可以根据已知的客户信息数据,将消费模式相似的客户分为一类,从而有针对性的进行调整营销策略,为客户提供更加适合更加满意的个性化服务。
4、分类分析。在电子商务中经常对挖掘的数据进行分类处理,即将数据性质相近的归在一类中,性质差别较大的归入不同的类中。利用已知类别事物的数据性质建立相应的函数式,对未知类别的新事物进行判别将其归入已知的类中。通过分析已知分类信息的历史数据,建立一个预测模型,预测哪些人可能会对哪些商品感兴趣,针对这类客户的特点开展商务活动,提供针对性的服务。
5、序列模式。序列模式挖掘是指挖掘相对时间或其他模式出现频率高的模式,电子商务活动中交易产生数据存放到相应事务数据库的表中,每一条记录包括用户的用户号、发生的时间、商品等项目信息。利用事务数据库来挖掘出涉及事务间关联的模式,分析用户几次购买行为间的联系,采取有针对性的营销措施。
五、电子商务中数据挖掘的应用
1、商品零售业。数据挖掘的主要应用领域在商品零售业中。随着信息化和电子商务的加速发展,商务数据量的不断增加,储存了顾客购买历史记录、物流、消费与服务记录等大量的销售数据。利用关联规则技术进行数据挖掘,有助于客户购买行为的分析,发现顾客的购买模式和趋势,从而设计出更好的商品运输与分销策略来使商品成本降低,改进服务质量,提高客户购买体验和满意度,最终实现商品销量比率和利润的提高。
2、金融投资业。各银行和金融机构均提供各种各样的银行服务、信用服务和投资服务等。在服务过程中会有比较完善、可靠和高质量的数据产生,便于金融投资业进行数据分析和数据挖掘。采用数据挖掘技术处理已有數据,根据挖掘到的模式做市场预测分析,作出最佳的投资方向选择,从而让金融投资的风险降低。例如在银行贷款业务过程中,银行可以根据客户的收入、学历、偿还与收入比率等来分析客户贷款偿还能力,这样有利于降低银行的贷款风险率。同时,还可以根据客户的信用度进行贷款发放政策的调整。
3、其它电商业中优化企业资源。基于电子商务平台数据挖掘技术能实时、全面、准确地掌握企业资源和销售信息,通过分析以往的财务数据、商品库存数据和销售数据,判断企业资源消耗的关键点和主要商务活动的投入产出比例,为企业资源优化配置提供决策依据,例如加大促销、提高资金使用率等。通过对电子商务活动数据挖掘,提取大量有价值的商业信息,为企业准确地把握市场动态,提高企业应对市场变化的规律和管理能力,合理协调内外部资源的关系,高效地利用好人力、物质和信息资源,使企业产生最佳的经济效益,促进企业发展的科学化、信息化和智能化。
六、结论
基于Internet的电子商务快速发展,要实现整个电子商务活动过程中的电子化、数字化和网络化,它是现代信息时代发展的必然成果,也是未来商业运作模式的必然选择,基于电子商务的数据挖掘技术将是一个非常有前景的领域。利用数据挖掘技术能帮助企业分析从网上获取的大量商业数据,提取有用数据信息,挖掘出商品的消费规律与客户的访问模式,针对性地帮助企业调整营销策略,优化企业资源,促进企业技术上创新和管理上创新,提高企业竞争实力。随着信息处理技术的发展,对数据挖掘技术的进一步的研究和经验的不断积累,电子商务数据挖掘技术的研究与应用必将取得长足的发展。(作者单位:贵州广播电视大学)
参考文献:
[1]石丽,李坚.数据仓库与决策支持[M].国防工业出版社,2003.
[2]毛国君.数据挖掘原理与算法(第二版)[M].清华大学出版社,2007.
[3]陈文伟.数据仓库与数据挖掘教程[M].清华大学出版社,2011.
[4]杨青杰.胡明霞.数据挖掘技术在电子商务中的应用研究[J].商场现代化,2008(16).
[5]周世东.Web数据挖掘在电子商务中的应用研究[D].北京交通大学,2008(06).