APP下载

电子商务中的数据挖掘及其应用

2016-05-19许霞唐浩汪永超

现代经济信息 2016年7期
关键词:数据仓库信息处理数据挖掘

许霞++唐浩++汪永超

摘要:互联网使用与发展使得电子商务在现代企业的地位日益加重,因此如何充分利用网络技术和数据库技术的业务优势,是目前所企业关注的一个重要问题。本文介绍了常用的数据挖掘和利用数据挖掘技术在电子商务分析领域的技术应用和建立动态,高效的电子商务的可行性,并做出更具针对性的电子商务网站,使得用户体验更加人性化,并为企业提供数据以支持业务决策。

关键词:数据挖掘;数据仓库;电子商务;信息处理

中图分类号:TP274 文献识别码:A 文章编号:1001-828X(2016)007-000-01

电子商务使得公司在发展商务活动的过程中得到大量的复杂的数据,这些数据需要通过一种方法将它转变成有用的信息和知识,从而为公司创造出应有价值。因此,通过在互联网对大量数据进行挖掘分析,从而对公司企业带来无比巨大的效益。通过数据挖掘技术,找出其中有效信息,进来调整企业营销策略,改善客户服务,使得企业的服务更加便捷更加人性化。

一、如何进行数据挖掘

挖掘数据过程可以分为3个步骤:

1.数据预处理。将数据文件或数据库合并;很多来自有效的数据分析得出的无用数据,除去无用的数据,并将其转换成以促进数据挖掘的格式等。

2.模式发现。通过模式发现来搜寻其中的能够用到的新的有效信息。web挖掘技术可以用于路径选择,相关分析,分类规则,聚类分析,序列分析等。

3.模式分析。从相位检测模式得到的模式的分析模型,通过技术手段,从中过滤掉不感兴趣的信息,得出有意义的结论。常用的技术有:关联规则,分类,聚类,序列模式等。

二、在电子商务活动中数据挖掘的作用

数字挖掘技术通过挖掘潜在信息来指导电子商务活动,通过这种方式来达到服务电子商务的目的。在电子商务中的作用有7个方面:

1.通过在客户浏览网站时反馈的信息来改善网络服务,提升客户的服务质量。

2.在对电子商务网站的浏览信息中挖掘潜在的客户。

3.通过挖掘商务网站的访问者的各类信息需求来优化服务,更加深入了解客户所需。

4.挖掘客户的购买需求与习惯来帮助开发产品和定制合理的促销策略。

5.通过对商品的访问状况和销售状况来优化营销活动。

6.针对不同客户提供不同的信息导航,方便客户的浏览。

7.通过收集客户在浏览时出现的各类错误,来发现该网站的漏洞以及不合理的部分,并改善问题,从而提高网站的稳定和解决客户的问题,以确保购物的效率。

三、常用在电子商务活动的数据挖掘方式

1.分类

数据挖掘分类启动一批已经分类数据集(训练集)来获取数据集中的知识。从而应用此模型(知识)的未分类的新数据进行分类。它的目标是分类或分类功能,数据项数据库用于特定类别的模型。分类的主要方法是基于数据分类树模型,贝叶斯分类算法,ID3算法和基于算法的神经网络等。例如,在医疗应用中,对象可以被划分成两种类型患病和未患病;在所有的财务中,该对象可以分为低风险和高风险类别。

2.聚类分析

聚类分析是一组相似的数据因之间的差异而被分成几类,其目的是使该各种类别之间的数据相似性属于同一个类别。聚类分析是数据挖掘的最常用的技术。聚类分析常用的方法有:聚类分割方法,层次聚类方法,基于密度聚类方法和罕见的高维聚类算法。从聚类分析的不同和分级的方法聚类分发数据之前,它们没有任何意义。在通过多次的删除或添加变量影响的分类方式,可以从中得到我们想要的最佳结果。使用电子商务的聚类分析的方法也非常广阔。一个典型的应用就是帮助企业通过数据分析来发现不同客户的不同需求,以及不同的方式来分享获取,对客户提供更细致的服务。

3.关联规则挖掘

关联规则是描述一个事物某些项目可以导出到其他项目的数据点数据库之间的关系出现,这是隐藏在之间的相关性或关系规则数据,例如,在相关的采集的事件购买各种产品。在电子商务,有一个由交易数据大量且有趣的业务关系,它可以帮助使许多商业决策。在典型的购物篮分析中,通过客人对购物篮中商品的分类,来得到不同产品之间的联系并得到决策制定。典型的应用是超市的客户,以确定哪些产品将被放置在一个购物车或购物篮,他们就会购买这些商品。这些信息可以帮助零售商选择调节分配和货架,行李箱出售。例如,将牛奶和面包放在一起刺激客人去同时购买这些商品。在电子商务,Web服务器因为日志文件记录访问用户数据,这些数据通过使用客户挖掘关联规则来购买产品的网上某些偏好和品牌忠诚的相关性,价格可以接受的范围内和包装要求的结果可以用来挖掘,以帮助管理人员计划,确定投资品,价格和新产品的类型。

4.序列模式分析

关联规则挖掘模型和类似的序列分析,而是侧重于之前和序列分析后的数据之间的关系。他发现,在一定的时间期限内形式的数据库,顾客购买商品1,然后购买商品2,然后购买商品3,会出现1-2-3这样的多次出现的数据。描述序列分析模型的问题是,每个序列是按照调节与交易的时间进行,在一个特定的数据库事务的序列,如果序列功能的事务处理流程数据库代理定义了一组,高频序列数据库会出现。当连续模型的分析,还要求用户输入至少最低的最低支持C和信任S。序列模式促进电子商务组织预测的方法给客户端,从而进行有针对性的广告服务或建议,尽力满足客人的各式各样要求。

四、结语

电子商务是现代信息技术的发展与应用,它给人们带来便捷的同时也给企业与公司带来了新的商业模式,并为未来的商务网站的运营提供了有力保障。而电子商务网站离不开数据挖掘技术,利用数据挖掘技术来分析大量数据,可以挖掘客户购买习惯以及浏览习惯来分析策略,并帮助企业制定有效的营销策略,充分发挥优势独特的企业,推进技术创新和管理创新,增强企业的竞争力。

参考文献:

[1]吴春琼.浅析数据挖掘技术及其在电子商务中的应用[J].黑龙江科技信息,2009,(30):90.

[2]叶俊,胡同森.数据挖掘技术及其在电子商务中的应用[J].丽水学院学报,2010,32(2):42-47.

[3]孙学军.Web文本数据挖掘技术及其在电子商务中的应用[J].菏泽学院学报,2011,33(2):35-39.

猜你喜欢

数据仓库信息处理数据挖掘
东营市智能信息处理实验室
基于数据仓库的住房城乡建设信息系统整合研究
地震烈度信息处理平台研究
CTCS-3级列控系统RBC与ATP结合部异常信息处理
基于并行计算的大数据挖掘在电网中的应用
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于数据仓库的数据分析探索与实践
基于GPGPU的离散数据挖掘研究