电子商务中数据挖掘技术的应用与研究
2018-02-19董敏王琨
董敏 王琨
摘 要:随着互联网技术的不断发展,大数据、云计算和数据的深度挖掘等技术的出现,给电子商务发展提供了更多的技术支撑。电子商务发展至今,从传统PC电子商务平台发展到今天的移动电子商务,让电子商务这个领域开枝散叶,不断扩展。本文主要是通过对电子商务平台中各类型数据的采集,对用户的购物行为和对商品的喜爱特点进行各种行为分析,已达到对用户购物行为数据的深度挖掘。以此可以理性地开展各种形式的电子商务行为,减少电子商务活动的成本,实现利益的最大化。
关键词:电子商务,评价数据,数据挖掘,行为分析
伴随电子商务在我国的飞速发展,各类型的数据也呈现快速膨胀阶段,已经达到海量级别。在电子商务平台中,用户在购买商品后,大部分会留下购物体验和对商品使用的感受和心得,这种数据称作为了用户评价数据。用户评价数据很大程度上会影响用户对该商品的购买的因素。因此,可以通过研究用户评价数据,分析数据之间的特点,挖掘数据的价值,就可以优化商品的不足之处,提高销售份额。
一、数据挖掘在电子商务中的作用
数据挖掘:英文名称为Data Mining,是从海量数据中分析出有价值、有意义、潜在的信息。并根据分析结果对各種决策提供数据依据和技术上的支撑。如何对海量数据进行有效利用,使得用户能够从海量数据中获得自己所需要的知识和信息,提高其各种活动的效率和价值。
在电子商务领域中,数据挖掘其主要的目的就是从互联网中获取大量有关于电子商务相关的数据,通过数据挖掘手段挖掘出电子商务活动过程中的潜在价值的信息,以此来指导电子商务营销活动,其具体的作用如下几点:
1.根据用户的浏览商品和购买商品的记录,挖掘出用户线上的活动规律,针对用户电子商务活动特点,指导电子商务平台用户提供线上的“个性化”服务。
2.通过对电子商务网站用户浏览商品页面数据的分析,可以帮助电子商务平台挖掘出该商品的潜在用户。
3.目前对于线上网站来说,主要用户都来自于搜索引擎和网站自身导航的引导,因此如何优化网站内部关键字和电子商务平台内部导航,以提高网站访问流量和方位商品的精准度。
4.通过对电子商务平台中用户对商品评价数据的挖掘,分析用户购买商品后的情感分析,可以更深层次的挖掘用户的具体需求。
5.通过平台Web数据的挖掘,可以分析出一定的网站威胁、欺诈、入侵和很多异常访问行为等。因此通过大数据挖掘分析,可以有效预防网络危机,构建出一个安全、和谐的网络环境。
随着大数据的广泛应用,数据挖掘对于电子商务的发展也起着很大影响,利用数据挖掘技术,可以有效的提高用户访问数量,优化网站访问效率,挖掘潜在用户、优化出售商品性能和提高网站安全环境等级等作用。
二、电子商务用户评价数据挖掘技术研究
1.电子商务数据挖掘的过程
数据挖掘作为大数据的重要发展方向之一,其主要的目的是挖掘潜在用户,服务于用户,为用户提供定制化的个性服务。在电子商务活动中,数据挖掘的服务对象是在线上的所有用户,本文主要是研究用户在电子商务平台中各种对评价数据,包括了对商品评价,物流评价和售后评价等各个方面。
在电子商务活动中,数据挖掘的一般过程分为三个方面:
(1)数据准备阶段,在该阶段主要是对数据进行采集、数据的预处理。数据采集,采用主题性爬虫进行,通过对电子商务平台的结果进行分析,采用面向电子商务网站的主题网站爬虫。同时利用云计算平台的高计算能力、高宽带量、大吞吐能力等有点,将网站爬虫部署到云计算平台中,采取并行技术,可以大大提高数据采集的效率,同时也可以提高数据采集的主题性。
将原始数据采集存放到数据库后,接下来就是进行数据的预处理阶段。数据的预处理就是通过消除噪声、计算缺值数据、数据去重,最终将数据转换成离散型数据的过程。
(2)数据挖掘阶段,对于采集和预处理后的数据,首先要确定是数据挖掘目标和类型。在确定挖掘具体的任务后,可以采用相应的数据挖掘算法进行数据的挖掘,具体的算法接下来会详细介绍数据挖掘的主要算法。经过数据挖掘过程后,会对挖掘的结果保存到数据库后,以便于接下来的处理。
(3)第三个阶段是对挖掘的数据结果进行评价,在该阶段主要是对发现的知识,经过量化评估后,对存在冗余的知识点和与挖掘目标任务无关的知识点进行清洗。其次就是对挖掘结果不完全满足的数据进行重新挖掘,可以选择其他数据挖掘算法进行。对于满足用户需求的挖掘结果数据,经过可视化处理后,提供个用户进行使用。
以上即是数据挖掘的三个主要阶段,可以看出,数据在挖掘过程中,会出现挖掘不理想的情况,因此就需要调整挖掘算法进行反复挖掘,直到对挖掘目标任务满足为止,同时保存挖掘不完整的过程,逐步的完善挖掘算法的自我学习和深度挖掘的能力,最终完成用户所提出的挖掘需求。
2.电子商务数据挖掘算法介绍
数据挖掘算法是实现数据挖掘的关键性技术,采取哪种数据挖掘算法会直接影响到数据挖掘的效果,以下即是介绍几种常见的数据挖掘算法:
(1)聚类挖掘算法,聚类分析是一种典型的统计学方法,是一种同数据库技术相结合形成的现代化数据挖掘最为常用的技术之一。其主要的思想是在给定的是一个初始化数据集中,搜索数据对象之间是否存在有价值联系。在电子商务活动中,可以利用聚类分析算法来发现客户群中不同特点的群组,从而针对不同的特征群组来优化商品上下架、推广的时间和位置,已提高商品销售量。
(2)关联规则分析法,该算法是比较基本的数据挖掘算法,其主要的思想是通过大量的数据来提取有用的数据,通过提出对提取数据和过去数据进行比较,找出数据与数据之间的关联性,从而发现其潜在的关系。该算法可以帮助许多商务决策的制定,为商务活动的决策提供可靠的数据依据。
(3)时间序列模式,该数据挖掘的主要思想是,通过发现按时间顺序查看时间事件数据库,从数据中找出一个或多个相似的时序事件,通过时间序列搜索出重复发生概率较高的一种挖掘模式。发现序列模式便于进行电子商务组织预测客户的查找模式,从而对客户进行针对性的服务。在时序模式中,一个重要影响的方法是相似时序。
(4)预测与评价,该方法与关联规则分析法有一定的相似性,都是对历史数据进行综合分析和归纳,从而推理出数据分布的时效性和规律性。从而对未来事件发展的趋势和结果进行预测和评估。
3.数据挖掘在电子商务中的具体应用
(1)建立电子商务推荐系统,数据挖掘应用于电子商务其最大的一个特点就是可以围繞客户为中心,为客户提供个性化服务。因此可以根据客户的喜好和不同的特征,可以建立其一个基于数据挖掘的电子商务推荐系统。可以通过该系统为客户提供与其感兴趣的商品,帮助客户快速找到所需要的商品,把电子商务由被动变为主动。
(2)优化商品的营销策略,通过对用户对电子商务平台Web页面的访问,采集用户各类评价数据,进行挖掘分析。可以充分了解用户在使用商品后的真切感受,从而优化商品营销的策略。针对不同的产品进行制定不同的营销策略,利用数据挖掘技术实现不同的产品优惠、各类型促销活动的策略方针,实现商品销售利润的最大化。
(3)优化平台网站结构,增强平台的安全性,对于电子商务平台来说,其方位的数据量和网站本身的安全性,是有个至关重要的运营因素。有很多方法可以很好的实现,但是数据挖掘可以通过客户本身的拥塞和访问平台的性能,来提示平台管理者加以改进平台的各项访问策略。比如网站的缓存策略、网络传输策略、流量负载平衡机制和数据的分布策略等。同时还可以有效防止非法人员恶意访问平台,消除平台的弱点,提高站点可靠性,保证平台的正常运行。
4.客户满意度分析机制,对于客户满意度的调查,可以通过各类型调查问卷来进行,但是这种方法最大的缺点就是被动,其效果与客户填写资料的主观性有着很大的影响。因此可以采取数据挖掘的方式来进行,通过采集和挖掘用户对商品、物流和客服的评价信息,进行情感分析实现主动式的客户满意度分析机制。这种分析机制可以主动、准确且客观的分析出客户对商品、物流公司和销售服务的各项调查数据,为改进平台的营销策略提供可靠的决策依据。
三、总结
通过数据挖掘技术,对目前电子商务提出一个更为深刻的课题,打破了传统的电子商务线上操作模式。对客户的行为进行深度的分析,为其提供更为有效、更为精准的商品服务,提供技术和数据上支撑,这也是今后一段时间内电子商务发展的一个重要方向。
参考文献:
[1]蒋良孝,蔡之华.电子商务中的数据挖掘及其应用[J].计算机工程与设计,2003,6(24),74-75.
[2]李涛,曾春秋,周武柏,等.大数据时代的数据挖掘--从应用的角度看大数据挖掘[J].大数据,2015,04:1-24.
[3]李雪菁.基于数据挖掘技术的电子商务客户关系管理[J].计算机与数字工程,2018.
[4]易新忠.数据挖掘技术在电子商务中的应用探析[J].现代经济信息,2018,13.
[5]刘芬.计算机数据挖掘技术的开发及其应用探究[J].现代工业经济和信息化,2018,06.
[6]史红霞.浅谈数据挖掘在电子商务中的具体应用期[J].计算机产品与流通,2018,04.