数据挖掘在电子商务在线答疑中的应用模型研究
2016-10-21潘晓辉
摘要:随着电子商务蓬勃发展,数据挖掘逐渐应用在电子商务需求的方方面面。本文在分析了电商平台中在线咨询功能的不足后,利用数据挖掘技术,提出一种基于关联规则挖掘的电子商务在线答疑模型。
Abstract: With the prosperous development of the E-Commerce, data mining technology has been utilized in various aspects for E-Commerce requirements. This paper analyzed the inadequacies of online answering functions in existing E-Commerce platforms, then proposed a novel E-Commerce online-answering model based on the association rules, utilizing the data mining technology.
关键词:电子商务;数据挖掘;关联规则;在线答疑
Key words: E-Commerce;data mining;association rule;online answering
中图分类号:TP391.1 文献标识码:A 文章编号:1006-4311(2016)09-0169-02
0 引言
电子商务是利用互联网、电子数据交换、电子资金转账等信息技术在国家、企业及个人之间进行的以经济效益为中心,以商品及订购信息、资金及支付信息、安全及认证信息为载体,以实现商务活动的电子化、网络化与智能化为目标的现代商业运转模式。
电子商务是在开放的网络环境中,买卖双方互不谋面,所有的活动在网上进行。这也造成了买家对商品质量、功能、用法等形形色色的的问题无法通过实物接触来获得,而商家疲于应付无数买家大量相同或不同的问题咨询,耗费了大量精力、时间。因此,利用数据挖掘技术设计一个较高智能的电子商务在线自动答疑系统,使得电子商务运营中的大量客户随机咨询问题时,无需电商客服在线解答,系统自动实时解答,就可以较好的解决这个不足。
1 数据挖掘概述
数据挖掘是从大量的、不完全的、模糊的、随机的数据中,提取隐藏其中的、有潜在价值的信息的过程,其主要步骤如图1所示。
数据挖掘的常用方法有分类、聚类、关联规则发现、回归分析、特征、变化与偏差发现等。分类就是找出一组描述已有数据集合共性的模型或函数,以便来分类未知数据的类别,即将未知事例对应到某个给定的类别。关联规则发现是为了挖掘出隐含在数据中的相互关系,即根据一个事务中某些数据项的出现可导出另一些数据项在同一事务中也出现,即隐藏在数据间的关联或相互关系。
2 电子商务在线答疑系统模型功能介绍
电子商务在线答疑系统模型是针对消费者问题的普遍性和共性而提出的。简单而言,首先由电商客服将大量常见问题答案对保存在系统问题库中,当客户随机地在线咨询问题时,系统在问题库中查找相同问题或高度相关的问题提交给客户进行参考,客户认为问答一致时,在线咨询完成;客户认为不一致时,该问题才会发给电商客服,客服解答该问题并添加入系统问题库。
例如,客户通过互联网上的电子商务平台(如淘宝、京东等)向商家提出问题时,系统首先去理解问题,之后调用问题匹配算法对问题库中所有问题计算其相对新问题的匹配程度,比较每个问题匹配程度值和相同问题阀值得出相同问题,并按照匹配程度高低顺序且参照相关问题阀值得出相关问题,最后将最相关的匹配结果序列(数量可控且少量)发送给客户端,由客户从提供的答案中选出和提交问题吻合的答案。如果推荐问题答案序列中存在和新问题吻合的答案,则此推荐问题访问频度值自动加1;如果不存在,系统就认为问题库中无相似问题。系统将该新问题发往电商客服,客服在系统中向提问的客户回答该问题,并将该问题答案对保存入问题库,这样特殊性的问题回答也得到保证。
3 电子商务在线答疑系统模型的理论基础
针对客户提出的初始问题Q,系统分析后会产生一系列相关问题(Q1…Qm)。再依次对问题Q和其中的一个相关问题Qp分解为各自的知识点和语义词的序列(K1…Km,Y1…Yn)和(Kp1…Kp(mi),Yp1…Yp(ni))。把序列(K1…Km,Y1…Yn)转换为m*n个两两由知识点和语义词组成的模式(Ki,Yj)。分别把每一对{Q,Qp}分解和转换,就可以得到相关模式项集Ti={(Ki,Yj),(Kpi,Ypj)}。这样就把问题转换为模式。
然后,对相关模式进行关联规则挖掘。因为各个模式所在问题的访问顺序不同,在对问题的次序概化处理后,所得到的每个模式都有对应的相关程度的类别。而相关程度的类别都有类别系数,这样就产生一系列包含有相关系数的模式。对各个有相关系数的模式应用关联规则的挖掘,得到一些列在一定模式层次上的规则,应用调整算法进行合并、删除这些规则就得到比较理想的规则。上述过程如图2所示。
■
4 电子商务在线答疑系统模型
在线答疑模型简要概括为:①分解初始问题Q的知识点及语义词;②产生相关问题过程(Q1…Qm);③相关问题(Q1…Qm)相关度的计算和排序;④利用规则库等匹配出最相关问题或在无相关问题条件下将该问题存入问题库;⑤电商客服非实时维护问题库。
利用关联规则挖掘的结果,可以提出一个较先进的电子商务在线答疑系统模型,如图3所示。
■
在分解初始问题的基础上,对初始问题和规则库中的规则模式进行匹配,对应初始问题的相关度计算由下式得出:
F(Qi)=G(ki)+M(Li1,Lik)+N(ri)=ki+Li1+……Lik+5*ri
5 电子商务在线答疑模型应用效果分析
采用电子商务在线答疑模型可以更实时的为消费者提供快捷高效的咨询服务,对比目前电子商务客服利用网上通讯软件在线应答时频繁出现中断或延时,浪费了消费者的宝貴时间,预计可以节省60%的时间,可以节省80%以上的客服人员及客服设备。当大量消费者同时咨询时,会造成客服人数不够而增加人力,同时也束缚客服必须时刻在线守候,极大浪费了人力资源,因此在线答疑模型的实际应用会大大提高电子商务运营的效率。
但是,毕竟在线自动答疑模型的智能性还不能完全与客服人工媲美,当遇到一些较难以理解的问题或较特殊的问题时无疑会导致消费者无法得到满意的答案,此时还需客服来人工完成咨询回复,所以笔者认为在电子商务运营中采用在线答疑系统模型处理客户咨询为主,客服人工答疑为辅的模式最为理想。
6 结束语
电子商务摆脱了时空的限制,省掉了很多人力成本,实现了各类资源全球性的共享,正以无可比拟的优势迅猛发展。电子商务中商家与消费者的交流可以通过各式各样的数据。只要充分发挥数据挖掘技术的优势,即可对瞬息万变的电商运营环境作出最快最好的反应,以此达到商家和消费者双赢。
参考文献:
[1]Pang-Ning Tan,Michael Steinbach,Vipin Kumar. 数据挖掘导论[M].人民邮电出版社,2010.
[2]潘晓辉. 数据挖掘在智能答疑模型中的应用[J].微电子与计算机,2006.
[3]苏群,申瑞民,王武.改进型智能答疑模型的设计和实现[J].计算机仿真,2003.
[4]张同珍,申瑞民.基于web的自动答疑系统问题匹配算法研究与实现[J].计算机工程与应用,2003.