APP下载

休闲服企业询单顾客的关键词频率及其波动

2016-11-30刘小红

西安工程大学学报 2016年4期
关键词:客服日志网购

刘小红

(惠州学院 服装系,广东 惠州 516007)



休闲服企业询单顾客的关键词频率及其波动

刘小红

(惠州学院 服装系,广东 惠州 516007)

挖掘网购企业与询单顾客沟通中未被企业利用的日志数据.以某大型休闲服企业的网购客服日志数据为样本,利用关键词度量函数和预置关键词集合,提取客服日志数据中的关键词,应用关键词频率及频率变化模型,计算关键词频率在分析周期内的波动变化.结果显示,询单顾客使用词意相同的差异化表达方式普遍存在,关键词指向问题主要集中在产品与物流,3个一级因子和15个二级因子的频率波动存在此消彼长关系,在新产品上线、重大节假日、重大活动时,关键词频率波动会加大.可提高客服人员快速,准确地在词意相同的不同关键词之间进行转换的能力,提高客服服务水平.

询单顾客;关键词频率;客服日志

Key words: inquiry customer; keyword frequency; customer service log

0 引 言

在各种搜索引擎被广泛使用之后,研究者们开始对查询关键词、点击链接等问题进行研究,挖掘与利用搜索日志的价值[1],如利用信息检索中用户关心的关键词作为查询推荐[2].对于搜索关键词的分析与预测研究已经取得了较好的研究成果.张云秋等[3]提出搜索用户的信息需求与实际搜索行为有助于改善信息供求双方的决策行为.Ginsberg等人[4]利用与流感流行有关的网络搜索关键词搜索量的变化规律,建立了基于网络搜索的流感流行预测模型.唐晓波等[5]利用网购消费者的日志信息分析客户偏好和商品偏爱,建立了客户聚类的商品推荐模型.这些针对关键词的分析与预测研究需要精确提取关键词的技术支持.Wang D X等[6]将特征词在类内与类间信息与信息增益结合,改进了TFIDF算法,提高了关键词提取的准确度.黄磊等[7]提出在语言分析中预先设计完整的关键词词典提高关键词的提取效果.罗繁明等[8]提出一种基于多级统计特征的关键词提取(TFIDF-SK)算法.白晓雷等[9]在分析和提取术语特征基础上,提出基于神经网络的中文关键词抽取方法.以上文献反映了关键词在提取与应用方面的研究成果.本文针对网络营销中询单顾客与客服之间沟通产生的日志数据,提取关键词,计算关键词频数、频率及其波动变化,为电商企业提供询单顾客消费意向的变化及网购营销中存在的问题,提高了网店在商品描述、服务态度、发货速度等DSR关键评价指标的水平.

1 研究问题与方法

与传统实体服装店铺营销相比,网购消费者购物线索发生了根本变化,由于服装网购店铺缺乏实体店铺所具有的购物环境及实物体验,完全依赖事先习得的相关购物概念,利用搜索引擎,从网店页面及客服沟通中获取购物决策信息.邢治斌等[10]在研究网购消费者网购学习行为时发现,在利益驱动下网购过程学习行为使网购消费者的行为趋于一致.因此,在网络营销中,培养消费者相关购物概念,建立网购线索成为重要的营销手段,而客服将成为消费者购物的重要渠道.

对于大型服装网店企业,客服是网购业务的重要工作之一,客服人员占其人力资源的1/3.客服工作包括售前服务与售后服务,针对顾客群体的不同.进入网店的顾客包括以下两类:一是静默下单顾客,这类顾客不需要售前客服提供的导购服务,直接下单;二是询单顾客,这类顾客是潜在的顾客,需要售前客服提供顾客所关注问题的答案,最后才决定是否下单.两类顾客都可能需要售后客服提供的售后服务工作.笔者在某大型休闲服网店企业挂职过程中了解到,在网店流量中,询单顾客约占1/3,而且客服每笔价格比静默下单高出约15%,表明接受客服的顾客水平高一些,也凸显客服工作的重要性.由于客服工作人员整天忙于服务工作,加之数据分析能力有限,所有的客服数据处于睡眠状态而失去利用价值,而这些客服数据潜在价值的挖掘正是本文需要研究与解决的关键问题.

本文应用SPSS工具,对客服日志数据进行预处理,建立分析模型,从询单顾客的问题记录中提取关键词,计算关键词频率、关键词频率的时段波动等数据,分析顾客关注的焦点问题,揭示关键词频率及其波动的市场意义.

2 数据分析模型

2.1 建立分析数据库

分析数据来源于网购企业客服工作人员在应用淘宝“旺旺”平台与询单顾客沟通过程中形成的客服日志记录,以文本形式存于电子文档.其中,客服或顾客每发送一次对话,代表一条对话记录.应用SPSS软件打开客服日志文件,建立初始分析数据库.

2.2 确定分析关键词集

日志数据处理的问题是文本数据不能直接进行量化处理,而且由于顾客知识背景、用词习惯、网页图片语境、文字输入等原因,所有的对话内容都缺乏统一性、规范性,如同样的问题可能有很多种不同的表述、仅作回应的单个语气或网络词记录、利用网页图片语境的简略语、问候语、错别字等.因此需要预选设置关键词集合,利用这些关键词与日志数据中的对话记录进行匹配,以此判断顾客问题所涉及的关键词.显然,不是每条客服记录都能有关键词与之匹配的,但只要合理预置关键词,就可以最大限度地将顾客所关注的核心问题提取出来.

为此笔者访问了客服工作人员,了解到他们的主要工作职责包括两个方面:一是售前客服,主要负责在线接待工作,在线解答或处理顾客网上购物提出的品种、尺码、颜色、质量、性能、裁剪、面料、适用性等产品问题,快递公司选择、发货与收货时间、分仓等物流问题,直接折扣、优惠券、包邮、数量折扣、手机端优惠、天猫聚划算、唯品会等促销活动,邮费、地址及收件人、合并订单、开发票及备注绿旗、退单重拍、好评优惠券等下单问题,并做好相应备注以及每天检查顾客好评情况、网页短信电话等催款以及收货好评等.二是售后客服,主要负责在线投诉及退货处理工作,在线解答顾客提出的投诉问题,回复投诉处理结果,引导顾客完成相应退货流程、分清运费责任,电话跟进处理结果,做好顾客申请退款订单汇总、退款及退货数据检验、投诉维权等.

在调查客服工作内容的基础上,对客服日志数据进行了随机抽取,分析顾客对话记录中所涉及的问题.结合营销4P’S理论,考虑到休闲服产品本身特点,确定了88个关键词,并将这些关键词聚类为3个一级因子和15个二级因子,见表1.

表 1 关键词集Table 1 Keyword set

2.3 关键词度量函数

询单顾客语句记录集合V=(v1,v2,…,vi)T,预置关键词集合K=(k1,k2,…,kj),关键词度量函数定义为

2.4 关键词频率

“哪有劳烦,是承蒙王爷看得起,小女自当受宠若惊。”爹在一旁,说道,“明日如果王爷想要游历杭州,可让小女同行,为您一一介绍杭州美景。”

关键词kj在V中出现的总次数即频数记为Fj,关键词集合K中所有关键词在V中出现的总次数即总频数记为F,关键词kj在V中出现的频率记为fj,计算公式为

2.5 关键词频率变化率

一般情况下,关键词被顾客使用的频率越高,表示关键词所指向的问题被顾客关注的程度越高,对于企业来讲,就是营销中的焦点问题.但由于服装消费具有典型的时尚特征,在时间维度上,关键词的使用会呈现波动现象.有些关键词的使用比较平稳,有些关键词的使用有比较大的波动.因此,在计算关键词频率时,需要引入时间维度,在某个时间维度上关键词的频率计算公式为ft,j=Ft,j/Ft.其中,Ft,j表示关键词kj在t时间周期的频率,t时间周期单位一般为周、月、年,所有关键词在t时间周期内的频率之和为1.该值越大,表示该关键词在该周期被询单顾客关注的比例越高,而该关键词所指向的问题将是网购企业需要解决的焦点问题.

利用差分计算原理,关键词kj的频率变化率计算公式为ft,j=(ft+1,j-ft,j)/ft,j.其中,Ft,j表示关键词kj从t期到t+1期时,关键词频率变化率的波动大小,反映了该关键词被询单顾客使用的稳定或突变特征.

为了识别关键词kj在t时间周期的稳定或突变特征,以t期全部关键词频率变化率为总体,利用置信区间计算原理,计算关键词频率变化率在置信度a=95%的置信区间,即关键词频率波动的上限和下限,计算公式为

其中

关键词频率变化率在置信区间之内的定义为稳定,表示这些关键词指向的问题处于常态水平.在置信区间之外的定义为突变.向上突变,表示该关键词所指向的问题出现放大突变,企业需要重点关注向上突变的原因;向下突变,表示该关键词所指向的问题呈现消退,企业重点关注相关需求萎缩或解决相关问题的措施所产生的效果.

3 结果与讨论

3.1 抽取客服日志数据

笔者从挂职的某大型休闲服网购企业客服管理平台抽取一个客服ID共9周的客服日志数据,数据以文本格式输出,数据字段包括:流水号、客服时间、客服工作人员及顾客ID代码、客服工作人员与顾客的对话记录.应用SPSS打开客服日志文件,建立询单顾客客服日志初始分析数据库,其中共有340 709条对话记录.由于本文是围绕询单顾客所提问题开展研究,因此在客服日志文件中删除了客服工作人员的回答记录、系统自动回复记录以及空记录,最后抽取询单顾客发送的对话记录106 483条,具体样本特征数据见表2.各周询单顾客人数及对话记录条数差异的主要原因是市场原因、客服轮休、新客服上岗等原因,由于不属于笔者可控因素,不讨论其对本文研究结果产生的影响.

表 2 样本特征数据Table 2 Sample characteristic data

建立询单顾客客服日志初始分析数据库后,调用SPSS中的匹配函数,计算每一个关键词的频数时间序列变量Fij,删除Fij=0的记录后,保存于独立文件中,生成88个独立文件以记录每一个关键词的频数时间序列变量Fij.在此基础上将88个独立文件合并建立关键词分析数据库,数据字段包括:流水号、客服时间、客服工作人员及顾客ID代码、客服工作人员与顾客的对话记录、关键词记录变量、关键词频数时间序列变量Fij以及关键词对应的一级因子变量、二级因子变量.在该分析数据库中,共提取了14 561个询单顾客53 083个关键词,占询单顾客总数的80%.没进入关键词分析数据库的询单顾客记录与关键词没匹配,但这些记录并非全部是无意义的记录,主要受顾客词语表达的丰富性及预置关键词的局限性,难以全部选出.此外,对与关键词匹配,但语义与关键词词意义不符的语句也进行了删除.

3.3 处理结果与讨论

3.3.1 一级因子频率及波动 一级因子频率处理结果见表3.从表3数据可以看出,询单顾客与客服沟通的问题主要集中于产品与物流.对于电商企业,要提高客服的沟通效率与询单顾客的转化率,必须加强客服人员服装产品、物流方面的知识培训.一级因子频率波动处理结果如图1~3所示.从图1~3数据可以看出,产品因子在第2,3,8,9四周波动超出控制线,促销因子在第3,8两周波动超出控制线,物流因子在第2,3,7三周波动超出控制线,3个一级因子之间存在相互消长的关系,促销因子波动相对稳定.从波动时间节点看,新产品上线时,产品问题会增加,重大节假日、重大活动时物流问题及促销问题会增加.

表 3 一级因子频率Table 3 Frequency of first grade factors

图 1 产品频率变化率Fig.1 Change rate of product frequency

图 2 促销频率变化率Fig.2 Change rate of promotion frequency

图 3 物流频率变化率Fig.3 Change rate of logistics frequency

3.3.2 二级因子频率及波动 二级因子频率处理结果见表4.从表4的1~9周数据可以看出,询单顾客对产品的关注重点是服装尺码,占比最高;其次是款式、颜色与品种,对面料与质量的关注度较低.询单顾客对促销的关注重点在打折优惠上;其次是定向促销与关系促销.询单顾客对物流的关注重点在邮费与发货;其次是下单、改退及快递选择上.

二级因子频率波动处理结果见表5.从表5中2~9周的数据可以看出,询单顾客关注的15个二级因子都存在波动,定向促销与活动促销因其营销的周期性而呈现剧烈波动.第9周服装款式、尺码、品种、关系促销、定向促销等因子均呈现较大波动,与第9周企业的清仓行动加大,产品组合不完整、促销活动加强等有关.

表 4 二级因子频率Table 4 Frequency of second grade factors

表 5 二级因子频率变化率Table 5 Frequency fluctuation of second grade factors

3.3.3 关键词频率及使用偏好 由于询单顾客分布在不同地区,其语言习惯、服装知识、网购知识、网页环境应用等方面差异,在了解15个二级因子时,使用了词意相同的差异化表达方式.表6的处理结果反映了15个二级因子使用频率最高的关键词.在了解服装尺码问题时,询单顾客使用了诸如“S、M、L、码、号、胸围、腰围、殿围、尺寸、多大、身高、体重”等关键词,但使用最多的关键词是“码”,大多数消费者偏好用“码”来了解服装尺码,当然企业要满足各类顾客需要,客服人员应该能快速、准确地在不同关键词之间进行转换.

表 6 主要关键词频率Table 6 Frequency of main keywords

4 结 论

(1) 通过统计关键词频率及在不同时间周期的频率变化率,了解询单顾客关注的问题及变化,有助于监控客服工作水平的异常波动,指导客服工作人员提高与询单顾客的沟通效率及询单顾客转化率.

(2) 向消费者提供充分全面的产品信息及高效、快速、安全的物流保证,促进电商成功的交易.

(3) 从波动时间节点看,新产品上线、重大节假日、重大活动时,关键词的使用频率波动会加大.一级因子、二级因子的频率波动存在相互消长的关系.

(4) 询单顾客在地区分布、语言习惯、服装知识、网购知识、网页环境应用等方面差异,会使用词意相同的差异化表达方式,培养客服人员快速、准确地在词意相同的不同关键词之间进行转换的能力,有助于提高客户服务水平.

[1] BRENES D J,GAYO A D,PEREZ G K.Survey and evaluation of query intent detection methods[C]//Proceedings of the 2009 Workshop on Web Search Click Data.New York:ACM Press,2009:1-7.

[2] 李亚楠,王斌,李锦涛.搜索引擎查询推荐技术综述[J].中文信息学报,2010,24(6):75-84.

LI Yanan,WANG Bin,LI Jintao.A survey of query in search engine[J].Journal of Chinese Information Processing,2010,24(6):75-84.

[3] 张云秋,安文秀,于双成.探索式搜索中用户认知的实验研究[J].情报理论与实践,2013,36(6):73-77.

ZHANG Yunqiu,AN Wenxiu,YU Shuangcheng.experimental research on the user′s cognition during exploratory search[J].Information Theory and Practice,2013,36(6):73-77.

[4] GINSBERG,MOHEBBI,BRAMMER Patel.Detecting influenza epidemics using search engine query data[J].Nature,2009(457):1012-1014.

[5] 唐晓波,樊静.基于客户聚类的商品推荐[J].情报杂志,2009,6(28):143-146.

TANG Xiaobo,FAN Jing.Recommendation based on customer clustering[J].Journal of Intelligence,2009,6(28):143-146.

[6] WANG D X,GAO X,ANDREAE P.Automatic keyword extraction from single-sentence natural language queries[C]//Pricai 2012.Berlin:Springer-erlag,2012:637-648.

[7] 黄磊,伍雁鹏,朱群峰.关键词自动提取方法的研究与改进[J].计算机科学,2014,41(6):204-207.

HUANG Lei,WU Yanpeng,ZHU Qunfeng.Research and improvement of TFIDF text feature weighting method[J].Computer Science,2014,41(6):204-207.

[8] 罗繁明,杨海深.大数据时代基于统计特征的情报关键词提取方法[J].情报资料工作,2013(3):54-68.

LUO Fanming,YANG Haishen.On the statistical features-based information keyword extraction method in the era of big data[J].Information and Documentation,2013(3):54-68.

[9] 白晓雷,黄广君,段建辉.一种基于BP神经网络的关键词抽取方法[J].合肥工业大学学报,2014,37(7):801-807.

BAI Xiaolei,HUANG Guangjun,DUAN Jianhui.A keyword extraction method based on BP neural network[J].Journal of Hefei University of Technology,2014,37(7):801-807.

[10] 邢治斌,仲伟周,曾小春.消费者网购过程中的学习行为实验研究[J].经济管理与研究,2013(1):59-67.

XING Zhibin,ZHONG Weizhou,ZENG Xiaochun.Experimental study on learning behavior of online shopping consumers[J].Research on Economics and Management,2013(1):59-67.

编辑、校对:田 莉

frequency and its fluctuation based on casual clothing enterprise inquiry customers

LIU Xiaohong

(Garment Department, Huizhou University, Huizhou 516007, Guangdong, China)

Large amounts of log data is produced in communication with enquiry customer every day, but the data has not been effectively mined and utilized. A data sample drawn from the customer service log of a large-scale casual clothing enterprise was used to get keywords with the metric function and keywords preset.The fluctuation in the analysis period was worked out by the model of keyword frequency and frequency variation rate.Results show that it is common for enquiry customers to use different expression for the same word; keywords focus on the products and logistics; frequency fluctuation of three first grade factors and 15 second grade factors is a one-falls-but-the-other-rises relationship, and will increase in the new product launch, holidays and events.This can improve customer service.

1674-649X(2016)04-0433-07

10.13338/j.issn.1674-649x.2016.04.005

2016-03-06

惠州市科技计划基金资助项目(2015B0l0003002);广东省教育厅基金资助项目(粤教高函[2012]204号)

刘小红(1967—),男,湖北省天门市人,惠州学院副教授,研究方向为服装企业生产、贸易、零售.

E-mail:477809786@qq.com

刘小红.休闲服企业询单顾客的关键词频率及其波动[J].西安工程大学学报,2016,30(4):433-439.

LIU Xiaohong.Keyword requency and its fluctuation based on casual clothing enterprise inquiry customers[J].Journal of Xi′an Polytechnic University,2016,30(4):433-439.

F 724.6

A

猜你喜欢

客服日志网购
教老妈网购
一名老党员的工作日志
扶贫日志
网购寒假作业
网购寒假作业
语音推销
网购那些事儿
雅皮的心情日志
敬业的客服
游学日志