基于移动互联网形势下客户特点分类技术的分析
2015-06-22天翼爱动漫文化传媒有限公司林峰
天翼爱动漫文化传媒有限公司 林峰
一、前言
移动互联网(MobileInternet,MI)是指将移动通信与互联网合二为一,利用智能化便携式终端,通过移动无线通信方式来获取服务的一种新兴业务。移动互联网主要包括硬件、软件、应用三个层面,硬件层由智能手机、IPAD、MID、电子书等终端组成;软件层由操作系统、数据库、中间件、安全软件等组成;应用层由应用工具类、新闻媒体类、休闲娱乐类、科技财经类等不同应用与服务所组成。2014年4G时代的开启以及移动终端设备的凸显,对进一步促进移动互联网的发展注入了巨大的能量。但同时,客户对移动互联网服务的满意度与忠诚度,一直是困扰电信运营商经营发展过程中的一个重要因素。因此,在促进移动互联网快速发展的基础上,还应该通过多种手段获取客户,以此来获得更好的利润空间以及更长久的发展空间。
二、客户分类的概述
(一)对于客户分类的理论依据
客户分类是由美国学者温德尔·史密斯所提出的观点,客户分类主要包括客户行为、客户特点两类。对客户进行分类,是依据两点理论进行的:一是客户需求的异质性。从实际情况来看,若有两个及两个以上的客户,那便可能有不同的服务需求。由此可见,客户的服务需求和购买行为是呈多元化、多样化态势的。基于这一特点,对客户服务需求的满足也应该呈现差异性特点。二是资源市场竞争的特异性。受自身条件所限制,不论是哪个企业都无法只依靠自身能力来满足整个市场需求。正因为如此,企业应能够准确细分出能利充分发挥自身优势同时又最具经济效益的客户群,针对细化的客户市场,集中优势资源,制定合理、有效的服务策略,以此获取更多客户。
图1 客户分类步骤示意图
(二)对于客户分类的主要内容
对客户进行分类,通常包括数据收集、模型开发、关系建立和结果应用等内容。首先是明确需收集的数据,确定收集数据的方法;其次是开发统计模型或算法,对相应数据进行综合分析,将分析结果作为客户分类的依据;接着是建立协作关系,企业前端运营部门和客服部门应该与后端IT技术人员进行沟通交流,开展协同合作,确定客户分类的目的,明确客户分类的技术要求以及限制条件;最后是利用科学、完备的网络基础设施,汇聚、储存、处理及转发数据分析结果。客户分类通常可参考以下六个步骤(见图1)。
三、移动互联网形势下的客户分类技术
在移动互联网时代,人们主要通过APP(应用)或浏览器来完成搜索、网页浏览、下载资源等活动,因此,通过对客户上网记录进行数据挖掘和行为分析,有助于掌握客户上网行为和偏好。
(一)应用分类技术
电信运营商可根据客户对APP(应用)的下载量,选择建立标准应用库,通常分为四个步骤:一是电信运营商与相关主流互联网厂商紧密合作,从而爬取及分享互联网应用的介绍、下载地址、标签等数据信息;二是对于那些没有统一地址的手机应用,可以根据服务器的分布,对其进行地域验证;三是建立标准应用库与信息点分类标准之间的映射关系;四是构建电信运营商自有基地业务(如电信八大基地业务涵盖音乐、视讯、物联网、协同通信、应用商店、游戏、动漫、阅读)与标准应用库之间的映射关系。
根据上述四步骤建立标准应用库之后,再进行应用解析,包括对客户使用的解析与对客户下载的解析。客户使用的解析主要包括私有协议与公有协议两种情况,可将其分别解析为交互方式-视频类与社交-交友类两种解析方式。客户下载解析主要是通过域名与URL,解析为家庭-购物类。
(二)Web内容分词技术
Web内容分词技术,是指从海量的Web页面描述数据中发现数据信息,从中抽取知识,并对其进行分词处理的一种技术。从我国目前所用的汉语自动分词技术来看,其主要可分为基于理解的分词技术、基于统计的分词技术以及基于字符串匹配的分词技术三种。基于理解的分词技术主要是利用计算机模拟人对句子的理解,以此来达到识别词的目的,该技术在分词的同时,还可以对词的语义、句法等进行深入分析,并利用语义与句法信息,对歧义进行处理。基于统计的分词技术是指对语料中相邻共现的各个字的组合频度进行统计分析,以此来计算它们的互现信息,达到Web内容分词处理的作用。基于字符串匹配的分词技术主要是依据相应的策略,将需要分析的汉字串与机器词典中的词条进行匹配操作,以便能在词典中找到相对应的字符串,达到成功匹配的目的。
(三)URL特征分类技术
规则URL分类。规则URL分类技术主要是利用多级域名或目录,对网站的内容URL进行编码操作,从而建立热门网站频道与URL分类的相关映射关系,并采用爬虫技术,对所收集的热门网站URL进行分类处理。
无规则URL分类。无规则URL分析技术主要是指应用同一格式编码,利用上网日志来获取客户访问的无规则URL,然后再应用网络爬虫技术,爬取URL对应的网页内容,最后通过分词技术将相关的内容拆分成单个词,通过文本分类算法、关键词匹配等技术,来识别URL分类(见图2)。
图2 URL特征分类技术
通过URL特征分类技术,可以对客户上网行为进行如下分类:一级分类,生活服务、休闲娱乐、文化教育等;二级分类,商业经济、交通旅游、软件下载等;三级分类,导航地图、游戏平台、广告营销等;四级分类,交友综合、原创、办公应用等。
四、客户分类挖掘算法及分类过程
(一)客户分类挖掘算法分析
基于移动互联网的客户分类常用的挖掘算法主要有四种:一是时间序列算法。在电信行业,可通过时间序列算法,对客户的上网行为信息进行科学、合理地预测,同时利用周期性分析、趋势分析等有效的分析策略,为电信客户提供并推荐最合适、最实用的产品套餐,并以此来提升客户的上网流量。二是关联规则算法。关联规则算法是指对客户上网行为之间的关联规则展开分析,帮助电信运营商针对电信客户的个性化需求提供最合理、最实用的服务,通过该算法,可分析客户购买的电信产品之间的关系性,进而利用捆绑销售、交叉销售等方式增加销售额。三是聚类算法。聚类算法是将看似无序的对象进行归类、分组,最终达到理解研究对象的目的。在移动互联网背景下,对客户行为进行分析时,网站的信息分类、用户社交圈、网页的点击行为关联性等问题,均可利用聚类算法进行解决,电信运营商常用该算法进行客户群体细分、客户特征识别。四是决策树算法。该算法属于电信行业应用较广的归纳推理算法之一,利用该算法可快速创建挖掘模型,通过易于解释的模型,达到对客户流失、广告定位、风险管理等行为特点的分析。
(二)客户分类过程分析
首先,利用客户的移动互联网行为数据,找出客户访问内容、网站、上网时段、使用的客户端等信息,经过分析获取客户的上网行为偏好。其次,定时对客户的上网行为规律信息以及上网偏好信息进行汇聚、归纳,总结出客户对各类兴趣需求点按日计算的访问量统计值。最后,根据客户的移动互联网消费行为、网络行为、生命周期等客户特点,对客户的终端偏好、数据业务偏好、产品偏好等偏好进行分类分析,进而获得客户的特征数据。
五、结束语
上述针对移动互联网形势下客户特点的分类技术分析,为电信运营商的客户服务提供科学、实用的参考依据。但是在移动互联网时代,仅仅依据客户特点进行分类还不够,后续还需要进一步的在客户行为轨迹上的开展深入研究。
[1]郑乐.基于客户感知的互联网质量指标体系研究[J].中国新通信,2014,2(2):32-33
[2]董昱.免费模式助互联网企业吸引客户探讨[J].行政事业资产与财务,2013,22(22):75-76
[3]黄河,彭伟刚.互联网客户服务体系探索与实践[J].江苏通信,2013,29(3):56-57