基于云计算的客户知识共享资源库平台构建
2015-04-13黄章树李宝玉陈翠萍
黄章树 李宝玉 陈翠萍
(福州大学经济与管理学院,福建福州 350108)
基于云计算的客户知识共享资源库平台构建
黄章树 李宝玉 陈翠萍
(福州大学经济与管理学院,福建福州 350108)
云计算技术的发展与成熟为跨平台数据资源的共享带来了福音,其强大的计算能力、高存储、低成本特征使得资源的共享变得更加切合实际需求。本文围绕电商企业客户信息管理中存在的问题,阐述基于云计算服务模式的客户知识共享资源库平台的构建思路,从平台的服务模式、资源管理和三层架构模型三方面论述平台的实现过程,详细介绍了平台的主要应用服务内容。最后通过基于该平台的RFM模型应用论证了基于客户知识共享资源库进行精准大数据挖掘的可行性。
知识共享;资源库;云计算;客户管理
互联网高速发展的今天,数据已经成为提升企业综合竞争力,赢得市场的关键性资源。“大数据摩尔定律”揭示了数据量正以超乎想象的速度在增长,随着客户数据的几何倍数增长,电商企业面临的挑战也日益加剧。大数据的4V特征(Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值))的每一方面都对企业数据处理工作造成巨大的挑战。特别是Web2.0时代的到来,客户在互联网络上的表现越来越活跃,社交网络、大众媒体、口碑式电商等平台的信息与日俱增,不同媒介平台信息的强异构性、分布存储性、高冗余性及海量性是一般电商企业所无法驾驭的。面对企业内外部的海量数据,企业如何利用海量数据挖掘出有价值的客户信息以及通过洞察分析海量数据,帮助企业做出更快更明智的客户管理策略成为当今研究的焦点。
构建基于云计算服务模式的客户知识共享资源库平台(Customer knowledge sharing resource library,以下简称CKSRL)是解决上述问题的一个可行方案。借助云计算平台强大的分布数据存储、高效的计算能力及虚拟化特点,CKSRL旨在实现跨平台异构数据环境下电商企业客户信息的自动过滤、清洗、安全管理和推送服务。平台以用户为导向,以最大化实现用户的个性化需求为目标,通过数据挖掘技术辅以适合的规则匹配算法实现对用户需求资源的提取、过滤、评价和推荐功能。
1 研究综述
对云计算(Cloud Computing)的定义学术界并没有形成统一的意见,由谷歌首席执行官埃里克·施密特在2006年的搜索引擎大会提出的云计算概念被认为是其最正统的诞生记,自那以后云计算受到国内外广大学者的追捧,从用户角度最通俗的理解为:云计算是一种新型的商业模式,它像水电煤气一样,只要你需要,给付一定的费用即可得到。目前云计算被广泛应用于金融、医疗、IT等领域,Google的App Engine开启公司的云计算之旅;亚马逊的云计算服务(Amazon Web Services,AWS)在IaaS领域中独领风骚,成为全球范围内实际意义上的公有云计算主导者;在国内阿里巴巴集团于2009年成立“阿里云”子公司专注于云计算领域的开发研究;腾讯也在2010年加紧脚步进军云计算领域,目前已有较成熟的云服务器、云存储产品。
在云计算数据管理方面上的应用研究,国内外已有一些研究成果:国外学者Goscinski和Brock(2010)提出基于云计算的Web服务资源框架(RVWS),研究如何通过网页接口进行动态资源的发布、搜索、选择、使用现有云,并实践证明了其框架的可行性及高效性[1]。Teregowda等(2010)讨论了在当前索引文件疯狂增长及用户个性化需求日益增加的环境下CiteSeerx所面临的挑战,提出基于云计算的高虚拟存储系统以实现CiteSeerx的可持续经营[2]。J.Octavio(2010)等在其书中指出在云计算环境中消费者、中间商和服务提供商三者交互影响,其将每一参与者视为一个Agent提出了一种云环境下基于多Agent的服务资源组合优化框架[3]。Gutierrez(2011)提出面向服务的移动云计算体系架构,采用开放网关和APIs维持底层丰富的网络资源用以实现网络服务(NaaS)[4]。国内学者张鼐(2010)以图书馆信息资源共享问题为例探讨了基于内容构建和服务构建的图书馆信息资源共享模式[5]。刘向等(2014)提出采用中介器/封装器设计模式,以GLAV方式实现中心节点间的数据分布存储和信息交互,构建基于云计算环境信息资源集成共享五层架构模型[6]。综上所述,对云计算的体系及构架的研究已有一些成果,但在电商领域的客户知识共享管理的应用方面还有待进一步的研究。
2 电商企业客户信息资源管理存在的问题
电商企业的客户信息资源管理往往局限于内部数据的挖掘,然而内部信息往往只是客户信息的冰山一角,并不能反映客户的真正需求。特别是在互联网背景下,一方面,客户网上社交行为产生了大量的用户偏好数据、实时产品需求信息,这些信息往往对准确判断客户需求至关重要。另一方面,随着电商平台的发展,客户的选择更加自由,客户跨平台的交易使得单平台的数据挖掘变得不可靠,例如客户实际已经在B电商平台购买了最近在A平台搜索过的产品,但是由于信息的不对称,A平台根据最近搜索推荐机制仍继续向客户推荐该产品,如此不仅影响平台的广告效果而且也造成了客户主观厌倦甚至是被视为广告骚扰。此外,中小电商企业由于资金、成本、人才等的限制,在海量数据中提取、处理和利用数据的成本往往超过了数据本身价值。因此迫切需要一种基于按需付费、低成本、高可靠性与扩展性的客户知识交易模式为企业提供有价值的客户信息。鉴于此,本文提出基于云计算的客户知识共享资源库平台的构建方案,并阐述平台的主要应用服务内容。
3 基于云计算的CKSRL构建
3.1 平台构建的意义
CKSRL平台体现的是以用户服务为中心,采用需求拉动形式的服务模式,为电商企业提供按需付费的客户知识管理服务,平台借助云计算技术以解决跨平台资源异构性、分布存储问题。平台的建设具有较强的现实意义。
(1)CKSRL中的客户知识是基于数据共享的多平台数据整合与交互,因而从共享资源云中抽取的数据能够提供客户360度全方位信息,其客户知识准确度更高,知识覆盖范围更广。
(2)CKSRL助力电商营销,各互联网运营商平台通过公共数据云建立客户知识模式后,能够借助其电商用平台特点为中小型电商企业提供精准化、个性化营销服务。
(3)基于“云计算”的服务模式让中小型电商企业的大数据客户挖掘价值成为可能。按需付费的客户资源获取,使得中小电商企业能够以较低的成本进行有效的客户关系管理。
综上,CKSRL的建设具有较强的现实意义,以下将从CKSRL的服务模式、跨平台信息资源管理方法、平台构架及其主要功能论述CKSRL的构建方案。
3.2 服务模式
要实现客户资源的共享,首先必须建立相应的信息服务共享机制,如图1所示,由资源管理仲裁委员会负责资源的统筹问题:制定相应的标准、服务机制、资源管理策略等并寻求合适的云计算运营商,由云计算运营商根据服务协议内容进行共享资源云的构建,解决跨平台数据源的资源云架构、资源数据安全、资源分配、使用管理问题。电商平台、社交网站等互联网运营商平台既是共享资源云的资源供应商,也是资源云的受益商,它们首先基于信息提供协议向云计算运营商提供其平台资源接口,接着根据资源云的信息使用协议,取得公共资源云的授权资源,构建各自的CKSRL应用服务平台为其平台上的电商企业提供客户知识管理服务以及广告营销服务。由此可见,平台的实现将涉及众多的利益相关方如提供与使用资源的平台运营商、维护共享云的云计算运营商、平台最终用户——电商企业,它们之间彼此相互关联相互依赖,但又存在资源竞争关系,因此仲裁委员会需要解决如何基于合作博弈最大化各平台的利益。
图1 服务模式
3.3 跨平台信息资源管理
跨平台信息资源管理是构建CKSRL平台的重点难点之一,为了能够实现不同信息源之间的共享与交换,首先需要解决各平台底层资源的异构性和复杂性问题,以实现分散资源的整合。这部分工作主要包括跨平台信息资源的描述、资源发现与匹配、资源的动态管理等。目前比较常用的资源描述方法有HTML(超文本链接标记语言)、XML(或扩展标记语言)、RDF(资源描述框架)和本体语言。HTML广泛用于Internet上的信息描述,但由于其扩展性较弱且其表达性较差无法适应云计算的资源描述需求,因此在云计算领域中后3种语言较为常见,这3种语言在HTML语言的基础上进行衍生与扩展,其较好地描述了异构信息资源的内外部特征;资源发现与匹配通过数据挖掘方法实现跨平台的资源调用与资源整合,当前的主流方式有基于分布式环境下的信息资源发现机制和基于语义规则的匹配,张迎新等(2010)提出一种基于服务属性和功能描述的混合服务匹配方法,以服务本体为基准采用LSA算法进行相似性匹配并实证了此方法的效率优化性[7]。在资源动态管理方面,客户信息总是处在不断的变化当中,为了达到最大化的客户知识协同管理,必须解决信息资源在不同资源平台的动态复制与迁移问题。而不同平台的信息结构、负荷能力往往不同,因此需要建立一套具有高扩展、强时效、适应资源状态不断变化的高效动态管理机制以实现对信息资源进行合理的分配与协调。
3.4 CKSRL平台架构
基于云计算的CKSRL平台是从用户的角度出发,以需求推动系统的运行,因此选择一种合适的架构模式至关重要。目前比较常见的模式有:基于层次的架构、基于代理Agent的架构以及基于P2P点对点的架构,关于这3种模式的研究,徐达宇等(2012)在其论文中进行了详细的探讨与说明,并建立了云环境下多源信息资源管理系统框架[8]。基于层次的架构模型与HTTP请求类似,它将请求的资源逐层提交给上层服务器后,服务器处理完毕后再逐层下发给请求层,其相关理论及技术的发展较为成熟,因此本文采取此种模式进行研究。
假如在数据整合之前,所有数据中关于客户隐私的细节都可以被有效隐藏。那么通过整合分布在各个平台的数据“云”构建一个庞大的“共享资源云”,由资源管理仲裁委员会授权的云计算运营商进行“共享资源云”的基础建设及资源管理。各互联网平台基于对资源云的资源贡献度及资源付费规则获取相应的授权资源,实现以客户知识发现为核心的CKSRL平台构建,然后通过CKSRL平台为电商企业提供按需付费的客户知识服务,同时也能为各平台的产品推广提供有力支持,最终提高各平台的广告营销效益。CKSRL平台架构分为3层,分别为云数据层、云计算层、云表现层,平台结构如图2所示。
云数据层是构建CKSRL平台的基础,主要实现将不同平台上的数据资源进行整合,建立共享资源云,实现跨平台数据的整合、抽取、清洗以及客户隐私信息的有效屏蔽。其主要包括物理层和数据云两部分,物理层面向的是数据传输媒体,主要由各电商平台、社交平台、搜索引擎等互联网平台的服务器设备、数据库存储设备、网络设备构成以及云计算运营商的资源整合管理设备组成;数据云层通过采用虚拟化技术实现共享资源云的构建,为跨平台的数据共享协同工作打下基础;该云层的技术关键点在于虚拟化技术和数据库访问中间件技术的应用,为节约软硬件的投入成本需要采用服务器虚拟化以及技术最大化服务器的利用率,为系统提供相互隔离的应用执行环境以实现各子系统的安全性,此外采用服务器虚拟化技术进行动态资源调配也可提升系统运行的稳定性;数据库访问中间件技术解决的是不同互联网运营商间数据接口的不一致问题,不同运营商所使用的数据库不一样,有的使用ORACLE,也有的使用SYBASE,使用该中间件可隐藏网络部件的异构性,实现服务器透明性、网络透明性以及语言透明性。通过以上两种关键技术最终实现物理层和数据云层的交互。
云计算层是平台架构的核心层,该层负责对共享资源云进行有效管理,主要包含3个方面,(1)用户管理:保证用户数据的安全性,对用户权限的合法性进行控制;(2)资源服务管理:对入池资源进行审核,根据资源调配机制进行资源分配、资源访问、申请管理、任务分配、资源使用计费、共享云监测和能耗管理等工作;(3)平台安全服务:保证平台数据的安全存储、合法使用,确保平台运行的稳定性以及服务器间信息传递及网络信息的安全性。云计算层采用Apache开源云计算框架——Hadoop,其底层的分布式文件系统(HDFS)具有高容错性和高吞吐量,能够实现低成本的海量数据存储。上层的MapReduce实现任务的分散与结果的汇总,为提高计算效率提供了技术支持。至此,云计算运营商完成共享资源云的搭建工作,与此同时各平台根据各自CKSRL建设需求引入数据分析中间件实现进行数据分析挖掘管理工作以实现用户的需求。
云表现层位于三层结构的最顶层也即CKSRL的具体应用层,其基本应用服务含有客户基础知识库管理、动态需求库管理、决策支持分析、广告推送营销服务、可视化分析报告等应用,在此基础上也可根据用户的具体需求进行改进与完善,从而满足客户个性化的资源获取需求。本层由用户接口、服务内容、访问模式、客户管理等功能组成。其中用户接口层描述终端的资源请求方式如电脑终端、手持终端等;服务内容即用户的服务请求内容;访问模式主要有B/S模式、C/S模式;用户管理主要实现前端用户的访问权限控制以及对用户的合法性进行审核。
图2 CKSRL平台系统架构
3.5 CKSRL平台的应用服务
共享资源云通过虚拟化技术集中了海量信息资源的虚拟映射,各互联网运营商基于“共享云”借助大数据分析与挖掘工具实现CKSRL平台应用服务,提供客户360°全视图知识管理、动态需求分析、客户关系管理、精准广告服务。
3.5.1 客户360°全方位基础信息的收集
通过已有客户数据的积累,结合公共数据资源云进行客户知识的完善及客户群体的分析,构建包含客户人口统计学特征、人口地理学特征、购买时机特征、消费特征及群体特征的客户360°全方位信息知识库。其中人口统计学特征包括:性别、年龄、学历、行业、职业等;地理特征包含:购买渠道、购买地点等;购买时机特征包括两方面内容,一是公共时机如双11、双12、国庆、春节及各种节假日等全民性活动;二是个人时机特征如结婚、入学、纪念日等;消费特征描述客户的消费、服务偏好、产品购买生命周期等信息;群体特征给出客户的个性特征、生活偏好等。
3.5.2 客户动态需求分析
在线广告营销成功的关键在于“在正确的时间,正确的地点,向正确的消费者,使用正确的营销策略,销售正确的产品”,因此获取客户的实时动态需求至关重要,CKSRL平台使用日增量方式更新动态需求库的客户实时需求。通过抓取待分析客户的社交数据、电商平台浏览记录及搜索引擎的数据,结合客户基础知识库中的客户信息即可建立客户购买意向预测模型,实现客户动态需求分析。
3.5.3 客户关系管理
结合用户本身积累的企业内部客户信息,平台可为企业提供全方位的客户关系管理咨询服务工作,包括:利用平台现有资源采用相似度模型挖掘潜在客户,对已有客户进行交易分析、生存分析、客户流失预警、行为预测分析,提供客户保持及挽留策略,量化客户关系管理成本绩效。
3.5.4 精准广告推送
在线广告投放的典型任务包括搜索广告、上下文广告、显示广告及行为定位,平台建立一整套与在线广告投放、计价、效果评估等相关的算法模型库,如精准广告推送的关键词匹配、排序算法、受众人群匹配算法等;基于CTR(Click Through Rate)点击率的广告投放成本预测模型,结合客户基础知识库及动态需求库建立用于客户定位的协同过滤模型等。通过这些算法库模型实现精准广告营销、广告成本测算及效果计量。
4 基于CKSRL平台的RFM模型应用
RFM(recency,frequency,monetary)模型是CRM中的重要模型,它被广泛用于衡量客户价值和估算客户创利能力。通过R(客户最近一次交易离现在的时间间隔)、F(客户购买频率)、M(客户的消费额)3个指标来衡量客户的价值。传统的RFM是建立在自有数据库基础之上的,但对于多数电商企业来说,采用单一平台进行的RFM客户知识挖掘并不能保证数据挖掘的准确性。此外,随着电子商务的不断发展,每一商品都有其易获取的替代品,且同一商品在电商平台上都存在多个店铺同时在售,因此要掌握客户对某一产品的购买频率和最近一次购买时间点比较困难。若企业通过CKSRL平台,则可以采用按需付费的低成本方式取得比自主分析更精确的客户数据,具体流程如下:
图3 基于CKRSL平台的客户RFM分析流程图
步骤1:提交企业分析请求,企业根据自有数据库向平台提供所需要分析的客户名、主导产品等相关信息,平台分析人员对客户请求进行需求确认。
步骤2:获取客户基础信息,平台分析人员根据客户名匹配模式从客户基础知识资源库中找到对应的客户,同时输出综合各平台分析后的客户360°基础知识,如客户的商品定位、偏好电商平台、网购活跃度、偏好社交平台、社交活跃度等,将用户标上行为标签。
步骤3:数据抽取,通过步骤2得到待分析客户的基础信息后,结合产品特征从共享资源云中匹配客户及产品记录,取得客户相关产品及替代品的交易数据并对这些数据进行清洗,与此同时云计算运营商进行资源调度、分配与计费工作。
步骤4:数据挖掘,取得相关数据后就可以按分析主题进行数据挖掘,伴随着数据挖掘技术的不断成熟,如何有效选择合适的数据挖掘算法成为数据挖掘的重点。在客户价值分析方面,可以采用基于RFM模型和协同过滤的客户细分及价值分析法,根据上一步骤取得的客户产品及替代品的交易记录使用RFM算法即可得到客户对某一同质产品的最近一次消费的时间、购买频率、消费水平。最后,采用协同过滤算法进行客户群体的细分,将具有相似特点的客户聚为一类,为企业针对不同客户群体进行客户关系管理提供决策支持。
步骤5:交付与验收,分析员以可视化的表达形式向商家提供分析报告。商家得到相关分析报告后,可通过基于客户价值、客户购买频率、最近购买时间、客户产品定位、偏好平台聚类得到的客户群体细分特征制定个性化的营销方案。
通过以上步骤实现了对客户价值和客户创利能力精准化的全面估算。此外,通过对客户的购买频率分析,企业也可精确把握客户购买时机从而进行精准化营销。
5 结 语
互联网时代,传统企业建立在信息不对称和特殊渠道上的销售优势将被彻底颠覆,而基于信息交换与共享的资源整合及优势互补的客户知识共享将成为势不可当的趋势。本文通过分析电商企业跨平台客户知识管理中存在的问题,提出了一个基于云计算的客户知识共享资源库平台的构建方案,用三层架构模式——云数据层、云计算层、云表现层搭建了平台的主要架构,阐述了CKSRL平台的主要功能。建立了CKSRL平台的运营服务机制,探讨了跨平台信息资源管理的方法。希望通过CKSRL的建设与应用能在一定程度上解决电商企业客户信息的孤岛问题,有助于收集全面的客户信息,以便深入地进行客户信息的分析与挖掘,为企业的精准营销提供帮助。
[1]Goscinski A,Brock M.Toward dynamic and attribute based publication,discovery and selection for cloud computing[J].Future Generation Computer Systems,2010,26:947-970.
[2]Teregowda P,Urgaonkar B,Giles C L.Cloud computing:A digital libraries perspective[C].Cloud Computing(CLOUD),2010 IEEE 3rd International Conference on.IEEE,2010:115-122.
[3]J.Octavio Gutierrez-Garcia,Kwang-Mong Sim.(2010)Agent-Based Service Composition in Cloud Computing.Grid and Distributed Computing Control and Automation(pp 1-10).Berlin.Springer Berlin Heidelberg.
[4]Gutierrez,M.A.F..Mobile Cloud Computing based on service oriented architecture:Embracing network as a service for 3RD party application service providers.Kaleidoscope 2011:The Fully Networked Human?-Innovations for Fu-ture Networks and Services(K-2011)[C].Proceedings of ITU,2011:1-7.
[5]张鼐.云计算环境下信息资源共享模式研究[J].情报科学,2010,(10):1476-1479.
[6]刘向,王伟军,李延晖.云计算环境下信息资源集成与服务系统的体系架构[J].情报科学,2014,32(6):128-133.
[7]张迎新,潘善亮.基于混合模型语义Web服务匹配机制的研究与实现[J].宁波大学学报:理工版,2010,(3):38-43.
[8]徐达宇,杨善林,罗贺.云计算环境下多源信息资源管理方法[J].计算机集成制造系统,2012,18(9):2028-2039.
[9]蒋丽艳.基于云计算的图书馆信息平台的构建[J].现代情报,2011,31(8):47-51.
[10]Shvachko K,Kuang H,Radia S,et al.The hadoop distributed file system[C].Mass Storage Systems and Technologies(MSST),2010 IEEE 26th Symposium on.IEEE,2010:1-10.
[11]孙玲芳,张婧.基于RFM模型和协同过滤的电子商务推荐机制[J].江苏科技大学学报:自然科学版,2010,24(3):285-289.
(本文责任编辑:马 卓)
Construction of Customer Knowledge Sharing Resource Library Platform Based on Cloud Computing
Huang Zhangshu Li Baoyu Chen Cuiping
(School of Economics and Management,Fuzhou University,Fuzhou 350108,China)
The development and maturity of cloud computing technology has brought gospel to the data sharing on cross-platform,the characteristics of super-strong computing,high storage and low cost made resources sharing became more realistic.This paper analysed the problems existing in customer information management of e-commerce companies,elaborated the construction ideas of customer knowledge sharing resource library platform based on cloud computing.Introduced its implementation from the service model,resource management and three-tier model.Described the main functions of CKSRL platform.And finally through the application of RFM model based on this platform demonstrated the feasibility of big data mining based on CKSRL platform.
knowledge sharing;resource library;cloud computing;customer management
2015-01-14
福建省社会科学规划项目“大数据背景下的电商企业客户行为分析及社交营销模式研究”(项目编号:2014 B217)。
黄章树(1956-),男,教授,硕士研究生导师,研究方向:数据挖掘、企业信息化。
10.3969/j.issn.1008-0821.2015.04.015
G250.73
A
1008-0821(2015)04-0069-06