“互联网+”背景下零售企业客户知识获取研究
2019-10-16曹悦
摘 要:信息技术时代,海量的数据呈现爆炸式增长。网购已逐渐成为人们购物的主要方式,特别是在“互联网+”战略推动下,营销模式也发生了重大的转变,新零售模式逐步兴起并得到发展。这就对企业的营销策略提出了更高的要求,为了能够全面了解消费者需求、消费者购物习惯,从而实现个性化营销和精准营销,更加需要企业掌握和利用好大数据。通过阐述互联网时代,依托粗糙集,以消费者的大量行为轨迹数据挖掘出客户的隐性知识,从而能够更好地为企业的营销服务提供助力。
关键词:互联网;隐性知识;新零售
中图分类号:F27 文献标志码:A 文章编号:1673-291X(2019)20-0081-02
引言
信息技术时代,知识管理已经成为更多企业来谋求竞争优势的重要手段。知识管理理论认为,企业能够获得持续竞争力的前提是能够对自己现有知识进行有价值的知识创新。Polanyi认为,知识可以分为显性知识(Explicit Knowledge)和隐性知识(Tacit Knowledge),相比显性知识来说,隐性知识因其极强的主体承载性、不可替代性和稀缺性更具有创造性。因此,企业在进行知识创造时,可以从大数据中挖掘出难以格式化描述、难以编码的隐性知识,从而挖掘出消费者的隐性知识,使企业更好地利用这些知识,快速地应对日益加剧的激烈的市场竞争环境。
一、理论基础
(一)新零售的内涵
马云在2016年杭州云栖大会上提出了“新零售”的概念[1]。2018年4月《2018“美好生活”智慧零售白皮书》中曾提到,我国正在进行着一场以技术为驱动,线上线下一体化的变革。2017年《中国“家·生活”用户消费行为专题分析报告》中指出,消费者不再单纯地满足于购买产品或服务,产品或服务所带来的心理效益开始占据越来越重要的位置。因此,越来越多的企业开始采用体验式营销模式,注重开展各种沟通活动,增强顾客体验感受,使消费者在物质上和精神上得到双重满足,促进消费者做出购买决策。未来的十年将是新零售时代,互联网技术能够很好地运用大数据、云计算等,逐步去发掘出客户的需求,倾听客户内心的声音,保持并且持续改进与消费者的关系,进而对消费者实施精准营销、有效营销才是未来零售企业制胜之道。
(二)粗糙集
1982年波兰学者创立了粗糙集(Rought Sets,RS)理论,它是用来进行数据挖掘和分析的一种软件计算方法。自创立以来,越来越得到更多的关注,尤其是人工智能的興起[2]。RS以收集到的原始数据的分类能力为基础,然后对样本数据进行分析,从而去发现其中所隐藏的规则知识。这种计算方法不需要任何的先验知识,能够处理不完整(Incomplete)、不精确(Imprecise)、不一致(Inconsistent)的[2]数据,并且操作起来简单、方便。目前,已经在许多领域得到了广泛的应用,如地震预报、机器学习、人工智能、临床医疗诊断、故障诊断、模式识别、图像处理等。
粗糙集的知识表达系统(Knowledge Representation System, KRS)可以表示为:四元组,其中:
二、消费者隐性知识获取的过程
新零售实质上是利用大数据和互联网重建人、货、场,在互联网上,消费者的浏览记录和消费记录等形成了庞大的数据库,哪怕一个微小的行为都会影响着大趋势[3]。由于网民越来越多、基数越来越大,我们正处于海量的数据之中。大数据本质就是通过某些特定的计算方法和技术,将收集到的顾客的消费数据进行汇总、整理、分析,从而判断出消费者的消费趋势,喜欢哪一类产品,即将会有什么样的产品需求,总结起来即是对消费者数据进行分析。互联网技术的高速发展为我们获取消费者隐性知识提供了很多的便利条件。互联网是一个动态地、分布式、大规模的,囊括了多种数据(结构化、非结构化、异构数据)的信息源。基于粗糙集理论的数据挖掘可以从爆炸式增长的海量数据中挖掘出消费者行为和企业潜在顾客之间联系的规则知识,有效地去指导企业的一些措施和方案。
(一)数据预处理
粗糙集能够处理多种类型的数据,但在具体的应用过程中是以等价关系为基础的,处理对象是离散化数据。因此,需要对原始数据进行规范化处理。在互联网上搜集到的数据可能并不规范,因而,在数据预处理阶段,需要多搜集到的数据进行规范化处理,对原始数据中一些缺失数据、不一致数据、噪声数据等进行清理;在互联网收集到的客户知识中不仅有离散性数据,而且还存在连续性数据,要对连续性数据进行离散化。本文使用信息熵的离散化方法对连续性数据离散化,它是对原始数据的属性本身进行划分,来使信息熵的减少和区间数达到最小,以寻求熵损失和适度区间数的平衡,使离散值最佳[4-5]。经过数据预处理以后,使数据更加完整、干净、具有针对性。
2.属性约简
在搜集到的数据中,有些属性对决策是没有用的,冗余属性的的存在会增加系统的数据量,一方面使计算机计算速度变慢,另一方面会产生更多的规则,影响最后的决策[6]。属性约简的前提是不影响原有信息表,剔除一些不相关属性,最后得出的就是最小属性集,计算起来运行速度加快,相应的挖掘出来的无用规则就少了,规则获取的速度就提高了。文中使用遗传算法对离散化后的属性值进行约简,我们想要得到最准确、精简的规则集,就必须使属性值最少。使用遗传算法进行约简可以降低复杂性,提高运行效率。
(三)提取规则知识
建立决策系统DT=〈U,A,V,f〉,使用RS生成规则,这时令?琢表示c(c∈C)的描述合取,?茁表示决策表,D决策属性,粗糙集计算结果得出的规则表明条件属性和决策属性之间关系,可以用“IF-THEN”的形式表示。此时得出的规则,并不能作为最终的规则集,需要去粗糙集得出的众多规则进行筛选,筛选指标为支持度和精确度。
1.规则的精确度Accuracy(α→β)可以表示为[6]:
2.规则的支持度
其中,决策表为DT=〈U,A,V,f〉,A=C∪D,U表示论域,U中对象的总数目为N;生成的规则是dr;xC是满足这个规则前件的对象数目。
Accuracy值越大,正确得出决策对象的个数越多;Support反映的是论域中可以与规则集中规则匹配的比例大小,Support越大,表明示例数据在实际应用中出现频率就越大,也即是规则应用型强。
三、算例分析
用一个例子来说明本文隐性知识获取的过程。首先,通过各种平台收集客户数据,并基于所收集到的客户数据集,假定收集到的客户数据为:条件属性为3个方面构成、决策属性由1个方面组成,分别记为C={I1,I2,I3}和D={d},建立知識表达系统KS=(U,A,V,f),如表1所示。
本算例中数据较少,使用离散化算法以后依然是原来表达系统,上图所示,然后用遗传算法进行属性约简,结果如表2所示。
属性约简的支持度为100,约简后得到两个决策表,根据这两个决策表生成规则,结果如表3所示。
在生成规则以后,如果规则过多,可以用精确度和支持度两个指标对规则进行筛选,经过筛选以后的规则精确度和支持度都很高,在实际应用中通过这些规则进行预测时准确率会比较高,筛选以后的规则就形成了规则集。如表3所示,I2特征为1,I3特征值为1时就可以做出决策为D2。
结语
信息技术高速发展的时代,作为电子商务企业一定要紧跟时代的步伐,根据企业自身性质,利用好消费者数据特征,从大数据中挖掘出对企业竞争有力的信息,为企业的持续发展奠定基础。本文介绍了从消费者大量数据中获取隐性知识的方法,通过对原始数据进行清理、离散化、属性约简,然后生成规则,最后用一个算例来验证方法的可行性。由于算例数据较少,可能会影响结果的精确性,后续会用案例来进行说明消费者隐性知识获取的过程。
参考文献:
[1] 朱春晓.新零售模式下电子商务的现状及趋势分析[J].现代营销:经营版,2019,(6):133.
[2] 曹悦.电子商务背景下客户隐性知识获取机制研究[D].郑州:郑州大学,2017.
[3] 袁佳玲,王海盈,陈丽媛,秦旖旎,张颖.“新零售”发展前景及关键问题研究[J].现代商贸工业,2019,(15):53-55.
[4] 周凡程.粗糙集理论在数据离散化中的应用研究[D].长沙:中国人民解放军国防科学技术大学,2012.
[5] 王举范,陈卓.基于信息熵的粗糙集连续属性多变量离散化算法[J].青岛科技大学学报:自然科学版,2013,(4):423-426.
[6] 赵茜.自动化技术、计算机技术[J].中国无线电电子学文摘,2011,(5):167-246.