APP下载

基于精准营销的问答平台数据挖掘算法需求综述

2018-02-07刘艳李一铭刘子逸

中小企业管理与科技 2018年2期
关键词:博客

刘艳,李一铭,刘子逸

(河海大学企业管理学院,江苏 常州 213022)

1 引言

近年来,随着社交网络平台的不断发展,知识的交融及共享愈加多元化。百度知道、知乎等社会化问答平台逐渐成为人们寻求知识的重要途径。据统计,截至2017年9月,知乎个人注册用户总数超过1亿,日活跃用户量达2600万。很多商家看到问答平台上存在的大量商机,纷纷通过精准广告投放来达到营销的目的。以往,由于技术不成熟,投放效果不明显。但随着挖掘算法的发展,其用于问答平台的需求愈加丰富,如何做好对问答平台精准营销挖掘算法的需求分析成为一个有待解决的问题。

2 相关理论研究

2.1 精准营销理论

2005年,著名营销大师菲利普·科特勒首次明确提出精准营销(Precision marketing)理论。他认为“精准营销是采取更精准、可衡量和高投资回报的营销沟通,制定更注重结果和行动的营销计划,并更加重视对直接销售沟通的投资”。国内学者伍青生、余颖、郑兴山等人认为“精准营销是企业通过定量和定性相结合的方法对目标市场的不同消费者进行细致分析,根据他们不同的消费心理和行为特征,采用有针对性的现代技术、方法和指向明确的策略,实现对目标市场不同消费者群体强有效性、高投资回报的营销沟通”。

精准营销实施的策略和途径分为三种:①基于数据库的方法,主要包括邮件直付营销、呼叫中心(Call Center)、手机短信等;②基于互联网的方法,主要包括门户网站广告,“窄告”,关键词搜索广告,博客,Email广告,电子优惠券,来电广告等;③基于第三方渠道的方法。

2.2 数据挖掘理论

数据挖掘有多种定义,其中比较有代表性的是“从数据中汲取出包含着的过往不被知道的有利用价值的潜在信息”。在新世纪信息产业与网络互联持续发展、数据激增的背景下,数据挖掘相关技术如今已被各大领域大力应用。如秦文哲等人提出把数据挖掘技术用于医学研究[1],张亮等人提出把数据挖掘方法用于公司的财务预警[2],连德福提出把数据挖掘用于社交网络的位置信息分析[3],熊亚军等人提出把KNN数据挖掘方法用于地区霾等级预报[4]等。常见的数据挖掘算法包括聚类分析、K-Means聚类算法、决策树、逻辑回归以及神经网络算法、遗传算法以及粗糙集相关的算法等。

3 数据挖掘需求分析

3.1 用户前端的行为习惯分析

在问答平台中,对于用户的前端行为习惯的分析关键是要结合用户的行为流程进行分析,用户的行为流程主要包括用户的浏览点击过程以及用户的搜索过程等。其目的是方便用户快捷地寻找到符合自己查询需求的结果。客户的行为习惯的分析主要包括两点内容:一,特定用户群的浏览规律及特点。通过对于用户浏览访问习惯的分析,追踪出用户习惯的频繁访问路径并进行抽取,用于平台前端界面的优化。二,用户的搜索行为方式和特点。通过对用户搜索习惯的分析,采集用户的搜索特征信息,优化用户的搜索结果以及提供的搜索选项。

3.2 用户后端的数据分析

用户后端数据的分析主要通过用户个人设置的兴趣标签信息和用户的提问或者回答的文本信息,用户的收藏信息以及用户的基本信息等来建立潜在用户特征模型,为商家提供较为准确的用户类群信息。其主要内容为:一,用户的个性兴趣爱好特征。通过用户的兴趣标签进行统计分组,分析得出用户可能会对于哪些广告感兴趣。二,用户的互动信息。通过用户的提问信息以及用户的回答信息的文本分析,从中得出用户的情感趋向,最终对用户进行精准营销。三,潜在客户的影响力价值。在得到潜在用户的类群分组后,对潜在用户的网络影响力进行计算分析,抽取出其中影响力较大的某些潜在客户,通过某些方式使其成为商家的客户,利用其影响力扩大营销。

3.3 商家信息分析

社交网络平台对于商家的信息分析主要是完成商家的精准广告投放,从而谋取利益。在知识问答平台上商家需要通过平台找到其对应的潜在客户,然后通过平台的某些方式(在用户浏览的信息之间插入广告、平台通过快捷栏推送等)进行广告投放。平台在这个过程中需要对商家的信息进行分析,明辨商家投放广告的需求量。如果需求量较大,平台就需要慎重斟酌,在不影响用户使用舒适度的保证下向用户推送。此外,平台还需要结合用户群偏爱广告的程度,向商家说明投放多少广告和投放频率能让其对这些广告不感到厌烦,保证平台用户数量稳定。

4 数据挖掘算法研究

目前在问答平台精准营销中数据挖掘算法的应用主要为以下几个方面:①使用关联规则算法对UGC项集进行信息挖掘和规则提取[5];②使用分类和预测算法对文本信息进行特征提取;③使用文本聚类算法,对按照内容或语义将同一问题下的所有答案进行聚类等。本文将从聚类算法、分类和预测算法以及关联规则算法的概念,基本原理以及使用范围进行综述。

4.1 聚类算法

聚类是一种无监督的机器学习方法,可以实现针对目标群体的多指标群体划分,这些分类往往是精准营销的基础和核心。只有正确地对目标群体进行分类,精准营销的业务才能有效开展。其主要使用的业务范围包括:一是目标客户群的分类;二是不同产品的价值组合。该算法有五种分类:基于层次、基于划分、基于密度、基于网格的方法和基于模型的方法。

4.2 分类与预测算法

分类算法是一种有监督的学习,通过对已知类别训练集的分析,从中发现分类规则,以此预测新数据的类别。预测方法用于对预测数据对象的连续取值。分类算法主要应用的业务范围包括:按照既定的标签或目的对客户进行分类以便寻找不同种类用户的特征。常用算法包括决策树、贝叶斯法、SVM法、粗糙集、遗传算法、BP神经网络算法等。预测算法主要应用的业务范围是预测客户访问行为、潜在客户转化为使用客户的可能性等,算法主要包括线性回归、非线性回归、多元回归等。

4.3 关联规则算法

关联规则算法主要是发现不同项之间的相关性,利用关联规则可以发现存在于数据库中的可被发现的两个或多个变量取值之间存在的规律性。关联规则典型的算法是Apriori算法。在问答平台中关联规则算法的主要应用的业务范围包括:UGC项集的规则挖掘,分析用户的情感趋向。

5 总结与展望

通过对精准营销理论,挖掘算法理论、问答平台挖掘算法的需求分析以及用于问答平台的数据挖掘算法的介绍,本文总结得出当前用于问答平台的数据挖掘算法仍然存在许多需要优化的地方。但是,随着问答平台和数据挖掘算法的不断发展,用户的需求将会不断得到解决,精准营销用于问答平台的理论支撑将更加丰富,问答平台的营销模式将不断得以优化和完善。

猜你喜欢

博客
速览/博客
博客
博客
博客
博客
博客
博客
博客天下
博客相册
博客相册