基于聚类分析的互联网广告投放研究
2016-09-29
曹阳 陈永当
【摘 要】随着互联网的飞速发展,网络信息以指数形式爆炸式增长,大数据时代随之到来,广告形式也发生了变化,互联网广告的比重越来越大。本文采用聚类分析的方法研究了互联网广告定向精准投放问题,从而可以降低广告成本,也可达到有效的宣传效果。
【关键词】聚类分析;互联网广告;精准广告
Internet Advertising Based on Clustering Analysis
CAO Yang CHEN Yong-dang
(School of Mechanical&Electrical Engineering, Xian Polytechnic University, Xian Shaanxi 710048, China)
【Abstract】With the rapid development of the Internet,the network information in the form of index explosive growth. The era of big data to follow. Advertising forms have changed, too. The proportion of Internet advertising is bigger and bigger. This article adopts the method of cluster analysis studies the Internet advertising directed their problems, in order to decrease the cost of advertising, also can achieve effective publicity.
【Key words】Clustering analysis; Internet advertising; Precision advertising
1 研究背景与意义
近几年来,互联网爆炸式发展。据艾瑞咨询研究调查,预计到2016年,中国网络经济的市场规模将达到13500亿元。互联网的快速发展,产生了海量数据,大数据时代随之到来。2014年,中国大数据市场规模已达23亿以上,并且以很高的速率增长,大数据中蕴含无限大的商机。
广告是一种公开传递信息、具有一定目的的宣传手段。广告的媒体形式从报纸、杂志到广播、电视再到互联网。目前,互联网广告已经成为一种新的广告投放模式,并且具有以下几个显著的优势:范围广、消耗少、易计量及灵活性强。因此互联网广告发展异常迅猛,已经成为仅次于电视广告的第二大媒体广告。
但是,随着大数据时代的到来,传统互联网广告投放的粗犷性和无指定性弊端越来越明显,使得市场迫切需求一种精准的互联网广告,于是在此背景下诞生了一种新的广告模式一大数据环境下的互联网精准广告。精准广告将广告内容与潜在受众进行匹配,有针对性的进行广告投放,这样可以提高广告的投放精准性。
2 聚类分析
数据挖掘技术是对未来人类产生重大影响的十大新兴技术之一,聚类分析是数据挖掘中的一个功能。聚类就是将数据对象根据相似性划分为若干个组或簇,同组相似性高,异组差异性大。与分类不同的是,聚类操作要划分的类事先是未知的,类的形式完全是数据导向的,属于一种无指导学习。聚类分析也看作是一种数学工具,像数据如何分布、数据的组成特征都可以通过它来获取。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、重叠聚类和模糊聚类等。
聚类分析在数据挖掘中主要有以下几个应用:①可以作为其他算法的预处理步骤;②可以作为一个独立的工具来获得数据的分布情况;③可以完成孤立点挖掘。
聚类分析的基本过程:选择聚类变量→聚类分析→找出各类用户的重要特征→聚类解释、命名。
现在普遍的分类方法是用数据样本间的距离对数据样本分组。聚类分析中使用的数据集表示为X={xi|i=1,2,…,n},其中xi用d维特征向量xi=(xi1,xi2,…,xid)来表示,xik(k=1,2,…,d)分别对应d个描述属性A1,A2,… ,Ad的具体值。描述属性可以是连续型、离散型或者混合型的属性。计算不同描述属性的相似度的方法不同。像年龄、收入和距离这样的属性就是连续性的属性,它们的取值是连续的。
普遍使用样本间的距离描述样本之间相似呈度。两个样本xi和xj之间的距离表示为d(xi,xj)。常用的距离有如下三种计算方式:
(1)欧氏距离
(2)曼哈顿距离
(3)明可夫斯基距离
以上三种距离满足如下性质:
(1),即数据样本之间的距离是非负值—最小性。
(2),即数据样本与自身的距离为0,样本与自身的相似性最大—自相似性。
(3),即数据样本之间的距离是对称的—对称性。
(4),即数据样本之间的距离满足三角不等式的性质—三角不等性。
样本的距离可以度量样本之间的相异性。当距离的取值很小时,x和y相似;当距离的取值很大时,x和y相异。给距离设定一个阈值,小于阈值时可以看成一类,从而达成相似性聚类的目的。
3 广告受众的指向性
一种产品或服务只能满足部分人的需求,因此产品或服务的广告就有一定的目标受众,不是所有人群都适合。我们可知广告受众据有这些特征:针对性、复杂性、多变性、集群性、自主性和互动性。如何从海量的人群中找出广告的目标群体是广告投放者所关心的一个重要问题,这样可以提高广告的投放精准性。
互联网广告受众有多种差别,基本可以从以下几个维度进行分析:基本属性、购买能力、行为特征、社交网络、心理特征、兴趣爱好等。广告人必须在一定范围内选择受众的共同兴趣作为广告的诉求点。
聚类算法能够将受众按照某种规则进行分类,将特征相同或相近的受众聚成一类,将特征不同或相似度低的受众分成不同的类群,通过分析不同类群广告受众的特征,进而确定广告产品的目标受众,实现广告的精确性投放,实现广告投放有的放矢,减少广告的投入费用。
4 基于聚类分析的互联网广告投放模型构建
互联网广告精准投放其核心内容就是根据用户的固有属性和访问网站的动态属性进行分类,也就是把用户定位在对用户兴趣度最高的那类广告上。具体来说就是首先根据用户上网的综合行为来分析他的特征,包括用户注册时的一些基本信息、他搜索过什么广告、浏览过什么样的网页以及在页面的停留时间等。通过对这些信息的提取和分析,可以准确识别用户特征,获得用户消费需求,从而锁定目标用户,进行精准广告投放。聚类分析可以对用户进行相似性分类,也可以对网页按相似性进行分类,以下是基于聚类分析的互联网广告投放模型。
5 小结
广告网络是通过集中采集各类网络媒体的媒介资源,通过技术手段实现分布投放的虚拟运营平台,帮助广告主实现多种媒体资源组合投放的广告服务网络。广告网络负责对大量页面进行分析、聚集,完成广告投放转换的过程。其优势体现在对网站媒介资源的整合能力、受众数据获取和挖掘的能力以及精准匹配广告主营销需求的能力。投放流程要包含以下几个方面:广告位所属网页的内容分析、用户受众定向、广告匹配、广告选择与投放、展示跟踪与报告等。本文主要介绍了一种基于聚类分析的互联网广告精准投放模型,算法利用用户网页浏览等行为信息进行聚类分析,并在通过这种方法将真实用户的行为模型转化为兴趣模型从而进行了更高精度的广告投放。
【参考文献】
[1]李娜,李爱军. 基于用户特征分类的精准广告投放研究[J].电脑知识与技术,2010,01:196-198.
[2]李朝娟.基于聚类技术的客户细分模型研究与实现[D].哈尔滨工业大学,2006.
[3]俞淑平,陈刚.一种高效的行为定向广告投放算法[J].计算机应用与软件,2011,01:4-7.
[4]丁青,周留根,朱爱兵,张义东.基于K-means聚类算法的校园网用户行为分析研究[J].微计算机应用,2010,06:74-80.
[5]陈艳燕,许晓昕.模糊聚类算法EFCM及其在上下文广告关键词提取中的应用[J].计算机与现代化,2009,03:81-83.
[6]黄诗瑶.聚类分析在移动通信用户行为分析中的研究与应用[D].广东工业大学,2013.
[7]郭心语,刘鹏,周敏奇,周傲英.网络广告定向技术综述[J].华东师范大学学报:自然科学版,2013,03:93-105.