APP下载

基于用户画像的广告精准投放系统设计

2022-05-09刘子靖于润童

江苏科技信息 2022年10期
关键词:计费画像标签

刘子靖,于润童

(南京工程学院,江苏 南京 211100)

0 引言

在互联网技术急速发展的背景下,广告行业发生了巨大的变革,逐步从传统的线下、电视广告形式转变成线上、互联网广告形式。目前的广告投放主流相比于传统的投放形式,拥有较高的针对性,内容也更加丰富,这足以在很大程度上减少企业的人力资源成本,并提高资源利用率。目前只有部分大公司才有一些技术能力以及开发资源,但是还是会存在系统数据不够完善、技术不够扎实等情况,同时中小型企业没有能力进行相关技术研究,因此市场还存在着很大的空缺。

在此背景下,建立了基于用户画像广告精准投放系统。本项目主要分为两部分:第一部分是基于flink流处理对用户画像进行分析描写并生成分析后的数据;第二部分是基于Spring Boot与Spring Cloud并加上vue.js前端,读取分析的数据,显示在html上。旨在降低企业广告投放成本,提高资源利用率,加强广告投放针对性,使企业产品更好地定点推销,提高购买率。

1 投放系统研究综述

1.1 用户画像研究

在过去,市场大多数为企业生产什么样的产品,消费者就消费什么的供需关系。而随着经济的发展,市场供需关系也发生了改变,现在企业需要迎合消费者多样、精细的需求。为了企业能够更精确地了解消费者需求,用户画像发挥了重要作用。企业通过对消费者基本信息以及行为数据的收集处理,获得消费者标签化画像,之后企业基于用户画像实行精准的广告投放。

用户画像是交互设计之父阿兰库珀提出的一个概念,被定义为“用户信息标签化”,也可以被理解为企业通过收集与分析消费者主要信息的数据之后,呈现出一个用户的商业全貌。这些信息主要包括社会属性、生活习惯、消费行为等,足以为企业提供充分的信息基础,帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。

一方面用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。另一方面就是,金融企业利用统计的信息,开发出适合目标客户的产品。提到用户画像,很多厂商都会提到360度用户画像,其实360度客户画像经常是一个广告宣传用语,根本不存在数据可以全面描述客户、透彻了解客户。人是非常复杂的生物,信息纬度非常复杂,仅仅依靠外部信息来刻画客户内心需要根本不可能[1]。用户画像使得投放过程更加可控,投放效果更加量化。网络广告精准投放活动,凭借可控化、可量化的优势,获得了众多广告主的青睐,所占的网络广告市场份额进一步提升[2]。

目前,大多数企业所掌握的大数据技术还不够成熟,他们通常只是将大量数据按照某一标准进行分析(见图1—2),根据比例权重来进行广告投放。如此一来,就不能保障广告的命中率,会增加不必要的成本投入。

图1 互联网购物性别比例

因此,本系统更注重于用户自身特点。系统在分析数据时会创建用户特有的标签,而不再是仅仅关注某一信息进行大数据分析。如表1所示,系统会通过用户的动态信息以及静态信息来绘制标签化形象,该用户画像能够简洁准确地表现用户的信息以及产品偏好。通过系统绘制出的画像,企业可以向其投放中等价位的服饰,这样便可以在很大程度上减少广告投放成本。

表1 用户画像图例

本文主要阐述了用户画像概念研究以及用户数据研究两个方面。通过描述用户画像的概念、原理并将用户画像与传统的大数据分析进行对比,体现使用用户画像可以提高广告的命中率,以确保该系统运用到广告投放系统的合理性。

图2 互联网购物年龄段比例

1.2 广告投放研究

传统的广告类型,根据内容主要可分为三类:服务广告、公关广告以及商业广告,这三类广告有各自所适用的情况以及特点。

涉及酒店、餐馆、房屋租赁、车辆出租、电器维修等服务性内容的广告一般称为服务广告。这类广告都拥有明确的信息,使用简洁明了的文字、图片传达最核心的内容,为人们提供服务性信息,让读者能够按照自己的需求寻找并得到帮助。

公关广告主要是企业或组织单位进行知名度提高的广告类型,一般这类广告是免费的。其侧重点在于公关,通过各种方式在企业、单位与大众之间建立关系,将品牌文化转化为公众共识。例如摩拜单车,通过创始人不断出镜反复强调创业理念,培养公众对产品的好感,这就是公关广告的一个鲜明案例。用公关塑造品牌,用广告传播品牌,公关与广告相辅相成,最终达到企业产品广为人知的目的。

系统主要投放的广告类型是需要企业经营者承担一定的费用,通过电视、互联网等媒介进行介绍的商业广告。

想要详尽、直观地描述产品,面对面推销无疑是最好的办法。但是由于人口基数过大,面对面推销所需要的人力和物力过于庞大,使得这样的方式让企业力不从心,因此商业广告这样的宣传形式诞生了。商业广告也就是产品广告,主要是通过介绍产品的品牌、用途、价格、特点等基本要素,加上独到的广告词来吸引消费者进行购买,从而使企业获得经济收益。

本系统通过接口将描绘的用户画像传送到企业前端,企业可以根据该用户的品牌偏向、消费能力以及行为数据等信息,选择适合他的广告进行投放。比如,某一用户多次搜索按摩仪,系统将此信息写成画像送到前端,企业获取这一信息,便可以在其设备上投放本公司的产品广告。

广告主根据广告形式的不同会选择不同的计费模式。广告计费模式主要包括CPT,CPM,CPC(Cost Per Click,按点击计费),CPV(Cost Per View,按观看次数计费),CPS(Cost Per Sales,按照销售量计费),CPA(Cost Per Action,按行为计费),oCPM(Optimized Cost per Mille,优化的千次展示出价)等[3]。企业在获取本系统描绘的用户画像之后,可以根据自身需要选择合适的计费模式。如,只有个别用户对于香水比较感兴趣,那么企业便可以选择按点击计费的模式;或者有很大一部分用户对于电子产品类型感兴趣,那么企业便可以选择千次展示计费模式。

广告作为广泛推销商品的方式已经深入每个人的生活,但是投放广告的代价也是巨大的。本文通过阐述广告类型以及广告计费方式,表达使用本系统不仅可以提高产品的购买率,还大大降低了企业投放广告的成本。比起传统模式下的广告投放,本系统可以在很大程度上考虑目标用户之间的差异性,并为用户提供更具个性化的服务。

2 用户画像广告精准投放系统构建

在基于用户画像广告精准投放系统构建中,本系统是采用分布式服务架构,基于虚拟机来进行创建的,可以处理较为复杂的大规模数据。采用分布式服务架构的原因是为了确保系统能够较快地读取用户信息然后进行缓存,并在系统运行的过程中,将不稳定因素降到最低。

创建过程中将系统主体细分为4个部分:第一部分是使用Flume与Kafka等技术采集来自用户行为、日志的数据;第二部分是将所收集到的数据存储进Hadoop文件系统和HBase、MongoDB等数据库中;第三部分是利用Flink等算法分析所得数据并得到标签化用户画像;最后一部分是将最后的画像通过动态接口展示在页面上(见图3)。

图3 用户画像分析流程

2.1 数据采集与存储

构建用户画像系统,首先要进行数据收集与统计。从用户行为、日志所获取的数据越多越完善,用户画像就会越精准,从而提高广告投放的准确性。本系统使用Flume,Kafka等相关组件进行数据的采集并进行简单处理。首先是由Flume系统中Source组件与数据源进行对接,当用户产生新的行为数据或数据发生改变时,Flume会连接接口并通过Channel组件传送到下沉组件Sink中,再将数据传送到Kafka,Kafka会将获得的数据进行清洗然后复制以防止数据丢失。在此过程中,有多级agent共同工作,以便同时处理大量数据。

本系统所传输的数据一般分为静态数据与动态数据。静态数据是指用户的注册信息(姓名、性别、年龄、籍贯、省份等)、商品信息(价格、产地、生产日期等)、商家信息(地址、名称、负责人等)。但是静态信息有些是不准确的,因此为了保证数据的精准,需要在采集过程中进行简单的处理,进一步纠正。动态信息主要指用户的行为动作,比如注册、浏览、点击、购买、评价等。对于本系统所需要的画像,比较重要的数据有浏览商品、收藏商品、加入购物车、最大消费、订单数量等信息。

当信息采集完成后,会由Sink组件将数据下沉到HDFS中进行备份,这是为了防止运行过程中数据发生丢失或错误,因为agent会同样将数据传到HBase和MongoDB数据库中。

对于数据库,本系统主要使用了Hadoop的高扩展性、高效性以及高容错性。Hadoop开源平台主要由分布式文件系统(Hadoop Distributed File System,HDFS)和MapReduce编程框架组成。HDFS是一种分布式的文件系统,主要的工作就是以分布式的形式存储大规模的海量数据。HDFS中包含两类节点,分别称之为名称节点(NameNode)和数据节点(DataNode)。其中,NameNode主要负责分布式文件系统的命名空间,在其中保存了两个核心的数据结构,即FsImage和EditLog。DataNode则是HDFS的工作节点,主要负责数据的存储和读取,它会根据客户端或NameNode的调度来进行数据的存储和检索,并向NameNode定期发送自己所存储的块的列表。通常存储在HDFS中的数据会被分割为相互独立的数据块,然后交给Map对其进行并行处理,而Map的输出接着会变成Reduce的输入,接着执行Reduce计算得到最终结果,并存入HDFS[4]。作为介于关系数据库与非关系数据库之间的MongoDB会把所获得的数据文件映射到内存中,进行提高性能的操作。

2.2 数据分析

在数据分析阶段,主要使用了K-means,TF-IDF等算法。当系统完成数据采集之后,系统会获得由Kafka下沉的数据。紧接着会使用K-means的算法,将数据分成若干个聚类,并设置一个质点。然后将相关联的数据划分到质点范围内,将质点移动到聚类观测点的中心,不断重复这些步骤。同时,系统在某些情况下也使用TF-IDF进行数据处理。通过TF-IDF技术,系统会根据词频来寻找区分能力较强的词条作为年度关键词。比如某一用户经常浏览品牌服饰,但是其他用户很少浏览,那么对于该用户来说,品牌服饰就是他画像中区别能力较强的年度关键词。如果在分析过程中,数据发生了错误或丢失,那么系统可以调用数据库中的备份数据。

为了能够使企业更精准地投放广告,提高广告的命中率,本系统在分析用户画像阶段做出了创新。系统会对企业产品标注特定颜色并与Kafka简单处理后的数据一同进行分析处理。系统会通过K-means算法,将与产品存在关联度的用户数据打上标签并使用色阶标注。例如,某一用户与某一产品关联度很高,那么他的标签颜色就会越接近,随着关联度的降低,颜色也会逐步演变成反差色。因此,在数据呈现阶段,如果某一用户的标签颜色与产品颜色很接近,那么企业便可以在其设备上投放广告。如果另一个用户的标签颜色与产品颜色呈反差色,那么企业便可以不对其投放广告。

通过以上两种方法,系统能够较为完善地将用户数据标签化,紧接着系统会将数据再次传入数据库中。

2.3 数据呈现

在数据呈现阶段,系统会通过Spring Boot与Spring Cloud创建的分布式查询接口与前端查询接口从数据库获得画像并传送到前端页面上。前端页面,本系统使用了Vue.js与node.js技术,因为Vue.js是较为简洁的以数据驱动和组件化的前端框架;并且系统还使用highcharts在前端构建图表,目的是为了使用户画像更加的简洁明了。

在此阶段,企业能够明确地了解用户不同的画像,以及对于产品的契合度,根据信息来决定广告投放的次数、人员以及平台等,从而减少企业在广告投放过程中的成本消耗。

3 结语

在国家政策法规的支持和引导下,网络广告精准投放正蓬勃发展。用户画像利用大数据技术将客户的特征进行了数据化的描述,并在互联网上进行整合,以用户数据为基础,借助其可视化、标签化、信息化的特性对目标消费用户的动机行为进行归纳。用户画像策略选择和特征维度选择建模对新媒体广告投放有着重要的意义,而如何更高效率收集归纳并利用这些用户画像便成为关注的焦点。

目前,部分大公司才有一些开发体系和技术资源,但由于系统数据不完善、客户留存率低、业务局限、成本较高等原因,同时中小型公司没有条件开发,市场还存在着很大的空缺。如果今后大多数企业能够运用用户画像技术,并实行相应的广告投放服务,再通过消费者的反馈进行改进,那么企业的营销会更加精准化,产品命中率也会提高。

猜你喜欢

计费画像标签
5G网络独立组网中融合计费方案的研究
威猛的画像
基于云计算和微服务架构的高速公路计费系统
“00后”画像
画像
生活中的分段计费
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
基于AM3354的电动汽车充电监控计费系统电表通信的实现
让衣柜摆脱“杂乱无章”的标签