基于大数据技术的广电用户收视行为建模
2017-07-16余远洁
余远洁
广东省潮州市广播电视台,广东潮州 521000
摘 要 通过应用大数据技术对广电用户进行用户画像及收视行为建模,准确刻画用户收视行为的特征和路径,为企业的业务决策和运营提供数据支撑,从根本上解决目前有线电视营销中存在的产品设计落后、业务销售与拓展受限、广告经营和主动运维不足等瓶颈问题。
关键词 用户画像;数据建模;数据采集;精准运营;收视行为
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2017)11-0065-02
随着互联网发展,网络电视台大量兴起,内容碎片化,媒体分众化趋势日渐显著,用户可以根据自己喜好选择观看各类节目视频,传统广电媒体的受众、开机率、广告份额出现快速下滑,广电行业受到极大的冲击,借用新技术进行变革迫在眉睫。
以往传统媒体播送时代,广电媒体“不知道用户在哪里,不知道用户是谁,也不知道用户想看什么”,因此,难以精准把握用户需求,而随着数字机顶盒等技术的普及,广电媒体具备了获取用户全样本、实时收视数据的能力,通过海量数据对用户的收视行为进行建模,准确刻画用户收视行为特征和路径,有针对性地推送电视产品和服务,这将全面提高用户体验,并为企业的业务的决策和运营提供数据支撑,是当前“数据驱动业务与运营”的发展方向。
1 建立用户画像的四个阶段
用户画像是指通过各个途径收集到的与用户特性和行为有关的属性标签,包括个人基本信息、社会活动信息、操作行为习惯等,通过对这些信息的综合分析,勾勒出该用户的特征与轮廓。为用户画像通常需要经过数据采集、战略定位、数据模型和业务应用四个阶段。
数据采集阶段:通过各种途径如广电机顶盒、广电运营支撑系统及外部合作获得的用户的海量数据,并对数据进行清洗和入库。
战略定位阶段:明确用户画像建模的战略目标和意义,如提升产品服务质量、实现产品的精准营销等,根据战略目标确定用户画像的分析结论,开展有针对性的建设实施工作。
数据建模阶段:根据实际需求建立用户、产品、渠道、服务等数据实体,再以数据实体为中心,对分析对象和维度进行规约,选取和战略目的相关的数据维度,对次要的数据维度进行分解,在此基础上对数据进行分析和挖掘。
业务应用阶段:针对不同业务场景开发应用,基于用户家庭特征、消费数据和收看特征数据了解用户特征和潜在需求挖掘,开展基于用户中心的产品设计优化,提升产品设计管理的数据决策力,并利用用户画像和协同过滤等算法进行主动营销。
2 数据分类及收视行为建模
2.1 用户数据分类收集
构建用户画像的关键就是准确获取用户信息,根据用户数据的变化特征和频率,我们将用户数据划分为静态数据和动态数据两大类。静态数据就是用户信息中相对稳定、不容易发生变化的信息,如广电用户的姓名、性别、年龄、身份证号码、家庭地址、电话号码、机顶盒标识码、订购套餐类型等人口属性和商业属性,此类数据最重要的工作是通过数据清洗,提高数据质量。而动态数据则是跟用户行为相关的不断变化的行为信息,包括收视信息、社交信息和节目信息。针对广电用户特点,我们从人群、时间、地点、产品和付费方式五个维度进行用户数据的收集,具体可详细描述为:什么用户,在什么时间什么地点观看了什么电视频道的什么节目并是否付费。其中:
(1)人群维度,目的是为了区分用户和进行单点定位,通过机顶盒进行用户信息绑定及用户收看节目的偏好来获得,从而明确用户年龄特征如少儿、青少年、中年或老年及性别特征等,以及习惯的收视语言是外语、国语、粤语等。
(2)时间维度:时间包括两个重要信息,时间点+时间长度。时间点是用户发生行为的时间点,时间长度则是用户观看某一电视节目的停留时间。
(3)地点维度:指用户的收视常在地。
(4)产品维度,产品包含两层信息:电视频道+节目分类,其中,频道标明收视的来源渠道,节目分类则包括体育、综合、电视剧、时事、汽车、旅游、时装、购物、少儿等内容。
(5)付费方式维度则标明用户是收费用户还是免费用户。
2.2 收视行为建模
根据电视业务开展需求,从人群、时间、地点、产品和付费方式这五个维度对用户的收视行为进行建模,并通过模型分析获知家庭成员构成、产品相关度、客户细化、客户忠诚度、客户价值等知识。
(1)根据收视行为,推测分析用户的家庭情况,构建完整用户画像,包括家庭人数、年龄、职业、收视忠诚度及用户收视兴趣等。
(2)根据用户使用产品的情况,找出产品间潜在的关联关系,发现隐藏规则或知识,如通过数据挖掘发现:“增值产品中关联最强的四大业务为体育、音乐、气象和动漫”“看纪实节目的人常看法制类和新闻类节目”“喜好看动作剧场的人很少看欢笑和娱乐类节目”等知识。
(3)通过建立客户和产品需求矩阵计算实现产品精准营销。例如,通过矩阵运算发现具有下列标签“老人、小孩、运动节目、宽带速率、月均消费额”的用户与具有标签的A产品具有高关联性,从而有针对性地进行产品营销推送。
(4)根据用户使用时段上的分布情况,包括收视总时间段及分布、工作日与周末的收视差异、地区和套餐上的时段分布差异,收视偏好、业务占比及增长情况等,对用户类型和特征进行细化。
(5)计算用户的价值。通过定义客户价值中影响变量如“日均点播时长、回看使用天数及次数、收视中直播业务占比”,判断准则如“使用时间长的用户比使用时间短的用户更有价值”,和价值计算公式如“某类用户总价值=直播业务价值+点播业务价值+回看业务价值”,进行用户价值的综合计算,获得用户的重要权值。
2.3 技术实现
基于大数据的广电用户收视行为分析建模及实现项目包括大数据收集加工平台和大数据存储分析平台两部分内容。
首先,搭建大数据收集加工平台,通过ETL等工具对数字电视机顶盒及广电业务系统产生的数据进行加载管理、服务总线、接口管理、模板编辑、模板下发和采集归档,再对采集到的操作型数据、历史数据进行质量检测、数据脱敏、数据清洗和数据转换等清洗处理后,加载至带有事实表和维度表的数据平台。
其次,基于HADOOP建立海量存储、高效计算的广电大数据存储分析平台,利用Spark等在线高速计算分析算法,通过各种数据分析工具,对收集到的各种非结构化文档数据和结构化业务数据进行深度融合分析,从数据中获取更准确、更深层次的知识,准确刻画用户行为画像,提升对数据的理解、推理、发现和决策能力,更好地应用到业务营销及各种管理,全面提升广电系统的服务能力和效益。
2.4 效果分析
通过对用户收视行为进行建模,运营商可精确把握对当地广电用户群体的特征和收视行为习惯模式,并基于上述分析结果提供个性化、精准化和智能化的服务推广,从根本上解决目前有线电视营销中存在产品设计、销售与业务拓展、广告经营和主动运维等瓶颈问题。基于大数据技术的用户收视行为分析将成为各大广电运营商优化现有商业模式、创造新型商业模式、提高运营效率和服务质量的重要战略举措。
参考文献
[1]李冰,王悅,刘永祥.大数据环境下基于K-means的用户画像与智能推荐的应用[J].现代计算机版,2016(24):11-15.
[2]丁伟.基于大数据技术的手机用户画像与征信研究[J].邮电设计技术,2016(3):64-69.