基于大数据的电视节目评价体系构建研究

2021-11-30庞雪芮

湖南工业大学学报(社会科学版) 2021年2期

宋凯，庞雪芮

（1.中国传媒大学媒体融合与传播国家重点实验室，北京 100024；2.中国传媒大学互联网信息研究院，北京 100024）

电视节目评价体系自20世纪90年代初见雏形，其力图通过科学的评估，改进传播效果，提高传播决策和经营管理的有效性，体现电视机构的社会功能和价值诉求[1]。互联网背景下，由于新媒体冲击和传统电视行业竞争的不断加剧，巨大市场压力下，各种忽视社会效益、盲目追求收视率的现象时有发生，甚至出现了污染样本户事件，节目的同质化和低俗化趋向抬头[2]。因此，构建一套适用于当下时代的电视节目评价体系是电视行业发展的当务之急。缘于此，本文欲在现有评价体系基础上，结合网络用户大数据，构建新的电视节目评价体系，以期助力电视事业之发展。

一大数据技术与电视节目评价体系之相容性

互联网时代，电视节目普遍以台网联动为播放方式，即节目在电视台和网络中同时播放，这使得用户在网络中观看节目会产生更多的行为数据。这些数据与以往单纯从线下观看中收集的数据相比，其更为多元，更适合作为评价体系的参考。本文从以下三个方面分析网络用户大数据与电视节目评价体系的相容性。

（一）受众侧：消费行为逐渐向线上转移

来自电视节目受众群体直接或间接的反馈，是节目内容制作与节目评价的关键影响因素。电视节目内容制作和传播的对象就是观众，观众的选择和消费行为也会直接影响电视节目的制作。传统媒体时代，电视台牢牢掌控观众对节目的消费方式，观众只能在固定时间收看电视节目，观众娱乐时间的灵活性受到限制。互联网融入到大众日常生活中后，市场上涌现出了一批在线视频网站和资源聚合网站，这些网站以在线视频平台为媒介提供收视资源，允许用户在任何时间段收看电视节目。用户行为的改变冲击了电视节目的收视率，与需要固定时间等待电视节目播出的模式相比，互联网为观众提供了新的内容消费方式。移动互联网与智能手机的出现，更是加速了电视台的没落。与此同时，社交媒体平台聚集了大量的用户，成为公众日常获取和传播信息的关键场所；开放的空间允许用户发表对电视节目的看法，并通过裂变式的关系网络快速传播，用户口碑传播成为影响节目评价的关键因素。

当下，由于移动互联网的技术赋能，用户的观看、传播及消费行为逐渐从传统电视转移到了网络当中，传统电视台的影响力日渐式微，在失去受众注意力这一关键因素后，过去专业的电视节目制播体系与收视评价体系渐渐陷入了发展瓶颈。

（二）渠道侧：台网联动及网络独播成为趋势

互联网培养了用户线上观看电视节目的习惯，观众向新媒体平台靠拢已成为不可逆转的趋势。为了迎合新媒体时代观众的观看习惯，影视制作公司开始向新媒体视频平台分销版权，允许电视剧和综艺节目等在电视台和在线视频平台同时段播放。在用户的注意力逐渐从线下转移到了线上后，电视台拓展新媒体渠道，台网联动的播出方式成为电视节目播出的新选择。

互联网用户群体的消费习惯几近成熟后，各家新媒体视频平台开始与制作公司合作，通过资本投入以及引入节目内容制作人才的形式，主动介入到制作环节，成为电视节目的出品方和一手制作方，制作只在各家视频平台播放的独家内容。与同为传统媒体的报社一样，电视台也开始推动新媒体与传统媒体相融合，其节目制播方式也从独立制播转变为以内容制作为核心，电视台、新媒体平台多渠道分发的模式。电视节目输出渠道拓宽后，以线下收视率为主要占比的传统节目评价体系，也就失去了可对比维度的一致性，其数据的可统计性和有效性都大打折扣。

（三）大数据拓宽电视节目评价体系边界

过去的电视节目评价体系主要依靠第三方调研机构的数据统计，分为收视率、专家评审、回报率三个维度，在新媒体严重冲击传统媒体的背景下，这种电视节目评价体系的有效性大打折扣。新媒体时代，用户多数日常行为转移到了线上，其在使用互联网的过程中产生大量数据，包括个人基础信息、在平台上发布的内容，以及每一个点击、播放、购买的操作，都会被记录在该公司的服务器上。这些数据以用户为中心，构成一个个独立的数字化个体，直接反映每一个用户的特征、个性以及消费习惯。平台可以分析每一个用户个体的喜好与行为特征，找到与之具有共性的其他用户，捕捉到用户群体的行为倾向，并通过分析产生该行为的因果关系，将其直接反馈在对产品或内容的评价与改进当中。对于新媒体视频平台来说，通过大数据可以直接掌握来自于用户的第一手数据。对用户消费行为元数据的处理与分析，能更加直观地反映用户对电视节目内容和相关产品服务的评价，体现相关产业链的转化效果。这样，对于电视节目评价体系的制定来说，就可以不再停留在宏观面的数值统计上面，而是可以结合每一个用户的数据，从微观的角度透视用户的认知与行为，构成更具个性、更为立体的评价体系。

互联网用户大数据可分为身份、内容和行为三大类。身份信息是所有消费行为数据的基础，包括性别、年龄、所在地、职业和学历等个人信息。平台可以根据用户提供的基础个人信息提供更加精准和更具个性化的服务。内容是用户消费行为数据的血肉，是用户大数据中最核心也是能够直接阐明用户态度与评价的数据；通过采集用户的真实评价、第三方平台评分系统等数据，可以从多元角度获得用户对电视节目的评价，获得其最真实的反馈。行为数据是用户在新媒体平台上被动留下的行为痕迹，如用户的点击、浏览记录、播放时间、付费记录等等。它的数量更加庞大，可以从更微观的角度反映用户对电视节目的选择、评价情况和转化效果。

二电视节目大数据评价体系模型之建构

长期以来，我国广播电视将收视率作为评价电视节目水平的重要依据。进入全媒体时代后，电视节目开始从传统的广播电视渠道向融媒体渠道迁移，网络平台积累了大量用户的收视和评价数据。因此，本研究以广播电视节目收视综合评价大数据系统为基础，结合网络用户大数据来构建新的电视节目大数据评价体系模型。

（一）广播电视节目收视综合评价大数据系统

2018 年12 月26 日，国家广播电视总局宣布广播电视节目收视综合评价大数据系统基本建成并开通试运行。该系统主要通过建立与网络传输机构之间的安全通道，汇聚用户收视行为数据，经清洗、转换、分析与挖掘，输出开机用户数、观看用户数、收视率、市场占有率等30项核心指标，其具有样本多、大数据、抗污染、全方位和开放性五大优势，代表了我国基于广播电视收视率建构的评价体系和评价技术的最高水平。

1.用户维度数据

该体系指标在用户维度上将全国广播电视机顶盒、IPTV 和互联网电视的开机用户数以及观看用户数等海量数据进行收集、整理、清洗和分析。系统初期汇集了4000 万有线电视和IPTV 样本用户的收视数据，全面涵盖直播、回看、点播等多种收视方式，并将逐步扩展至数亿级样本规模，实现样本全覆盖[3]。

2.收视维度数据

该系统指标立足于收视率数据这一核心指标，在数据收集时实时处理并精准到户。其既可以反映热门节目、黄金时段的收视情况，又可以精准捕捉小众节目、边缘时段的收视特征。例如，某城市500 万用户，如果从中抽样选取500 个样本用户，那么这500 个样本用户没有看过的节目均会被统计为“零收视”；而在系统的大样本统计中，即使1‰的低收视率也会记录留痕[3]。

3.市场维度数据

该维度以市场维度下的收视数据为主，既能提供客观真实的收视统计数据，还能以此为基础，结合思想性、创新性、专业性等节目品质元素，对节目传播力、引导力、影响力、公信力等多维度建模分析，构建全方位的节目综合评价模型[3]。

（二）基于网络用户大数据的评价指标

1.宏观评价指标

（1）用户画像

不同特征的用户群体收看电视节目的习惯会有所不同，并且不同因素会影响其对节目的选择和评价。本部分通过对观众基本人口统计学特征的总结分析，从中挑选可能对用户习惯产生影响且能够将用户群体进行有效分类的特征指标，以此作为用户画像部分的评价指标，其中包括性别、年龄、收入、学历、地域等关键用户信息。

具体指标设计如下：

性别：该节目观众性别分布(男、女)；

年龄：该节目观众年龄分布(0~15 岁、＞15~25 岁、＞25~35 岁、＞35~45 岁、＞45~60 岁、＞60 岁，并突出 15~35 岁的年轻观众占比) ；

收入：该节目观众收入分布( ≤1000 元、＞1000~3000、＞3000~5000 元、＞5000~10000 元、＞10000~20000 元、＞20000 元，计月收入) ；

学历：该节目观众学历分布(小学、初中、高中、专科、本科、硕士、博士)；

地域：该节目观众的省份分布。

（2）节目画像

本部分基于观众反馈和媒体反馈对节目画像进行分类分析，观众反馈包括对节目的整体评价和分项评价（嘉宾、主持人、编导、类型等等），媒体反馈包括对该节目的报道数量、整体评价及分项评价。数据主要来源于互联网媒介，反映的是观众和社会各界在网络空间中对节目的反馈、评价和评估。

观众反馈。观众是电视节目内容和价值观输出的直接受众，观众反馈是电视节目评价体系中最核心的部分。观众反馈指标需收集用户在视频网站、社会化媒体平台以及其他第三方网站中生产的内容和直接行为数据，通过数据判断观众对该节目的态度。一方面，通过对观众在社交媒体、视频网站评论当中对节目内容、主题、场景、嘉宾等各种元素发表的看法进行内容分析和词云统计，获得来自观众主观层面的评价；另一方面，收集用户的行为数据，包括观看节目时长、不同时段播放情况、播放终端，以及观众在不同渠道对电视节目的接受程度等，这些数据可以反映出用户对电视节目的态度倾向和节目本身的影响力。

节目画像观众反馈的具体指标设计如下：

整体：观众对该节目整体评价的关键词云(整体)；

分项：观众对该节目分项评价的关键词云(分项：嘉宾、主持人、编导、场景、叙事、节奏、主题、类型等)；

评价：观众对该节目的整体评价情况(正面、负面)；

观看：观众停留在该节目的时长(＜30 分钟、≥30 分钟~1 小时、＞1 ~ 2 小时、＞2~3 小时、＞3~5 小时、＞5 小时，以日观看时间计)；

时段：该节目分时段的播放情况(周：每周按天统计的播放曲线，日：每日按小时统计的播放曲线)；

渠道：不同渠道展示节目信息的数量占比，以及观众通过不同渠道的接受情况(如微博、贴吧、报道、广告、视频、自媒体、观众评论等) ；

阅读：观众对与节目有关文章的接受度(阅读量、收藏量、评论量、转发量) ；

终端：该节目播放终端情况占比(含手机、PAD、手提电脑、台式电脑、智能电视、其他智能终端)；

地域：该节目在不同地域的播放情况占比(含一二三线城市、县镇、乡村) ；

竞争：该节目观众同时追其他同类别综艺节目的占比(含 0 档、1~2 档、3~5 档、＞5 档)；

评分：该节目的网络评分(各大评分网站，如豆瓣等)；

媒体反馈。媒体是社会舆论的风向标和关键引导者，反映了社会各界对电视节目的整体评价，与个人观众根据自身好恶对节目内容进行评价不同，媒体反映的不仅包括普通民众对节目的评价，也含括节目在专家、政府、市场等不同领域所产生的影响，是社会舆论对电视节目态度整体趋势的呈现。

节目画像媒体反馈的具体指标设计如下：

数量：媒体对该节目的报道数量(区分传统媒体<含传统媒体网站>、商业网络媒体、个人自媒体，以节目播出后1~3 天、4~7 天、8~15 天、＞15 天计) ；

整体：媒体对该节目整体评价的关键词云(整体) ；

分项：媒体对该节目分项评价的关键词云(分项：嘉宾、主持人、编导、场景、叙事、节奏、主题、类型等)；

评价：媒体对该节目的整体评价情况(正面、负面)；

反馈：观众对媒体对该节目报道的认可情况(正面、负面，主要以评论区数据为依据) 。

（3）节目画像与用户画像的综合评价

节目画像与用户画像指标都是从宏观角度对电视节目进行评价，是对观众态度、行为等方面的定性分析，为电视节目的制播以及如何处理与观众的关系提供参考。根据具有特定特征的用户群体中所展现的对电视节目的不同取向和消费习惯数据，可以呈现出观众群体的特征与电视节目消费行为之间存在的关系。节目画像与用户画像的综合评价主要体现在以下几个方面：

不同评价取向(正面、负面)的观众的用户画像性别、年龄、收入、学历、地域特征；

不同停留时间的观众的用户画像性别、年龄、收入、学历、地域特征；

同时追其他同类别综艺节目的观众的用户画像性别、年龄、收入、学历、地域特征；

取前五位的节目整体评价关键词，做出该评价的观众的用户画像性别、年龄、收入、学历、地域特征。

2.微观评价指标

本部分从主流意识认可度、社会影响力关注度、观众喜好度忠诚度、市场和消费带动度四个维度对电视节目进行全面客观的评价，为电视节目行业提供评价体系借鉴。

（1）主流意识形态认可度

主流意识形态认可度是指社会各界及社会舆论对节目的普遍认可程度。与普通观众相比，主流媒体作为客观、权威性的代表，其发布的内容通常摒弃个人情感，反映出社会各界和舆论基本面的评价。主流媒体对该电视节目的报道和评价内容，以及因主流媒体报道所产生的对民众、对社会乃至对政府的影响，都代表了社会主流意识形态对节目内容的判断和认可程度。本部分是对主流媒体在互联网中发布的信息进行内容分析与数据分析，以此对电视节目进行打分评价。

主流意识形态认可度的具体指标设计如下：

数量：主流媒体对该节目的报道(含评论)的数量(根据不同量级分档次，不同档次的分值相应递减，下同，占20%) ；

评价：主流媒体报道对该节目的整体性评价的正面、负面指标(根据不同的占比分层加权，占40%) ；

词频：主流媒体对该节目的报道中正面、负面评价中各类词频与词性指标(根据数据情况加权，占10%)；

观众：因主流媒体对该节目的报道引流而带来的观众评价(正面、负面，如跟帖等，分层加权，占20%)；

决策：因主流媒体对该节目的报道引流而来的政府决策关联(有无加权，占10%)。

（2）社会影响力关注度

社会影响力关注度是指电视节目通过播出与推广宣传等形式，对社会舆论形成的影响程度。电视节目作为一种内容载体，其内涵与核心思想会对社会公众造成一定的影响力，从而引起社会的关注和讨论，一档节目引发的关注和讨论热度则代表了社会影响力。通过对相关数据的内容分析和统计，并根据不同指标的加权计算，对电视节目进行打分评价。

社会影响力关注度的具体指标设计如下：

评价：该节目引发社会舆论的整体正向、负向评价(根据不同的占比分层加权，占30%) ；

词频：该节目引发的不同社会评价的词频和词性指标(根据情况加权，占10%) ；

程度：该节目引流的社会舆论热点热度、频度、持续度(如数量、强烈程度等，分层加权，占20%)；

关注：该节目引流的社会对节目中明星、叙事、场景、话题的关注度 (如数量、强烈程度等，分层加权，20%) ；

影响：该节目在社会化媒体中的影响力(被呈现的强度、量度等，分层加权，占20%)。

（3）观众喜好度忠诚度

观众喜好度忠诚度是指观众对电视节目的认可程度，包括观众观看电视节目时的行为及观看后的反应。通过统计观看时长、观众是否为节目的粉丝、是否参与讨论等方面，分析观众对节目的喜好度和忠诚度，观众喜好度忠诚度越高，代表节目影响观众心理认知和行为态度的可能性越高。

观众喜好度忠诚度的具体指标设计如下：

数量：节目的粉丝数(含贴吧粉丝、官微粉丝等)、观众对节目评论的数量(分层加权，占20%)；

态度：观众对节目整体评价的正向、负向态度(根据不同的占比分层加权，占20%) ；

分项：观众对节目中的人、节目叙事、节目场景、节目类型的正向、负向态度(根据不同的占比分层加权，分别占10%，共计40%) ；

黏性：观众观看黏性(单次观看的时间持续度、单人的持续性观看，分层加权，占10%) ；

反馈：节目播出后，节目和嘉宾、主持人社交账号下的活跃度(分层加权，占10%)。

（4）市场和消费带动度

市场和消费带动度指电视节目转化自身影响力，带动相关消费市场发展的程度。我国的电视节目内容产业属于第三产业，意味着电视节目内容的生产不仅仅具有社会属性，也同时具有经济属性[4]。一方面，为了在激烈的市场竞争环境当中获得自身生存和发展的空间，需要获得经济收益来保证具备制作出品质优良、为广大观众所喜爱的电视节目。广告商会通过广告投放、用户推广等形式将自己的商品植入电视节目当中以增加曝光率，优质的电视节目品牌可以吸引更大的广告商进行投资；另一方面，电视节目通过内容输出型媒介，在节目中出现的元素会影响观众相关消费行为的选择，会影响其他消费市场及行业，包括旅游、餐饮、文创产品等。在电视节目播出后，通过节目引流形成的市场消费行为体现出节目在观众群体中的影响力。

市场和消费带动度的具体指标设计如下：

关注：观众对节目中消费物的关注程度(含服饰、食品、酒店、交通、景点，分层加权，占 20%)；

欲望：由该节目引流而带来的观众购买欲望指数(如网络空间表达出的消费兴趣，分层加权，占 20%)；

购买：由该节目引流而带来的观众实际消费情况(如在淘宝、京东等电商的消费情况，分层加权，占 40%)；

收入：该节目的整体收入情况(如冠名和广告，分层加权，占10%) ；

品牌：节目品牌被用作消费宣传的情况(分层加权，占10%)。

（5）微观指标的综合评价计算

主流意识认可度、社会影响力关注度、观众喜好度忠诚度、市场和消费带动度四个维度都是根据用户数据从微观层面评价节目，通过分层加权计算所收集到的用户数据，得出该电视节目的整体评分。具体分值的呈现有利于电视节目评价的量化，方便与其他节目对比分析，对电视节目制作和市场都具有一定的指导意义。

微观指标的综合评价计算方式如下：

“主流意识形态认可度”得分× 15% + “社会影响力关注度” 得分×35% + “观众喜好度忠诚度”得分× 35% + “市场和消费带动度”得分 × 15% = 电视节目评价总得分。

三基于大数据电视节目评价体系之反思与建议

大数据重塑了传统的电视节目评价体系，为电视节目带来了全新的评价方式，但是，基于大数据的电视节目评价体系也存在一些问题。笔者拟基于大数据的电视节目评价体系的困境，对此进行一些分析，并结合技术发展趋势，对我国电视节目评价体系未来发展进行展望。

（一）完善数据广度深度，构建多元评价机制

基于大数据的电视节目评价体系，主要通过从社交媒体、报刊杂志、媒体网站、电子商务社区等全媒体平台收集和整合相关的资料和数据，再加以量化研究和统计分析，以科学客观的量化指标因素反映出一档电视节目的质量。此评价方式是一种典型的定量研究，它可以解释有关整体的、相对宏观的、普遍的客观问题。概括来讲，该评价体系主要是描述电视节目总体的结构、趋势及其相关特征。

基于大数据的电视节目评价体系，通过全平台、全样本的数据分析，来反映电视节目制作和传播情况，其具有一定的客观性和精准性，但量化评价结果往往只能反映出有限层面的问题，具有一定的表层化倾向。它能向我们展示“实然”的状态，却无法指引我们“应然”的方向。大数据的特点决定它更偏向于追求相关关系，而忽略问题的因果关系，这使得我们在利用大数据技术体系评价电视节目效果的好坏时，无法通过梳理数据之间的关系去明晰现象背后的逻辑链条。比如，在利用电视节目大数据评价体系模型分析用户画像时，通过数据统计，可以很快分析出电视节目用户的性别、年龄、收入、学历、地域等关键信息，但对于电视节目为何会呈现出这样的用户特征，量化数据却无法给出解释。如需进一步深入挖掘数据背后的因果关系，还需要进一步对电视节目内容以及社会环境进行分析。

除此之外，不同的电视节目具有不同的特点。如果用同一标准去评判新闻节目和综艺节目这样不同类型的节目，其评价结论显然不会精准。因此，在利用大数据对电视节目进行评价时，应针对电视节目的不同特点，采用更有针对性、更细化的评估标准，从而构建更为科学的评估构架；且不应仅停留于对电视节目播出后的数据进行分析，还应注重对播前、播中的数据进行分析，建立起贯穿从电视节目策划到播后舆情分析的全流程评价机制。因此，建立多元化的电视节目评价机制势在必行。

（二）谨防节目数据造假，保证数据科学真实

无论是传统的唯收视率的电视节目评价体系，还是现如今基于大数据的电视节目评价体系，都不能不面对数据造假的问题。数据造假，使得电视媒体、相关机构和企业无法全面、客观、准确地了解电视节目的制作情况、传播情况以及用户评价，影响对电视节目价值的判断，降低了电视节目评价体系的信用效度。

在电视行业，数据造假已是陈年痼疾。早在2010 年，《人民日报》就曾连发3 篇深度报道揭秘收视率造假问题。2018 年，导演郭靖宇在其微博发布题为《起来，与操纵收视率的黑势力决一死战》的长文，深入揭露电视节目数据造假问题，他在文章中透露，自己正在播出的新剧曾被要价7200 万元作为购买假收视率的费用，以保障顺利播出。该文一经发出，便迅速引起了舆论的广泛关注。

就目前而言，大数据评价体系确实是一项比较前沿和新颖的电视节目评价体系，其从多个层面给数据造假增加了难度。另外，除了防治数据造假外，还需避免“唯大数据论”。现实中，大数据在传播中往往存在失真的情况，原因之一就是人工干预的数据采集过程可能存在引入误差。由于失误导致的数据失真与偏差，最终会影响数据分析结果的准确性。此外，数据失真还可能是由于数据的版本变更的原因，即在传播过程中，由于现实情况发生了变化，早期采集的数据已经不能反映真实情况。

电视节目数据造假，不仅增加了电视节目制作和宣传的成本，还愚弄了普通观众，给电视节目市场的正当竞争造成阻碍，长此以往，其会严重影响电视产业的健康发展。因此，我们需要通过新技术、新方法，建立贯穿全流程的多元评价机制，以便能全面、深入、准确地评价电视节目。

（三）坚持党性与人民性，强化社会责任担当

在我国，电视媒体是党和人民的喉舌，是重要的思想文化阵地，担负着舆论引导的重要职责和重大使命。电视节目是电视媒体的重要组成部分，是电视台所播出的内容的基本组织形式和播出形式。当下，一些电视节目受商业利益驱使，制造和利用虚假数据以博取虚名和完成绩效，其在价值导向、观念表达、制作品质、用户个人隐私保护等方面出现偏差。在此背景下，我们对电视节目的评价也有需不忘初心，牢记使命，毫不动摇地坚持党性和人民性的原则，引导电视节目弘扬时代主旋律，凝聚发展正能量。换言之，在关注技术引入的同时，电视节目评价体系还应坚守“全心全意为人民服务”的立场，力求以客观、真实的数据为基础，以国家主流意识形态为指引，在大数据系统中融合社会责任和价值担当的因素，将其具体化为评价电视节目社会效益的指标纳入整体评价体系，这样，我们才能在强调科学性、系统性的同时，体现出电视人的使命与担当。

参考文献：

[1] 张海涛.广播影视行业组织的实践探索与理论思考[M].北京：中国广播电视出版社，2016：270.

[2] 刘燕南.央视新评价体系的纵比与横比：特点、差异与探讨[J].南方电视学刊，2011(4)： 10.

[3] 国家广播电视总局.广播电视节目收视综合评价大数据系统开通试运行[EB/OL].[2020-02-20]. http://www.nrta.gov.cn/art/2018/12/26/art_114_40072.html.

[4] 李如义.理论经济学概论[M]. 天津：天津社会科学院出版社，2003：7.