大数据变革视听节目与受众测试方法*
2018-02-09余志为袁海涛
■ 余志为 袁海涛
新技术消解了传统媒介建立的一个中心后,又建立起了若干个中心,这些中心关乎共同的趣味、爱好、习惯,也可能是共同的价值观,如果应用在影视文化作品上,这些“中心”是一个个类似“粉丝”式的群体组织,他们的收视习惯与收视行为正在逐渐地被重视起来。作为电视与网络新媒体节目策划与运营的重要一环,受众偏好的测量方式也正在发生变化,以往的小样本抽样测试方法代替整体偏好的时代渐成过去,取而代之的是重视全体数据和受众兴趣的大数据测试方法。
从西方节目测试的演变来看,无论是公共电视台还是商业电视台都注重节目对受众收视行为与心理的考量。多年来已经形成了一套完整而较为科学的节目测评方法,主要体现在节目自身的定性和定量测试、受众偏好与反应的定性和定量测试、受众数量的定量测试。①本文将在回顾前两个阶段,即人工抽样节目测试阶段和机器抽样测量仪阶段测试方法的基础上,对大数据方法影响下的节目和受众测试进行分析,探讨大数据方法和背景给观众研究带来的影响,对其目前的发展现状、可行性和优势进行重点分析。
一、人工抽样节目测试阶段
电视节目测试大致经历了三个阶段,分别是人工抽样测试阶段、机器抽样测试阶段和大数据测试阶段。三个阶段的产生都与技术媒介的发展更替有关,1923年创立的尼尔森收视调查公司的主要业务是为迅猛发展的广播业和广告业做受众测试。50年代当电视开始走向普及,尼尔森也把业务向电视业拓展,节目和受众测试渐成规模。早期他们主要采取两种方法:
一是电话测试。AC尼尔森收视调查公司早期使用的调查方法主要是电话测试,这种方法被称为电话对对碰,公司随机抽取几百近千个号码进行询问,通过被测试者的回答确定电视节目的收视状况,这类方法在受众调研极度缺乏的时期起到了重要作用,电话调查有利于企业人员直接与受众进行沟通,可以直接得出用户态度信息,至今仍然有许多公司把电话回访当作方便有效的测试方式。
二是日记卡测试。电话调查法对收视时长的调查不准确,难以实现秩序性固定样组测量,测量误差较大。七八十年代日记卡测试法较为盛行,其在受众测试史上也占有重要的地位。“在地方受众的测定中,公司在全美选定5000个家庭样本,样本观众在日记卡上记录自己收视情况,尼尔森公司每年分四次对样本进行统计,大约有210个电视市场会得到统计”②。日记卡,是真正的固定样组测量,通常这类方法会与电话调查等人工调研方法相配合进行。但是,日记卡法的缺点是公司需要样本用户具有较高的自觉性和配合性,数据准确度较低。
统计预测方法可以归纳为定性预测方法和定量预测方法两类。定性预测方法主要依靠丰富的经验来进行预测,具有极强的主观性,这种方法通常要配合定量预测法。早期的抽样调查中,由于样本数量较小而总体数量较多,主要以定性预测为主。
电话测试和日记卡测试在受众分化前的媒介时代是具有较高的代表性,按照科伦伯格提出的受众分化四阶段,即一元模式阶段、内在多元模式阶段、核心—边缘模式阶段、分化模式阶段③,一元模式阶段(二十世纪五六十年代),在这个阶段电视处于初步发展时期,节目数量极度匮乏,受众只能接受共同的媒介内容。随着电视地方频道的开播,受众有了更多的选择机会,这一时期是受众内在多元时期。在这前两个阶段的受众测试中,小样本能够代表大多数受众的收视行为。然而随着媒介竞争者的加入,电视频道数目剧增,节目内容剧增,受众可以选择到与大多数人不相同的电视节目,受众逐渐分化为核心—边缘模式阶段。第四阶段指的是受众群更加广泛的分化,受众之间的媒介共享情况大大减少,媒介融合加速了这一时期的到来。原始的小样本抽样已经越来越不能代表分化受众的喜好了,他们变得更加难以琢磨。人工测量技术越来越难以支撑更多样本的测量,随之机器测量仪诞生了。
二、机器抽样测量仪阶段
机器测量仪抽样的出现有两层含义,一是为了弥补人工节目测试在样本选取和精度上的不足,另一层含义是受众已经发展到了多元模式和核心—边缘模式阶段,受众的审美因为各种原因已经发生了分化和提高,这使得同质化电视节目难以生存,创新在艺术行业的要求尤为重要。从电话调查法来看,它对用户的收视时长无法准确地评估,对实现秩序性样组测量有很大难度,增加了测量的误差率。日记卡法虽然能够实现固定样组测量,但是需要用户的高度配合。样本户对自己的收视行为的记录主要是回忆式的,测量准确度仍然有限。为了增加数据测量的准确性,90年代收视公司又增加了测量仪对受众用户的收视行为进行测试。
测量仪是一种收视统计器,可以自动化的抓取样本的收视行为。“AC尼尔森公司对在全国收视率估算中,以5000户家庭为样本,大约13000多人”④。通过给他们家庭安装测试仪,抓取他们每天在什么时段打开电视及切换频道。再通过中央处理器收集这些收视行为,然后得出收视率和开机率。
测量仪测试方法大致有三个优点:第一,可以在不干扰样本的前提下,自动统计用户的收视时长以及收视时段;第二,测量仪测试更加精确地统计用户的收视情况。在终端计算机的处理下,得出用户的收视行为。配合电话调查和日记卡调查的情况下,可以更加精确地得出受众测试结果;第三,相较于人工测试法可以更加快速地得出某个栏目在某个时段的收视情况。
近年来,收视率作为节目测试的主要手段饱受诟病,其主要原因之一在于样本选取量少和代表性差的问题,尼尔森公司在高峰时期可以在全国选择12000个样本户,在美国上亿人口中,样本数量仍然很低,而且还面临对少数族裔样本户选取不足的问题。
除了传统的尼尔森、TNS传统的市场调研方法之外,还有两种节目测试方法是主流。第一种是ASI受众研究公司,这类数据调研公司还被大量的使用,尤其是以CBS、BBC为代表。ASI的节目测试有两种方式:分别是剧场测试和在线测试⑤。剧场测试在城市中心开办“审片室”,通常会有几百位观众参与审片活动。这类调查优点是样本规模大、及时反馈,但是剧场环境并不能如实地反映家庭的观看环境,该方法还存在很多弊端;二是有线测试,利用遍布各地的有线电视网络系统,通过互联网将视频节目传送分布全国各地的家庭样本。这种测试方法弊端在于,样本数量有限且不能有效地控制整个测试过程,最重要的是受众处于被动调查的位置,他们是否能够代表整体存在疑问。
第二种方法是像CBS在拉斯维加斯米高梅酒店设置电视城研究中心。在这里,每年有近几万人接受节目测试。这种大样本可以很清晰地记录样本用户的观后心情,并得到及时的记录。同时还能从他们中获取最直观的建议和意见。
在我国,以上两种方法长时间以来都没有得到普及。国内电视台传统上一般采用座谈会的方法,样本量极少而科学性不足。但是,近年来国内开始重视受众研究,除了央视市场研究中心CTR是最有影响力的研究机构之外,各电视台也陆续成立了专门的部门。同时也开始借鉴海外的测试方法,如2013年上海电视台就成立了专门的受众测试和研究中心,2016年江苏电视台也成立了受众测试实验室。上海台的电视受众测试中心方法上也是借鉴了CBS和ASI的传统做法,完成了《中国达人秀》《花样爷爷》等节目的播出前测试。同时也将测试应用于将受众兴趣与广告市场需求进行对接的环节上。⑥
三、大数据变革受众研究方法
新技术的迅猛发展,整合了几乎所有的媒介内容。“老式的、机械的、由中心向边缘扩展的单向模式,再也不适合今天的世界,电力的作用不是集中化而是非集中化”⑦。无中心的传播模式逐渐取代中心—边缘的传播模式。新兴电子媒介打破了地域、行业、媒介等的区隔,也打破了知识生产和信息消费的模式,集体智慧和信息分享与整合代替了被动接收。大数据时代,“受众”一词已经被“用户”取代。传统上的人口统计学特征来把握受众的方式已经过时,在新媒介的世界里,用户行为特点显得更加重要。受众的行为模式也呈现出非线性的特点,不再是过去流程化的消费模式,而呈现出更为复杂和多向多点的特点。⑧随着大数据挖掘技术分析用户行为模式成为可能,如何利用用户生产的内容来挖掘用户真正所需,掌握媒介融合后的视听节目观众的收视心理,大数据测试方法应运而生。
(一)获取大数据从聚合受众开始
新媒介时代迫切需要把分化的受众重新聚合,各类公司强势进入新媒体电视,主要目的是建立自主的集聚受众的媒介平台,这也是获取大数据受众调查的开始。互联网电视将会把这种交互性和个性化发挥到极致,最大限度地抢占新媒介用户资源。“圈地运动”带来了数据垄断,少数几家IT公司掌握了绝大多数中国网民的用户信息数据,这成为它们重要的客户资源。
收视方式的变化促进了节目制作与编排的变化。未来的电视节目将会更加个性化和定制化,今天的受众强调互动、分享、对话、交流,他们更加具有自主选择性。不同的文化背景与知识构成使审美与需求都呈现出差异化,窄众传播中找出精确的目标群体,了解并满足他们的潜在需求,编排出他们喜好的节目,有利于增强他们的媒介使用忠诚度。以此推断,未来的传播可能更加偏向小众化,“广播”向“窄播”转变的趋势越趋明显。传统媒介在新媒介面前显得创新不足、突破不够。新媒介通过内容整合,已经在网络上开辟了大片天地,吸引了大量的会员用户,而传统电视媒体难以打破旧有的机构格局,无法实现真正的媒介融合,在互联网上显得与视频网站竞争力不足,也难以找到合适的平台利用机制与转型机制。
(二)节目受众测试中的大数据分析
大数据分析是依靠转换而得出结论的。“在电力时代,我们发现自己日益转化成信息的形态,日益接近意识的技术延伸。”⑨麦克卢汉的媒介延伸论指出了人的转换,人可以越来越多地把自己转换成其他超越自我的形态。无论讲城市是人的延伸还是技术是人的延伸,都在有意识地强调媒介的转化、运用。大数据其实是把人的行为、态度转换成一组组数据、再转化成图表。实际上是把人转化成语言符号。在舍恩伯格看来,大数据挖掘运用的是相关关系法,而不是因果关系,相关关系更加适合大数据的数据挖掘。通过查找这个人的相关行为来寻找此人,凡是与此不相关的都不是此人,这正是我们常说的排除法。大数据在节目受众调查中的运用是要找到一个分类方法,我们寻找的不是个体,而是最大化的群体,毕竟电视在目前看来还是大众传播媒介。如何从逐渐分众化的大众中寻找到最集中的受众是大数据分析的任务和目标。
数据的价值不会自动呈现,需要运用数据挖掘技术才能找出其中的价值。舍恩伯格提到:“数据的真实价值就像漂浮在海洋上的冰山”⑩,不同的公司都有其独有的用户群,例如淘宝公司可以追踪用户的家庭住址、联系方式、性别、喜好以及大致的职业构成和收入,这使得企业向用户推送产品时有了更多的针对性。而像Facebook(脸书)这里的社交平台则能统计出海量用户关注的热点以及企业被搜索和提及的参数,分析出企业的发展“镜像”。大数据受到大企业的重视是商业竞争的结果,也是海量数据产生后倒逼数据挖掘的结果。这些数据的挖掘成了公司提升竞争力、分析受众和竞争对手的重要依据。
社交媒体互动数据影响节目的收视指数。新浪微博和CSM合作推出微博电视指数,把社交媒体的数据与收视数据结合起来,通过话题设置和数据分析的方式,可以得出电视节目话题的阅读量、讨论量、提及的次数和人数。“行为指标与经济效益直接相关,也是最有参考价值的传播效果评价指标”,这些数据展现节目在社交媒体上的互动程度,往往社交网站上互动程度与节目的收视情况成正相关关系。
(三)大数据节目受众调查的运用与特性
大数据时代,节目受众调查由被动调查转向主动生产和提供。大数据调查方法是利用新型技术,让受众在不知不觉中主动把收视数据传回了计算机终端,这种方法正是在分析人们的无意识行为或者潜意识行为的外化,最后再把这种外化的行为通过数据的形式传送给计算机终端。弗洛伊德认为潜意识的本我状态是没有经过伪装的,这就是说大数据其实是在寻找人的潜意识行为,而非经过过滤选择的有意识行为,这使数据收集的真实性有了质的飞跃。那么大数据调查究竟有哪些优势特征呢?
1.预测。舍恩伯格认为大数据的核心是预测。我们利用大数据进行节目调查目的是要指导创作。如今在面临越来越多高投入的电视制作商的情况下,能够为电视节目提供有效的收视预测将会为媒体节约大量的资金,并且在节目创新上也会有更加大胆的尝试,我国电视节目创新远不及欧美国家,目前来看我国收视率前几名的电视节目都借鉴国外的优秀模式,真正自主创新的电视节目模式非常少。从以往的节目创作上看,主要依赖经验丰富的制片人创作电视节目,未来电视节目模式的创作应该更多地引入大数据方法。节目创作更具有科学依据。
2.隐匿。随着数字电视的逐渐推广运营,电视节目测试的方法也向前推进了一步。在尼尔森网联的解决方案中,尼尔森公司已经开创出了一种新的方法用于更加方便和准确的测试数字电视的收视情况。这种方法有别于传统的模拟电视时期的测量仪方法。尼尔森网联依靠全球最新的RPD技术、HPT技术和Watchbox测量仪相结合,可以精准测量直播的收视数据,囊括数字电视的多种收视行为,检测到受众的回看、点播等多种收视行为。在模拟电视的收视测量中,频道与频率之间是一一对应的关系,在媒介、网络融合的时代,电视频道与频率不再是一一对应的关系,在同一的频段可以播出不止一个的电视节目频道。这种通过频率探测观众收视行为的时代已经不适应于技术的发展。更重要的是,数字电视提供用户回看、点播的收视方式,改变了以往的线性的、单向的收视方式。电视台终端对观众的控制力在逐渐下降,人们可以自由选择观看何种节目,智能电视甚至可供观众编辑自己喜欢的节目。
3.安全。尼尔森公司采用封闭式的、全自动的数据采集方式提升了数据的安全性,并且在不干扰受众的前提下进行数据采集,有利于增加数据的准确性。尼尔森网联已经具备了大数据挖掘数据的思维,尤其是在样本选取的量和对用户收视行为的分析上较传统方法是一次飞跃。但是此类方法对收集和分析非结构化数据仍然有很大的局限。在大数据中,超过百分之八十的数据都是非结构化数据,缺乏对这类数据的挖掘和分析,不能真正从大数据中获益。
4.实时与真实。大数据方法的隐匿性使得调查结果更加真实。乐视、搜狐、爱奇艺等视频网站建立了类似的视频指数中心,基本囊括了用户搜索、播放、评论、顶、踩、收藏等指数。此外,这些网站可以清晰地看到用户的播放时间、播放设备、人群地区分布、性别、年龄、星座、学历、兴趣、职业、收入、学历等。视频网站的互动性有助于粉丝社交的发展。分化受众时代,受众们已经不能仅仅满足于传统的熟人社交圈,他们在更渴求地寻找具有共同趣味的粉丝社交圈,以获取更多信息、评论和解读方式等,这些参与性的行为也促使他们从单向度的受众转化为更加具有参与性的用户。作为粉丝最大的快感便是表达,并且这种表达是为了获得精神上高层次的尊重需求,陌生人社交也会因此变得更加频繁和活跃。从我们传统的人际交流来看,人与人之间是面对面的实在性的交流,使得这项活动具有一种仪式感和真实感,电子媒介虚拟性虽然阻碍削减了熟人社交的时间,但是反过来对陌生人社交却具有某种促进作用,这是一种此消彼长的关系。这些交往实际上产生了实时和真实的行为数据。
5.准确。以优酷视频数据中心为代表的统计方法,已经符合了大数据节目测试的许多特征,如:样本等于全体,网络化双向互动的视频节目,只要用户打开了网页,后台的日志记录服务器就会把每一个用户的选择、收看动作记录下来,包括用户看了多久、在哪里做了暂停、在什么时间段收看的这些都被详细的记录下来。最后通过数据软件和人工筛选得出各个节目的收视数据,除此之外网络还有独立的留言板块,以收取观众的反馈意见,增加节目对用户的实时互动。事实上构建大数据调查背景,不仅需要海量的样本,还有需要不同数据之间的相互配合,达到融汇贯通,实现高效地整合不同平台之间的数据,以此达到从海量的数据碎片中挖掘出有价值信息的目的。我们从隐匿的调查中得出的结果表现出真实和准确两个特性。
6.权重与大数据统计模型优化数据。无论是微博电视指数,还是各大网站的收视指数,都应该注意数据造假的问题,尽管互联网大数据统计主要是机器自动捕捉的,这里面仍然存在误差。在水军横行的今天,我们许多互联网上的数据都不能直接使用,而必须建立更为科学的统计模型来过滤那些重复统计的数据,以此得到更为准确的数据计算方式。在大数据时代,科学的数据抽样法仍然值得尊重。
四、结语
大数据节目受众调查和测试方法是受众分化后必然采用的科学研究方法,新媒介时代受众细分和分化使媒介不得不更加重视观众的需求。新媒介时代的受众更多希望与传者进行对话,或者直接参与到内容制作之中去,他们不再是被动的信息接收者,而是参与者和制造者。从这个意义上说,受众并不是消极地对待媒介,而是渴求在媒介内容制作上获得更大的参与性,他们渴求自己的意见、喜好得到重视。实际上媒介与受众的关系是越来越紧密,这是一种相互依存的关系,受众离不开媒介,媒介更离不开受众。在这个背景下,媒介经营者应该更加注重受众的体验,从海量受众测试中找出他们真实的兴趣点,充分发挥大数据的预测功能,为未来的节目创作提供重要依据。
注释:
①⑤ [美]苏珊·泰勒·依斯特曼,道格拉斯·A.费格斯:《媒介内容策划与运营:战略与实践》(第八版),刘涛、何艳、张海华译,清华大学出版社2009年版,第50、54页。
②④ 郑亚楠:《AC尼尔森:美国最权威的收视调查公司》,《新闻传播》,2004年第9期。
③ [英]丹尼斯·麦奎尔:《受众分析》,刘燕南、李颖、杨振荣译,中国人民大学出版社2011年版,第168页。
⑥ 陈雨人:《解密SMG电视节目受众测试体系》,https://www.tvsou.com/article/2311019ee40f224ded10,2015年6月2日。
⑦⑨ [加]马歇尔·麦克卢汉:《理解媒介》,何道宽译,译林出版社2011年版,第56页。
⑧ 聂磊:《新媒体环境下大数据驱动的数据分析与传播策略》,《新闻大学》,2014年第2期。