浅析大数据背景下传播学研究的变革
2019-02-20丁勃文
□ 丁勃文 王 晨
“大数据指由于其数据规模巨大,因而难以通过人工在一定合理时间内整理成为人们所能理解的信息。”①大数据也是由人、机器、传感器、工具以及其他技术系统创造出来的数字数据②。其中大数据方法使用于传播学研究的,有分析大数据下的新闻生产、广告营销、舆情分析与把握③,利用大数据研究新浪高转发量微博④,分析百度搜索词数据,构建反映舆情基本情况⑤。大数据技术的应用已经蔓延至整个社会的每个领域,它正改变着人们的生活和工作,也被越来越广泛地应用到社会科学的学科研究中。
一、传播学研究思维的变革
大数据技术在科学研究中的广泛应用使得传播学研究转向了精确量化的阶段,这使传播学的社会科学属性变得愈发明显。大数据技术已经渗透到生活的方方面面,因此新闻媒体在进行新闻传播活动时就应该以全新的思维方式来创新。
首先,大数据背景下的传播学研究,理论上应当让位于算法,纯粹理论的价值应逐渐弱化,而将大数据有效地管理和应用的数据算法和处理规则变得越来越重要。其次,大数据时代,原本基于抽样调查法的样本分析方式被“全数据”的分析方式逐渐取代,大数据不再局限于数据的细枝末节,而更关注总体的、宏观的趋势。最后,大数据更多关注“相关性”,而非“因果关系”。“相关性”所带来的思维方式可以带来更多的可能,不但能使我们透过问题看清事情的本质,更能使我们透过数据对未来将要发生的事进行合理的预测,从而挖掘更多的新闻价值⑥。
二、传播学学科地位的变革
随着我国教育水平的不断提高与科学技术的不断增强,科研领域不断朝着垂直化和细分化的方向发展,各学科之间的边界也因此而更加清晰。大数据技术的发展和它在科研领域的应用使当前的研究重心发生了转移。海量的数据成为学科之间的纽带,大数据技术使得传播学的研究变得越来越多元化。
(一)大数据推动传播学与其他学科的融合
随着全球化进程的不断加快和相关技术的飞速发展,大数据技术已经广泛地应用到了人们的生活和生产当中。在社交网络、资讯平台和电子商务等领域中,根据大数据对用户进行画像从而精准营销,这种方式已经创造出了巨大的社会效益和经济效益。
过去,传统的传播学研究方法将定量分析与定性分析完全割裂开来看,定量分析的方法主要有内容分析、问卷调查和控制实验。定性分析主要通过民族志和参与观察等方式。大数据是由众多形式的覆盖多方面的数据内容构成的,它模糊了定性研究与定量研究之间的界线,使定性与定量在研究中结合使用成为一种主流。过去,精确量化属于科学的范畴,但随着大数据技术的应用,精确量化已经被广泛地应用到传播学的研究中。在今天的互联网环境下,大数据是信息传播的核心,更是传播学研究者进行研究的基础和前提,也是传播学研究者同其他研究人员沟通交流的介质。这些数据可以消除不同领域、不同学科之间的隔阂,模糊学科之间的界线,将传播学对数据的分析和理解方式应用到经济、政治和文化等更多领域⑦。
(二)大数据促进学科研究定位的转变
大数据时代的一个显著优势就是拥有大量的信息数据可以用于研究,研究人员可以更大程度地对研究方法和研究领域进行拓展。在过去的数据采集和研究背景下,获取的数据资源非常有限,因此最终实现的效果并不理想,且在数据统计和实证研究的过程中会消耗大量的人力和物力。即使是被广泛采用的抽样调查法仍然会不可避免地产生一些误差,从而影响到最后结果的准确性。而在某些研究场景下,大数据技术可以对样本的全体数据进行分析,找出其中的规律,对事实进行判断,因此最终的效果和准确度也更高。
三、传播学研究方法的变革
大数据技术的海量数据的特性改变了传播学的研究方法,赋予了传播学研究新的活力,一方面促进了其他学科与传播学研究的融合,另一方面使得传播学的学科研究定位发生了潜移默化的改变。研究方法的改变主要体现在以下几个方面。
(一)数据获取方式自然化
计算机运算能力的不断增强使得获取海量数据并进行高效处理成为了可能,一些互联网公司利用大量的数据可以实现对未来的预测。如预测不同地区、不同人群在“双十一”活动期间的购买力,景区在高低峰时间段的人流量,春运期间各地的人口迁移规模等。通过分析历年的数据,对某一阶段可能出现的情况进行预测,这些数据并非由人主导设计并调查取样,而是在被调查者不知情的情况下自然产生。这就存在着两点优势。首先,被调查者是在不知情的情况下被收集了数据,因此测量和统计的过程相比于问卷调查,就排除了语境等其他因素的干扰。其次,使用大数据获得的数据比问卷调查获取的数据要多,有时甚至能覆盖全部的数据。例如,对互联网中参与某篇帖子讨论的所有用户进行用户画像,这就是覆盖了全部的数据。这样的方式可以为后期的数据分析和研究带来更细节、更全面的认识。
(二)数据存储规模海量化
在传统的抽样调查法中,受到时间、空间和成本的限制,只能抽取样本中的一部分作为研究对象,这就意味着最终结果势必会产生一定的误差。而大数据不仅可以最大程度地保证准确度,还可以在此基础上实现海量样本甚至全样本的收集和分析。全样本数据意味着无需抽样,也就不存在抽样所造成的误差问题。
此外,传统的抽样调查获取的数据是结构化的数据,也就是事先经过数据模型的设计,可以储存在数据表的行列当中,如个人信息中的姓名、年龄、性别等。而大数据技术下捕捉到的数据还常常包含没有数据模型的数据,被称为非结构化的数据,例如Twitter 中的推文和YouTube 中的视频内容。事实上,非结构化的数据在数据的总体中占有百分之七八十的比例。在传统的抽样调查方法下,这些数据是不可用的,但在今天通过大数据技术,这些内容都可以被用来分析和使用,而且非结构化数据在今天的研究中扮演着越来越重要的角色。研究者可以从这些非结构化的数据中分析出更多的相关性,获取隐藏在数据背后的结论。
(三)控制实验的互联网化
传播学研究中的控制实验一般只能对少量的样本进行研究,面对大量的样本数据就无从下手。进行实验的环境也一般只限定在实验室内。大数据技术的一些特性可以克服这些实验过程中的缺陷,把进行实验的场所放到互联网上,把整个互联网环境都作为进行研究的实验室。互联网上的实验不仅可以消除传统控制实验存在的一些缺陷,还可以摆脱时间和空间的限制,通过大规模的数据收集和分析获取更多小规模样本数据统计所不能发现的微小变化。
四、结语
大数据技术的广泛应用不但改变了人们的生活,也对传播学研究的许多方面产生了影响。一方面,它改变了传播学的学科地位,海量数据推动了传播学研究的精准化,使它的社会科学属性得到加强;另一方面,它对传播学研究方法产生了巨大的影响,使定性研究与定量研究的边界模糊化。我们只有积极地学习传播学知识,才能更好地应对和迎接这场变革。
注释:
①Kusnetzky Dan.What is “Big Data?”[EB/OL].http://www.zdnet.com/article/what-is-data/,2010-02-16.
②Schilling P.L.,Bozic K J.The Big To Do About “Big Data”[J].Clinical Orthoparedics and Related Research,2014(11):3270-3272.
③喻国明,李彪,杨雅,李慧娟.新闻传播的大数据时代[M].北京:中国人民大学出版社,2014:192-250.
④李彪.微博中热点话题的内容特质及传播机制研究——基于新浪微博6025 条高转发微博的数据挖掘分析[J].中国人民大学学报,2013(05):10-17.
⑤喻国明.大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009-2012)的舆情模型构建[J].中国人民大学学报,2013(05):2-9.
⑥常春梅.大数据与新闻传播研究创新[J].新闻传播,2018(17):18-20.
⑦卜令法.对于大数据时代新闻传播学研究的重构与进路[J].电视指南,2018(05):55+57.