突发公共卫生事件中数据新闻生产环节探究
2022-06-25程挺松桂思睿何倩儿梅沁怡谢倩栩
程挺松 桂思睿 何倩儿 梅沁怡 谢倩栩
摘要:突发公共卫生事件报道中,数据新闻已成为常规范式。但数据新闻在新冠肺炎疫情报道的应用中暴露出信源透明度低、数据中心主义泛滥和前瞻效力弱的问题。作为数据新闻的“生命”,数据的获取和排列方式决定了信息传递的效率。为深入研究数据挖掘、表征和加工在报道突发公共卫生事件中的功能,文章对上述问题进行了反思,并以澎湃新闻“美数课”数据新闻栏目发布的171张与新冠肺炎疫情相关的数据可视化图表为研究对象,运用定量分析和个案研究相结合的方法,探究数据新闻生产中各个环节具有的功效与存在的不足。研究发现,疫情期间,数据新闻生产中数据的获取、表征和加工坚守了新闻的价值本位,革新了新闻的生产方式,而共享环境缺失、人本逻辑偏离和前瞻性不足是数据新闻工作者需要攻克的难题。
关键词:突发公共卫生事件;新冠肺炎疫情;数据新闻;澎湃新闻;可视化图表
中图分类号:G210.7 文献标志码:A 文章编号:1674-8883(2022)06-0041-05
基金项目:本论文为大学生创新创业训练计划项目“突发公共卫生事件数据新闻的传播困境研究”成果,项目编号:202113290011
不同于以文字逻辑叙事的传统报道,数据新闻以数据“说话”,深度契合了新冠肺炎疫情期间受众信息获取的需求。大数据的功能由辅助新闻报道的“工具”,转变为预测和决定传播内容的“引擎”[1]。因此,数据的获取和表征决定了数据新闻信息传播的功效。疫情期间,数据新闻的生产有三个环节:数据挖掘,获取与疫情相关的海量元数据;数据表征,以丰富的可视化手段呈现结构化、脉络化的信息;数据加工,通过引入可视化元素拓宽新闻叙事的深度和广度。文章统计了2019年12月至2021年11月期间,澎湃新闻“美数课”栏目下171张可视化图表的数据来源和可视化手段等相关信息,深入探究数据新闻生产各个环节中蕴含的传播学理论知识,对数据新闻报道突发公共卫生事件的前景和价值展开预判。
一、数据挖掘
(一)多方数据源交互印证新闻真实
客观真实是坚守新闻本位的首要原则。新冠肺炎疫情期间,数据新闻通过数据可视化的方式呈现病例数据、物资运输、扩散途径和疫情防控等方面的信息。因此,在突发公共卫生事件中,新闻真实的前提是数据真实。澎湃新闻通过征引多方数据源,在数据维度上建构了真实的信息环境。
第一,数据来源数量众多。疫情期间,澎湃新闻发布的可视化图表由多个数据源合力驱动。统计发现,在选定的时间范围内,澎湃新闻“美数课”中以可视化图表为叙事手段的报道共39篇,包含171张可视化图表,共引用数据源357个,平均每张可视化图表引用数据源2.09个。若以单篇数据新闻报道为统计单位,剔除同一报道内不同图表重复引用的数据源,得出数据源引用渠道为4~8个的图表类数据新闻报道有16篇,占比最高,达到41%;15篇图表类数据新闻报道的数据源为1~3个,占比38%;引用9个及以上数据源的图表类数据新闻报道有8篇,占比21%。
第二,数据来源的种类丰富。学者周谦豪、梁佳霁和许鑫将数据新闻的数据源分成五大类别:一是自主获取,二是研究机构,三是政府(或政府间机构),四是企业(或非政府组织),五是其他媒体[2]。
依照此类标准,对171张可视化图表的数据源进行分类统计(见图1)。从整体上看,政府(或政府间机构)类数据源利用率最高,占比达到30%,数据主要来源于国家与地方卫健委和各类行政主體;来自研究机构的数据源和其他媒体类数据源的利用率相对持平;企业(或非政府组织)类的数据源引用率为18%,信息源主要包括权威性强、专业性强的数据机构。自主获取数据源的数据新闻报道数量最少,只占总数的2%。
同时,文章摘录不同种类数据源的词条,发现澎湃新闻多次引用同一数据源,如在研究机构一类的数据源中,约翰霍普金斯大学发布的数据就被引用了19次。同样,在以其他媒体为数据源的图表中,央视新闻数据的引用频率最高,达到14次(见图2)。
因此,数据新闻在报道突发公共卫生事件时,通过引用多方数据源印证疫情相关信息的真实与客观,这是在新闻信息获取角度对马克思报刊“有机运动”和人民报刊“有机整体”思想的另一种诠释,即由多元新闻生产,新闻传播主体相互影响、相互作用共同塑造的新闻真实[3]。新冠肺炎疫情期间,由多方数据源合力驱动的数据新闻不仅满足了受众获取疫情信息的需求,还能根据媒介议程设置的不同,征引与报道议题相关度最高的元数据。
(二)各类数据源深度契合媒介议程设置
疫情期间,澎湃新闻挖掘和引用能够充分发挥媒介议程设置效力的数据源,深刻体现其“数字是骨骼”的新闻生产理念。
统计发现,从媒介议程设置的角度出发,171张可视化图表的报道议题可以分为以下七大类别(见表1)。
澎湃新闻对不同种类数据源的引用与媒介议程存在一定关联,主要表现为以下两个方面。
第一,以政府(或政府间机构)和其他媒体发布的数据建模,通过权威的客观数据佐证病例数据和病毒扩散途径的真实,以此保障受众的知情权。疫情期间,某一区域内的病例基数和感染者的行程轨迹对受众的生命安全构成直接威胁。因此,受众获取议题为“病例数据”和“扩散途径”类信息的优先级最高。这就要求上述两类信息的来源准确、客观,才能消除受众的不安和恐慌心理。统计表明,171张可视化图表中,议题指向为病例数据和扩散途径的图表共有56张,引用数据源120个。
整理和归类这56张图表的数据源,发现政府(或政府间机构)和其他媒体类数据源引用比例很高,共引用83次,两类数据源累计占比72%(见图3)。政府(或政府间机构)一类的数据源中,除国家、各地卫健委和政府分管部门之外,还包括一些知名政府间国际组织,如世界卫生组织和世界银行。而源于其他媒体的数据源中,信息获取的对象主要是不同国家最具权威或知名度很高的媒体单位,如我国的人民日报、央视、新华网,境外的BBC、卫报和纽约时报等。在突发公共卫生事件中,权威的数据来源渠道能够营造更加客观的叙事氛围,一定程度上增强受众对信源的信任。
第二,以研究机构发布的数据制图,科普疫情防控知识,从而提高疫情防控的效率。文章对31张传播疫情知识、解读相关病理的知识科普类可视化图表进行了数据源统计。统计表明,在知识科普类的数据新闻报道中,源于研究机构的数据引用率最高,共有38处,占比达到47%(见图4)。此类数据的来源主要包括海外研究院所、高校和外文文献。经过专业学者的研究和分析,海量数据得以优化重构,能够从知识的视角为受众提供疫情相关信息。而对此类数据源的征引,能够极大提升受众信息获取的效率,从而实现媒介议程设置效益的最大化。
(三)信源不够透明,共享环境尚未形成
学者杨宏认为,数据新闻对元数据的披露应当做到翔实且透明,一篇专业的数据新闻应尽可能让读者有机会鉴证报道的真实性[4]。与财新“数字说”栏目相似,澎湃新闻也存在数据开放程度低的問题。
首先是数据源界定不明,信源披露不够详细和明确。统计表明,新冠肺炎疫情期间,澎湃新闻引用的357个数据源中,共有24处以“公开资料整理”和“其他媒体报道”一类的模糊陈述标注数据源。此类较为笼统的标注,阻碍了受众自主探索数据真实性,因而不利于数据新闻的社交化传播。
其次是数据共享不够全面。虽然澎湃新闻标注了每一张可视化图表的数据来源,但标注形式仅仅是以词条文本的形式置于图片内部,并未对词条设置超链接功能,使其能够跳转到元数据的获取界面。突发公共卫生事件的信息量庞大,信息结构也较为复杂,因此数据新闻报道应当打通受众与数据的沟通渠道,否则受众将依然被置于较为封闭且被动的信息接收环境中,这一定程度上有碍于数据新闻的传播。
二、数据表征
数据可视化是数据新闻生产的第二环节。在突发公共卫生事件中,数据新闻可视化强化了信息的表征力,能够将病例数据、人口流动、病毒扩散途径等疫情相关信息置于全新的叙事背景下,让受众直观感知疫情风险,从而满足受众安全避险的需求。新冠肺炎疫情期间,澎湃新闻生产的171张可视化图表不仅种类丰富,而且议题分布广泛。
(一)图表多元,丰富新闻叙事手法
澎湃新闻数据处理技术精湛,多元图表的应用延展了信息传递的思路。澎湃新闻产出的可视化图表不仅种类丰富,而且结构多元。多数图表的结构为复合型,即图表之间的相互嵌入与交联。因此,若以传统意义上的图表种类作为分类依据,很难体系化梳理171张可视化图表。
学者谭剑、王明玉和白东鸣以图表叙事主题为标准,将可视化图表分为对比型、分布型、关联型、趋势型和地理型五大类别[5],较为全面地展现了不同形式的可视化图表。按此类标准,剔除仅以文字呈现的简单列表19张和叙事主题不明确的图表2张,对剩余的150张数据新闻图表进行分类整理。
统计发现,对比型叙事图表占比最高,达到71张,主要包括面积图、气泡图和多系列条形图一类视觉对比性强、易于受众识别的图表。关联型叙事图表20张,主要有双线图、桑基图和节点关系图等,能够清晰展现不同数据之间的关系。分布型叙事图表主要包括散点图和热力图,能够展示数据的分布和聚合情况,共11张。趋势型和地理型叙事图表共55张,分别以时间轴和区域地图为信息载体,显示时空整体维度下的数据特征。
部分可视化图表同时拥有两类叙事主题。疫情期间的信息量庞大,于宏观而言,疫情发展趋势、波及范围和社会影响具有整体性;于微观而言,不同的病例个体有不同的移动路径和感染症状。因此,澎湃新闻以多元图表扩充叙事主题,做到了宏观与微观的结合,符合疫情期间信息传播的规律,彰显了“设计是灵魂”的新闻生产思路。
(二)主题明确,切合新闻报道议题
文章统计了不同报道议题下可视化图表叙事主题的数量分布(见表2)。数据表明,澎湃新闻产出的可视化图表与报道议题存在一定联系。从表中数据可知,对比型图表在病例数据、疫情影响和知识科普类议题中应用率较高,其原因有两点:一是面积图和多系列条形图一类的对比型图表能够通过图幅的大小和长短差异,较为直观呈现病例基数的变化,量化疫情造成的社会影响;二是对比型图表避免了对疫情专业知识的直接陈述,而是通过构图差异和视觉冲击,阐明病理与症状的内在联系。
例如,澎湃新闻于2020年5月21日发布的《图解|全球累计确诊破500万,“解封”之路并非一片坦途》就使用气泡构图的方式,从流行程度和死亡人数等维度出发,对比新冠肺炎疫情和人类史上其他重大突发公共卫生事件的异同。
关联型图表在扩散途径类议题中应用率较高,是因为双线图、桑基图和节点关系图能够清晰还原感染人口的运动轨迹,挖掘地域、防控力度、病例种类等多维度信息之间的内在关联。同时,趋势型和地理型的图表能够打破时空的限制,折线图和地图基底散点图一类的图表能够在时空的整体维度下,呈现脉络化的病例数据信息。在这种情况下,图表传递的信息不仅是单一的病例数据,还有建模赋予的整体性和连贯性,这是宏观视角下对疫情发展态势的“数据把握”。
(三)本位偏离,人本逻辑亟待回归
有学者认为,在大数据新闻中,作为科学技术手段的大数据“凌驾”于人之上,渐渐形成了一种数据中心主义[6],呈现出与人本逻辑背离的趋势。新冠肺炎疫情期间,澎湃新闻生产的可视化图表中,存在部分图表与受众需求脱节的问题,主要表现为对专业化外文图表的直接引用和列表呈现形式下的数据堆砌。
统计发现,171张可视化图表中,有18张图表是对外文文献、研究报告和海外媒体的直接援引,而并未将其转换为中文图表;同时,数据呈现能力一般的简单文字列表共有19张。此类列表的叙事维度较为单一,与传统文字报道的叙事逻辑如出一辙。在信息传递的环节中,媒介起到勾连现实世界和信息世界的作用。而现实世界最终会以什么样的方式进入信息世界,一方面取决于符号表征问题上的新闻专业理念与伦理,另一方面取决于传者和受者之间的认知距离[7]。虽然数据可视化增强了数据表征力,但外文图表的应用和数据的简单罗列无法缩短传者和受者之间的认知距离,本质上依旧是数据中心主义的体现。
三、数据加工
数据加工作为数据新闻生产的最终环节,是以可视化元素对建模后的数据进行可视化渲染的工序。可视化元素的引入不仅能够使图表更加美观,更重要的是能够提高信息传递的效率。研究发现,新冠肺炎疫情期间,澎湃新闻加工数据的方式主要包括色彩注入和动态呈现。
(一)为数据注入色彩
数据新闻的诞生是数码设备普及的必然结果,而移动终端的迭代更新也为色彩的显示提供了设备支持。疫情期间,澎湃新闻产出的可视化图表具有极高的色彩应用率,信息呈现色彩为两种及以上的可视化图表有131张。除去色彩仅仅起到美化作用或增强视觉效果而无实际指代意义的图表37张,对余下的94张可视化图表进行定量研究,发现色彩的注入不仅能够提高信息对比度,还可以构建新的叙事维度。
1.色彩指代信息,增添叙事维度
研究表明,色彩对信息的指代有两种实现手段:一是以原色指代同一层级下的不同信息,如性别、医护人员职位、国家与地区等;二是以某一原色下色调的深浅差异呈现一类信息下的不同指标,如病例基数、波及范围和民众对待疫情的态度等。这两种实现手段都具有共同的功能指向,即引入信息载体、构建叙事维度。笔者对每一张可视化图表中色彩的指代信息都进行了标记和归类。统计发现,94张可视化图表中,色彩指代的信息非常广泛,不仅包括地理位置、病毒机理和病例数据等一类便于统计归类或量化的信息,还包括政策响应、态度观念一类数据表现张力弱的信息(见图5)。
色彩的注入不会受到图表类型和议题内容的限制,是相对独立的可视化渲染方式。在表征形式上,文字或图像类的具体信息被转化为具有视觉冲击效果的色彩,填充于图表或图示的不同位置,与图表的叙事主题相得益彰。这不仅压缩了新闻的叙事篇幅,还能挖掘不同叙事主体之间的关系,丰富新闻的叙事手段。例如,可视化图表以病例数据建模,同时以某一原色色调深浅作为背景,指代政策响应力度的强弱。因此,受众能从强烈的视觉对比效果中直观解读政策响应力度与病例数据的内在关系。同理,被色彩渲染过后的地理位置类信息能够清晰对比不同地域内病例数据和疫情防控水平的差异。
对于信息范式广、数据表現张力弱的信息,如疫情影响和民众对于疫苗接种或疫情前景的态度观念,色彩构建的独立叙事维度也能自然将其囊括其中。
2.色彩对比度不高,表征强度负载
图表色彩所容纳的信息不能超过人类大脑信息处理系统的阈值,否则会造成叙事环境紊乱的后果,这与数据新闻的传播理念背道而驰。研究过程中,笔者发现部分可视化图表的色彩存在对比度不高的现象。而出现此现象的原因在于海量的信息超出了色彩所能容纳的极限。因此,数据新闻生产者只能通过削弱色彩对比度、扩充色彩种类的方式增加信息载体的数量,但这却造成了表征强度负载的问题。例如,澎湃新闻于2020年2月16日发布的《回溯45个重点疫区的数据,我们该如何看待当前疫情?》,在呈现湖北病例数据的面积饼图中,指代病例数据的“红色”被分为了色调强度不同的7种色彩。由于对比度不高,这些色彩的效果并不理想,受众无法从色彩的差异上读取相关的病例数据。因此,虽然色彩的应用能够增添新的叙事维度,提高信息传递的效率,但过度的渲染却会造成事倍功半的后果。
(二)为数据构注入活力
1.隐藏时间基轴,优化新闻内容
171张可视化图表中,动态呈现的可视化图表虽然只有9张,但表现亮眼。动态可视化图表所具有的显著优势是能以时间序列下可视化元素的运动呈现数据变化的趋势。因此,时间叙事的维度被隐藏,时间序列上的信息也被运动中的可视化元素指代,进而缩短新闻报道的篇幅,优化了新闻内容。9张动态可视化图表中,有7张图表的议题指向为病例数据。动态呈现的方式在读者获取信息的过程中构建了相应的时空维度,同时又规避了以静态文字或图表来呈现时间变动要素的冗杂和赘余,是对新闻内容的二次整合,也极大节省了受众读取信息的时间成本。在动态呈现效果的加持下,受众能从病例数据的变化中见证疫情发展的整体趋势,从而构造“疫情整体观”。
2.前瞻力度不足,预测报道稀缺
疫情发展前景是每一位受众迫切想要知晓的问题。但研究发现,澎湃新闻仅是通过动态效果重现疫情在过去的发展趋势,没有预测新冠肺炎疫情未来的走势。其原因在于新闻预测不仅受到数据处理技术的限制,还受到新闻伦理和社会效益的约束。学者王茜认为,预测性新闻带来了新的新闻伦理问题[8]。突发公共卫生事件话题严肃,社会创伤面大,与国计民生有直接关联。而预测性报道能提供的事实只是一种概率性描述,不具备“导向标”的权威性和准确性。一旦预测性事实与社会实际出现了偏差,媒体的公信力和话语权可能会沦为众矢之的,并且伴随着经济损失的巨大风险。因此,若要更大程度地发挥数据新闻的预测功能,首先应当解决的是新闻伦理与法规问题。
四、结语
新冠肺炎疫情期间,从数据挖掘到数据表征,再到最后的数据加工,数据新闻生产的各个环节都充分发挥了数据的独特作用,适应了突发公共卫生事件信息的传播规律。但由于数据再挖掘能力的不足和新闻伦理的约束,出现了一定程度的人本逻辑偏离,数据预测的应用也存在诸多限制,期冀数据新闻在未来能不断发展与创新。
参考文献:
[1] 李春节,党东耀.我国大数据传播研究的现状与前沿[J].青年记者,2021(18):32-33.
[2] 周谦豪,梁佳霁,许鑫.国内外数据新闻研究与实践:基于文献计量和内容分析的比较研究[J].文献与数据学报,2021,3(2):47-64.
[3] 杨保军.新媒介环境下新闻真实论视野中的几个新问题[J].新闻记者,2014(10):33-41.
[4] 杨宏.中美数据新闻专业规范对比研究:以新冠肺炎疫情期间财新“数字说”与纽约时报“UpShot”栏目为例[J].青年记者,2020(36):40-41.
[5] 谭剑,王明玉,白东鸣.数据新闻如何选择合适的可视化图表[J].新闻与写作,2021(8):108-112.
[6] 万颖.大数据新闻的创新与困境[J].湖南师范大学社会科学学报,2021,50(5):151-156.
[7] 刘涛.理解数据新闻的观念:可视化实践批评与数据新闻的人文观念反思[J].新闻与写作,2019(4):65-71.
[8] 王茜,尼古拉斯·迪亚科波洛斯.预测性新闻中的伦理问题探讨[J].青年记者,2020(13):86-87.
作者简介 程挺松,本科在读,研究方向:数据新闻与数字媒体。桂思睿,本科在读,研究方向:中国媒介与社会。何倩儿,本科在读,研究方向:中国媒介与社会。梅沁怡,本科在读,研究方向:中国媒介与社会。谢倩栩,本科在读,研究方向:中国媒介与社会。