主流媒体的数据新闻实践
——基于新华网、财新网数据新闻栏目的对比研究
2023-01-11荣晓曼
◎荣晓曼
近年来,大数据、5G、人工智能等技术发展迅速,使社会进入了大量生产、传播和消费信息的时代,并给人们提供了全新的科学计算和数据获取方法,信息爆炸、数据海洋成为社会的重要特征之一。①大数据成为重要的社会资源,影响了新闻原有的呈现方式和传播形态,催生了数据新闻这一新型新闻报道形式。大数据技术帮助媒体和记者收集数据信息,扩大报道材料的范围。数据新闻通过对数据信息进行有效挖掘和分析,弥补了传统新闻采集方法和宏观描述的不足,使新闻报道更接近事件的真实面目。国内各类媒体开始运用数据新闻进行报道,部分主流媒体建立了专门的数据新闻栏目,以专业性和精准性为数据新闻报道实践提供了有益的探索。本文以主流媒体新华网、财新网的数据新闻报道为研究对象,探讨数据新闻栏目的现状、特点及存在的问题。
一、数据新闻的概念及主要类型
(一)数据新闻的概念
数据新闻并不是新事物。1821年5月5日出版的《卫报》创刊号上(当时的《曼彻斯特卫报》)就刊印了一个数字表格,这可以称为数据新闻的开山之作。它的用意很简单,就是让信息一目了然、便于查询。②米尔科·劳伦兹(Lorenz,2010)认为,“数据新闻是一个工作流程,包括以下基本步骤:通过重复爬取、过滤和重组来深度挖掘数据,聚焦特殊信息来过滤数据,可视化呈现数据,合成新闻故事。”国内学者在对国外数据新闻进行考察和学习时,结合我国新闻行业的发展状况,也对数据新闻提出自己的理解。祝建华梳理了数据新闻发展的历史:“新闻经历了1980年开始的精确新闻,1990年开始的电脑辅助的新闻,2000年开始的数据库新闻,直到2010年开始的数据驱动新闻。近年大数据概念引入后浓缩为数据新闻。”③方洁认为,数据新闻是一种基于数据采集、挖掘、统计、分析和可视化展示的新型新闻报道方式。④笔者从对数据新闻概念的梳理中,总结出数据新闻的特征:数据量级、数据驱动、互动可视化。数据量级指的是数据新闻较其他基于数据的新闻来说,在数据获取的量上更倚重大数据。数据驱动指数据新闻制作过程要通过对数据的反复筛选来深度挖掘数据,以数据来驱动新闻的生产。互动可视化强调用可视化的方式呈现数据并讲述新闻。
(二)数据新闻的主要类型
根据对数据的挖掘程度,数据新闻可以划分为常规型和调查型两类;根据选题内容,可以分为实证类、环境类、医疗卫生类等。⑤有学者把可视化的呈现类型划分为统计图表、数据地图、数据动画、信息图、时间轴等。⑥数据可视化是数据新闻最主要的特征之一,在划分数据新闻类型时常以视觉呈现状态划分为以下几类。一是信息图表。信息图表又称为信息图,是将信息以形象化的手段呈现出来,以获得更好的传播效果,具体来说就是“图形+数据”。因此,信息图的本质是对复杂信息的简化和可视化。信息图可以分为静态、动态和交互三种类型。二是时间轴。时间轴是从时间的维度,系统、完整地记录、展现事物的变化轨迹,是基于时间顺序呈现事物发展的可视化形式。时间轴通常会运用在跨度很大、线索较多的事物的演变全过程。三是数据地图。数据地图是把数据添置在地图的坐标中,宏观、清晰地揭示地理位置与数据之间的关联。数据地图通常采用两种呈现方式:一种是把数据以小圆点的方式标注出来,受众点击小圆点即可获得具体的信息;另一种是将数据以热力图的方式附着于地图之上,使多维度数据同时展现,便于受众对比并深入了解整体情况,发现数据背后的深层原因。四是社会网络关系图。社会网络关系图能够帮助受众清晰且快速地了解新闻人物之间的复杂关系。其用直观的图形梳理人物关系,通过色彩、形状将人物关系进行区分,用线条将相关联的人物和时间相连。
二、研究方法
Lewis(2015)概括了“大数据时代的新闻业”这一主题的研究,主要有三个视角:一是基于案例的实证研究视角,主要描述和解释新闻产业的发展;二是对概念体系的研究,以解释和理顺上述新闻业的变化;三是从批判的角度进行研究,质疑该领域一些被认为理所当然的规则。他认为,这三个角度的研究并不相互排斥,在一项研究中,这三个角度的交叉往往同时发生。在这一理论基础上,本研究选择了国内主流媒体的数据新闻报道进行量化分析。
本文选取2022年1—8月新华网《数据新闻》栏目和财新网《数字说》栏目发布的数据新闻报道为研究对象,对样本数据新闻报道的数据来源、报道选题、数据处理程度、可视化设计与呈现等方面进行描述和比较,总结主流媒体数据新闻的现状及存在的问题,并探讨其对主流媒体的作用。本文选取的数据新闻均为不定期更新的新闻,其中新华网8篇,财新网61篇,样本总量为69篇。
(一)研究样本的选取
(二)对数据新闻报道内容的评价
笔者根据Lorenz(2010)所描述的数据新闻的生产过程模式,结合数据可视化产品评价标准,分别从数据来源、报道选题、数据处理程度和数据可视化设计与呈现四个方面提出假设,对样本进行分析。
第一,是否标明数据来源。高质量的数据源不仅是高质量可视化产品的保障,还是判断作品可信度的主要依据。因此,笔者首先对数据新闻的来源进行分析,包括对数据来源的描述、数据来源的机构、数据来源的数量这三个指标的统计。数据来源描述是指数据源在数据新闻中的描述程度,可分为无数据来源、数据来源模糊和数据来源清晰三种类型。模糊意味着没有给出数据链接或来源,读者无法知道数据来源。清晰意味着读者可以通过链接或报告中的特定引用找到数据的具体来源信息。
第二,数据新闻的选题。笔者对数据新闻的选题进行分析。根据两个数据新闻报道栏目的选题,将题材范围确定为政治及国际形势、经济、文体教育卫生、社会民生四大类。
第三,数据处理程度。依据数据可视化生产的过程,考察对数据的使用情况。数据可视化需要通过调查、挖掘,并采用较为复杂的数据处理技术,挖掘数据背后的关系、趋势。对数据新闻的数据处理程度进行赋值,具体为:完全没有数据处理的为0分,仅将数据处理简单化,如总量统计、百分比计算、均值计算等为1分,数据做多样化描述的为2分,做探索性统计分析、大数据挖掘等复杂处理的为3分。
第四,数据新闻的呈现形式。借用方洁、高璐(2015)的赋值方式,对数据新闻报道中呈现形式的难度赋分如下:全文静态设计为0分,仅表格或表格变体静态设计为1分,静态信息地图设计或结合数据的静态时间线为2分,交互式时间线和普通视频为3分,交互式地图和3D动画设计为4分,游戏设计为5分。
三、研究问题与假设
本研究假设国内主流媒体的数据新闻有较高的质量和影响力。要细化研究问题,需验证以下几个假设。
研究假设a:主流媒体的数据新闻有比较明确的数据来源,虽然有少量数据来源描述模糊,但样本中的绝大多数描述是清晰的,新闻可信度较高。
3.加强供应商关系管理,转变物资储备方式,改进资源占有方式。供应商关系管理是指运用供应链管理思想,通过搜寻、考核、评价等方式,对作为企业重要外部资源的供应商分层次建立合作关系,并对其关系进行管理和维护的活动。实行供应商资格预审制及供应商许可供应产品目录制,将其优势产品列入可供应产品目录。对每个有交易的供应商进行动态量化考核,建立供应商动态量化评价体系。考核得分由整体实力、供应量、合同执行情况、网上报价率、奖惩等5个部分组成。对考核优秀的供应商在招投标、付款、供应份额上给予倾斜,不断培养优秀的主力供应商群体,并逐步与之建立稳定的合作关系。
研究假设b:数据新闻会结合时事或热点进行选题,注重新闻本身的价值。
研究假设c:样本的数据新闻数据处理程度较高,对数据进行了较为复杂的处理与挖掘。
研究假设d:数据新闻的呈现形式多样,样本呈现的可视化程度高,各分值都有分布。
研究假设e:样本中占多数的数据新闻能增强用户体验,引发用户的主动参与,如点赞、转发、评论。
四、研究发现
(一)验证假设a:主流媒体的数据新闻有比较明确的数据来源
该假设需明确统计样本有无交代数据来源及交代数据来源占比。统计发现,财新网《数字说》标明数据来源的有61篇,其中注明了来自公开资料整理的有59篇,数据来源模糊的仅有2篇,有明确数据来源的新闻占比为96.7%。新华网《数据新闻》有3篇数据来源模糊,5篇标明了数据来源。财新网《数字说》中大多数数据描述是清晰的,新闻可信度高;新华网2022年的《数据新闻》栏目中,数据新闻总量较小,多数数据新闻也有清晰的数据来源,假设a成立。(见表1)
表1 数据来源的数量及描述
(二)验证假设b:数据新闻会结合时事或热点进行选题,注重新闻本身的价值
假设主流媒体在选题时会考虑选题的新闻价值和社会影响力,主要围绕重大事件和受众普遍关心的社会现象进行选题。《数字说》和《数据新闻》样本的选题主要集中在时政类、财经类、民生类、文教卫类这四大类型。从表2可见,财新网《数据说》选题主要集中在经济和文教卫,两类的占比分别为41%和44%。新华网《数据新闻》文教卫类数据新闻占比较高,为50%。该栏目结合2022年北京冬奥会的发展动态实时更新新闻信息,以图文结合的形式对热点新闻和事件做出快速反应。因此,假设b成立。
表2 数据新闻选题统计表
(三)验证假设c:样本的数据新闻数据处理程度较高,对数据进行了较为复杂的处理与挖掘
将数据处理的程度进行量化打分:完全没有处理的为0分,简单化处理的为1分,多样化描述的为2分,大数据挖掘的为3分。财新网《数字说》的数据处理得分为:1个0分,16个1分,41个2分,3个3分。财新网《数字说》的数据处理程度很高,体现在多样化描述的数据新闻较多。新华网《数据新闻》的数据处理得分为:8个0分。可见,财新网《数字说》比新华网《数据新闻》数据处理程度高。新华网《数据新闻》的新闻均未对数据进行处理,是数字新闻,大部分报道是以图片化的方式将数字报道的内容做了简单呈现。财新网《数字说》对数据做出多样化描述呈现的新闻占比较高,部分还进行了较为复杂的数据挖掘和处理。因此,假设c部分成立。
(四)验证假设d:数据新闻的呈现形式多样,样本呈现的可视化程度高,各分值都有分布
可视化形式主要有信息图、数据地图、静态统计图、动态图、Flash动画、热力图等。财新网《数字说》数据新闻呈现形式打分情况:1篇0分,23篇1分,30篇2分,1篇3分,3篇4分,3篇5分。《数据说》的数据新闻整体呈现形式多样,可视化程度较高,主要集中在静态信息图设计或静态时间轴,也有部分可视化程度很高的动画设计和游戏设计。新华网《数据新闻》中的8篇新闻均为0分,可见其在呈现形式上比较单一,它以图文新闻为主,将文字新闻图片化,无可视化程度高的数据新闻。综上所述,财新网《数据说》的数据新闻可视化程度较高。因此,假设d部分成立。
(五)验证假设e:样本中占多数的数据新闻能增强用户体验,引发用户的主动评论或点赞
从财新网《数据说》和新华网《数据新闻》2022年1月—8月的数据新闻中各选择5篇评论数或点赞量最多的新闻报道进行分析,发现可视化类型、选题和受众的参与行为有一定的相关性。可视化类型主要集中于饼图、面积图、折线图、表格等。这些可视化类型使受众能快速比较数值的大小,发现数据的变化规律,理解数据之间的关系。另外,选题的受关注情况与选题在社会中的热度有关。
新华网《数据新闻》点赞量最大的5条新闻皆为图文形式,其中有2条与2022年北京冬奥会有关(见表3)。财新网《数据说》评论数最多的5条新闻,可视化类型大部分为信息图,这5条新闻的选题是当时发生的灾难或疫情的相关报道(见表4)。两个栏目的数据新闻报道虽然能帮助受众快速地获取信息,但用户体验不足,点赞量和评论量小,因此假设e不成立。
表3 新华网《数据新闻》数据可视化产品点赞Top5(2022年1月1日—8月31日)
表4 财新网《数据说》数据可视化产品评论Top5(2022年1月1日—8月31日)
分析发现,两家主流媒体的数据新闻都有比较明确的数据来源。数据新闻主题会结合时事或热点进行选题,注重新闻本身的价值。在数据处理程度方面,财新网《数字说》的数据处理程度比新华网《数据新闻》高。在数据呈现的可视化程度上,《数字说》也比《数据新闻》高。在数据新闻报道的交互性方面,《数据说》中部分新闻里的信息地图可以实现互动,但大部分新闻报道的交互设计不足。
五、结论与讨论
对2022年1月—8月新华网《数据新闻》和财新网《数据说》的数据新闻内容进行分析发现:主流媒体数据新闻报道的数据处理程度和可视化程度不一。整体来说,做复杂的数据处理的较少,数据可视化程度高的新闻报道比重低,交互程度较低。两个数据新闻栏目的优势在于:新闻报道绝大部分有比较明确的数据来源,新闻可信度较高;新闻内容丰富;选题结合时事热点,注重新闻本身的价值。《数据说》选题覆盖领域较广,《数据新闻》数据图形化处理的形式较多。在数据新闻处理程度上,《数字说》比《数据新闻》数据处理程度高。在可视化程度方面,《数据说》的可视化程度较高。在用户体验方面,两个平台的用户点赞数、评论数总体都不高,用户参与情况一般。
研究表明,以新华网和财新网为代表的主流媒体,利用已有的公信力和专业性进行数据新闻的传播,在传播技术、选题、新闻质量方面有很大的优势,但在传播效果方面还有可以提升的空间。主流媒体的数据新闻应当更关注用户的特征和需求,在交互设计方面,将用户“介入”纳入数据新闻报道的生产过程中,增加更多的动态信息图、视频和3D动态图形等呈现方式,让平面的“可视化”变得更加“立体化”⑦,增强数据新闻的体验功能,更好地满足用户的个性化需求,推动数据新闻在中国的发展。
注释:
①许向东.数据新闻可视化[M].北京:中国人民大学出版社,2018:11.
②[英]西蒙·罗杰斯.数据新闻大趋势[M].岳跃,译 .北京:中国人民大学出版社,2015:52.
③林晖.数据驱动的研究型报道:互联网时代的财经新闻新趋向——兼谈财经新闻人才培养改革[J].新闻记者,2017(02):64-68.
④方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(06):73-83.
⑤许向东.数据新闻可视化[M].北京:中国人民大学出版社,2018:71.
⑥张彬,过宏雷.数据新闻可视化设计的表现形式探析[J].大众文艺,2015(10):183-184.
⑦谢帅光,朱爱敏.大数据时代新华网数据新闻的可视化路径探析[J].视听,2022(06):143-145.