法治新闻的数据挖掘与应用
2014-03-16魏春华
□ 文/魏春华 吴 珂
法治新闻的数据挖掘与应用
□ 文/魏春华 吴 珂
在大数据时代,强调数字优先、文字在后和信息可视化的数据新闻迅速崛起,法治新闻也应做出相应变革。本文以当前我国部分法治媒体的数据化实践为例,探析我国目前法治新闻数据化现状及存在问题,并结合国外数据新闻的理论和实践提出改进建议。
大数据 数据新闻 法治报道 可视化
数据新闻与法治新闻数据化
分析当前国内媒体的数据新闻实践发现,可以将其分为狭义和广义两种情况。狭义是指“对数据进行分析与过滤,从而创造出新闻报道的方式。”①这是真正意义上的大数据新闻;广义的,还包括借助数据进行可视化表达以及深度解读等方式,以实现“用最好的方法讲述故事”。
与其他类型的新闻报道相比,法治新闻具有较强的专业性,使用的语言高度抽象,这使媒体在报道法治新闻时面临着一些困难。首先是信息专业化与读者阅读需求和习惯的矛盾。在信息传播的碎片化时代,人们生活节奏加快,无暇阅读长篇、深度的报道,“快餐式阅读”“碎片化阅读”成为主流。而传统的法治新闻侧重于报道立法、执法、司法领域的活动,解读法律政策,信息的专业性强,对习惯于“懒阅读”的受众来说形成不小的挑战。其次是抽象的法律语言与读者理解力之间的矛盾。法律活动作为特定的专业范畴,有着特定的专业术语和表达方式,这些专业化表达在增强表意准确性的同时也加大了受众的阅读成本,给阅读带来一定困难。
而数据新闻“通过挖掘和展示数据背后的关联与模式,运用丰富的、具有互动性的可视化手段”②,使信息传播精确性与形象性的兼顾成为可能,增加了阅读的便利性,这为法治新闻的革新提供了新思路。目前,国内法治类媒体在数据化实践上也做出了一些尝试,如《法制日报》《检察日报》等法治类行业报借助新媒体,实行报网联动,利用数据挖掘技术策划数据新闻,提供舆情服务;一些门户网站专门开辟图表新闻栏目,如新浪“图解新闻”,网易的“数读”,搜狐的“数字之道”,用可视化的方式阐述新闻,其中不少涉及法治领域的报道,如搜狐的“数字之道”就对马航失联后涉及的航空事故赔偿问题推出了“航班事故如何赔偿”的数据新闻,获得了好评。
法治新闻数据化实践
实际上,法治领域存在大量有意义的数据信息,对这些信息的及时挖掘、解读和研判具有较高的新闻价值。近年来,众多法治媒体都开始在数据新闻领域进行积极探索。
1.“策划”数据新闻。
2014年7月2日,《中国青年报》推出“2014上半年,中央纪委反腐七个‘最’”新闻专题。记者统计了中央纪委监察部网站发布的相关数据,梳理出今年以来反腐工作的七个“最”。上半年“反腐风暴”有哪些新特点?有多么强劲?不用过多语言描述,数据向读者做出了最有力的说明。(图一)
在海量法治新闻数据中挖掘新闻线索,策划数据新闻,不仅充分发挥了报道者的主观能动性,还实现了新闻价值的深度挖掘,有效利用数据资源“敏锐地看到眼前发生的事实,敏锐地回忆过去发生的历史,科学地预测未来,找到过去、现在和未来之间的发展趋势。”③满足受众的信息需求,实现了新闻报道社会价值的最大化。
2.图解新闻:信息的可视化呈现。
数据新闻的可视化就是“将大量数据组合构成数据图像,同时将数据的各个属性值以多维数据的形式展示,使人们能够以更直观的方式从不同的维度观察数据及其结构关系,发现数据中隐含的信息”④。伴随着计算机图形、图像处理、计算机视觉、人机交互等领域的兴起,信息可视化的内涵不断拓宽,法治新闻也不断在创新数据的可视化呈现形式。
化繁为简的信息图。信息图表在大数据时代扮演着重要的角色,它是将数值型和文本型信息可视化的一种方式。数据可视化就是将数据信息的“量”和“关系”展现为直观的图形,通过感性的方式形象地展示数据间的变化、差异和关联。
看图说话是将大量的文字信息变为形象符号,以视觉的形式引发人们的关注和思考,这也是目前法治媒体使用最多的一种数据表达信息图表方式。看图说话不仅能够浓缩新闻要点、揭示关系、图解过程,还能展示情状、再现场景,阐释观点。
化虚为实的导览图。
2014年5月22日新疆维吾尔自治区乌鲁木齐市沙依巴克区公园北街早市暴力恐怖案发生后,法制网以一张新华社制发的《近年境内暴力恐怖事件》数据地图为切入点,推出“全国开展为期一年打击暴恐专项行动”专题报道。图上每一个数字代表一次事件,还配有系列图示,注明了每次事件的犯罪过程以及警民伤亡数字。通过数据地图,读者可以清晰地看到近年来暴恐事件在时间上、地域上的密集性以及手段上的恶劣性。读罢此图,无需更多文字描述,对于打击必要性,读者心中已做出了自己的判断。
化静为动的交互图。
在当今网络传播时代,新闻信息的生产、传播和反馈更多的是在网络平台上完成的,互动性成为新闻生产的常规。作为数字新媒体时代的宠儿,数据新闻与网络媒体有着更为密切的联系。在互联网上不仅可以运用具有创意性的图表展示信息,还可以采用互动性更强的交互图。
正义网2013年3月22日推出的“中国政法方阵”专题就采用了交互图的信息呈现方式。网站制作了一个“中国政法方阵”的组织结构图(图二),用户可以用鼠标点击任何一个按钮,详细了解每一个组织部门的具体人事组织情况。这种形式不仅将大量人事数据浓缩在一张简洁的图上,使得界面更加友好,同时也提高了用户的自主性和参与性。
以上几种是目前法治新闻专题中运用比较成熟的形式,毫无疑问,还有大量数据表达方式等待我们去实践。
精准的舆情服务。
在互联网时代,网民的思想、行为和感情都会在网络上留下痕迹,而“大数据使得细节化、即时化地测量个体的行为和情绪变化成了可能,并通过一定的隐私保护,通过其‘电子痕迹’对个体进行社会行为刻画,在此基础上展现出个体的社会心理变化。”⑤这使得精准化的舆情服务成为可能。
《检察日报》依托正义网的技术力量,构建了全国政法网络舆情监测与服务平台。它能够“通过功能强大的软硬件设施,有针对性地对新闻门户网站、论坛、博客等分类设置采集源,自动对几千个网站的海量信息进行24小时不间断地浏览,对关注的网络舆情信息进行快速识别和定向追踪”⑥,自动发现网络舆情热点并按需自动预警。针对不同的地域,监测系统还提供地方舆情服务,将各地方的舆情热点事件收纳于舆情地图中,供用户使用;而舆情分析师也会对热点舆情事件进行数据分析,为用户提供深度解读。以2013年的“李某某案”为例,正义网舆情频道在案件发展的不同阶段对事件舆情分别做了详细的舆情报告,为法院有效疏导舆情,实现司法公正提供了有利的参考。
随着移动互联网的兴起,舆情服务也延伸至移动终端,《检察日报》推出了政法网络舆情、反腐倡廉网络舆情的微博与微信公众账号,为下一步个人定制式的舆情服务奠定了基础。
大数据思维的养成
大数据以“Volume(海量)、Velocity(高速)、 Variety(多样) Value(价值)”即“4V”为特征,为法治新闻报道提供了新的发展契机,借助互联网、计算机视觉、人机交互等技术,法治新闻报道已经搭上了数据化的列车。但就整个法治新闻领域而言,数据化程度偏低且与国外大数据新闻的实践相比存在不足,真正“数据驱动新闻”的狭义大数据新闻少之又少,而图解新闻等广义的居多。自媒体时代,传统媒体的内容组织、报道方式、运作流程、经营模式乃至思维方式,都受到了冲击。新闻人,需要一场由大数据思维引发的头脑风暴。
1.大数据策划意识。
收集数据资源,从混淆、乏味的原始数据中“看出”其中暗藏的故事,提供“新的视角”,发现并呈现表象背后的原因与真相。目前法治新闻领域数据来源较为单一,绝大多数新闻停留在政府公报、法制事件中业已披露数据的梳理和阐释。大数据资源在哪里?成为难点之一。
实际上,大数据对于法治新闻报道的巨大价值之一是数据驱动型的调查性报道,这是“基于大型数据的挖掘和分析实现的对新闻事实的深度揭示和解析”⑦,可广泛地应用于犯罪新闻和反腐新闻中。由于“大数据”与新媒体紧密相关,对微博、微信等社交媒体的应用和用户的关注也是重要的一环。社交媒体上网民的原创性生产、启动性生产、资源性生产和互动性生产都能为媒体提供丰富的数据资源,成为报道的线索、背景和素材。而且,司法公开力度的不断加大,更为案件新闻的数据化报道打开了空间。
也就是说,“富矿”是有的,关键在于编辑的目光是否能够放开,思路是否足够开阔。比如,那些看似与法治并不沾边的经济数字中,也蕴含着法治新闻。
对于传统法治新闻媒体而言,大数据策划是一个难得的翻身机会。传统媒体在捕捉新闻的速度上处于劣势,但将大量碎片化、低质量的信息进行关联、整合、挖掘,经过策划、制作,将其变为高品质的深度报道,这正是传统媒体所擅长的。
2.大数据人才意识。
“从本质上来说,信息可视化就是指对已知数据的归纳和揣摩,并通过简洁明了的方式呈现出来。”⑧这意味着新闻记者不仅是报道者还是解读者,他们不仅要从庞大的数据中去寻找意义、线索和故事,还要以一种直观、可视化的方式呈现给受众。这要求他们具备对读者的测试理解能力,与读者的角色互换能力以及使用必要的专业媒介的能力。
浏览英国《卫报》的大数据新闻,伊拉克战争日志、伦敦骚乱系列报道、关于政府各部门开支的报告,等等,涉及的数据量相当巨大。如借用维基解密资料制作的伊拉克战争伤亡的新闻,数据量就多达39.1万条,在地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明。此外,信息可视化表达方式也丰富多彩,数据地图、时间线、交互性图表,等等。当然,这些工作不是由一两个记者完成的,往往是一个团队。
比较而言,目前我国的法治数据新闻大多停留在数据的简单可视化呈现阶段,数据分析不足,表达方式也相对单一,有较大的开发空间。这一切,取决于我们相关人才的发现与储备。据介绍,在美国颇有影响力的政治新闻博客“538”,它的主持者并非新闻人,而是统计学家Natesilver。而世界知名媒体BBC的数据新闻团队由20人组成,包括记者、设计师和研发人员。团队中并没有哪个记者专门司职处理数据,但所有的编辑人员都必须熟练掌握一些基本电子表格的应用技巧,如Excel 和谷歌文档等,以便对数据进行分析。研发人员的技术和建议,以及设计师的可视化处理技术构成了每一个数据项目的核心组成部分。尽管每个人首先是记者、设计师或研发人员,但大家都勤于学习,不断增加对彼此专业领域的熟悉和了解,这样的团队才有战斗力。
大数据法治新闻制作团队必须是高端的复合型人才团队,需要了解法学、新闻学、统计学、图表软件应用等多种知识。法治媒体应当建立专门的数据积累与分析部门,并加强跨界合作,充分利用外部的力量,通过购买、外包、孵化等方式,为数据的运行、挖掘和分析提供设备、技术和人才支持。对于数据的处理,不仅要对已经形成的数据进行分析解读,更需要提出选题方向和数据采集、处理的方案。
要发展大数据新闻,人才培养意识、储备意识不可或缺。令人欣喜的是,已经有人开始行动了,“上海启动大数据人才培养计划 未来3年培养引进千名高端人才”“清华成立数据科学研究院 启动大数据人才培养”,今年以来,不断有此类消息见诸媒体。
3.大数据运营意识。
大数据来临,经营决策将告别靠感觉、凭经验时代。未来,数据化的法治新闻应当更注重对数据的分析,挖掘数据与受众之间的联系。这也为个性化的新闻订制拓展了思路。由于受众的阅读会在网络上留下足迹,因而只要对固定的IP地址或同一终端浏览器上的数据进行监测和分析,就可以获知用户的上网习惯和内容偏好。媒体可以根据这些信息以合适的方式推送新闻,满足受众个性化的内容需求,增强媒体对受众的黏性。
编 辑 陈国权 24687113@sina.com
大数据的精准分析,将倒逼媒体进行更加精细化的营销运作。在这方面,《金融时报》通过用户分析调整“付费墙”策略,《纽约时报》综合比对订户数据和访问数据获得更精确全面的读者信息,这些做法值得借鉴。对于法治媒体来说,亦可以考虑针对不同受众推销不同法治新闻,比如,对某些喜欢案例故事的读者,推销案例为主要内容的特刊;对关心法治建设的读者,推销理论性较强的特刊。精细化的营销将助推媒体权威性和影响力的提升,当然,也将带来经济效益的提升。
从营销成本来讲,数据驱动的项目更胜于传统战略。在线新闻的产出往往还会转化投入到搜索引擎优化(SEO)或者搜索引擎营销(SEM)中。一个运作的数据项目正常情况下都会产生大量的点击与讨论,还可能会病毒式地传播。出版者们通常可以因此减少开支,还能够获得与SEM同样效果的点击与链接,吸引同样等级的注意力。
(作者分别是:《检察日报》基层采风编辑部主任、中国政法大学新闻与传播学院2013级研究生)
【注释】
①章戈浩: 《作为开放新闻的数据新闻——英国<卫报>的数据新闻实践》,载《新闻记者》[J],2013年6月
②刘杰:《数据新闻可视化叙事初探》,载《科技传播》[J],2013年8月(下)
③赵振宇:《新闻策划的定义、作用及实施前提》,载《现代传播》[J],2001年第4期
④方洁,颜冬:《全球视野下的“数据新闻”:理念与实践》,载《国际新闻界》[J],2013年6月
⑤李彪:《大数据视域下社会舆情研究的新境界》,载《人大复印资料(新闻与传播学)》[J],2013年第9期
⑥http://yq.jcrb.com/fwtx/201203/t20120301_815159.html
⑦彭兰:《“大数据”时代:新闻业面临的新震荡》,载《人大复印资料(新闻与传播学)》[J],2013年第4期
⑧赵佳:《论新闻可视化信息的制作》,载《新闻天地》,2011年第2期