数据新闻的困惑
2015-03-15曹素妨
本刊记者|曹素妨
对 话
采访对象:
匡文波:中国人民大学新闻学院教授、博士生导师
姜 飞:中国社会科学院新闻传播研究所、世界传播中心主任
互联网的发明以及在此基础上形成和发展起来的大数据技术将对人类历史产生:深远甚至是颠覆性的影响。
在传媒行业,大数据作为一种生产方式、技术手段、表现手法等,贴身服务于新闻的生产和传播,并扮演着越来越重要的角色。
关于大数据、数据新闻、数据可视化新闻等领域,还有哪些需要继续探讨的问题?
《中国传媒科技》:数据新闻的前提是数据公开。但当前中国却面临着公共数据残缺,难以完全公开,个人数据泄漏却又比较严重的尴尬局面,这个问题怎么解决?
匡文波:公共数据的残缺,需要通过立法,推动政府部门信息公开的进程。
个人数据泄漏,需要通过立法、道德约束、技术措施的方式予以解决。
姜飞:其实这是数据新闻或者说是大数据在传媒行业初期发展过程中必然出现的一对矛盾。要想解决数据残缺的问题首先是明白数据在哪里。首先数据在政府手中,政府有必要审时度势,通过立法或者行政手段妥善处理和开放数据,比如说美国有data.gov网站和阳光基金会,英国有政府倡议的开放式数据中心,因此政府有必要适时协调政府间和企业间数据,让公民有效接近和合法使用数据,这样就能有效地扩展数据来源渠道;其次,数据还掌握在大企业和大型调查公司中,这些企业具备较强的数据搜集、调动和整合能力,它们是否放开这些数据也能在很大程度上影响数据公开程度,当然我们看到了有些企业在这方面已经做出努力,比如说企鹅智酷、艾媒咨询、百度数据研究中心等;但需要各界认真研究和思考的是,这些拥有数据的企业获取数据渠道以及使用的合法性。因此,从长远来看,一方面需要加强商业组织的自律,对于客户的资料使用要让用户知悉并取得用户授权,坚持“平等交换、授权使用”原则;其次,政府和相关组织要尽快完善个人信息保护法,明确个人数据尤其是隐私属于个人财产,未经当事人允许,他人不得私自使用,并且要对个人信息进行分级。再次,还要加强用户信息培训,个人一定要提高数据素养,加强对自我数据的管理。
《中国传媒科技》:有专家认为,一财和阿里数据合作的方向是对的,对传统媒体转型而言符合数据沉淀共享的原则。但阿里对于消费者交易等数据的处置权是有问题的。其专供一财使用的“用户隐私保护”理由虚伪荒唐,这种垄断地位和BAT等传媒寡头如出现对公众而言是危险的。请问,您是如何评价阿里和一财的合作以及对数据的运用?
匡文波:互联网行业具有很强的马太效应,互联网巨头具有市场的强势地位。这种马太效应带来的强势地位,也表现在用户隐私保护方面。这需要通过行政手段、立法手段、技术措施来干预和加强消费者的用户隐私保护。
姜飞:传统媒体对接大数据、互联网+是行业和时代的要求,借此逐步提高我国数据服务的能力等级,为相关财经、金融建设提供支撑,对于合作双方也是互利的,这样的趋势和方向是值得肯定的。从整体来看,我们的数据保护体制和机制尚有待完善,问题的破解方式现在还不明朗,根据法理的精神,任何两方的合作都不应以损害第三方的方式获利,这个基本原则也是需要强调和尊敬的。
《中国传媒科技》:每个人都是一个大数据单元。线上大数据研究方兴未艾,线下个人大数据的挖掘才刚刚起步。从需求角度出发的应用研究会很有意义,也会兼具商业价值。请问,对于线下数据收集有什么策略和想法?
匡文波:线下数据收集主要借助技术手段,关键是如何保护用户隐私信息。
姜飞:无
《中国传媒科技》:数据新闻团队的构成一般是怎样的?如何分工?
匡文波:数据新闻团队一般有新闻记者、大数据软件工程师、用户分析师等构成。由于数据新闻刚起步,团队构成尚没有公认的标准。
姜飞:以国内财新传媒为例,他们调取了技术部、编辑部和设计部的开发人员、采编人员、设计师总共10人组建了一个虚拟的财新数据可视化实验室,财新数据新闻生产流程是设计人员根据采编人员提供的素材设计图形,并和编程人员沟通,如果开发人员认为成本太高或周期太长的或可视化效果不好的话,则需要修改设计方案。在方案设计过程中,程序员很可能反过来要求记者提供更多数据。等到最终方案确定,设计、开发、文案工作同步进行,所以这三方是合作和互动,相互补充的关系,技术人员的地位得到大幅提升。
再比如国外的《泰晤士报》通过组建新视觉新闻团队来实现数据新闻的制作:数据记者,具备写作、调查、搜索数据、解读数据、制图的能力,他们日常的工作就是挑选题、挖掘数据和编辑数据;数据挖掘员需要具备数据深度研究、计算和快速抽调数据的能力;信息编辑需要具备制图、信息沟通、HTML编程、后期制作和使用Adobe edge软件的技能;内容设计编辑是项目的决策人,主要职责是确定选题、编辑数据、成品初稿。
《中国传媒科技》:传统的图文影音编辑如何练就对数据的敏锐、对可视化的创新、对工具的运用自如?他们能通过哪些途径自学提升?
匡文波:自学提升途径很多,没有标准答辩。
姜飞:无
《中国传媒科技》:一个可视化新闻作品的具体制作流程通常是怎样的?
匡文波:目前尚没有标准的制作流程。
姜飞:英国《卫报》数字新闻部首先就是确定选题、然后根据选题分析海量数据,在收集、过滤、分析数据之后,通过图表、地图或者互动效果图等形式进行数据可视化转化,实现视觉化新闻叙事过程。《泰晤士报》新视觉新闻团队在开发视觉新闻时基本遵循这样的流程:定选题-挖掘数据-编辑数据-制图-成稿,同时也会根据内容而邀请文字记者加入,图标设计人员与合作记者共同完成最后的视觉产品。另外在开发互动图表作品时,涉及到的主要工具有HTML5、CSS3和JavaScript。用HTML5绘制图形和动画,用CSS3实现排版,用 JavaScript处理交互和动画。
《中国传媒科技》:是否已有数据新闻相关课程?就相关师资、课程建设、学生实践等方面,请谈谈您的想法。
匡文波:各高校开设数据新闻相关课程刚刚开始起步,其成效尚需要观察。
姜飞:未关注
《中国传媒科技》:什么样的新闻适合数据可视化呈现?有无具体标准?
匡文波:数据新闻的数据可视化刚起步,目前尚没有具体的公认标准。
姜飞:理论上来说,任何新闻都可以可视化。但一般而言金融类或者财经类的新闻可视化呈现效果比较好,在这方面的实践也比较多点,因为他们主要涉及到数据的对比和预测,但是这并不绝对。一条好的数据可视化新闻的标准是没有信息图就不能看懂这则新闻,也就是说如果没有可视化图表你还能看懂新闻,那么你的可视化就是一种点缀性的附加品,没有意义。不管是哪类新闻,只要是读者可以从你的可视化作品中得到讯息就可以称之为一篇好的可视化新闻。
《中国传媒科技》:大数据这么热,我们需要怎样的冷静?
匡文波:可以看看我的《大数据带来的冷思考》一文。
姜飞:首先需要辨析数据库和大数据思维的差异。目前很多自称大数据的产品和过程基本还是数据库的思维方式。其次,需要辨析大数据中新增数据的特点,即非结构化数据的量大又无法计算,在技术上还有很多点亟待突破。第三,任何事情都有正反两个方面,有必要通过各种渠道和方式对大数据给人们生产生活带来的弊端有所知晓和预警,比如说个人隐私问题。第四,需要辨析因果律和关系律的关系。大数据强调一种相关性,藉由相关性而朝向规律性;在这个过程中,有必要强调的是,即使相关性重要性上升,也不能忽视因果性,否则对于社会科学的研究是极为不利的,同时,仅仅依靠某些弱相关性就得出重大结论也有悖科学的严谨性。并且即使依靠相关性找到某些事件的源头,那么如何对这个源头进行定罪也是涉及到伦理的一大难题。最后我还想谈的就是大数据终究是偏向于技术的一种工具或者思维方式,所以还要防止陷入技术决定论的误区。