大数据时代,媒体如何转型
2013-04-29
编者按:2013年被认为是中国的“大数据元年”,年初,不管是信息领域专家学者还是一些嗅觉敏锐的媒体,都将焦点放到了大数据领域,从硅谷到北京,大数据的话题被传播,在普通人还不知道大数据究竟为何物时,它就猛然蹿到了我们的面前。而在太平洋的另一边,目前,美国政府已将大数据视为“未来的新石油”。
2012年年末,被视为国外大数据研究先河之作的《大数据时代》认为:大数据开启了一次重大的时代转型,就像望远镜能够感受宇宙、显微镜观察微生物一样,大数据正在改变我们的生活以及理解世界的方式……大数据时代作为信息传播、知识传播的传媒业,与今天有什么不同,传媒业在大数据时代如何转型?为此,本刊特邀学界和业界的专家解读其心目中的大数据及其所期待的传媒业。(以下嘉宾以姓氏拼音为序)
本刊记者:哈佛大学社会学教授加里·金说:“庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这个进程……”也就是说大数据不是针对某一领域,但适用于每一领域;就传媒业来说大数据到底意味着什么?大数据会给传媒业带来哪些期待?这个大数据时代与以前的数据库有何不同?
石长顺:首先要弄清与大数据相关的几个概念:数据、数据库与大数据。
数据,是对信息数字化的记录,本身并无意义,只有将其放在一定背景下解释才被赋予意义。数据仓库,是一个面向主題的、集成的、相对稳定的、反映历史变化的数据集合,用以运营性系统保存、查询和决策管理。大数据,是一个相对概念,一般认为是传统的软件工具难以捕捉、存储、管理和分析的数据,其数量是“太字节”,即2的40次方。
2010年,美国总统科技顾问委员会在给奥巴马总统和国会的报告《规划数字化的未来》中,首次从国家发展层面提出了大数据战略。接着,2011年,麦肯锡公司推出了研究报告《大数据:下一个创新、竞争和生产率的前沿》。
大数据适用于社会各个领域,从政府层面看,包括三大数据来源,即业务工作的管理数据、民意民情的调查数据,以及对大自然、动植物的特点和变化所监控而产生的环境数据。严格来说,这些都是传媒关注、报道的领域,都应成为传媒的信息数据库。从专业角度看,传媒业也应当建立中国与世界传媒“业务”数据库,其量化进程从收集、保存、维护、管理开始,继而对之进行分析、共享。传媒业务将通过对数据的挖掘,进行专题报道、深度分析、阐释报道等,特别是通过对民意调查、市场分析等数据的运用,实现政治传播、民生报道中的新闻专业主义。
柯惠新:大数据是一种时代现象,主要是商业概念,还未形成严谨的学术定义。
按照以往的看法,大数据通常用来形容一个公司创造或收集的大量非结构化和半结构化的数据,如网络日志、社会关系网络上的用户活动数据、互联网搜索引擎上的详细搜索记录,甚至天文学、大气科学、基因组学等学科、跨学科的科研记录等。对于电视媒体,大数据一般指跨媒体或全媒体数据,如电视机顶盒的回路数据、电脑或移动终端收看视频的数据、社交媒体上对所收看节目的相关评论等等。
而现在提及大数据,通常还指一种解决问题的方法,即通过收集、整理生活中方方面面的海量数据,并对其进行分析挖掘,从中获得有价值的信息。这种对大数据应用的期待和实践,已衍化出一种新的商业模式。在这种商业模式下,一个公司的核心竞争力不但取决于它拥有的数据规模,更取决于它分析运用手头数据来解决问题的能力。
陈昌凤:大数据时代各领域皆可量化,而量化的核心是使信息准确描述,包括模糊性的准确,目的则是使我们认知不清晰的方面变得清晰,帮助我们去判断现状和趋势、确定未来战略,在记录、描述,并分析、重组后让它带来效率、效益。
就传媒业而言,要融入这个时代,利用大数据发展自己。大数据的前提是加入这个游戏圈,首先数字化,让电脑可以处理那些数据,也就是建立数据库;在数字化基础上进行数据化,变成软件可识别的数据化文本;智慧地使用已有的理论和方法,让这些数据发挥价值——内容提取、分享、互动,让它们更好地服务于使用者,发掘其中的商业性创新价值。
大数据带来了各方面的创新和期待,在国际传统媒体中正在发挥越来越重要的作用。但坦率而言,大数据对中国传统媒体的影响难以看见。我国除少数传统媒体有些许实验,但多数既没看到机会,也没看到危险。而对于互联网媒体,这个领域的实践已走在了前面。
邓光和:大数据时代的来临是大信息时代的内在要求和必然结果。当今世界,经济、科技、文化、教育高度发达,国家之间、地区之间、人与人之间交往互动日益密切频繁,相关信息被报纸杂志、广播电视、互联网络捕捉整合传播,信息数量呈爆炸式增长。社会越进步,信息越增多,人们对信息的需求甚至依赖程度越高。但面对海量信息,单个的个体或组织很难全面准确地理解和把握,甚至可能陷于信息的海洋而迷失自我。这就需要专业人员、专门机构来对信息进行测量、统计、整合、分类,其结果就是数据。由于这些数据涉及社会生活的所有领域,数量和影响非常大,故称大数据。
数据即信息,大数据即大信息。信息是商品,是财富,是生产力。人们之所以关注数据,实质上就是关注信息的内在价值,关注信息在生产生活中的巨大作用。
传媒业本身就是生产和传播信息的产业。大数据时代,传媒业大有可为。首先,信息源更加丰富。传媒机构可充分利用数据资源,搜集、整合、加工、传播各类信息。其次,对受众需求的把握更加准确。传媒机构可根据受众需求确定传播内容和传播策略,实现精准传播。再次,传播效果反馈更加全面。传媒机构可根据反馈数据,及时调整自己的内容和策略,不断扩大受众规模,提高品牌影响力。
本刊记者:《纽约时报》2012年2月的一篇专栏称:“大数据时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析,而并非基于经验和直觉……”一般认为经历才会产生经验和直觉,这一论述是否意味着在大数据时代,数据就是一切,经历在从业中是无足轻重的或居于次要地位?数据和经历在决策中的比值将出现什么现象?
陈昌凤:大数据是世界的另一半,也许是较新的一半吧,但不是全部。经验和因果关系,仍然是人类的宝贵财富;数据和相关关系,是一种思维的创新,但它也是建立在经验和知识基础上的判断。两者并非对立或独立。
石长顺:在美国有句话流传极广,这就是爱德华·戴明的名言:除了上帝,任何人都必须用数据来说话。这句话将数据与上帝并论。事实上,美国是一个崇尚数据、用数据说话的国度。从传播学的诞生来看,许多经典理论和学说,也是来源于经验学派的量化分析。近年来,随着大数据时代的来临,“用数据决策”“用数据管理”“用数据创新”“用数据……”成为未来社会的助推器,但这并不排斥传播者的经历、经验对传播的促进作用。因为经历实际上是人生的数据库,并且是经过人的长时间筛选、归纳、积累下来的活化数据,能触发人的灵感、智慧的数据。因此,二者互补,不可偏废。
邓光和:数据并不是万能的,一是数据反映的可能只是事物的表象,二是对同一数据也可能有不同的解读,三是每个单位或个人的实际情况千差万别。所以,唯数据论是没有根据的。人们在长期从业经历中形成的经验和直觉,仍然有着重要作用。
本刊记者:也有人质疑,大数据是一个新机遇,但不是所有行业、所有人都有机会,有人才才有机会、有设备才有机会、有技术才有机会,这些条件对媒体来说都是新的课题、新的挑战,媒体将怎样面对新时代?
陈昌凤:打个比方:每个人的生活都有自己的哲学,但他不一定是哲学家。未来每个人的生活,都几乎与大数据相关,但他不一定要直接使用或掌握大数据。当你被说服到京东网买一架相机、到淘宝网买一件衣服时,你知道他们是如何通过信息把你作为客户瞄准的吗?大数据。大数据正在带来政治、经济、文化等各方面的变化,生活在其中的个体能独立其外吗?但是,我们并非要把大家都变成精通或拥有大数据的人。大数据也并非由个人能掌握的资源,它是一种共享时代由公众共同生产出来的产品,通常由少数大公司掌控。每个人几乎都是贡献者。
不过,有一点大致可以确定:未来一个人或机构拥有信息,即数据的多少,确实决定了其获取权力和财富的大小。
邓光和:媒体人必须重视数据,掌握分析运用数据的能力:一是善于从各类数据中寻找具有重要传播价值的信息资源;二是具备对海量信息进行科学整合和深度加工的能力;三是密切关注受众需求,重视受众反馈,不断增强传播效果。
数据意识实际上就是受众意识、市场意识、经营意识。中国传媒业面向市场经营已经30多年,电视收视率数据使用也有20年,传媒人已经具备了数据意识,但是,分析和运用数据的实际能力却还有待提高。
石长顺:大数据时代对国家、企业、个体既是一种挑战,也是一种机遇,但这种机遇只留给那些有准备、有识别能力、善于驾驭数据的人。这种机遇甚至可能改变传媒人的角色,未来将会出现新的传媒职业,即“筛选者”“数据分析者”角色。
本刊记者:大数据开发在首创地美国也只是刚刚开始,其标志是2011年的《规则数字化未来》报告和2012年3月美国政府发布的《大数据研究与发展倡议》。
就大数据来说,我国还在路上,据统计,我国数字化的数据资源远远低于欧美,每年新增数据量仅为美国的7%、欧洲的12%;就已有的有限数据资源来说,还存在标准化、准确性、完整性低及利用率不高等情况。也有一组名为“互联网上的一天”的数据显示:一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的紙质信件数量);发出的社区帖子200万个(相当于《时代》杂志770年的文字量),卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万。这一系列惊人的数据,都是新媒体产生的。大数据时代的媒体转型和发展,需要结合自身的特色,走一条符合传播规律、符合自身实际、符合受众需求的发展之路。您认为我国进入大数据时代的条件是否已成熟?我们距离大数据时代还有多远?
陈昌凤:中国在大数据的认知方面,大概落后于美国四五年;实践方面,落后更多。路遥遥。
柯惠新:大数据的分析方法、技术和软件等目前尚不能适应需要,还有待深入研究和开发。
对大数据的分析需掌握多方面的知识与方法,一些相应的技术和软件都得配套。例如数据如何分类、提取、转化、分析、呈现;如何分析非结构化的数据,如社交媒体上的海量文字、图片;还有如何分析视频、音频数据等等。
我的一位研究生毕业之后一直在某媒体研究公司工作,该公司最近推出了一个“网络影响力”的收视测评。“这个东西如果扩展出去的话,很多电视台都会很感兴趣”,最近我从负责进行这个测评的毕业生那里了解到其在分析相关大数据时的感受,“实际上大都是手工分析的,非常辛苦,因为现有的文本分析软件根本不好用”。
由此笔者联想到两年前所主持的一个关于《重大事件舆情监测指标体系与预警模型》的“211课题”,虽得到了澳门“易研网络研究实验室(ERS, e-Research Lab)”的大力帮助,得到了所需的大数据(海量帖子等)和文本分析软件,但对于帖子倾向性等方面的分析,最终还是不得不通过传统的内容分析方法在人工编码后进行。
邓光和:从某种意义上讲,大数据是信息高度发达社会的需要,也是市场经济的必然要求。我国早已进入市场经济和信息社会,但市场经济还不完善,数据市场发育程度不高,对数据市场的规范管理还不到位,数据的准确性、公信度还有待提高。以电视收视率调查为例,国内收视率调查市场造假等乱象较突出。因此,如果说现在已进入大数据时代可能还不够确切。但大数据时代已迎面向我们走来,我们已经能够感受到这个新时代的呼吸。
王宁:大数据首先强调的是“大”,了解数据分析一般原理和方法,或有过一些市场、社会、媒体研究经历的人,都能懂得或理解,其实数据并不一定是越多越好,关键是如何借助相关的理论,针对研究问题去设计、分析和应用。
针对设计良好的“小数据”,如有代表性的样本数据,小的切入点、小而具体的研究问题、科学的研究框架、合理的分析和适当的解读等,也能作出深入而有用的分析。
本刊记者:从硅谷到北京,大数据的话题被传播,一个大规模生产、分享和应用数据的时代正在开启,大数据的真实价值就像浮在海洋上的冰,我们能看到的只是冰山一角。2013年“两会”上,有代表提出构建“数据中国”的建议,认为数据将成为国家竞争的前沿、企业创新的来源。数据的占有和使用会不会形成新一轮竞争?
柯惠新:大数据的质量参差不齐,需慎重使用。不同公司、机构所掌握的大数据在质量方面可能会有很大的差异。在“全球化下的社交媒体与数字网络:2012中国网络传播学年会澳门国际会议”的专题讨论——“基于大数据挖掘的行为和方法”中,一位演讲嘉宾在探讨如何充分挖掘互联网社区大数据社会化营销的效果时,提到了“僵尸”和“水军”问题,估计“有一半网民的信息是真实的”。也就是说,可能有一半的信息是不真实的。
带着这个疑问,我曾请教过一位几年前曾经在某网站工作过的企业高管,是否“有一半网民的信息是不真实的”?这位先生坚定地说:“100%都是假的!”
虽理解他是在强调问题的严重程度,应不会是“100%都是假的”,但还是很感意外,尽管目前由于没有实证研究的数据,无法作出准确的判断,但根据这几位业内专家的判断,起码网络上的大数据质量堪忧。
此外,抛开网络上大数据的真实性问题,借助大多没有细节和深度的大数据,如网上的评论,能否分析得到比较有价值的东西?也使一些想使用大数据的研究者止步不前。
陈昌凤:“数据中国”这样的话不是过于超前,就是罔顾中国现实。大数据并非一场全民运动,它是由有技术优势的大型公司和创新精英挖掘出来的。
邓光和:信息是人们用来消除对周围世界的未知性和不确定性,增强预见性和安全感的重要手段。市场经济条件下,市场的不稳定性和风险性进一步强化了人们获取信息的内在要求。信息在社会生产生活中的价值进一步提升。需求就是市场,采集、整理、分类、出售各方面的信息数据,自然而然成为一个有利可图、具有广阔市场前景的产业。事实上,人口调查、商品零售调查、广播电视收听收视率调查等,就是专门的数据生产。在中国,随着市场经济的深入发展,对数据的需求量会越来越大,这必然推动数据产业的大发展。数据产业属于信息产业,不仅空间巨大,且很多数据关系到国计民生,甚至关系到国家信息安全。可以预计,未来中国数据产业会形成一轮新的竞争,对数据生产的管理和规范也将逐步走向成熟。
本刊记者:随着大数据时代的来临,媒体人将受到前所未有的挑战。西方媒体越来越重视数据挖掘,认为数据挖掘的新闻往往比传统新闻报道更有力度。著名学者彭兰在为本刊的撰文中也指出:“过去只有受过专门训练的人才能承担的新闻报道工作,开始部分地转移到计算机身上。”是否可以这样猜想:记者的职业即将消失,或者说大数据时代记者的职能要转型?
朱川燕:新闻工作者的职业不会因大数据时代的来临而消失,但新闻工作者的技能和使用的工具需要升级换代,从这个意义上讲,新闻工作者的职能可能会转型。
对大数据时代新闻工作者的技能发展可做简要总结。一、如何从数据中发现和挖掘新闻。大数据时代的新闻工作者需更多依赖数据库和数据分析来发现新闻、报道新闻。但大数据时代新闻工作者传播新闻信息的根本职能不会变,而新闻工作者所应遵守的新闻标准和所应具备的新闻敏感也不会变。大数据时代产生的海量数据并不都適合媒体报道,正如每日正在发生的海量事件中只有少量成为新闻事件一样。因此,大数据时代的新闻工作者更要善于从尚未引起人们注意的冰山一角挖掘出隐藏的新闻。这对新闻工作者和新闻事业都是一个新的挑战。二、如何将数据可视化。除发现新闻以外,大数据时代新闻事业所面临的另一个重要挑战,是如何用数据讲故事。在传统的新闻写作课上老师会传授给学生一条不成文的规则,新闻导语中最好不要有数字,因数字抽象,受教育程度低的读者或听众观众不好理解。而大数据时代中通过数据挖掘产生的新闻报道的主要事实就是数据。如何解决数字抽象枯燥不好理解的难题呢?这就要求新闻工作者不仅要善于从数据中挖掘新闻,还要善于用数据讲故事。三、如何保证数据新闻的真实性和准确性。这要求新闻工作者不仅要有新闻鼻而且要有统计专家的火眼金睛,能够洞悉具有新闻价值的大数据来源是否可靠、数据收集手段是否科学、数据是否有代表性和可比性。举个例子,如果某位记者拿到了教育部部属大学的学生最近5年的就业统计数据,那么该记者在写稿前需冷静审核这些数据,检查各大学对就业的定义是否一致、采用的统计指标是否一致、历年的统计指标和定义是否一致。只有在这些指标和定义都一致的情况下,才能够进行大学之间的横向比较或不同年份之间的纵向趋势比较。而负责审稿的编辑,也同样需要具备统计知识,以保证数据新闻的数据来源、数据分析方法和数据呈现方式都符合真实性和准确性的原则。
石长顺:与其说大数据时代给新闻业带来了挑战,倒不如说是带来了更大的机遇。因为数据就是一个巨大的信息库,这种信息与一般新闻报道中的信息有所不同,后者是一种事实信息,仅供客观的报道与传播,而前者是一种数据信息,通过挖掘分析,不但可作为现在的事实报道,还可作为未来的预测报道,甚至可通过数据洞察社会问题,影响公众参与公共事务,影响公共政策决策,发挥建设者作用。
邓光和:大数据时代,新闻业既有挑战,更有机遇。挑战在于在媒体高度发达的情况下,传统的“抢头条”“争独家”的新闻竞争模式难以为继。新闻媒体须依靠自身高素质的人才队伍,充分利用数据资源,从海量信息中寻找、整合、加工新闻信息,满足受众需求。机遇在于可供媒体选择使用的信息资源更加丰富,媒体对受众结构的了解更加方便透彻,对自身传播效果的评估更加全面准确。大数据时代,记者职业显然不会消失,但记者的思维方式和工作方式需要及时调整转型,更加重视对数据的分析使用,更加重视对信息的深度整合和加工。
陈昌凤:记者消失了,谁去挖掘数据呢?
其实记者的部分采集信息的手段会改变,但记者仍然是在采集信息、解读信息,因此职能并不真的转变。但长期下来,信息的结构和内涵会发生一定程度的改变。
本刊记者:Narrative联合创始人兼首席技术官克里·哈蒙德认为未来机器生成的新闻将占到媒体新闻的90%,是否意味着新闻要机械化、复制化?未来大批量产生的新闻是否会更刻板?
王宁:长久以来,分析、整理和理解数据,都是专业人士,如统计学家、人口学家、经济学家等,才会涉足的领域。而通过将数据可视化,可大大简化数据的可读性。随着数据可视化技术的蓬勃发展,越来越多的新闻从业者开始在报道中使用这项技术。2010年,拉斯维加斯太阳报(Las Vegas Sun)发表了《杜绝事故》(Do No Harm)的报道,在这个专题报道中,记者分析了2008年至2009年间,拉斯维加斯地区的290万条医疗记录,从中梳理出3689件可避免的伤亡、感染或手术事故。为帮助读者理解,记者把这个庞大的数据库转化成简单易明的互动图表,让即便是完全没有任何数据分析基础的普通民众,也能轻松解读,甚至利用图表的互动功能对数据作进一步的考察。如读者可按照医院可视化,让患者了解各医院的运作状况;也可将伤亡按照事故性质可视化,让患者了解不同事故的普遍程度,所有这些都只需读者点击页面上方的两个小下拉菜单即可轻松完成。这个报道产生了重要的社会影响,直接促成内华达州的立法机构通过了5条关于医疗系统运作公开化的法案。
陈昌凤:不知克里说此话的语境是什么,机器生成的信息是一种编辑手段、组织信息的方式,还是指信息的来源?总得有人把信息从现实中移到机器上吧?复制的新闻现在就有,不是非要机器时代,但它的价值有多大?
想要有质量的信息,判断力是必不可少的,即使是机器操作,也是要人设置了程序,才能判断出哪段文字、哪张图片是有价值的。
邓光和:大数据时代,数据是媒体可资利用的新闻素材,但不是新闻本身。媒体从业者可通过计算机使用、分析、处理各种数据,制作新闻作品。新闻作品包含新闻工作者的劳动创造,体现了媒体的传播意图,这是任何机器无法代替的。即计算机不可能代替新闻工作者批量生产新闻作品。新闻强调新鲜性,是易碎品,复制的新闻不是新闻。
本刊记者:大数据时代似乎对新闻行业影响更直接,对于图书出版、期刊出版,其影响有多大?学术图书、小说、散文在大数据时代的出版将是怎样的模式?
邓光和:大数据是社会方方面面的数据,也包含图书、期刊方面的数据,故图书出版、期刊出版同样会受到大数据时代的影响。图书、期刊及其内容、形式、读者、销量等数据,显然是图书、期刊出版管理者在经营管理过程中重要的决策依据。
陈昌凤:从目前的情形看,大数据对出版的影响大于对新闻的影响。Google从数字化转向数据化的实践就是例证。
本刊记者:受众分析是媒体的基本工作,在大数据时代,抽样调查的有限性是否成为历史?大数据时代受众的整体分析、个性化分析将成为可能,个性化信息服务也容易实现,是否意味着每个人都可收到适合的信息,不再为海量信息、垃圾信息而烦恼?也有人认为大数据的个性化分析也会包括人们的行为、位置、喜好,甚至心理、生理数据等,也会给人造成很多隐忧。大数据到底是一个宝藏,还是一个隐忧?我们如何进入一个安全的数据共享时代?
石长顺:对这个问题的担忧不能简单用是与否回答。先讲一个故事。美国20世纪初期有一本畅销杂志《文学文摘》,因其准确地预测了1920、1924、1928、1932年4届总统大选的结果。但在1936年第32任美国总统罗斯福谋求连任与兰登的竞选中,该杂志对240万普通民众进行了调查,把“宝”压在了兰登身上,而盖洛普研究所则只抽样了5000人进行调查,宣布罗斯福会胜出。结果《文学文摘》失败,导致破产。此后,在18次美国总统竞选中,盖洛普民调成功预测了16次,这说明科学的抽样方法并不逊色于大面积访谈的大数据。当然,也不能以此而否定大数据时代整体分析和个性化分析的准确率,关键还在于掌握大数据的人如何科学地运用大数据。
柯惠新:大数据对传统的抽样调查提出了挑战,但并不能相互替代。
传统抽样调查方法的理念是希望通过调查分析一个具有代表性的样本,进而对我们感兴趣的研究总体进行推断。随着大数据的出现,有些学者认为,既然可以直接分析所有的,也就是总体的数据,自然就不再需要抽样了。维克托·迈尔-舍恩伯格和肯尼思·库克耶在其著作《大数据时代:生活、工作与思维的大变革》一书中,甚至激动地宣告:“统计抽样其实只是为在技术受限的特定时期,解决当时存在的一些特定问题而产生的……在大数据时代进行抽样分析就像在汽车时代骑马……慢慢地,我们会完全抛弃样本分析。”
但对具体的研究者和具体的研究项目来说,很难做到真正意义上的拥有和分析“所有的数据”。当研究者抓取新浪微博的数据时,也许可获取所有公开的关系和博文,但无法获取那些“悄悄关注”的关系,也无法读取有隐私设置的博文,如密友微博。又比如,由于分析技术和时间精力的限制,研究者选择只分析所有文本格式的微博内容,而忽略其他格式,如视频、图片等的数据。在以上这两个例子里,研究者都只采集和分析了一部分的数据,无论这是一个主动的还是被动的选择,都可看做是一个非随机的抽样过程,它得到的数据的代表性很可能并不如一个设计良好的随机样本。也就是说,研究者能够收集或分析的,常常只是一部分数据,无论这一部分数据是多么庞大,研究者必须明白:拥有海量的数据不等于拥有所有的数据。
陈昌凤:进入互联网时代,就进入了没有安全的时代。创新是需要代价的,互联网的历史,其实就是冒险的历史。
大数据时代的个性化,并不意味着信息进入单一时代,它提供的选择更多了,突出的信息更明确了,服务更个性化了。你的信息需求本身,就有成百上千個相关的链接信息。前工业时代的人是心安理得进入工业社会的吗?工业社会的人是安全无忧地进入信息时代的吗?人类的发展过程中,从来没有任何东西能保证一切都安全。不开放的心态,才是最大的危险,了解它、认识它、适应它、利用它,并且改造它,我们才能走下去。
邓光和:任何事物都有两面性,不能因噎废食。面对大数据可能带来的问题,国家须加强立法,通过法律法规规范数据生产、出售、传播等各主体的行为,切实保障国家、社会利益,保障个人和组织的合法权利。
本刊记者:大数据时代的种种变化告诉我们,专业媒体需要重新寻找自身的位置和自身的价值,而新的定位、新的价值必将通过业务形态的变革体现,未来媒体的主要调整方向会体现在哪些方面?
石长顺:一是加快确立大数据媒体战略,争夺世界全媒体传播前沿。二是加快建立中国传媒数据仓库,在全国推行“最小数据集”的概念,并从国家层面强制收集某个媒体的数据指标,在国家信息与文化安全的前提下,更好地管理和共享数据资源。三是加快实现传媒业的转型。从新闻采访者向数据挖掘者转型,从事实报道者向未来预测者转变,从数据识别者向数据可视化转化。
朱川燕:大数据时代所面临的诸多挑战要求新闻工作者具有综合性技能。除因媒体的发展要求新闻工作者具备跨媒体平台工作的专业技能外,从事数据新闻的记者还要具备一定的统计技能和比较高的数据软件和图表软件应用技能。如何培养优秀的数据新闻记者成为国内外媒体关注的一个普遍问题。是培训新闻记者使其具备统计技能和软件应用技能,还是培训数据分析能力强的研究工作者或信息图表设计工作者使其具备新闻报道的技能?国外在数据新闻报道上领先的媒体如《纽约时报》《卫报》、英国广播公司等两种途径都有采用。不过,在最近一次英美两国数据新闻专业工作者组织的视频会议上,与会者认为从新闻记者中培养出来的数据新闻从业者更容易做出故事性强的吸引人的数据新闻。
柯惠新:国际媒体研究机构对于是否可以提供、如何提供多屏、全媒体的收视数据,还在探讨和测试阶段,还没有行业认可的统一做法和标准。
新媒体的快速发展和市场的需求,促使我们不能再等待犹豫,要尽快开展大数据的相关研究和应用。但这不是一件轻而易举的事情,不要炒作,不要将不成熟的东西急于推向市场。
期待解决的行业问题:
如何保证或检验大数据的真实性?如何界定大数据拥有方与研究方的关系?如何保证大数据拥有方的中立性?
如何界定有关大数据的“四方”问题。传统的市场、社会研究国际准则(ESOMAR CODE)和我国前年出台的国家标准《市场、民意和社会调查 服务要求》及《市场、民意和社会调查 术语标准”》中,都仅涉及三方:数据提供方,如调查研究机构;数据使用方、客户方,如电视台、广告公司等;被调查方,如某项研究中的调查对象。但在大数据时代,出现了拥有大數据资源的第四方,如网络运营商。如何界定四者的关系、权利和义务,对保证研究的中立性和客观性至关重要。