大数据时代新闻生产模式的创新研究:自动化新闻的实践、影响与未来
2018-03-27郭世瑾郑州大学
郭世瑾 郑州大学
技术创新给新闻传播带来的变革从未停止过。在大数据的环境下,人工智能技术不断发展,新闻生产方式发生了变化,新闻生产流程被重塑,新闻传播业态经历变革。Web2.0 之后媒体变革的起点是移动互联网,但它更大的趋向是媒体智能化或智媒化。[1]自动化新闻正是新闻生产智能化在现阶段的体现。
自动化新闻,是指在初期算法编程完毕后,不经人为干预,软件或算法即可自动生成新闻故事的过程。一旦算法生成,从收集和分析资料,到实际的撰写和发布新闻,新闻生产的每个环节都可以自动完成。[2]20世纪60年代,自动化文本生产最初应用于天气预报,随着移动互联网的发展,自动生成系统获得更广泛的应用。2014年3月,《洛杉矶时报》关于一场3.7 级地震的自动化报道成为“机器人新闻”发展的一座里程碑,这篇报道由算法生成,但和记者采写的报道在形式上几乎无差别。现如今,欧美几乎所有主流的新闻机构均已建立一定程度的自动化新闻生产平台,自动化新闻报道的生产数量也得到了极大的提升。欧洲的九家通讯社——包括路透社、法新社、挪威新闻社等,均已投入采用自动化新闻。国内的自动化技术与国外相比虽仍处于弱势,但也是有了质的飞跃,已经相继推出腾讯的“Dreamwriter”、新华社的“快笔小新”、阿里巴巴与第一财经的“DT 稿王”、今日头条的“Xiaomingbot”、南方都市报的“小南”、百度的“度秘解说”以及广州日报的“阿同”等机器人写手,自动化新闻发展逐渐成为新闻生产领域不可逆转的趋势。人工智能与物联网、大数据深度结合,催生新闻生产智能化,将人类从繁琐的新闻生产任务中解放出来,大大提高了新闻产量和效率。
一、自动化新闻生产模式分析
自动化新闻的常见形式是”机器人新闻”,它实际上是一种稿件自动生成软件,已经越多越多的在媒体中被使用,也着实为媒体节约了人力、提高了效率。目前,自动化新闻的生产方式主要有3 种:挖掘用户数据的基础上生成个性化稿件、利用记者数据模型智能化生成稿件、利用结构化数据生成稿件。现在的自动化新闻生产多运用自动化数据进行模板填充,并依据运算逻辑大规模报道新闻。这种模式相对固化,情感色彩较少,表明立场、提出建议的表达能力相对匮乏。但是,随着人工智能技术的创新,自动化新闻的质量会日渐提高,将在新闻敏感、发现选题、表达情感、提出观点、深度报道等方面更加成熟。
二、自动化新闻的应用特点分析
媒介技术发展的动因,来自人类社会驾驭信息传播、不断提高信息生产和传播效率的基本需求和不懈努力。[3]自动化新闻的诞生正是新兴技术作用于新闻生产领域的有力实践。依靠庞大的数据库和人工智能技术,自动化新闻的数据分析能力更强,计算精准度和生产效率更高,有力解决了新闻生产层面的效率问题。
(一)革新新闻采集方式,利用人工智能优势,提升稿件质量和准确性。
自动化新闻利用人工智能对海量数据的抓取、处理、分析能力生成新闻,数据本身构成了新闻报道的主体内涵和核心内容,形成数据可视化报道,提供了对社会现实、事件、现象和各种复杂关系的多元分析观察视角。数据新闻被视作一种工作流程,相较于传统单一的文字、图片报道,数据新闻有着不可比拟的优势,也是媒介融合的体现。其中,财新是业界数据新闻的典范。只要数据无误、算法科学且正常运行,自动化新闻就可大大降低诸如计算错误、拼写错误、事实信息不全等差错出现的概率,弥补人工撰稿的不稳定性、主观性等缺陷,提升稿件质量和准确性。
(二)革新新闻生产方式,创新可视化新闻,全面提升新闻时效性和可读性。
新闻时效性是衡量新闻的一个决定性标尺,是媒体增强竞争力的重要要求。机器人利用高速的计算能力,根据预先建立的数据模型,自动生成新闻报道。这种报道生成方式,降低了新闻编辑的工作负载量,提升了新闻生产效率。美联社与自动化平台Automated Insights 进行合作,将数据抓取技术应用到财经新闻报道和体育新闻报道中,使财经新闻的写作时间平均缩短了25%。同时机器人可自动为新闻报道匹配图表、图片和视频,以可视化形式展现数据,提升报道可读性。2018年3月2日,新华社发布消息称由新华社和阿里巴巴公司共同研发的国内第一个媒体人工智能平台”媒体大脑“从5 亿网页中梳理出两会热词并在15 秒内生产出第一条两会MGC(机器生产内容)视频新闻。由此可见,自动化新闻的创新领域越来越宽广,应不断挖掘行业发展的潜能。
(三)革新新闻分发方式,实现新闻信息的个性化和定制化,提高传播针对性。
有别于传统的“千人一面”分发模式,智媒时代的信息传播呈现出一对一的特点。一方面,自动化新闻技术可以覆盖现有的全部媒体报道并进行分析,将社会关注率较高的话题从中筛选出来并进行分类汇总,提升内容生产的针对性。另一方面,借用人工智能,在与用户的互动过程中接收反馈,提高传播效果。2016年3月,《华盛顿邮报》研发出聊天机器人Feels,在美国总统大选三周前,“Feels”聊天机器人每天晚上推出一个简单的问题 与读者互动:“今天的大选让您感觉如何?”随后的第二天早上,聊天机器人便向用户推送关于前一天大选的感觉图表和关于用户感觉的原因摘录[4]。通过此种方式,Feels 采集了用户信息并整合进自己传统的数据库中。学者匡文波提出:“技术总是会让新闻报道增色”[5],我们有理由相信自动化新闻的光明前景。如若将机器人的信息采集、自动化新闻生产与新闻信息推送的算法整合到同一产品之中,自动化新闻就将由半自动化转向全自动,当前新闻实践就会有突破性的进展。
(四)洞悉事物发展规律和趋势,进行基于海量数据的合理性预测。
大数据时代的核心是预测,预测精神为自动化新闻发展带来新机遇。大数据分析技术对研究对象的发展规律和趋势进行合理化预测,数据可视化技术对新闻进行全方位的深度预测,增强报道的科学性与人性化。2008年11月,在突发性公共事件发生的几周前,美国借助人工智能对社交媒体数据进行抓取、分析,成功预测了流感爆发。另一典型案例是,美国数据分析师奈特创办了一个以总统大选为主题的民意聚合博客,他认为数据调查可呈现出真实民意,最终应用棒球比赛数据分析模型,对选情进行了成功预测。
三、自动化新闻对新闻传播业的影响
政府规制、技术进步、资本介入、社会变迁是影响传媒业发展的重要变量。[6]智能化技术在提升新闻产品质量的同时,也推进了新闻传播行业的变革。这些变革不仅重塑了新闻机构自身的生产流程,也对新闻从业者的职业发展方向、受众和社会产生一系列重要而深远的影响。
(一)记者的职业分工发生改变,“人机共生”成为未来新闻报道主要模式
在自动化新闻的实践中,劳动密集型记者可能会被取代,也可能会创造新的职业岗位,记者将在新闻生产过程中扮演新的角色。例如,美联社聘请了一个自动化新闻编辑,工作内容是确定可以自动化的内部程序。未来的新闻报道将形成人机共生模式,机器将人类从繁琐的重复性劳动中解放出来,使记者拥有更多精力投入到深度分析报道中。另外,自动化新闻生产旨在通过人工智能技术和大数据为媒体发展赋能,所以在技术发展的基础上,对新闻媒体创新能力的提升将有更高的要求。新闻不是冷冰冰的数据产物,而应该是带有人性温度的报道。将机器人写作和人工写作的结合,是将感性经验和价值判断互补的最好方式。
(二)数据采集和开放面临伦理问题,受众关心内容生产的科学性和透明度
首先,对于科技产业而言,不断地质疑机器的运作方法及原因,是相当重要的,大多数的人工智能都像是黑箱作业,决策过程都是隐蔽的,诸如侵犯个人隐私、报道片面失衡等问题时有发生。其次,受众或许难以分辨出机器写作和人工写作的区别,但算法的透明度成为用户日益关切的问题,包括数据来源的准确度如何,媒体是否有权处理这些数据,由谁控制算法,由谁对内容生产负责,又由谁监视算法和机器,媒体是否会向用户声明新闻是自动化生产的等。因此,人工智能的公开及透明度成为建立信任和避免误解的关键,“基于算法的负责任报道”正变得日益迫切和必需。
(三)媒介组织面临一系列新挑战,在责任的框架下规范算法成为必需
自动化新闻对媒体而言是机遇也是挑战。一方面,当自动化新闻涉及批评性报道时,数据的准确性、内容的质量以及程序的透明度将变得更加重要。新闻媒体在自动化内容生产中需要考虑源数据、数据处理和最终输出有关的问题。当数据和算法出现错误时,媒体可能会面临公布源代码的压力,他们不仅需要强调内容是“机器生成的”,同时也应解释报道是如何产生的。[7]另一方面,智能算法加剧了工具理性与新闻价值间的矛盾。马克思.韦伯提出工具理性和价值理性两个概念,基于算法的自动化新闻可能会忽视新闻道德和义务等理念价值,过多个性化推荐会导致市场宣传行为泛滥。因此,媒体不能过度依赖工具理性,影响自身对新闻价值的判断。
(四)对社会舆论的形成产生负面影响,产生“信息茧房”、“过滤气泡”等效应
自动化新闻的优势之一是生产个性化新闻,使信息分发更精准化。然而这种优势会导致用户倾向于获取与之态度相一致的新闻,逐渐失去异质化信息的接触能力和机会,沉浸于自己营造的“拟态环境”中。与此同时,用户被人为地与其他信息隔绝开,形成“过滤气泡”,造成社会上多元化声音减少,言论更加单一。以今日头条的“信息分发机制”为例,系统可能首先会将一条信息推送给1 万人,如果其中阅读比例达到一定指标,再推送给更大范围的用户,否则就停止推荐,这条消息将自然沉底,这意味着用户从主动选择到被动接受,决定用户接收信息的权利被转移给算法。因此,新闻媒体应注重多渠道、多角度推送新闻,营造健康、多元的社会舆论环境。
四、自动化新闻的前景与未来
自动化工具的应用将是未来新闻编辑部不可避免的发展趋势。伴随新闻业的收入逐年下降,自动化新闻的生成将在一定程度上提高利润率、降低生产成本,特别是在利润空间稀薄的本地新闻报道中。此外,自动化新闻兼具了大样本研究和个性化定制两个看似并不相容的优点,能够通过系统化的模型搭建提高报道的速度和准确性。
未来自动化新闻的应用领域将更加广泛,不仅局限于体育报道和财经新闻,还将包括房地产、财务金融、政治、天气预报和自然灾害监测等细分领域。除此之外,自动化技术还将在新闻追踪方面做出贡献。路透社表示该项技术的核心在于社交平台中的信息流一旦出现超过常规值,机器会在第一时间通知记者进行真实性核查。该项技术旨在强化自动化技术在突发新闻报道中的领先优势。
人们一直担心自动化技术会对传统新闻业造成较大冲击。许多记者认为,人们对技术的过分关注将会使新闻本身和记者的价值被忽视。但众多实践证明,单一追求自动化报道工具是不可行的,人工智能并不会取代记者。自动化技术执行数据采集与分析等任务,充当记者助理的角色,其根本目的是将记者和编辑从常规事务中解放出来,全身心地投入到他们真正擅长的事务中,如发现新闻、确定选题、提出问题、表达观点、深度分析和人物专访等方面。开发自动化报道工具的核心不是让机器写出具有深度的新闻报道,而是在人类的优势与机器的优势之间达到微妙的平衡。未来的自动化新闻发展模式将一边借助记者的丰富经验和敏锐判断,一边利用自动化技术实现大数据抓取和分析,将人类和自动化技术进行紧密结合。
五、结语
目前,人工智能和自动化技术仍处于发展阶段,其对新闻价值的把握、数据的分析和挖掘仍存在诸多不足。新闻报道的最核心价值,仍需人力来把握和创造。但作为当前新闻业进行转型升级的重要举措,我们还应不断拓展自动化新闻的发展空间,最大程度地释放媒体人的精力,让媒体人的智慧在最有价值的地方得到充分的发挥,为新闻业的发展提供更多可能性。自动化新闻不仅变革新闻业,也造福了人类生活。未来的新闻传播业是智慧与智能共同参与、人与机器的合作建构的。我们应不断创新新闻生产方式,让其更好地服务于人类。