人工智能+新闻运作范式分析
2018-01-26文/周易
文/周 易
所谓人工智能是指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,诞生于1956年夏天,由约翰·麦卡锡(John McCarthy)为其命名。2017年,在《政府工作报告》中人工智能已经上升至国家战略高度。
近几年,人工智能与大数据技术进入新闻生产领域,在国内,腾讯财经最早在2015年9月用机器人Dream writer发布了一篇关于当年8月份CPI的稿件,题名为《8月CPI同比上涨2.0% 创12月新高》。2015年11月18日,新华社的“快笔小新”也开始被用于新闻写作过程中,“快笔小新”操作简单快捷,输入一个股票代码,再点一点鼠标,就能产生一篇财报分析。今日头条则借着2016年里约奥运的契机,推出了自己的“xiaoming bot”,可以在数据库更新的两秒之内生成新闻稿并发布,而且能够根据赛前预测和实际赛果的差异调整新闻生成的语气。2017年12月26日,新华社的媒体人工智能平台“媒体大脑”正式发布,为媒体提供包括线索、策划、采访、生产、分发、反馈等在内的全新闻链路的服务,成为传统媒体运用新技术的标杆。
人工智能+新闻:产制新范式
从人工智能的技术发展阶段来看,可将人工智能分为计算智能、感知智能和认知智能三个阶段。计算智能是指机器能运用神经网络和遗传算法等机理像人类一样计算、存储和传递信息;感知智能则指机器能够通过视觉和听觉两大信息摄入系统获取信息并作出判断、采取必要行动;认知智能在计算智能和感知智能的基础上取得更为长足的进步,机器能够像人一样独立思考,主动采取行动。人工智能与新闻生产链条的结合也因此呈现阶梯分布:计算智能,在新闻生产中依旧是“人工为主,机器为辅”,人工智能主要用于辅助记者储存和快速处理海量数据;感知智能,新闻生产过程中“看”和“听”的工作由机器替代记者完成;而进入认知智能阶段,自动化的新闻编辑部将从梦想变为现实,机器代替或全面辅助人类。
国内人工智能在新闻行业的应用大部分还停留在“计算智能”的阶段,并呈现向“感知智能”发展的趋势,自动化新闻主要体现在新闻线索搜寻、策划和撰写阶段。但是无论是在国外的实践还是国内业界的规划中,以互联网为代表的新传播革命正在重构我们的社会关系和社会形态,为新闻传播媒介的发展与创新提出了一系列全新的要求,开启从信息搜集到信息生产到信息分发和反馈收集的全新的新闻链路运作范式成为当下传媒发展的当务之急。
新闻信源规模化采集。无论是何种形式的自动化机器人新闻生产,第一步都是读入大量结构化和标准化数据。智媒化数据采集的三大特征表现在数据来源的多样化,数据获取的规模化和数据处理的高效性上。包含传统的摄像头、无人机、行车记录仪等智能采集设备,这些传感器的使用不仅能扩宽数据来源,而且采集的信息也更加多维。作为一种监测装置,传感器是一种收集数据信息的方式。它通过感受到被监测对象的信息,将其按一定规律变换成为电信号或其他形式进行输出,来实现对信息的记录、传输、存储、显示和控制等。可穿戴设备、智能手机、摄像头、行车记录仪、无人机、电子芯片、遥感卫星等传感器是人的感官延伸,充当了记者的“眼睛”和“耳朵”,任何带有智能传感器或处理器的物体,都可能成为信息的采集者、中介者甚至发布者,实时监测新闻事件,每天都能实时智能生成规模级的新闻线索和新闻素材。相比人工采集,通过传感器进行声音、图像资源的采集能够显著提高新闻生产的效率,例如,专业级录音应用实现了将录音内容自动转写为文字的功能,并无缝衔接移动端和PC端。
新闻内容自动化生产。MGC(Machine Generated Content)新闻,即运用人工智能技术生产新闻,从关键技术领域而言,其是整合了数据库知识发现(KDD)以及自然语言处理(NLP)两个领域,由机器智能生产的新闻。通过传感器获得海量数据信息,与储备数据进行关联分析,寻找新闻角度,还可以定制语言风格,智能生产新闻稿,视频编辑、语音合成、数据可视化等技术,实现了真正的媒介融合。富媒体应用在对话式新闻上,新闻会话机器人基于对大数据的学习,不仅能将文字转化成音频通过智能家电触及用户,甚至和用户就新闻进行互动,进一步延伸新闻内容的传播路径。最后是对新闻内容的“润色”阶段。一方面,确保新闻的真实性,通过基于精准的人脸识别系统可以从源头上减少虚假新闻的发布。另一方面,增强稿件的“温度”和“深度”,让新闻变得更具可读性和吸引力。
新闻内容个性化分发与反馈。新闻生产的一个重要目的就是触达用户,因此内容的分发起着举足轻重的作用。进行内容分发的基础是详尽的用户画像,针对不同读者的阅读心理偏好和行动习惯等精准的信息,依托新闻分发渠道,通过大数据在智能硬件等设备上,为读者个性化定制新闻资讯。
宏观上,网络上的海量新闻种类繁多,通过人工算法实现个性化推送,根据用户的阅读习惯、阅读时长等各种数据分析受众喜好,机器做标签提取、聚合等分析,将读者分为不同类型,分类推送内容。微观上,人工智能的个性化推送甚至可以精确到语言风格的偏好,利用人工智能技术完成对各种语料库语言风格的智能学习,为不同群体传送不同风格的新闻报道。通过语言风格的差异化处理,同一条新闻可以同时匹配不同用户群体的语言风格和阅读习惯,不仅大大提高了新闻生产的实用性和可读性,还完成了个性化新闻的量产。比如,运用智能新闻为某一政策的支持者和反对者提供不同的新闻内容。一方面人工智能介入下的机器分发可以充分考虑“长尾需求”。传统新闻内容往往集中于关乎大多数人权益的重要热门事件,而人工智能分发覆盖面更广,涉及个人生活、个人兴趣相关的长尾新闻报道。另一方面可以协助编辑跳离局限的视野,算法排序的核心是根据用户、内容、上下文信息决定实时计算每个内容的得分,按照得分进行排序。由于考虑到了用户的信息,排序结果是个性化的。另外,模型的更新也是实时的,能够充分的利用已有数据,指导下次分发,最大化地优化分发效率。
超精细化的个性化分发虽然能够更好地满足读者的需求,但是也存在“信息茧房”的危险,在这种情况下,读者的反馈就变得尤为重要,无论人工智能怎么发展,人都应该是核心,是规则的制定者,人工智能技术支持新闻报道根据读者的反馈随时对个人的定制内容做出调整。
人工智能+新闻:优势和局限性分析
人工智能+新闻的优势分析。人工智能应用在新闻行业可以将人、物、视频、文本等所有的信息都串联在一起,打造一个“智媒平台”。首先,自动化新闻的优势体现在新闻生产的数量、质量和速度上。自动化新闻拓宽了新闻报道的范围,提高了稿件的质量。只要保证数据正确,算法科学且正常运行,自动化新闻的生产能降低人工疏忽带来的信息错误率,小至拼写错误、语法错误、计算错误、大至要素缺失和逻辑,能大大降低因为人工疏忽造成的错误。
不仅如此,由大众化的信息生产转向有效地生产和推送个性化信息产品。一方面,在未来的新闻生产流程中,机器人自动化写作与预注册文本和数据库有着密切关系。伴随着机器学习,自然语言处理和生成技术日趋成熟,文本资料和数据库日益丰富,人工智能可以帮助我们挖掘选题拓展报道的广度、深度,提炼规律,预判内容的传播效果,反过来指导我们写作的起点。另一方面,读者的长尾需求得到重视,传统新闻编辑部的内容生产力与新闻记者的数量息息相关。而借助人工智能,媒体可以通过数据的存储和挖掘使得有限的记者和编辑也可以制作出大量内容,以前因为人力不足或“关注度不够”而被迫抛弃的新闻资讯,现在可能正被机器人生产,读者的选择因此变得更多,对有关社区体育、地方工会活动、民生等区域性新闻给予更多关注,新闻最终可以回归社区,回归到个人。
此外,人工智能预设框架下为UGC的有序化内容生产提供了可能。当下基于发达的社交媒体,各式自媒体蓬勃发展,生产的信息早已成为新闻媒体不可或缺的信源,但是信息的良莠不齐也成为扰乱舆论场的一大问题。人工智能的基础是数据库的建立,当前媒体数据主要来源于记者或数据分析师、第三方数据公司和用户。人工智能的发展为UGC内容提供了新的发展机遇,相较以往松散混乱的内容,人工智能提供的模型和框架为有序的内容生产提供了可能。
最后,人工智能时代下的全新闻链路运作范式新闻生产的核心生产力被颠覆,机器人在撰写常规报道等具有强规律性和框架性的报道时,在速度和准确度上具有人类记者无法匹敌的优越性,甚至可以脱离人类主观的干扰做到真实客观,记者的优势表现在对于深度文章撰写和创造性思考上。大部分的新闻都可以通过自动化生产生成,实则将新闻工作者从简单重复的工作中解脱,也对新闻工作中提出了更高的要求,转变工作重心,由即时消息生产转向创意化的数字新闻生产;由传统以文本为主导的内容生产转向以影像为主的视觉内容生产;最终发挥人类的思考力,强化以人物、历史为主的深度报道内容。
人工智能+新闻的局限性分析。
人工智能技术的发展首要解决的是新闻生产的效率问题,新闻生产速度加快,总量成量级增长,新闻可以借助人工智能实现自动创建,那么假新闻同样也可以被自动创建。2015年8月底,Face book解雇数十名新闻编辑,热门话题的编辑、推荐和排名都由机器算法控制以保持“客观公正”。然而,几天后一篇关于新闻主播Megyn Kelly因为力挺希拉里被福克斯踢出公司的假新闻被顶到Face book热门话题榜的首位。一般来说,人们认为人工写作在内容的清晰易读上具有优势,但在可信度、信息量和客观性方面比不上撰稿软件(Cler wall,2014)。但是实际上,算法也是由人类创作的成果,算法的输出结果中包含了设计者的意图和传播介质等不同方面的因素,并且算法运行过程中也存在失误,有必要建立算法问责制,避免算法“黑箱”,提高算法和机器意图的透明度。
同时,提升人工智能数据分析的精确性及其对于情景的反映能力。人工智能虽提供了美好的媒介生活愿景,但也存在不少困境。以传感器为技术基础的新闻呈现无终态的特征,现有条件下,新闻真实越来越表现为一种过程真实,人类去辨别真伪,透过现象看到本质都颇为吃力,机器无法看到表面事实背后错综复杂的利益链条,无法形成基于多重事实的价值判断。尽管人工智能研究者尝试在计算机系统当中模拟人类解决问题、进行决策的能力,但是很多情景中的决策制定与推理过程中只有局部性的、可信度有待考虑的信息,甚至信息源的信息还相互冲突。如何表达这种不确定性信息、将各种不确定的局部信息相互组合,最终使用这些信息实现有效推理是提供专业可靠的新闻报道的前提。
人工智能影响的新闻业带来了版权和隐私两个方面的问题。许多自动化新闻程序都需要通过某种电子表格式的设置来组织、整理数据集,从而将未加工的信息转化为系统化、有条理的新闻故事。而法律对于这种算法程序是否能够纳入版权保护,仍然存在相互冲突的观点。并且,信息的获取依存于无处不在的传感器,深入人们生活的传感器必不可少会侵犯个人隐私,如何重新界定隐私并限制侵权行为,人工智能在大众媒介与隐私法领域亟需论证。
最后,技术公司与金融资本夹击专业新闻生产。“二次售卖”模式风行后,资本对新闻专业性的影响一直备受到关注,在当下新的盈利模式还没形成和人工智能发展对资本高度依赖的情况下,金融资本必然会影响新闻生产。与此同时,当人工智能成为生产力时,数据就成了重要的生产要素,掌握数据的主体,就掌握了核心生产要素,掌握大量数据的科技公司则会拥有足以形成壁垒的天然优势。新闻媒体如何作为中立、第三方的力量,继续充当强大的“第四权力”,成为社会有力的守望者是人工智能时代下必须要面对的问题。
结语
在物联网和互联网交织的环境下,人工智能对新闻业的数据分析、内容生成和个性化分发会发挥更大的作用,进而对整个新闻业态产生更具深度的变革和挑战。整个新闻生产链条效率大大提高,读者的个性化需求也前所未有得到重视,“人机协同”也将最大程度激发新闻工作者的创造力和活力。但是也给新闻业态带来了重重挑战,宏观层面我们需要重新评价新闻内容对用户的价值,在个性化和公共性中寻找一个平衡点,在高效率和高专业度上做到均衡,微观上如何提升人工智能在大跨度的复杂变量的处理和判断方面、在微妙情感关系的处理和表达方面,尤其是在价值规则的制定和参照框架的选择方面的能力,实现不同资源的调度和“混搭”也是目前新闻要面对的问题。面对技术浪潮下的种种焦虑,归根结底,人的发展才是技术发展的本质,人工智能研究的原点是人脑,是人类对于自己大脑的理解的反映,人类才是最终规则的制定者,而智能媒体平台的存在也需要新闻信息为用户而生,越来越懂用户所想与所需。