人工智能时代传媒业的“人工”与“智能”
2019-12-17文/汪萱
文/汪 萱
2017年,“人工智能”被写入我国政府工作报告,2018年白宫成立人工智能特别委员会,在政策、科研和资本的合力推动下,AI(Artificial Intelligence,人工智能)这一沉寂了近20年的技术,在几年内掀起了世界范围的产业革新浪潮,宣告着人工智能时代的到来。伴随着各舆论场中Alpha Go棋坛封王、Duplex突破图灵测试、AI再现网格细胞的声音不绝于耳,人工智能的迭代速度超越了大部分人的想象,不断改变并重塑着各行业。
传媒业对人工智能的尝试早已开始,近年来随着人工智能技术的落地,“机器是否会取代人的工作”成为学界探讨的热点,有学者对此持乐观态度,如喻国明认为所谓取代目前只是纯粹的逻辑问题,“人类智能与人工智能应在对话机制中实现功能互补”。Latar则提出任何机器都不能成为道德的守护者,从业者应使变化服务于社会价值的实现。而以Putnam为代表的计算功能主义学派则时刻警惕着强人工智能,认为当工具获得了自主性,会倒逼从业者转型,出现“机进人退”的颠覆式变革。传媒业中人工与智能的进与退、取与舍的问题,是当前传媒发展必须解决的问题。
一、被“智能”重构的“人工”
从产业发展的角度看,近年来传统媒体遭遇了一系列挑战,种种数据表明传统媒体已到了转型的关键期。对此,学者胡正荣预测“转型窗口期会在2020年左右关闭”,作为未来融媒体核心的人工智能成为转型的关键。李俊认为“传统媒体如不紧抓住人工智能的发展潮流,将遭遇技术变革的降维打击,”幸而人工智能与传媒的结合正逐步成熟。目前,人工智能已经覆盖了传媒业策划、采访、编辑、审核、发布、反馈的全过程。要了解技术会如何重构“人工”,先要从技术的特性和优势入手,了解人工智能能做什么。
1.人工智能的特性。一是非结构化数据处理。在以往的印象中,机器泛用性差,只能处理人整理好的结构化数据,这也是大部分人工无法被取代的原因。近年来,在大数据产业的助力下,基于人工神经网络的智能算法颠覆了这一现状。算法可以识别图片、视频、自然语言文本及音频等非结构化数据,能分辨素材中的人、事、物,甚至是人的行为和情绪。面对海量的素材,记者和编辑不再需要逐一浏览,算法可自动筛选出有价值的部分。在UGC逐步“改写中国舆论场版图”的当下,算法通过分析社交网络中的自然语言,可以探索潜在的新闻热点。在视觉素材加工中,Clarifai的识图算法可依据内容匹配最佳图像,自动添加视频字幕和内容文本标识。在音频处理中,新华社的“采蜜”可迅速完成录音文本的转录,Agolo的自然语言处理算法能同步完成翻译、初级语义分析和文本分析。这些人工智能算法的引入都加速了业态转型。
二是监督学习与无监督学习。人工智能分辨事物的能力并非算法自带,需要机器学习的过程,一般分为监督与无监督两类。前者与案例教学类似,先学例子总结规律,后举一反三。例如,想让算法区分表情,就需要输入大量标识了情绪类型的相片作为训练集,算法通过分层提取各类表情的特征并形成模型,就能“明白”人的情绪。只要素材能够数字化,理论上算法就可以进行学习,且随着训练数据的提升不断改进输出,有很高的泛用性。传媒从业者可以通过输入各种训练数据,让机器完成判别复杂现场中主体、分析受众稿件偏好等耗时耗力的工作。监督学习则需要明确的训练数据,但采编工作常面对从未标识过的全新内容,或是难以短时间内理清线索的庞大文件,此时可采用无监督学习,将内容输入后,算法聚类可以划分内容类别,并探索彼此之间的潜在关联。这一过程往往能呈现出人们直觉之外的发现,这在纯人工处理中是难以想象的。
三是自然语言生成。在人工智能与传媒结合的报道中,最常被提及的是机器写作,即通过算法自动将输入数据变为人们可直接阅读的文章。新华社的“快笔小新”、美联社的Wordsmith和路透社的Open Calais都是这类应用,它们无需人工干预就能生成大量报道,这也是机器侵入人的领域最直观的体现。在这种应用中,算法先收集数据,分析新闻价值,并匹配适宜的篇章格式和语句模板,其后输出文章,其中最关键的是自然语言生成技术。机器学习使算法“懂”人话,自然语言生成则让算法“说”人话。其早期只用于灾害预警、竞赛播报、财经数据新闻等有固定模板的文本生成中,随着算法的迭代更新,目前已经可以完成部分个性化写作,可以根据受众的群体特征甚至是个人的阅读偏好,匹配不同的语言风格。
四是智能机器人。摄像机器人及无人机等智能采集设备,具有人力所不能及的广阔视角和无间断的采集能力。结合算法,多传感器的协同工作可以为素材提供丰富的参数,实时反馈现场状况及人的行为数据。引入模式识别算法后,机器可以识别场景、光线和遮挡物,自动调整摄像角度、光圈及焦点等参数。通过改进面部及运动识别算法,摄像机器人的高速跟拍和预设拍摄能力得到了巨大提高,已广泛应用于各类大型体育赛事。例如,里约奥运会中Getty Images就利用水下机器人捕捉了大量角度独特的精彩瞬间。无人机在战地新闻的取材上也发挥了巨大作用,记者可以在相对安全的距离完成取材。此外,无人机不仅是航拍工具,还是移动的数据采集中心,当其与地理位置信息结合后,可以为机器学习提供素材,还可以用于收集气候、地形等数据,支撑更深层次的数据挖掘。
五是未来融媒体的核心。人工智能已成为新媒体与传统媒体资源整合及媒介融合的关键技术。非结构化数据处理和自然语言生成打破了新老媒体的边界,机器学习与机器人拓宽了传媒发展的可能性。而从媒介环境学的角度,人工智能最重要的贡献是融合并扩展了传媒输入与输出的媒介。在输出端,伴随VR(Virtual Reality,虚拟现实)和AR(Augmented Reality,增强现实)在算法和硬件上的成熟,新媒介内容高速发展,《纽约时报》开发了NYT VR移动端应用并在一年内实现盈利。在输入端,随着可穿戴设备和移动终端上生物感应元件的普及,经受众同意的无意识信息获取逐渐成为主流。智能算法无缝衔接了从输入到输出端的信息回路,VR等新终端媒介,其“沉浸性、互动性、构想性”的特点结合智能算法的内容生产和分众个性化推送,描绘了传媒产业未来的发展样貌。
2.何种人工会被取代。在人工智能的推动下,传媒业从策划到编审全链条的生产形态都将被重构,转而变为更高效的人机协同发展模式,在这种背景下,两类人群会首先受到技术的冲击。
一是最像机器的人。学者胡泳提出“凡是能自动化的一定会被自动化”,在技术革新中最早被取代的是最像机器的人。从生产角度,传媒专业主义崇尚优质的内容生产,但业内也存在许多“搬运工”,简单的搬运不会提升内容价值。尤其是在网络时代,规模化搬运成本极低,这进一步突显了简单搬运的弊病。而算法能将搬运做到极致,依据多元受众特性,通过自然语言生成最恰当的内容形态和语言风格,并匹配给用户。同时,新闻业界也存在着模式化内容筛选和多层级审核制度的问题,算法在部分内容的筛选和审核上效率已超人工操作,在未来可以由智能算法承担一部分类似工作,缩短筛选和审核流程。
二是无法利用技术优势的人。当传媒业中人工智能的大规模应用成为常态,生产过程将被大幅度缩减。掌握技术的传媒人从繁复的机械劳动中解放出来,有更多的时间进行内容阐释和信息的深度挖掘,创造出更多的价值。而无法利用技术优势的人依然被“刀耕火种”的工作方式束缚住手脚,被机械重复的工作流程耗费掉大量时间,专属于人类的智慧被埋没,创造的信息价值和传播的成效难以满足不断变化的舆论环境要求。因此,在人工智能高速扩张的浪潮下,无法合理利用技术展现人类智慧的工作,最可能在未来被人工智能所替代。
二、需要“人工”型塑的“智能”
人工智能扩展了传媒的边界,甚至可能重新定义了传媒的概念。但现有的人工智能并不是人类的通用智能,Hawking预言的强人工智能是否会到来尚未可知。就目前而言,在与技术的融合中,传媒人的职能虽有重构,但依然不可取代,主要表现在三方面。
1.算法的准确度。真实性是新闻的生命,如果把人工智能设备视作普通机器,人们会给它贴上真实、精准和理性的标签。但算法的分辨能力是通过机器学习而得到的,其学习的训练样本大都由人工处理及标记而成。训练集若有偏误或数量不足,也会导致机器犯错。美联社的Marconi举过一个石油开采和森林消失相关性报道的例子,他们让算法学习开采与森林消失相关的卫星照片,之后让系统识别新照片,判断出四个位置的森林消失由开采导致。但在后续追访中发现真实原因是火灾或商业砍伐,与石油并无关联。这种指鹿为马的现象需要人工矫正,这要求传媒人了解算法的基本规范,明白何种训练可以让算法得出更准确的结论,训练集的编辑也需由不同的人来完成,以防止算法带入个人偏好。对于现象间相关性和因果性的判断需要由人来把控,同时内容和素材的审核环节也不能缺失人的监督。
2.价值导向的效度。在社会主要矛盾发生转化的大背景下,党的十九大报告提出要“坚持正确舆论导向,高度重视传播手段建设和创新,提高新闻舆论传播力、引导力、影响力、公信力。”新时代对传媒价值导向提出了更高的要求,回到人工智能的视角,这一要求突显了算法的价值观问题。Facebook曾因“新闻偏见门”解雇热门话题的编辑,改用算法推送,却又因算法将《战火中的女孩》标识为儿童色情而被舆论口诛笔伐。算法是否有价值观这是伦理学争论未决的问题,但对传媒业而言,算法的输出会影响受众的价值观则是明确的。若不加以规范,基于效率的算法只会向受众推送其偏好的信息,传媒的社会功能就会被削弱。因此,推送算法需人工介入来保证价值导向的正确和内容的多样,恰当地利用受众画像,定制推送的内容和形式,以更好地提升舆论和价值导向的效度。
3.内容的深度。作为智能编辑部的先行者,美联社曾举办写稿机器人WordSmith与专业记者的写稿比赛,机器虽然速度领先但在投票中大败,投票者认为后者的文章更易于阅读。也有学者比较了今日头条的Xiaomingbot与主流媒体对同场比赛的报道,指出除了存在信息冗杂堆砌外,机器新闻缺失了人工稿件中“获胜的喜悦或失利的惋惜”这些使受众产生共鸣的要素。这其中因为语言风格、行文逻辑和内容取舍等原因造成的不足,会随着算法的改进和训练集的完善而削弱,但其蕴含的思想深度及思考的源头,仍是专属于人的领域。优秀报道的产生离不开传媒人的专业主义坚持和深入现场的一手资料获取,尽管设备可以实现超越感官的详实记录,但传媒人在事件现场的感受、与当事人的接触、在田野调查中的感悟及由此引发的思考,都是人工智能难以企及的。这也是读者感受到文字背后的思想深度的来源。
三、从“人工+工具”到“智慧+智能”
有学者提出“智能时代,编辑记者更重要的工作是设计、指挥、操控机器干活。”这种论断正确无疑,但更多地立足于传统“人工+工具”的视角,如果只把人工智能视作工具,就可能导致对效率的单纯追求。如今,传媒业遇到的挑战的关键不在效率,更多在于受众需求、舆论环境、传播媒介和内容特性的变迁。要实现传媒业的突破,核心是人的理念与能力的突破。人工智能使机器带有了一定人的属性,其“智能”已足够取代部分人工,由此解放的时间,传媒人可以投入到深层次的内容创作和人文意涵的阐释等更体现人类智慧的领域。而且在人类智慧发挥的过程中,人工智能还可实现人力所不及的数据探索,挖掘蕴含在表象下的潜在可能,进一步助力传媒人价值的实现,形成人机协同共生的“智慧+智能”的发展模式。
1.生产端:人机协同的半自动化内容生产。经过算法的迭代,人工智能在部分领域已“不再是辅助生产的手段,而是一个相对独立的生产主体”。要充分利用新主体的优势,掌握技术是首要任务。限于技术门槛,现阶段需要算法专家与技术传媒人两类人群。算法专家负责算法编写,并具备传媒基本素养,了解内容的优劣。技术传媒人是专业的记者、编辑,且了解人工智能的基本应用,清楚技术可以如何提升内容价值。前者能够减小后者的技术负担,后者能够保证传媒的专业素养和社会责任不因技术而流变,以此最大化发挥人机协同的效用。在选题上,可借助自然语言处理捕捉舆论热点进行选题策划,或通过非监督学习探索潜在议题,而人的工作是设定范围并筛选结果。在获取素材上,可以运用人工与机器人并行采集的方式进行素材获取。在编辑制作上,可以利用算法自动筛选素材,匹配模板和语言风格,提供多样的呈现方式,人可以在此基础上发挥自身智慧、专业主义与人文精神,提升内容的价值。由此形成人机协同的半自动化内容生产。
2.分发端:多维度用户画像结合权重的分众推送。
受众偏好的变化是传媒业当前面临的重要问题,“万物皆媒”的时代,受众注意力资源更加分散,固有的信息呈现模式已经无法留住受众资源,传统的受众研究方式如通过收视/听率、电话调查、受众定制等也难以支撑对受众偏好的掌握。但随着民用智能设备的普及,各类传感器已无声地进入了大众的生活,算法可以精准刻画出前所未有的多维度用户画像。终端设备已经能依据读者的偏好、环境甚至是精神状态进行相关内容的推送,且经过用户同意后,终端设备还能够在受众无意识中采集生理、物理信息以反馈并改进算法。但还需要注意传媒业的价值导向、信息茧房等问题,平衡用户偏好与价值导向工作,这就需要有专业素养和人文精神的传媒人对信息权重进行标识,对有正面价值导向的内容给予更高的权重和更多的加工资源,在提高信息传播效率的同时,肩负起承担社会责任的要求。
3.研究端:深层次数据挖掘和人文价值探索。无论是专职传媒研究者还是一线传媒从业者都有追溯事件本源、探究现象规律的职责。财经记者若要追踪全球市场产业变动,以往需将大部分精力用于数据的整理、统计方法的选择和呈现方式的比较上。现在经调试的智能算法能以秒为单位完成数据收集,匹配统计方法,并以多种适洽的方式呈现结果。在此基础上,记者可以深挖数据背后的意义,由信息的“提供者”转变为“解释者”。从研究者的角度看,传播领域常用量化研究常需要繁复的数据收集、模型构建和试错过程。以传媒绩效指标的影响因素为例,若引入算法,由程序自动爬取数据,构建模型并试错,最后将可能存在意义的模型和变量呈献给研究者,研究的效率会大幅度提升。对于执行田野调查的研究者和访谈一线的记者,人工智能可以在前期的材料准备、调查中的数据转录、后期资料整理和定性比较分析上提供帮助。研究者和记者则可以更突出自身的人文属性,将精力放在讲述事件背后的社会价值上。
四、结语
在人工智能大举进军传媒业,重构传媒业的当下,最机械化和无法利用技术优势的岗位会最先受到冲击。但无需担心人工智能大规模地抢夺传媒从业者的工作,它所实现的是将人从机械、繁重的工作中解放出来,有利于人在内容深度、广度和温度上进行深入探索。同时,也不应将人工智能视作简单的工具,需要明确自身价值与技术的耦合关系,实现人机协同共生,这才是人工智能时代处理“人工”与“智能”关系的核心。