AIGC一个“特类”:再论ChatGPT应用新闻生产新模态
2023-10-14郝雨文希
郝雨 文希
【摘要】人工智能不但颠覆了传统新闻生产传播的方式,而且将催生全新的新闻产品和样态。人工智能从算法程序处理大数据的基础层,到多模态识别模拟人类体感知觉的感知层,到现在演进为自然语言理解自动生成的认知层,让新闻生产传播朝着智能化、人性化、个性化的方向发展。ChatGPT的出现为探索“人机对话新闻”提供了无限可能,未来在人机互嵌中共塑智能新闻业。
【关键词】人工智能;新闻生产;对话新闻
在不断迭代的智能媒介化浪潮中,新闻传播业态将如何被改写值得学界持续关注。本文之所以把ChatGPT新闻生产称为AIGC特类品种,最根本的原因就是其他任何AIGC都是依赖数据库已有资源加以自动生成内容,而ChatGPT新闻生产则必须从现实世界和场景提取素材,因为“新闻是最新发生的事实报道”。对新闻事实第一手资料的现场获取以及深度访谈调查报道等特殊生产方式,是对ChatGPT的特别考验和挑战。
一、在颠覆中推进:无可抵挡的人工智能作用于新闻生产
(一)以计算机为视角,万物皆可编程
在智能新闻中,万物皆可被编码为抽象数据。智能技术抓取信息主要通过信息采集、数据判断、结果执行三个基本单元完成,信息采集单元负责搜罗计算机可识别电子数据信息,之后传递给数据判断单元进行归类,最后由结果执行单元进行取舍。这样的方法避免了重复采集数据,提升效率的同时确保数据的准确性。智能技术除了利用人类现成的数据库,也有自己的信息采集方式。其一,无人机采集新闻影像。当现场环境极其危险,记者无法靠近时,无人机实时捕捉现场环境影像,传回更加全面高清的视频。比如客机事故、森林火灾、化学品爆炸等紧急危险事件,无人机能实时跟进灾难新闻报道。其二,智能传感器延伸人的视觉、听觉、触觉感官,为全景式新闻提供24小时的新闻素材。封面新闻打造的“智慧内容平台”每日可采集的数据达上千条。传感器技术实现了传统由人赶往事件现场到事件现场向人实时传送的转变。信息采集的智能化大大削减了记者重复劳动的工作量,使记者能够投身到更具创造性的深度报道中去。
(二)计算可能性的穷尽,AI预测新闻强势突围
如何从海量数据中挖掘出有价值的新闻线索是新闻生产的第二个重要环节。传统的新闻生产方式是依靠具备丰富社会经验和知识储备的资深新闻从业人员日积月累的新闻敏感度,人工智能则是利用算法洞察大数据的趋势与异常,美国西北大学教授Nicholas Diakopoulos将其称为“计算发现新闻”。人工智能透过多维数据处理工具预测事件潜在的发展趋势,强大的分析与预测功能推动“AI预测新闻”的强势崛起,这也是对人类分析力、提炼力和预测力的模仿。因为人工智能是对已有资料的挖掘,由于新资料的注入、环境的变化,预测也可能会出现偏差失灵的情况,因此需要人的参与和监督。
数据分析处理过程是AI的机器学习过程,算法模型在分析处理中不断修正完善,数据库由此不断充实。整体而言,数据处理过程是对数据库文本内容的先解构再重构,如此循环往复生成更多新闻故事和扩容数据库的增殖过程。以ChatGPT为例,它的技术信息处理大致也分为三个层次,分别是预料体系、预训练算法模型和微调算法模型[1]。首先,OpenAI公司将从网络渠道搜集到的海量无标注数据利用开源代码爬取、搜集、加工成有标注的优质文本。接着,用预训练算法模型训练ChatGPT,从2018年初代版本GPT-1的5GB训练文本,到GPT-3的45TB训练文本,正是因為OpenAI研发了可以处理巨量训练文本的预训练大模型,才使得ChatGPT-3脱颖而出,甚至引发白领人群的饭碗恐慌。预训练算法模型具备自然语言理解、生成和联系上下文内容的能力,能够根据人类的提示(Prompt)结合特定场景,捕捉语义相似性和关联度特征,输出准确的高质量文本。最后,在预训练基础上,OpenAI公司进一步研发出微调算法模型,赋予GPT-4更强的代码理解、修改、生成能力。ChatGPT是人工智能数据处理技术的卓越进步。
(三)输出大于输入,AIGC的创造性生成
传统新闻的生成,在获取新闻线索后,记者需要投身采访、写作中,而今网络将地球联结成一个村落,人工产出新闻的数量难以满足受众的信息需求,新闻写作智能化大大缓解了新闻供小于求的问题。AIGC不同于传统搜索引擎基于互联网上已有的内容调取预设答案,智能内容生成会根据用户的提问生成新的内容。目前AIGC的类型大致可分为两类:一类是使用预先埋入模板模型,输入素材输出固定模式的规格化新闻类型。中国地震台网的地震报道就是典型的模板模型写作,它的优势在于成稿速度快,不到30秒便能生成分发。另一类是自然语言处理模型,可将采集到的数据转化为“类人话”语言,此技术可对机械化报道进行语言润色,减少机器写作的生硬僵化。ChatGPT采用的是大语言训练模型(Large Language Mode,LLM),并且创造性地运用了人类反馈强化机器学习(RLHF),以至于ChatGPT能快速产出符合人类用语习惯,符合大众基本认知和具有普世价值观的内容。自然语言处理模型是MGC向AIGC转变的结果。有网友试用后批评ChatGPT生成的是“正确的废话”,其实ChatGPT的回答遵循的是类似黑格尔辩证法的逻辑。我们以“AI是否会取代人类及工作”的问题为例让ChatGPT生成一篇“人机关系”的论文大纲,ChatGPT列出的核心主干部分是“AI如何取代人类工作,AI无法取代人类”,各从三个方面论述,最后得出结论“AI与人类合作才是未来”。从这个框架背后可以明显看出ChatGPT正是运用了黑格尔辩证法“正反合”的思维方法。学者张生将此逻辑方式称之为“褶子”,此说法引自法国后现代哲学家“有机体褶子”理论。即论证总是从正反、内外、现象本质等方面同时展开,它们是密不可分的一体[2]。这恰是ChatGPT的优长之处,既保持了内容的相对客观性,又拓展了语言思维的表达方式。
如今AI主播、聊天机器人、语音识别播报助手、数据可视化短视频等智能新闻呈现形式日新月异。文本方面,写稿机器人已经突破前1.0的生成简要通讯类信息的阶段,进入可以依据语法逻辑、算法关联生成带有一定分析的长新闻稿的2.0阶段。图片方面,AI能为报道自动配图,二维图、3D模拟动画等元素的加入增加了新闻报道的生动性。音频方面,已经出现了阅读机器人,自动为视频内容创作音频。视频方面,将抓取的数据生成可视化视频内容,用AI主播播报。如《新京报》用3D动画还原了韩国梨泰院踩踏事故,生成名为《血色万圣节》的动新闻。《人民日报》的AI数字主播任小融出镜了全国“两会”报道。人工智能不但丰富了新闻形式,同时人机的交互性也越来越强。用户对新闻事件的观点、时评也会被抓取成为AI新闻的素材。AIGC的智能是“集成的智能”,用一个公式来表达就是AIGC=UGC+PGC+OGC+MGC,以此建构了新的媒介内容生产格局。
二、“把关”与“使用”的双重精准:人工智能内嵌于新闻分发
(一)“拟主体性”充当“把关人”,赋能AI审核
社会心理学家卢因认为,只有符合群体规范和把关人意见的信息才可流向大众。智能时代把关机制由人向机器转移。用魔法打败魔法,用技术监管技术,开发出人工智能信息核查系统为新闻生产助力。学者吴飞提出记者编辑的把关应该设置三道关卡:事实观、政治关、辞章关[3]。这三道关卡同样也适用于人工智能为智能新闻把关。政治方面,过滤掉敏感词;辞藻方面,语料算法模型自动纠错。这两关比较容易通过,而真实是新闻的生命,事实核查是新闻把关的基础和核心要义。
对于新闻事实的核查有以下四种方式。第一,算法能够追踪一个事件的全过程,同样也能追溯同一新闻不同的信源,将不同信源的信息进行交叉验证便能迅速辨别出新闻的真假。第二,基于图像识别系统对抗虚假信息。图像识别系统可以在海量的图像、影像中快速定位新闻事件的人物信息,从源头阻断不实信息。第三,版权检测系统打击知识侵权行为。版权检测系统的核心技术是区块链,原创作者将作品加密上传到区块链网络,每位作者的作品都有唯一的区块链,如此便将原创文本、影像纳入监管范围之内。第四,舆情仿真系统研判新闻走向。舆情仿真系统是在新闻作品还未发表出来之前,模拟新闻作品可能产生的社会舆论,预判新闻的大致舆论走向,为记者写作内容、角度提供参考。总体而言,事实核查是对新闻质量的把关,AI运用到事实核查中有利于生产出优质新闻。
(二)算法思维介入内容分发,激活长尾效益
传统报纸的新闻生产和分发是相互独立和分离的,智能新闻的生产和分发实现了时间上的同步、空间上的分离。在时间上,智能新闻程序不但能实现自动分发,而且还能依据算法精准匹配需求,从以前的“我找新闻”到现在的“新闻找到我”(news find me)。算法分发提升了用户黏性的同时激活了新闻内容的“长尾效应”。以“今日头条”APP为代表,采用协同过滤算法,一方面搜集用户足迹,多角度描摹用户个人画像,推送符合用户喜好的信息。另一方面搜集用户的社交信息,多维度描摹用户社交地图,在兴趣相投、经验相同的圈子中投放热点新闻。社会网络科学发现,社会广大民众成为网络中的节点,以“己”为中心聚散着新闻信息。人类学家罗宾·邓巴认为自然状态下,人的大脑决定一个人所能连接的社交网络上限是150人。人工智能则拓展了人类的社交连接能力,算法将共同爱好的人聚合在一起形成虚拟社群,实现精准分发。
在空间上,新闻生产系统和分发系统分离,媒体拥有众多发布新闻的渠道。首先,媒体自有的平台自产自销。其次,门户网站、搜索引擎充当搬运工。然后,基于人际关系的社交媒体触发新的分发方式,集直播卖货、兴趣交流、快捷资讯多功能服务为一体。最后,分发平台以算法为媒介连通用户与内容,新闻生产者用算法解读用户需求,用户用算法陈述“我的诉求”。在人—机—内容机制对话下,增强了生产者对受众的理解力,提升了受众“使用与满足”理论下的地位升级,让媒体可以向用户提供私人定制化服務,带领新闻生产传播走进TOC运作模式,也就是生产内容面向个人用户,注重用户的个人体验,这是智媒趋于人性化的体现。聊天机器人的出现,让用户以对话的方式获取新闻成为可能。此外,从用户消费新闻的角度来看,智能移动设备的泛化致使用户无时无刻不处在自由流动的新闻场景中,加拿大学者赫米达将这种始终在线的新闻景观称之为“弥漫新闻”。移动化、场景化、个性化成为智能新闻的代名词。
三、智能化再造:ChatGPT催生人机对话新闻新模态
纵观人类传播史,技术革新不但会带来新闻生产传播流程的变革,而且还会催生出新形态,为新闻业注入源源不断的活力。比如微博、Facebook等社交平台催生了自言自语的“私语式新闻”[4]。各类直播平台催生了演员以线上直播表演的方式向受众展示事件发生过程的“剧场新闻”[5]。如今,ChatGPT对内是可以结合上下文语境与人类进行持续对话的聊天机器人,对外是基于千亿级别参数量训练出来的生成式AI,为人类提供信息服务。自20世纪80年代“信息”这一概念被新闻学引入后,信息实现了与新闻的融合,甚至有学者提出“新闻是新近信息的媒介互动”[6],强调了新闻最基本的功能就是向受众提供信息,这与人机对话在于获取信息的根本目的不谋而合,从此路径出发,ChatGPT将可能催生出“对话新闻”新模态。
(一)智能工业中双向度的人,人—机“对话新闻”
对话(Dialogue)来自希腊语“Dialogos”,意为两个或以上主体之间的谈话、交流。国外苏格拉底采用问答式对话开启教育实践,国内经典著作《论语》用语录体的写作方式阐述儒家思想。学者奥伦·索弗认为“对话”是新闻民主的体现,是相对于长久以来客观新闻规范的另一种思维方式,于2009年提出“对话新闻学”。学者蒋晓丽和李玮认为“对话新闻”崇尚平等协商、相互交流、彼此纠正的精神是对19世纪末实证主义倡导客观、公正原则的反思。李希光教授从国际传播的角度提出对话新闻旨在减少或避免不同意识形态的国家、民族之间沟通交流的屏障与误解[7]。史安斌教授认为新闻是记者与采访对象对话的产物,与“客观新闻学”目的是传递信息给受众的首要功能不同,“对话新闻”旨在引发具有建设性的公众对话[8]。总体而言,对话新闻提倡建立平等多元的公共对话平台。记者扮演着推动社会进步的参与者角色;受众不是“读新闻时代”被动接收信息的“单向度的人”,而是拥有充分表达权、生产权、传播权的“双向度的人”。从技术可供性视角来看,对话新闻对应的是数字媒体主导的“人人都是记者”“多音齐鸣”的新闻传播生态。当智能技术赋能新闻,新型媒介聊天机器人突破“人人对话”模式转向“人机对话”模式,新闻传播理念也需要跳出传统的“以人为中心”的客观反映论视角,走向“人机共生”的主动对话观视角。
ChatGPT面世以来,用户陷入与它持续对话的互动狂欢之中,ChatGPT与人的对话何以产生?ChatGPT有赖于生成式预训练的Transformer模型和对比预训练的Embedding模型。Transformer模型的核心组件是编码器和解码器,解码器的功用是词预测(Next Word Prediction),也就是基于给定文本序列,无监督地预测后续文本,这是ChatGPT能自动生成文本的根源。Embedding模型原理是关联相近文本,推开不相似文本,以完成聚类、分类、搜索等任务。ChatGPT能生成高质量的“人类语言”得益于人类反馈强化学习(RLHF)微调技术,标注者对生成的N个答案进行排序,让ChatGPT的输出文本接近人的表述。关于人机的“对话新闻”实践在ChatGPT引发舆论爆点之初就已出现,多家媒体与ChatGPT实战对话,连篇累牍的报道将ChatGPT推上顶流之路。
(二)ChatGPT震荡新闻传播生态
美国媒介理论家保罗·莱文森提出媒介进化的终极目标是人性化的观点。ChatGPT拟人化的持续对话引发人们对AI未来是否会拥有意识和情感的终极想象,带来“人机”关系的新思考。运用到新闻传播领域,除了可能催生人机“对话新闻”这一新样式之外,还会对整个新闻传播业态产生结构性的冲击。
在新闻生产主体方面,生产简单化、扁平化新闻信息的“劳工型”记者面临被具备计算机知识,精通算法原理的“技术型”记者所取代的风险。技术型记者需要熟练操作人工智能生产传播新闻,同时还能及时处理人工智能故障的问题。ChatGPT介入新闻生产能快速调查被采访者的背景信息,依据被采访者的特性列出采访提纲,甚至加入到采访过程中,同步记录采访者的回答并整理出新闻线索。但是AI目前还存在算法偏见和新闻失实的情况,记者需要承担起幕后监管AI的职责。联合机器人公司首席营销官塞西莉亚·坎贝尔认为大语言模型(LLM)会无差别引用互联网所有可访问的文本,GIGO问题明显,嵌入新闻中加剧深度造假风波[9]。这就需要记者着重把关内容,修正错误的事实和带有偏见的观点。硅基智能体看似给记者职业带来了危机感,实则仍是碳基智能体的产物,从“机之为人”的角度看,人类的主体性不但没有削弱反而增强了。
在生成新闻内容方面,场景化构建得到格外重视与强化,《即将到来的场景时代》一书中揭示未来25年互联网将进入全新的场景时代。各大主流媒体结合智能技术打造智媒应用场景。5G以高速率、大连接、低时延优势解决场景化应用视频卡顿、无法交互和延时加载的问题。新华社建立了“新立方智能化演播室”,在全国“两会”中推出两个真实空间场景虚拟跨屏访谈系列报道。聊天机器人从专注文本对话进阶成文本、图片、音视频等多模态的互动,ChatGPT支持输入图片输出描述,文心一言支持输入描述输出图片。AI接入音响系统打开语音聊天机器人的窗口,接入VR可穿戴设备延伸触觉感官,接入搜索引擎开启智能问答,微软已将ChatGPT接入搜索引擎Bing中,知乎应势发布了“知海图AI”,AI智能问答场景应用将成为新的流量风口。
在算法分发方面,用户提问破除信息茧房。个性化推送算法应用以来,信息围城的问题日益凸显。正如心理学著作《象与骑象人》中所描述的那样,骑象人以为是自己决定了前进方向,但实际上是由大象80%的潜意识和骑象人20%的显意识所共同决定的,如今人工智能就是大象,在人类自主决策中隐性地发挥着越来越大的作用。不同于平台算法静态精准推送的方式,ChatGPT生成内容的分发包裹在一个不断人机交互的动态对话之中,用户最后所获取的信息不是由平台单方面决定,而是在用户自主思考和算法模型计算的双重作用下决定的。这意味着算法判定用户喜好的做法将被逆转,用户自身代表着一种主动选择的机制,以提问的方式反向制约AI完全听命于算法,用户媒介素养的提高还将帮助ChatGPT补充信息,还原事实,平衡观点。在人机多轮对话中,个体加深了对新闻的理解。就用户角度而言,聊天机器人让用户从传统单向度的离身新闻接收转化为双向度的具身人机交互,在对话体验中加深用户身体和情感的卷入程度,凸显人工智能的人性化陪伴功能。
四、结语
人工智能技术的可供性极大扩展了新闻的应用场景,丰富了新闻的表现形式。聊天机器人引领的人机对话新闻,无疑表现出媒介技术与受众本位视角,重视人工智能和用户全程化参与到新闻采集、处理、写作、审核、分发各个流程中去,注重在媒体—人工智能—受众之间建立一个三脚架的多元循环交流关系,增强了媒介、媒体、用户三者之间的理解力、关联性和互动性,全面提升了新闻传播的效能。新闻生产传播业态中,各个环节均可见人工智能的身影。大数据赋能记者脚力,图像处理赋能眼力,机器自动化写作程序赋能笔力,算法模型赋能脑力,全方位延伸了新闻生产者的感官,开启了人机共生共存的智能传播时代。
参考文献:
[1]钱力,刘熠,张智雄,李雪思,谢靖,许钦亚,黎洋,管铮懿,李西雨,文森.ChatGPT的技术基础分析[J/OL].http://kns.cnki.net/kcms/detail/10.1478.G2.20230324.1112.002.html.
[2]张生.ChatGPT:褶子、词典、逻辑与意识形态功能[J].传媒观察,2023(3):42-47.
[3]胡尊栊.人工智能在新闻传播中的应用研究[D].成都:四川省社会科学院,2020.
[4]王建磊.社交型媒体与变形的新闻[J].新闻记者,2010(9):65-69.
[5]田浩,常江.回归社区与重构真实:剧场新闻的理念与实践[J].中国编辑,2023(Z1):105-112.
[6]宁鹏莉,王建磊.作为“对话”的新闻:ChatGPT带来的新闻业态变革可能[EB/OL].https://mp.weixin.qq.com/s/Nz3DAyBxrbEFMJ5QvLV
MyQ.
[7]蒋晓丽,李玮.从“反映论”到“对话观”:论多重语境下新闻的转向[J].湘潭大学学报(哲学社会科学版),2012(6):141-145.
[8]史安斌,钱晶晶.从“客观新闻学”到“对话新闻学”:试论西方新闻理论演进的哲学与实践基础[J].国际新闻界,2011(12):67-71.
[9]张建中.面对ChatGPT,新闻记者不应该有身份危機[EB/OL].https://mp.weixin.qq.com/s/eLyLLV0dkWpS3qph_8-bAw.
作者简介:郝雨,上海大学新闻传播学院教授(上海 200444);文希,上海大学新闻传播学院博士生(上海 200444)。
编校:董方晓