内容、算法与知识权力:国际传播视角下ChatGPT的风险与应对
2023-05-21王沛楠邓诗晴
王沛楠 邓诗晴
【内容提要】聊天内容生成预训练程序(ChatGPT)的兴起带来人工智能内容生成领域的蓬勃发展。但在国际传播层面,ChatGPT通过信息筛选和内容生产影响用户认知,并作为一种新兴且带有霸权色彩的知识权力崛起。从知识权力的视角审视ChatGPT,可以看出它在国际传播中会带来非监督学习状态下的算法歧视风险,监督学习状态下的内容操纵风险,并通过嵌入到搜索引擎和开放API接口成为内容生成领域的数字基础设施,进而造成国际传播中的话语权力风险。因此,需要对ChatGPT在国际传播层面的潜在风险进行有针对性的关注和回应,在数字化、智能化语境下推动构建国际传播新格局。
【关键词】ChatGPT 国际传播 人工智能 知识权力 算法歧视
2022年11月,开放人工智能公司(OpenAI)推出了基于大模型数据训练的聊天内容生成预训练程序(ChatGPT,以下简称ChatGPT)。它一经上线便在一周内达到全球注册用户数量超过100万人次的成就,成为全球最快拥有100万人次用户的数字应用。①与传统的聊天机器人不同的是,ChatGPT基于大模型具有初步的逻辑思维能力,使得它能够实现信息检索、内容生产甚至情感陪伴等多种复杂语境下的人机互动和对话。②
迅猛的用户增长和强大的互动能力,使得ChatGPT迅速引发了国际社会和全球传媒业的高度关注。曾经为OpenAI提供风投的微软则进一步强化了与OpenAI的合作,共同推出了ChatGPT嵌入的新型搜索引擎新必应(New Bing),带来搜索引擎领域的革命性进步;OpenAI则在不久前开放了ChatGPT的API接口,使得全球数字开发者都可以将ChatGPT接入到自己开发的数字应用中。
这一系列举措,推动ChatGPT开始深度嵌入到全球互联网和数字媒介的环境中,成为人工智能生成内容(AIGC)领域具有垄断性的数字基础设施,在国际传播和跨境信息流动的过程中开始扮演日益重要的角色。当ChatGPT通过信息筛选和内容生产影响用户认知,并作为一种新兴且带有霸权色彩的知识权力崛起时,如何在技术驱动的知识和话语权力结构层面理解ChatGPT的出现,对于人工智能语境下的国际传播和中国国际传播能力建设具有重要而迫切的现实意义。
一、作为知识权力的国际传播内容生产
从传媒业的角度来看,无論是新闻报道文本还是影视娱乐内容都包含了知识和观念话语生产的过程。在国际传播中,这种知识和观念话语生产则呈现为议题叙事、国家叙事或者国际体系叙事的建构过程。③从福柯对于话语和权力分析的视角来看,知识生产是一种话语实践行为,(话语)隶属于或来自于同一构成系统的一套陈述,或从属于不同领域但遵循相同功能规则的一揽子陈述,这些规则不仅是语言的或形式的,而且还产生一定数量的具有背景决定性的区分,如理性/非理性、科学/非科学。④
由此可见,国际传播中的价值判断和意识形态并非抽象的概念,而是具体的体现在媒体和公众生产的话语结构中。在不同的话语博弈和冲突的过程中,特定的话语逐渐将自己塑造成为罗兰·巴特所说的“神话”,成为一套被普遍认知和接受的共识性知识。在传统媒体时代,少数西方媒体对于新闻事件的阐释建构了全球受众对议题的普遍认知,而在ChatGPT作为一种“技术神话”出现之后,它所产生的陈述逐渐被视作一种具有影响力和权威性的话语,进入到了国际传播的话语体系生产结构中。
特别是ChatGPT连接搜索引擎并开放API接口之后,它能够隐蔽地嵌入到不同类型的数字应用中,以不可见的方式输出文本和话语。这一过程为全球用户在无形中构建了一套有人工智能生成和输出的知识体系,为公众提供知识的概念和定义从而构建了一种由技术驱动的话语权力。更为关键的是,技术的遮蔽使得用户倾向于认为ChatGPT生成的是客观的现实阐述而非带有价值偏向的主观判断,进而更倾向于认同和接纳其内容,推动ChatGPT所生成的内容演变成一套全球性的公共知识。
当ChatGPT在全球数字平台上得到广泛运用,它就由一个人工智能自然语言处理应用演变成为了具有基础设施性质的话语和内容平台。但在“公共知识”的外表下,ChatGPT内容生产的算法黑箱存在巨大的不确定性,其内容的稳定性和可靠性也备受质疑。当技术权力与知识权力在ChatGPT中形成合谋,需要引发我们对人工智能生成内容技术带来的国际传播话语和知识权力层面的风险给予更多的关注。
二、ChatGPT在国际传播中的多重风险
虽然ChatGPT的出现引发了国际传媒业在信息检索和内容生产领域的革命性变化,⑤但它在技术和内容层面都存在明显的不确定性。当它开放API接口并为搜索引擎和其他内容生产引用提供支持时,ChatGPT所蕴含的算法歧视风险、内容操纵风险和话语权力风险将会逐渐浮现,通过影响用户的信息环境和知识认知冲击既有的国际传播话语体系。因此,需要对ChatGPT催生的不同层面的风险进行密切的关注与深入的剖析。
(一)算法歧视风险
由于人工智能本身并不具有认知和判断,它们对所有问题的理解和判断都源于历史训练数据。因此,基于机器学习算法训练的人工智能存在着由于历史训练数据的偏向引发的歧视问题。⑥这一现象被概括为“算法歧视”。在此前的研究中,学者发现算法歧视会造成刑事司法中风险评估工具的种族偏见、性别歧视以及社会援助资格审查中倾向于惩罚穷人等歧视偏见的存在。特别是在人工智能开始被广泛运用于参与社会决策的背景下,这种技术驱动的歧视会更为隐蔽而普遍地存在。
ChatGPT在本质上也是通过学习算法和数据获取信息并形成判断的自然语言处理模型,因此,ChatGPT同样存在着容易受到训练数据暗含的偏见和歧视的风险。例如ChatGPT所使用的算法模型GPT-3在回答有关穆斯林的议题时,倾向于将穆斯林群体更多与“暴力”相关议题联系在一起,而涉及到犹太人群体时,算法则更多倾向于将其与“金钱”相关议题联系。⑦虽然这些刻板印象在国际社会中广泛存在,但人类社会通常能够给予伦理判断减少此类刻板印象的影响,但对于ChatGPT这样的自然语言处理系统,它们则会略去价值判断直接照搬自己所学习到的语义。由此产生的歧视与偏见可能会在缺乏算法理解能力的群体眼中被视作刻板印象的合法化和正当化。
基于对ChatGPT进行“政治罗盘”(political compass)的意识形态光谱考察,ChatGPT在政治、经济和社会伦理等议题中普遍带有鲜明的左翼自由主义立场,并且在跨文化的议题中倾向于站在“西方中心”的视角思考和回应。⑧由此可见,ChatGPT在未进行人工干预和标记的前提下会显著受到预训练的数据集的影响,在国际议题的内容呈现中则演变为以其核心训练集——西方主流媒体和舆论的话语和态度——作为答案的主题构成。这种算法歧视机制一旦被嵌入到搜索引擎和数字应用中并演变为具有公共性的知识,很大程度上重构和强化了“西方中心”的观念和视角,对于建立国际传播话语结构的新秩序构成威胁。
(二)内容操纵风险
ChatGPT在推出前更多接受的是无监督学习,即没有人工干预的自主学习过程。但《时代》杂志记者比利·培瑞克(Billy Perrigo)在调查后发现,ChatGPT正在肯尼亚雇佣一批外包数据标注工人,以每小时不到2美元的时薪要求他们参与ChatGPT生产内容准确性和伦理合法性的标注。⑨这意味着ChatGPT所输出的内容事实上是可以被操控和影响的,通过赋予特定内容优先级和显著性的差别,ChatGPT能够控制对于特定问题的回答。一旦ChatGPT被利用于进行内容层面的操纵,可能会在隐蔽的情境下实现对于用户观念和态度的操纵。
此外,ChatGPT的人机协同性和不能判断对错的特性,可能会导致认知固化和态度极化的风险。ChatGPT相对于其他语言模型的显著优势在于ChatGPT可以实现连续性的人机协同,用户可以在个人账号中保存人机对话记录,并基于该记录达成长期连续性对话,从而提升人机协同的效能。⑩但是ChatGPT高度依赖文本和用户的指令(prompt),因此容易受到用户影响。在对ChatGPT进行政治倾向测试时,即使最初得到了相对中性和客观的回答,但只要用户对结果进行质疑和引导,ChatGPT就会放弃原有答案提供符合用户引导价值观方向的答案。当用户开始对ChatGPT进行人工干预训练之后,与技术的互动可能会强化具有偏见性的认知,进而加深态度极化的趋势。
最后,作为具有公共性质的知识和内容生产工具,ChatGPT的私人所有的特性可能在传播中带来内容操纵的风险。在商业利益层面,ChatGPT的所有者始终是OpenAI而非全球用户。即使长期以来标榜非盈利和社群共识协商驱动的维基百科(Wikipedia)都不可避免地陷入到對于词条解释权的意识形态的争论中,ChatGPT无法避免在触及到私人利益的时候陷入价值困境。11特别是当ChatGPT作为搜索引擎和API接口进入全球互联网空间中,带有公共知识属性的基础设施与技术和产品私人所有之间必然会产生直接的矛盾。12
(三)话语权力风险
从预训练模型中衍生出的算法歧视风险和从人工干预中衍生出的内容操纵风险共同构成了ChatGPT在国际传播层面最为关键和直接的风险:改变国际传播内容生产和知识传播的话语权力结构。传统的国际传播格局中,国际媒体和社交媒体平台主导了国际传播的话语和叙事生成。但ChatGPT作为以内容输出为核心目标的人工智能算法,其出现以及对全球互联网的深度嵌入,将会引发算法权力驱动话语权力转变的挑战。
ChatGPT通过预训练、人工监督标记数据、专家调整模型、用户互动等一系列程序生成内容并构建知识,在不受政府和市场完全控制的制度之下,向全球的用户输出内容和知识。这种知识在多数认同的情况下成为公共知识。根据福柯对于权力的阐释,这种公共知识和权力结构同样密不可分。在ChatGPT迭代演进的过程中,种族歧视、性别歧视等歧视或偏向性内容不断在既有的预训练内容与用户生产的对话文本之间博弈,可能会对原有的偏见歧视内容产生一定的修正,但它从整体上来看仍然是全球互联网的主导意识形态——“西方中心主义”的投射。
ChatGPT的内容生成是一种重要的话语实践行为,通过文本和话语的生产影响着人们看待世界的行为方式。因此,作为知识生产者的ChatGPT具有话语建构的权力,其内容生产的行为既是政治性也是社会性的知识建构行为。在国际传播中,对于关键概念的界定和意识形态的偏向会影响到个体对他国的认知和判断,从而影响他国的形象,ChatGPT所具有的话语权力将成为国际传播中的风险来源,然而这种偏向在技术的华美包装下,隐匿在日常的使用中。依赖于ChatGPT的用户,可能会在无意识的情境下受到ChatGPT的影响,形成技术驱动的价值渗透。
三、ChatGPT与国际传播新格局的风险应对
面对ChatGPT带来技术驱动下国际传播话语权和传播机制的转型,我们需要在国际传播层面进行有针对性的关注和应对。首先应提高人工智能媒介素养,避免路径依赖,警惕意识形态渗透。ChatGPT在其人工智能的技术包装背后,存在着算法歧视和内容操纵的风险,同时这种风险伴随着意识形态的偏见。若全球互联网用户在未来对此应用形成资料收集与处理的路径依赖时,“西方中心主义”的意识形态必将在中文学习规模扩大后或缺乏监督的情况下形成渗透。因此,需要对ChatGPT为代表的西方人工智能应用保持警惕,避免陷入技术包装的意识形态渗透的陷阱中。
其次,在解构西方话语权力陷阱,掌握在国际传播中的“麦克风”方面,应积极引导中国互联网企业主动纳入国际视野,开发本土全语种智能语言模型应用。目前,中国主要互联网企业都接连宣布未来将测试并推出人工智能驱动的聊天机器人应用。但大多旨在构建面向本土受众的中文服务,忽视了更大规模的国际用户。应当引导和鼓励本土互联网企业在绘制产品服务蓝图时主动纳入全球视野长线布局,在全球多语言舆论场中构建中国自主技术体系,纠正“西方中心主义”的偏颇话语生态。
最后,作为新兴的媒介传播形态,ChatGPT为代表的人工智能生成内容(AIGC)尚处于混沌未开的状态中。全球范围内围绕技术标准、技术伦理等问题的讨论则方兴未艾。作为国际传播话语权的重要组成部分,技术规则层面的话语权亦具有相当分量。政府和互联网企业应当积极参与人工智能生成内容领域的国际对话,创新发展内容人工智能生成内容的技术能力,提高内容生成的准确性和速度。同时尽快开放API接口,引导国内外数字平台接入使用。一方面在技术能力上实现与西方国家的接近与并轨,另一方面注重参与相关技术规则和伦理标准的建立,为我国相关技术的发展和未来技术在全球范围内的广泛应用提供良好的制度和政策环境。
四、重思作为知识权力的ChatGPT
2023年3月15日,OpenAI发布了最近一版的预训练大模型——GPT-4。相比于ChatGPT所依赖的GPT-3,GPT-4超越了单纯文字层面的人机对话,实现了图片、视频、音频等多模态内容的识别和互动。这使得OpenAI在人工智能生成内容领域又向前迈进了一大步。本文从知识生产的角度探讨ChatGPT作为知识生产工具,在国际传播中的可能存在的风险,具体表现为非监督训练模式下的算法歧视风险和监督训练模式下的内容操纵风险。在算法歧视和内容操纵的语境下,ChatGPT作为一种公共的知识生产工具可能带来一套有技术操纵和驱动的话语权力转型,进而对当前的国际传播内容生产和知识生产结构形成冲击。
除此之外,ChatGPT与必应(Bing)搜索引擎的结合及其API接口的开放,虽然在信息检索和生成的效率上带来了革命性发展,大大提高了内容搜集和整理的便捷性和效率,但技术的双刃剑效应使得我们不得不警惕ChatGPT在嵌入到搜索引擎和数字应用之后可能带来的、被技术遮蔽和掩盖的“西方中心主义”式不平等话语的再生产。当它被冠以“人工智能生成”或“系统自动输出”的名号后,会隐蔽地影响到缺乏算法素养的受众的认知,进而冲击和影响国际传播中本就处在不利地位的全球南方国家的地位。
因此,需要从技术祛魅的视角理解重新审视ChatGPT的兴起,理解ChatGPT的内容生产和信息检索实质是嵌入到一套由算法技术和既有国际传播偏见性话语整合而成的知识权力体系内,并充分理解ChatGPT的普及可能对于国际传播中的内容、知识和话语形态的直接影响。基于此,一方面应当密切关注ChatGPT可能对既有国际传播格局带来的挑战和对于全球南方国家带来的风险,另一方面则需要大力推动国内人工智能生成内容技术的发展与产品的革新,在数字化、智能化语境下推动国际传播新格局的有效建立。
王沛楠系清华大学人文学院讲师,伊斯雷尔·爱泼斯坦对外传播研究中心研究员;邓诗晴系清华大学新闻与传播学院硕士研究生
「注释」
①ChatGPT sets record for fastest-growing user base - analyst note. By Krystal Hu https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-userbase-analyst-note-2023-02-01.
②何天平、蒋贤成:《国际传播视野下的ChatGPT:多元场景与多维交互》,《对外传播》2023年第3期,第64-67页。
③史安斌、廖鲽尔:《国际传播能力提升的路径重构研究》,《现代传播(中国传媒大学学报)》2016年第10期,第25-30頁。
④朱振明:《福柯的“话语与权力”及其传播学意义》,《现代传播(中国传媒大学学报)》2018年第9期,第32-37、55页。
⑤王沛楠、史安斌:《“持久危机”下的全球新闻传播新趋势——基于2023年六大热点议题的分析》,《新闻记者》2023年第1期,第89-96页。
⑥Barocas, S., & Selbst, A. D (2016) Big Datas Disparate Impact., California Law Review, 104(3), 671–732, DOI: https://doi.org/10.15779/Z38BG31.
⑦Abid, A., Farooqi, M., & Zou, J (2021) Large language models associate Muslims with violence., Nature Machine Intelligence, 3(6), 461-463, DOI: 10.1038/s42256-021-00359-2.
⑧《人类“3. 0”意识形态战场——C h a t G P T的政治化终局C h a t G P T的价值观及立场(四)》,腾讯网,h t t p s: // m p.we i x i n . q q. c o m /s / kx8HyZ1NWzuaibm7P3f0wQ0,2023年3月8日。
⑨Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic. By Billy Perrigo. https://time.com/6247678/openaichatgpt-kenya-workers/.
⑩史安斌、刘勇亮:《聊天机器人与新闻传播的全链条再造》,《青年记者》2023年第3期,第98-102页。
11甘莅豪:《规约与博弈:维基百科自组织知识编纂中的命名政治》,《新闻与传播研究》 2022年第12期,第53-69页。
12王沛楠:《跨国数字平台的基础设施化:结构转型与规制》,《青年记者》2022年第21期,第96-98页。
责编:霍瑶