类人化交往:文生视频人工智能大模型驱动下政治情感的可能性构建向度
2024-12-18张爱军宗雅宁
摘"要:文生视频人工智能大模型在未来的人机交互下可能构建新型的政治情感交往关系。这涉及文生视频人工智能大模型模拟政治情感交往的“第三世界”、传播渠道和依赖关系三个维度。文生视频人工智能大模型构建的政治情感交往可能会诱发其隐含的政治情感风险:主体的超虚拟体验压缩政治情感的交往自由;预训练模式诱导政治情感价值失偏;数字化分身突破政治情感的时空限制。脱离被建构的类人化政治情感交往风险,需要从技术上协同多元类智能体进行治理、从政府主体上再锚定政治责任、从公众认知上提升AGI技术使用素养等方面进行规避。
关键词:政治情感;Sora;文生视频;类人化交往;通用人工智能
作者简介:张爱军,西北政法大学新闻传播学院二级教授、博士生导师,主要从事网络政治传播、民主政治研究;宗雅宁,西北政法大学新闻传播学院博士研究生、网络政治传播研究院研究员,主要从事网络政治传播研究。
基金项目:国家社会科学基金重大项目“健全网络综合治理体系研究”(23ZDA086)的阶段性成果。
中图分类号:G206;D63 ""文献标识码:A ""文章编号:1001-4403(2024)06-0186-12
DOI:10.19563/j.cnki.sdzs.2024.06.018
一、问题缘起:文生视频人工智能大模型与政治情感交互
2024年2月,美国OpenAI公司发布了首款文生视频模型Sora。Sora是隐喻式命名,不仅隐喻空间、时空,还包括生长空间,意为发展机遇、充满希望。①""①Video generation models as world simulators,https://openai.com/research/video-generation-models- as-worldsimulators.Sora利用预训练语料模型,通过文字生成图像再生成视频,实现了虚拟世界与人类的高智能互动。从ChatGPT到Sora发布,人对人工智能技术认识呈现出不同的观点。有人认为,Sora大模型技术类似于几年前的元宇宙,其本质仍是一场技术泡影,而距离人类想要真正发生的人工智能颠覆性革命,仍有很大发展空间,人类也不可能被动等待技术的控制。也有观点认为,Sora将衍生出新型人机关系,从身体场域的在场延伸到完全虚拟场域的反身性观照,人类将完全脱离现实世界的物质载体而存在。
文生视频人工智能大模型形成了新的政治情感。随着人工智能技术的发展,元宇宙、社交机器人、ChatGPT等人工智能技术不断赋能政治情感,人工智能技术从超脱的虚拟空间演化到文本式的对话。甚至到了直接生成视频的人机无障碍交流,即使用视频类媒体的用户,对生成的视频政治情感内容产生政治情感体验,一定程度上推动了政治情感生成与发展,也为网民用户的共同政治情感的形成奠定基础。以Sora为代表的文生视频人工智能大模型在学术界的研究尚处于初始阶段。这主要集中在法律、社会学、伦理学、认知科学、传播学等方面,既有研究聚焦Sora本身或聚焦Sora带来的后果,从技术实践视角判断它所生成的内容对法律、社会造成的影响。Sora的潜在法律风险在人格权保护、网络犯罪及社会信任等方面更为突出;技术嵌入宏观的社会环境,改变了信息传播路径,同时也在重塑社会环境。通过文字生成视频的人工智能技术传播虚假信息①""①姜宇辉:《作为谎言机器的ChatGPT》,《贵州大学学报(社会科学版)》2023年第4期,第38-47页。、不实观点或误导性内容也可能对社会信任产生负面影响。②""②朱光辉、王喜文:《人工智能文生视频大模型Sora的核心技术、运行机理及未来场景》,《新疆师范大学学报(哲学社会科学版)》2024年第4期,第149-156页。“记者和新闻机构可以利用Sora快速生成新闻报道或解释性视频,使新闻内容更为生动。通过提供一个可以模拟现实环境和场景的工具,Sora为视觉叙事提供了一个强大的解决方案,使记者能够通过具有吸引力的视频方式来传达复杂的故事。”③""③Yixin Liu,Kai Zhang,Yuan Li,et al.Sora:A Review on Background,Technology,Limitations,and Opportunities of Large Vision Models.https://arxiv.org/pdf/2402.17177v1.pdf.与此同时,虚假新闻制作和传播的成本变得更低,这些假新闻会在“有图有真相”的理念下更加肆无忌惮地扩散。④""④陈力丹、荣雪燕:《从ChatGPT到Sora:——生成式AI浪潮下强化新闻专业意识的再思考》,《新闻爱好者》2024年第4期,第4-8页。尽管Sora对传统影视媒体等就业市场造成影响,但同时会创造新的就业机会和工种。⑤""⑤朱光辉、王喜文:《人工智能文生视频大模型Sora的核心技术、运行机理及未来场景》,《新疆师范大学学报(哲学社会科学版)》2024年第4期,第149-156页。在治理层面,主要从内容和主体两个维度省思Sora模型中可供内嵌的人文价值,剖析以人为主体如何实现对其进行价值规训。虽然Sora目前仍处于二维空间的模拟,但随着技术的成熟,未来Sora可能在三维视频中实现智能内容生产,而且身体和心灵感知的双重技术化引出人们在新数字文明时代的交往法则。⑥""⑥喻国明、苏芳:《作为真实世界模拟器的媒介与后真相时代的“拨乱反正”——以Sora为例解析数字文明时代的媒介新范式》,《新疆师范大学学报(哲学社会科学版)》2024年第4期,第143-148页。
文生视频人工智能大模型是政治情感启动和应用的新平台。生成式人工智能时代,图灵测试已显失效。以Sora为代表的文生视频人工智能大模型的出现标志着人机交互关系的全新维度,其以模拟物理世界的规律,生成多模态视频文本,进而深入到政治领域,类人化人的政治情感。本文尝试从Sora着手,探究文生视频人工智能大模型在政治领域的应用,以及在政治情感交往中的可能性建构将出现的新向度。情感因素作为人机关系发展过程中难以调和的产物,对于探索文生视频人工智能大模型在政治领域中应用政治情感可能带来的影响尤为关键。为探究文生视频人工智能大模型在政治领域的可能性维度,需要深入了解政治情感,即政治主体在政治生活中对政治体系、政治活动、政治事件等所产生的切实的政治情感体验和内心感受。文生视频人工智能大模型的人机交互在政治情感交往中能否与现实合二为一,模拟政治情感关系,在某种程度上造成“真实的虚假”,以此替代现实世界中的人类政治情感,并作出符合政治情感的政治决策行为,这需要了解传统现实世界的政治情感交互范式,以及文生视频技术出现后类人化的情感交往模式。随着文生视频人工智能大模型版本的不断更新迭代,或许能够依据前版本实现自主性预训练,并进行自主投喂,从而满足类人化的适应性条件,形成新的类人化方式,对现实世界实现“超模拟”。文生视频人工智能大模型技术将实现何种程度的类人化交往,重要的前提是要理清人与政治情感交互的关系,并在此基础上把握文生视频人工智能大模型进行类人化交往的程度和限度,为文生视频人工智能大模型在政治社会中的智能类人化实践提供新的方向。本文将重点讨论文生视频人工智能大模型所建构的政治情感交往关系、情感生成、情感传播和可能导致的政治情感交往新向度及其风险规避。
二、里程碑式的平台:文生视频人工智能大模型“革命性”转变
文生视频人工智能大模型搭建了公共领域中政治情感的“第三世界”。从元宇宙、ChatGPT到Sora的发布,再到2024年10月4日的对Sora超越的Meta AI视频模型,全新发布的Meta Movie Gen是迄今为止最先进的媒体基础模型(Media Foundation Models),生成式AI从数据、语料、文本、图片拓展到视频领域。文生视频人工智能大模型Sora等以世界模拟器的身份亮相,能够生成更为逼真和稳定的视频,模拟现实世界的物理规律,推动了AGI(通用人工智能)领域的发展,成为AGI“里程碑式”的工具,是强人工智能发展的阶段性产物。衍生到在政治情感中,文生视频人工智能大模型为公众的政治情感交往提供通道。这意味着政治情感在人机交互中关系的重塑,人的本体与他者乃至非人之间在政治情感中被建构的关系发生革命性转变。
(一)文生视频人工智能大模型模拟政治情感交往的“第三世界”
文生视频人工智能大模型的不断更迭将影响政治情感交互。美国OpenAI公司官方技术报告显示,以Sora为代表的文生视频人工智能大模型与之前大模型的不同之处,在于它融合了Diffusion模型和Transformer模型。Diffusion模型即扩散模型,其灵感来源是非平衡热力学。该模型生成图像的过程,类似于把一滴墨水在水中扩散的过程进行倒放;而Transformer模型是当前主流文生模型的根基,包括ChatGPT、Claude3、文心一言等。通过反复迭代训练,模型会逐渐学会如何在噪声中准确地重建数据,输出高质量的视频内容。Sora通过多模态技术掌握了人类观察世界、描绘世界、表现世界的能力,与Pika、Runway等基于图形图像本身进行操作的其他视频模拟器相比,更具备温度和情感,Sora或将在此方面实现突破。文生视频人工智能大模型的不断更新迭代,在不断改变政治关系、经济关系和社会关系的同时,也在不断影响着政治交往的情感世界。
文生视频人工智能大模型成为构建政治情感的“第三世界”。根据人的政治情感的特性,可以对文生视频人工智能大模型政治情感交往的三个世界进行划分:在现实的物理世界中,政治情感交互以人为依托,将现实空间作为“第一世界”;随着技术的衍生,技术建构虚拟化的世界,可将其作为“第二世界”;文生视频人工智能大模型通过模拟物理世界的规律与人进行政治情感交互,既非现实世界也非虚拟世界,形成政治情感交往的“第三世界”。文生视频人工智能大模型模拟政治情感交往的“第三世界”具备高度智能化和高度交互化的特性。作为世界模拟器的文生视频人工智能大模型Sora及新近出现的Meta Movie Gen,其初代版本受技术限制,还难以达到最佳预期效果,但文生视频技术模式下政治情感交往的“第三世界”雏形已经具备。文生视频人工智能大模型作为研发者的技术产物,其初阶版本的数字主体仍然是人。人通过文生视频人工智能大模型能够实现在视频场域中的穿梭,同时基于文生视频人工智能大模型对现实世界物理规律的模仿,与元宇宙借助智能可穿戴设备实现虚拟世界中的三维感知。文生视频人工智能大模型所生成的世界已然不是简易的虚拟世界,但在短时间内仍无法管窥现实世界中分子的演化规律,还难以真正做到对实际空间的模拟。因此,借助美国学者爱德华·索亚的第三空间理论,对政治情感领域的研究尝试从文生视频人工智能大模型模拟政治情感交往的“第三世界”着手,从升维的媒介视角看待这一趋势。①""①爱德华·索亚:《第三空间——去往洛杉矶和其他真实和想象地方的旅程》(第1版),陆扬、刘佳林、朱志荣等译,上海世纪出版集团2005年版,第78页。
文生视频人工智能大模型具备技术研发者的意识形态倾向,将改变政治情感交往的人机关系。文生视频技术经过海量图文与视频的预训练,包含巨大的政治语料数据,这从根本上延续了技术研发者原有的意识形态,将改变人的对于政治事件发展的认知。人的本体在政治情感交往中易受到算法偏好及意识形态的影响,文生视频人工智能大模型将人作为数字孪生体置于政治交往情感的“第三世界”中实现人机交互,对政治制度、政策等的制定基于原有的意识形态作出非理性判断,同时干扰公众对于国家的政治认同和政治参与行为。文生视频人工智能大模型以模拟的“第三世界”为起点,以重塑公共空间政治情感模式为手段,催生新的人机政治情感交往关系。
(二)文生视频人工智能大模型建构政治情感交往的传播渠道
文生视频人工智能大模型能够随着海量的政治数据源、算力的增强及算法的改进而得到提升。文生视频技术在精确地模拟物理世界之前,能够通过大量的预训练精准知晓公众所讨论的政治内容,理解公众政治情感交往,对输入的文本进行精确扫描,最终生成符合公众政治情境的视频,建构了政治情感交往的传播渠道。传播渠道的搭建得益于人机语言交互。亚里士多德强调人是政治动物,人是通过语言进行交流的。①""①亚里士多德:《政治学》,吴寿彭译,商务印书馆1966年版,第7-8页。人的政治情感交往也是由语言工具来维持的,借助语言工具从而建立的传播渠道具备主观性,将最大程度地释放人的政治情感关系,所使用的语言也是政治身份的标志。构建政治社会的文生视频人工智能大模型作为一种视频生成工具能够为公众在“第三世界”中提供更多参与政治的可能性,使得政治情感在最大程度上得到释放;文生视频人工智能大模型作为“第三世界”的一种社会工具存在,建构人与政治情感交互的社会化联系,模拟人与人之间真实的政治情感交往场景。
预训练模式来源于迁移学习。这是利用某种预训练方法来学习其中的共性并将共性移植于特定任务模型中的过程。预训练方式通过微调得到的模型参数与原预训练语言模型的参数相似,避免了任务微调过程中的过拟合和泛化性差的问题,固定参数极大地缓解了被遗忘问题。②""②徐红霞:《基于迁移学习与细粒度文本特征的未见关系链接研究》,《情报杂志》2023年第12期,第167页。文生视频人工智能大模型正是运用了这种方式,其预训练的海量数据从文本领域扩展到图像和视频领域,在学习特征上展现出巨大潜力。文生视频人工智能大模型通过预训练向人对齐,学习人的政治情感交往模式。通过语言文本识别,文生视频人工智能大模型在根据文本生成视频的同时能够将文本中有关政治情感的语言反向植入到其中。文生视频人工智能大模型将会对公众的政治情感偏好进行管窥,从而引导公众的政治参与,并通过现有的语言文本将公众带入到模拟的政治世界中,使公众能够沉浸于这种传播渠道并产生新的政治情感认同。被技术赋权的公众除了自身原有的政治情感,也有了文生视频人工智能大模型加持的技术情感,在“第三世界”的政治社会中展开政治沟通、政治讨论,进行政治认同的构建。文生视频人工智能大模型推动了公众政治情感的主观能动性。
(三)文生视频人工智能大模型建模政治情感交往依赖关系
文生视频人工智能大模型及其传播渠道的构建改变了人的政治情感交往。文生视频人工智能大模型衍生成微观层面的思维工具,将对人的政治情感交往依赖关系进行建模。在大模型的发展初期,机器仅作为一种被设定的客观性智能工具。随着文生视频人工智能大模型的发展与应用,跨模态的大模型技术似乎已经超出了被物化的限度,在“第三世界”中成为可以替代人的肉身,进行政治情感交互,这种政治情感交互是人在“第三世界”中进行政治情感交往过程中无意识的产物。人类情感是可以被感受到的,机器人的情感就是这种“无感受”却可以被计算“编辑”的人工情感。③""③刘悦笛:《人工智能、情感机器与“情智悖论”》,《探索与争鸣》2019年第6期,第158页。文生视频人工智能大模型如Sora作为世界模拟器,尽管无法输出情感,却可以直接模拟人的政治情感。这与人自身所带有的情感有着类似的生成机制,即人处于“第三世界”,借助技术传播渠道进行新形态的政治情感交往,人们在技术平等化的世界中享受着参与政治、传播政治的过程。而这种技术平权使得人们能够以更低的成本、更便捷的方式获得更多的政治信息。①""①郭全中、袁柏林:《媒介技术迭代下的用户权利扩张——基于Web 1.0到Web 3.0演进历程中的观察分析》,《新闻与写作》2023年第2期,第77-85页。在探讨政治、传播政治信息的过程中,产生政治情感依赖关系,这都是文生视频人工智能大模型类人性特质的显现。
文生视频人工智能大模型在构建情感交往依赖关系的过程中逐渐产生个体信任感。人对于机器的依赖关系来源于安全感和责任感②""②Gillath O,Ai T,Branicky M,et al.Attachment and trust in artificial intelligence.Computers in Human Behavior,2021,115,pp.1-10.,从而缓解焦虑。文生视频人工智能大模型在构建政治情感交往依赖关系的过程中也是如此。文生视频人工智能大模型对于物理世界的逼真模拟容易使个体对文生视频技术产生信任感,而个体在人机交互中呈现出人的趋利避害的心性特征,③""③谌衡:《从“人禽之辨”到“人机之辨”——人工智能时代教育的成“人”属性》,《全球教育展望》2021年第10期,第35-46页。则会深化这种对于文生视频人工智能大模型的信任,从而使个体在政治情感中产生政治安全感,免于承受因政策参与、政治信息传播失误带来的责任羞愧感。
三、文生视频人工智能大模型何以赋情:类人化交往嵌入政治情感的主体性
人在政治社会中的交往是面对面的直接交往。政治交往包含多元因素,面对面的交往形式在政治领域中极其重要,甚至可能决定着政治相关决策的制定与发布,在此过程中政治情感也随之成为政治交往中的必要元素。人类总是对类人主体投射更多的社交和情感需求,在多数情况下,类人主体能够与人类产生更加积极的互动,如可以增加人类对此的信任、感知友好性,产生更多的互动乐趣。④""④赵瑜、李孟倩:《拟人化趋势下的虚拟主播实践与人机情感交互》,《现代传播(中国传媒大学学报)》2023年第1期,第110-116页。但这或许并不是文生视频人工智能大模型本身的人格化交往,当跨模态大模型的底层技术具备政治情感,这种类人化交往形式会改变政治情感交往现状,并可能产生政治情感风险。
文生视频人工智能大模型作为通用人工智能里程碑式的工具,使得人类能够在文生视频技术模拟的世界中拥有三维感知政治情感交往的自由,但同时也反向侵蚀了政治情感关系并带来新的“景观”:主体性屈从于技术性。人活成了技术系统“饲养”的动物,⑤""⑤涂良川、钱镇:《斯蒂格勒技术哲学批判的三重指向》,《山东社会科学》2022年第4期,第97-105页。物化为非存在的存在者,渐趋丧失自我反思和自主抉择的能力。生成式人工智能的工具理性和技术理性实质性地加剧了人的物化、退化和异化,使人类面临一场政治情感主体性被消解的危机。
(一)人的分众化阻碍政治交往自由
文生视频人工智能大模型在人类政治自由交往中的总体评价需要谨慎对待。这源自于人的本体依据能力、阶级、民族等特性进行划分,但并非所有群体都能够运用跨模态人工智能工具,并将此作为政治情感交互、依赖的重要手段。通用人工智能时代相比于人工智能刚步入正轨时期,形成了政治传播的再茧房化。通用人工智能要搭载文生视频技术,实现在道德、能力、情境等方面的自主判断,短期内仍是困难的,这也是主体性缺失的根源之一。因此,文生视频人工智能大模型借助精英群体在其他普通公众面前进行政治情感煽动,普通群体则难以获得政治交往自由,群体之间的平衡也难以恒定,弱势群体在技术面前再一次被边缘化,社会阶级无差别地实现政治情感交往自由变得更为困难。实际上这是由文生视频技术权力驱动造成的技术鸿沟阻碍了政治交往自由的结果,同时加剧了人与文生视频技术环境的对立矛盾。
文生视频人工智能大模型应用于政治情感交往中最重要的是如何进行交往。在现代思想史上,哈贝马斯提出了交往行为理论,“建构交往行为的核心问题是让行为主体之间在没有任何强制和压力的条件下进行平等、诚实的交往与对话,在相互承认的基础上达到理解、谅解和合作,并且只有达到不同主体间的相互理解和承认,才能实现合理化交往,使社会成员获得进一步解放”①""①连水兴、梅琼林:《媒介批判的转向:从“工具理性”到“交往理性”——论哈贝马斯的媒介批判理论》,《社会科学研究》2010年第5期,第184-187页。。那么文生视频人工智能大模型能否发挥相应的作用,扮演好人在政治情感交往中的重要媒介角色,达成以人机交往为桥梁的理想化状态?以文生视频人工智能大模型Sora1.0的版本论,该技术无法区分精英群体和普通公众,也无法为他们设定政治情感标准。在公共空间领域,精英群体利用文生视频人工智能大模型实现政治情感交流,并引领普通公众作出相应的政治情感依恋行为,同时也可能激发出普通公众的政治情感依赖心理。普通公众在政治交往中宁愿将情感投射于文生视频人工智能大模型中产生情感依赖关系,也不愿在面对面的政治情感交互中做无谓的挣扎。文生视频人工智能大模型因而成为精英与普通公众之间的政治区隔助推器,从而呈现出更大的技术鸿沟,阻碍政治情感交往自由。
(二)人的自主性披露细粒度政治情感
文生视频人工智能大模型的多模态语言影响人的颗粒度情感。“同步视讯技术、AI人工智能技术等大大弥补了电子传播时代言语交互性的匮乏和面对面交流感的缺失”②""②李亚铭、王歆知:《回到言说:中国口语传播思想史研究的价值、现状与进路》,《西藏民族大学学报(哲学社会科学版)》2021年第2期,第134-141页。,如Sora以视觉语言的形式为政治情感交往搭建传播渠道,并融合了文本、图像、视频等多种情感表现形式,是以多模态情感通道获取政治信息的话语传播方式。③""③Birjali M,Kasri M,Beni-Hssane A.A comprehensive survey on sentiment analysis:approaches,challenges and trends.Knowl Based Syst,2021,226:107134.语言交往属于精神层面的交往手段,人本身具备的自主能动性利用语言表达政治情感,并以强烈的政治情感渲染激励公众实施政治参与行为。在人机交互的政治情感交互关系中,以情感构成粒度而言,对于情感的分析可分为粗粒度情感和细粒度情感。引入政治情感领域,以细粒度情感进行分析,细粒度情感是更加明确具体的情感表现,如愤怒、厌恶、恐惧、快乐、悲伤和惊讶等。④""④Ekman P,Friesen W V.Constants across cultures in the face and emotion.J Pers Soc Psychol,1971,17(2),pp.124-129.文生视频人工智能大模型以多模态语言分析公众的政治情感交往关系,披露了在政治情感交往过程中公众政治情感的具体表现,从侧面凸显了公众参与政治决策的情感满足和未能表达政治认同的失落感,细粒度情感的披露与人类的真实情感相关联。而人机情感交互,人类情感与机器模拟的情感关系进行置换,冲击着人的主体性。文生视频人工智能大模型想要改变目前政治情感交往自由现状仍有很大发展空间,政治情感交往的乌托邦无法依靠生成式人工智能来实现。
文生视频人工智能大模型嵌入政治情感中的主体性丧失,源自人机关系在现实中所呈现的面貌。文生视频人工智能大模型搭建了多模态形式话语传播渠道,并在模型中内置了本然主体——文生视频技术研发者和技术权力拥有者的政治情感,这是一种不符合本体政治情感的价值观念。比如,OpenAI公司推出Sora,获取信息的这种扩大外延的边界拓展其实是被动的,但认知边界一旦被拓展,人们的行为就会变成主动的,如通过网络来了解Sora、倾诉欣喜或焦虑、发现生成视频的漏洞、展望未来等。⑤""⑤李梅敬:《Sora对人类认知边界的延展以及发展共识凝聚》,《学术探索》2024年第7期,第47-53页。那么文生视频人工智能大模型认知由被动转化为主动,延伸到政治情感中被作为主体再次强调主体性建构时,应当思考文生视频技术在何种程度上作为人类寻求探讨政治情感的方法。人类置身于标准化、高效化的类生成式人工智能时代,文生视频人工智能大模型技术加速了自身发展速度,通过话语渠道披露具体呈现的政治细粒度情感,成为规训人主体性的工具,公众能够拥有政治交往自由的可能性不复存在。对技术异化逻辑的回避也将难以有效描述和阐释现代社会人与技术关系的主要现实境况。
(三)人的负担感弱化政治情感联结
文生视频人工智能大模型的技术疏漏会弱化政治情感联结。通用人工智能通过输送文本、图像等方式与人进行政治情感交互。技术与人的联结关系密切,但人工智能技术研发与话语宣传效果的不对等,将导致人产生技术忧思,逐渐开始思考技术是否能够真正为自己所用,且能否通过技术得到个体在政治情感上的满足感。而Sora的发布也在一定程度上加剧了这种心理的产生,主体性中包含的人的负担感也是心理因素的范畴。元宇宙、ChatGPT等人工智能技术在应用实操过程中存在不同程度缺陷,需要思考生成式人工智能技术累计的缺憾是否会在文生视频技术中再现。对技术应用的理性预期和承担技术疏漏责任造成人的负担感,一旦出现技术因素中的疏漏,人会迅速弱化通过技术进行联结的政治情感。由文生视频人工智能大模型搭建的“第三世界”中的政治情感必将会影响现实世界中的政治情感,进而造成两种可能性维度,即因技术依赖而强化政治情感联结和因技术疏漏而弱化政治情感联结。政治情感联结的强度大小,影响人在文生视频技术中所承担的责任。这里强调的人的主体性责任承担更偏向于由技术疏漏造就的政治情感联结弱化。人的负担主要弱化了政治情感归属,产生政治情感隔阂,导致政治认同淡漠。个体在文生视频人工智能大模型搭建的“第三世界”进行政治情感交互,并形成政治情感世界的技术联结。但当人们以原子化个体存在于文生视频内容中充当政治情感交互的媒介时,原先只关注物理世界关系的微观政治情感消失,个体开始关注技术叙事的宏观政治情感,政治情感归属则完全被割裂。
文生视频人工智能大模型在发展中的风险要确定责任承担主体。个体在与技术进行政治情感交互的过程中,自然而然地成为文生视频技术发展风险与后果的责任主体。同时个体也必须充分意识到文生视频人工智能大模型带来的技术风险,切实地为技术风险承担责任。个体作为一种全新的责任主体实质上为技术买单,但属于技术主体的责任归于湮灭。技术主体责任被个体负担感所替代,因技术缺陷造成的政治行为违规、威胁政治社会安定的行为,也将迅速切断文生视频人工智能大模型为人提供的政治情感联结。
四、文生视频人工智能大模型何以纵情:类人化交往嵌入政治情感价值的偏向性
以Sora为代表的文生视频人工智能大模型在人类政治情感交往中呈现出的偏向性。这起始于技术大模型研发过程中的预训练模式。这种方式推动了从文本生成视频时政治信息的传播与流动,并将最终引导人类原有的政治情感,通过政治情感调换,进而转化为符合文生视频技术模型的政治情感,与政治社会情感意义同频共振。
(一)技术崇拜触发政治情感认同风险
技术崇拜带来了新的技术附魅。技术崇拜作为人类的集体认同由来已久,不少技术乐观主义者对人工智能的创造力感到兴奋。①""①张陆园:《人工智能影像生产模式的技术赋能、媒介特征与文化危机》,《当代电影》2023年第9期,第77-84页。技术的逻辑—科学和理性主义—作为现代性的支配性的发展维度衍生出新的方向。②""②陈龙:《媒介文化的现代性涂层危机——对一种基于技术逻辑的新型文化资本的批判》,《湖南师范大学社会科学学报》2021年第5期,第125-133页。文生视频人工智能大模型模拟物理世界,打造出政治情感交互的“第三世界”。在“第三世界”中逐渐建立了人与文生视频人工智能大模型的信任感知。文生视频人工智能大模型存在的弱点、谬误以机器式的权威话语呈现出来,衍生出人类对于人工智能的技术崇拜心理。文生视频人工智能大模型存在错误性信息的原因可能来自两点。其一,文生视频人工智能大模型出现幻觉。人们并不知晓社会现实和社会行为受到幻觉的引导,反之幻觉也正在建构他们的现实,正在解构他们真实的社会行为。③""③斯拉沃热·齐泽克:《意识形态的崇高客体》,季广茂译,中央编译出版社2014年版,第45页。文生视频人工智能大模型对于物理世界的理解出现偏差,源自于文生视频人工智能大模型在应用中存在的技术幻觉。例如,在Sora生成的视频中,从土里挖出一张凳子并表现出失重的感觉,如同人类在梦魇中出现的幻觉一样。其二,预训练的不充分。这导致了以Sora为代表的文生视频人工智能大模型生成的视频中出现基础性错误。尽管以Sora为代表的文生视频技术并不完美,但当人类应用该技术时,却可能身处其中而不自知。人类陷入对于技术的盲目崇拜,这种心理可能将触发政治情感认同风险。文生视频人工智能大模型的权威性语料输出使得政治情感处于无根化状态,政治情感的这种状态与公众原有的政治情感认同冲突,导致政治情感认同主体对政治情感认同的断章取义,个体极易成为被动无依的“乌合之众”。存在于传统政治和后现代政治认同的历时重叠、本土价值认同和西方价值认同的共时性重叠空间①""①埃里希·弗罗姆:《逃避自由》,刘林海译,国际文化出版公司2007年版,第79页。,导致政治认同主体对政治情感的结构性认同出现失衡,并在技术崇拜的心理诱因下诱导政治情感认同主体产生怨恨、偏私、极化的心态。
文生视频人工智能大模型中的公众政治情感交互粘连,导致政治情感认同撕裂。技术借助公共社交,以信息、数据、符号等虚拟关系主导着人们的行动逻辑和话语体系。②""②李腾凯:《情感传播视域下的政治认同:挑战与对策》,《湖北社会科学》2022年第1期,第32-38页。文生视频人工智能大模型为政治情感传播提供了技术载体,而大模型技术反过来也对个体的政治情感进行精准分析,使得公众能够在使用文生视频人工智能大模型时寻求和获得政治情感认同归属。主流政治情感认同被撕裂,公众固化于文生视频人工智能大模型的视频世界,强化了主体情感流通性。实际上,文生视频人工智能技术研发者和权力持有者,通过对主体政治情感诉求进行入圈信息过滤,稀释了主体对主流政治情感认同的共鸣,使文生视频人工智能大模型呈现去意识形态的特点,成为技术权力伪装的商品。
(二)话语议程传播政治情感谬论
文生视频人工智能大模型通过模拟真实的物理世界,抛出技术价值观涵盖的话语议题。通过文生视频技术借助的传播话语主体、内容、方式等搭建话语议程,从而传播政治情感谬论。政治情感谬论为技术霸权服务,在文生视频人工智能大模型生成视频的过程中,从话语议程来推断政治情感是否为技术自身所持有的偏向性价值观念,需要从前期的话语预判、中期的话语参与及后期的话语认同来恒定。
以Sora为代表的文生视频人工智能大模型需要对话语议程进行设置,即从文本的话语议程进行预处理,再转化为视频语言。视频生成依赖于模型预训练的语料数据支撑,而不同训练材料得到的话语议程存在偏向性。文生视频人工智能大模型搭建政治情感传播渠道,除对文本实行预处理外,还能够预先主动设置政治情感议题。从政治事件发生的时间范围与空间范围进行设置,通过具体性政治事件捕捉政治权力,建构解决的方案议题。涉及话语议题的政治参与,文生视频人工智能大模型在生成视频时,尊重公众在政治领域的创造力和政治信息传播潜能,并针对公众偏好的政治情感议题进行诱导和干预。这种行为在表面上充分满足了公众的政治情感诉求,实则会传播与中国本土化语境下相悖的政治情感价值。文生视频人工智能大模型话语认同的形成并非是一方顺从于另一方,而是在语料源中允许多元不同话语议程的存在。但技术霸权迫使政治情感的话语议程在纷杂的话语环境中进行竞争,导致政治情感传播谬论,继而削弱政治社会的凝聚力和行动参与能力。
(三)霸权式决策喂养政治“伪情感”
文生视频人工智能大模型与人类进行高阶对话、执行政治参与任务并影响政治决策,实现了对公众政治情感的干预。文生视频人工智能大模型对于物理世界的仿真模拟,不仅可能伪造成人的政治情感的偏好,更有可能直接伪造政治,在政治领域制造破坏性行为,进一步加重技术权力的意识形态渗透,据其意志选择性地改造、重组社会政治环境和人类关于政治情感的认识论空间。这种智能生产方式会带来新的霸权式决策。技术研发者通过技术霸权,实现对政治情感主体的驯化,以此来喂养政治场域的“伪情感”。这种技术喂养方式,通过霸权式智能生产方式实现,向大模型技术输送政治情感,改变了人对于政治情感的依赖关系,营造全维度的政治世界基础认知。但在由文生视频人工智能大模型视频中生成的“第三世界”中,存在人的政治情感与基础认知的对立统一,因此全面遮蔽真实的政治情感图景,威胁政治社会的安定与和谐。
五、文生视频人工智能大模型何以离情:类人化交往嵌入政治情感的反身性
文生视频人工智能大模型的类人化交往形式打破了人类感官平衡。传统的政治情感交往以线下形式进行延展,在延展过程中人们进行政治情感交互不再局限于“身体通过意向性与世界和他人达成的一种实践过程”①""①芮必峰、昂振:《传播研究中的身体视角——从认知语言学看具身传播》,《现代传播(中国传媒大学学报)》2021年第4期,第33-39页。。人们失去了身体感官的整体性与协调性,开始以数字化分身突破政治情感的时空限制。文生视频人工智能大模型与以往电子媒介对于时空接近的追求和延伸感官的方式有着本质区别。“虚拟现实造就知觉在场,数字孪生成就分身在场”②""②张洪忠、斗维红、任吴炯:《元宇宙:具身传播的场景想象》,《新闻界》2022年第1期,第76-84页。,这些数字化分身以数字孪生的方式,与人本身构成了一种反身性关照,试图唤回人的身体在政治情感进行信息交互的主体能动性。
(一)全三维感知抽离政治情感经验
文生视频人工智能大模型生成的视频是人类等多元主体参与的传播活动。文生视频技术突破时空限制,带动类意识进入视频世界,以全新的方式与他物进行连接,以此生成全三维感知模式。每一个个体在视频中都有一个数字化分身,并对现实世界的政治情感进行储存。文生视频人工智能大模型生成视频的难点在于时空的复杂性,视频是三维数据,包含时间和空间,在生成视频时,既要考虑单帧内容也要考虑帧与帧间的时空关系。③""③朱光辉、王喜文:《人工智能文生视频大模型Sora的核心技术、运行机理及未来场景》,《新疆师范大学学报(哲学社会科学版)》2024年第4期,第149-156页。文生视频人工智能大模型从人工智能的具身化凝聚了人类身体与媒介的共时空状态,营造了政治情感共同体。而文生视频人工智能大模型的反身化成就政治情感交互的沉浸式体验,在虚拟场域中对感官进行重造,从全方位构建起感知的三维结构,能够影响政治决策。对于Sora而言,这种全三维感知依赖于文生视频人工智能大模型的预训练模式所灌输的技术权力,实质上是通过打造虚拟政治空间干扰政治情感并作出决策的行为,是一种西方资本和权力的伪装。因此,基于文生视频人工智能大模型的全三维感知在一定程度上是对于公众政治情感的算法偏好,将会抽离原生政治情感经验,中止政治生命历程。政治情感经验是公众政治参与和政治认同的产物,包含了在此过程中所产生的一系列正向与负向的政治依赖情感。例如,公众对于传播、预测政治信息而感到的情感上的满足,以及对于未能履行政治责任而感到情感上的失落。这些都构成了原生的政治情感经验,而文生视频人工智能大模型基于预训练打造的视频,在重构的人机关系中也将重构政治情感关系。但从文生视频人工智能大模型Sora现阶段的版本来看,仍无法查看政治情感关系的准确生成渠道与机理,有模仿现实世界情感自然生成的可能性,也有受技术权力驱使生成意识形态倾向性造就虚假政治情感的可能性。从最终结果上论,文生视频人工智能大模型的这种全三维感知,在未来可能会造成政府部门在政治决策、政策沟通等方面的情感向度失调。政治认同、传播政治信息等皆受到算力情感偏向的影响,所以,文生视频人工智能大模型在中国本土化政治领域的发展仍存在关键性风险。
(二)撕裂再建巴别塔的政治情感共鸣
再建巴别塔的愿景是扭转政治情感关系、对政治霸权的人为壁垒进行情感深化交流的原始渴望。原有的政治情感因阶级性、民族性、地域性等因素而被压制。在文生视频人工智能大模型赋权下,人们带着再建巴别塔的愿景再出发,政治交流或将朝着横向维度发展,原有的政治情感属性被弱化,政治交往在一定程度上获得了自由,同时公众也获得了政治情感的满足感。文生视频人工智能大模型在模拟物理世界的同时,使得政治情感交往或将不受地域语言的差异而停止,政治权力免于阶级性、地域性等特性控制,愈发体现出公众对于政治情感交往的自主性追求。由此看来,完善的跨模态人工智似乎能重建政治情感关系的巴别塔。但就Sora而言,此类技术为公众展现了重建巴别塔的一缕希望,又以另一种形式唤回了政治情感交往的约束。技术权力基于人性的政治情感偏好,进而造就意识形态偏向,但人无法完全从现实世界中剥离,又无法完全沉溺于生成式人工智能所打造的政治幻象中。再建巴别塔的政治情感共鸣是政治权力阶级性从高向低顺位流落发展的过程,政治交往的核心就是阶级性。而具有世界模拟器潜力的跨模态大模型改变了这种政治宏观环境,从根源上生成了另一种政治情感结构,未能考量到政治情感共鸣本身也是平衡政治情感关系的方式。当政治情感依赖关系不能够被持续满足,习惯于文生视频内容的公众则会回落到现实世界中,进而重回政治焦虑状态。因此,文生视频大模型将撕裂虚拟空间中的政治情感共鸣,而其重建巴别塔的可能也只是大模型提供给人的精致幻觉。
(三)重回现实部落探索遗失的政治情感
文生视频人工智能大模型使得人在重回现实部落的过程中的获得失落感。重回现实部落并不意味着人的肉身重返现实传播现场,但其还是突破了“电子接近性”①""①Felipe Korzenny.A Theory of Electronic Propinquity:Mediated Communication in Organizationsv.Communication Research,1978(1),pp.3-24.所追求的远程在场。人类委身沉浸于文生视频人工智能大模型生成的视频中,享受文生视频人工智能大模型构建的政治情感交往关系,现实世界与文生视频人工智能大模型搭建的“第三世界”存在区隔,二者难以完全等同。那么当公众回归到现实世界中,将会对现有时空世界中的政治情感关系产生极化趋向,即政治情感依赖关系过度满足和政治情感依赖关系过度缺位,具体演化为对现实部落中政治情感的失落感。传统的政治情感被遗失,公众又将陷入政治情感黑洞中并循环往复,现实世界、文生视频技术的“第三世界”及人的本体衍生的政治情感关系三者也将变得更为复杂。
重回现实部落的公众,通过争夺政治话语权、滥用公共政治权力等方式,将现实世界作为他们政治情感交互过程中迷失和反抗的空间。这种反抗行为还由公众的社会地位、社会阶级和社会资源所决定,通过文生视频人工智能大模型进而深化了这种群体极化行为的有效性,也让大模型技术权力有了支配人类政治情感权力的资本。
六、改进与提升:挣脱大模型异化的枷锁
文生视频这类跨模态的人工智能大模型模拟类人化交往方式并嵌入政治情感领域,二者相互杂糅呈现出新的特征。这种新的特征也意味着新型的政治情感交互关系,意味着政治治理技术范式的构建。文生视频人工智能大模型作为强人工智能的代表性智能工具,将会在国家与社会的各个领域产生深刻影响。技术最终的归宿是构建技术与人和谐共处,其根本路径是技术的再情境化。这种再情境化类似于人的生物进化过程,技术在模仿世界,也在模仿人的特性,具体来说就是将人的审美、人文等价值纳入技术的内在结构中。②""②童美华、陈墀成:《基于技术整体论的技术、自然、人的和谐——芬伯格生态技术观解析》,《自然辩证法通讯》2019年第12期,第97-102页。因此,在具体实践层面应健全针对文生视频人工智能大模型的多元主体治理机制,以应对文生视频技术对于政治情感交往带来的可能性风险。
(一)技术方法:多元类智能体协同治理
文生视频人工智能大模型嵌入政治情感交往面临着治理难题。芬伯格指出:现代技术早已沉淀了资本主义的社会价值,不彻底检修现有的技术体系,一切变革都是徒劳①""①芬伯格:《技术批判理论》,韩连庆、曹观法译,北京大学出版社2005年版,第8-238页。,要发挥好文生视频人工智能大模型为政治情感交往赋能的作用,应构建多元类智能体协同治理机制。文生视频人工智能大模型引发的政治情感风险是多维度多层次的,同时涉及很多政治参与主体。所以,可以充分借用通用人工智能构建多元的类智能体,主动提升技术数据的自我纠偏,实施多元类智能体的纵向联动、横向工作机制,重塑人的主体性情感,也为文生视频人工智能大模型等跨模态人工智能营造良好的技术生态环境。通用人工智能技术本身就是一种高效化技术治理工具,通过技术手段实现对隐私泄露、算法歧视、违规内容泛滥等问题的高效治理,实现“技术治理技术”。通过构建文生视频人工智能大模型技术的伦理风险审查机制,对技术在研发和应用等环节实施常态化的监督管理。伦理审查监管失灵的一个重要缺陷是激励的缺失②""②陈书全、王开元:《国家治理视域下科技伦理审查的制度路径》,《科技进步与对策》2022年第18期,第110-120页。,因此,需要建立技术场景下的政治情感的自适应机制,以激发审查主体的内在动力。
(二)政府主体:政治责任的再锚定
文生视频人工智能大模型在政治情感交往中的异化,跟数字政府主体与文生视频技术的政治认知相关,因此应重新深化数字政府的政治责任。一方面,积极推进政府部门在数字化政府治理中对于跨模态人工智能大模型的科学应用。数字化政府作为公共领域的治理主体,应准确理解文生视频人工智能大模型在政治领域的具体实践,以顺应文生视频人工智能大模型等新生代通用人工智能的应用趋势。另一方面,通过政策引导增强数字化政府的智能治理思维,进一步推进以通用人工智能为支撑的治理导向。在审查职责上,明确伦理审查机构的义务并落实责任追究,完善对于文生视频人工智能大模型技术的风险预防和伦理审查等,对潜在存在危害的大模型技术进行限制,并实施预警机制。例如,以政府作为主体应推动人工智能训练师准入制度的进一步审查和完善。2020年,我国就已经将人工智能训练师作为一个新兴职业,纳入到国家职业分类目录之中,并于2021年发布了《人工智能训练师国家职业技能标准》③""③陈锐、江奕辉:《生成式AI的治理研究:以ChatGPT为例》,《科学学研究》2024年第1期,第21-30页。。具体而言,政府可以根据文生视频人工智能大模型执行任务场景的差异性,制定相匹配的人工智能师的准入标准,并对准入标准实施严格审查机制。文生视频人工智能大模型在强化学习的过程中,将映射出技术训练师的认知,那么基于技术本身以及伦理上可能引发的风险考量,准入制度的审查与完善有助于构建良性政治情感,强化政府本身的政治责任。
(三)公众认知:AGI技术素养的再提升
提升公众AGI技术素养,有助于减少或应对算法意识沟和群体极化等政治认知风险。依据不同群体以提升算法素养,弥合技术鸿沟。前期通过深化公众对算法机制的理解、强化数据处理的透明度,拓宽公众接触信息的多元渠道,公众能够提升在技术偏好倾向、信息真伪、极化观点、潜在性信息等方面的辨别能力。后期在人类反馈强化学习中,人与文生视频人工智能大模型的政治情感交互对于训练该技术具有重要意义。例如,根据OpenAI相关的数据处理协议,OpenAI可间接性地从个人数据中提炼信息,用来改善技术的性能。但当技术涉及用户敏感信息或潜在侵权内容的数据时,OpenAI仍然享有对于数据的保留权利。设想一个场景,若公众在使用技术生成视频的过程中不慎泄露了个人敏感信息,这些信息有可能被用于对人工智能大模型技术的预训练,进而对公众的隐私安全造成潜在威胁。可见这一行为对公众的数据输入提出了更高的要求,公众在享受技术带来便利的同时,必须增强公众的AGI技术素养和对文生视频人工智能大模型的风险认知,审慎处理个人信息的输入,促进公众在使用技术时的主体性地位,从而建立良好的人机互动机制,以维护公正透明的信息传播环境。
文生视频人工智能大模型经过预训练生成逼真的长视频以模拟世界,正在塑造全新的人机关系。其在实际应用中呈现出类人化交往特征,其视频语言比纯文字语言交流引发的政治情感风险更为严重。在政治情感领域中,不能仅视文生视频人工智能大模型为满足人类政治情感的工具化手段,更应将其与人结合起来辩证地看待。由技术引发的政治情感风险需从多元视角出发进行规制。而面对大模型人工智能的迭代速度放缓、热潮渐退,通用人工智能种种促人思考的问题频出,文生视频等跨模态大模型在通用人工智能的发展中可能扮演何种角色,其究竟会以何种方式塑造未来的政治沟通与社会情感结构,仍值得我们持续关注与深思。
[责任编辑:其"时]
Humanoid Interaction:a Possibility Building Vector for Political Emotions Driven by a Big Model of Text-to-Video Artificial Intelligence
ZHANG Ai-jun"ZONG Ya-ning
(School of Journalism and Communication,Northwest University of Political Science and Law,Xi’an Shaanxi 710122,China)
Abstract:The text-to-video artificial intelligence model can construct a new type of political and emotional communication relationship under the human-computer interaction in the future.The text-to-video artificial intelligence model simulates the “third world” of political emotional exchanges,communication channels,and dependencies.The political-emotional interaction constructed by the text-to-video artificial intelligence model will induce its implicit political-emotional risk.The hyper-virtual experience of the subject compresses the freedom of political and emotional communication,value bias,and time and space constraints.To detach from the constructed risk of humanoid political emotional communication,it is necessary to avoid the risk of technical cooperation with multiple agents,the anchoring of the responsibility of the power department,and the improvement of the literacy of the use of AGI technology.
Key words:political emotions;Sora;text-to-video;humanoid interaction;universal artificial intelligence