APP下载

生成式人工智能与国家治理信息机制变革: 以ChatGPT为例

2024-09-23曾森

理论月刊 2024年8期

[摘 要] 信息机制是国家治理的基础。相较于前现代的模糊国家,现代国家的建立意味着社会的清晰化和国家信息能力的提升。其中,技术迭代和发展是推动国家信息机制变革和国家信息能力增长的关键变量。随着智能技术的兴起,国家治理的信息机制面临智能化变革趋势。ChatGPT等大模型代表着生成式人工智能技术的里程碑式发展。随着其技术迭代和应用的推进,类ChatGPT生成式人工智能技术将推动国家治理信息机制变革,大幅提升国家信息汲取的准确性、全面性、即时性和深入性;优化国家信息处理的交互反馈、分类挖掘、开放共享;以国家信息应用推动政民互动、政府决策和治理预警。不过,如果生成式人工智能的发展和应用出现异化,也将加剧国家信息污染,侵夺社会信息权利,挑战政府信息权力,威胁国家信息安全。因此,国家治理信息机制的智能化变革必须正视生成式人工智能带来的机遇与挑战,并在完善法律建设、明确使用规范、强化技术监管与推进自主创新等方面提升对生成式人工智能的治理能力。

[关键词] ChatGPT;生成式人工智能;大模型;国家治理;信息机制

[DOI编号] 10.14180/j.cnki.1004-0544.2024.08.010

[中图分类号] D922.17;TP18 [文献标识码] A [文章编号] 1004-0544(2024)08-0082-13

基金项目:国家社会科学基金重点项目“加快数字化发展与建设数字中国的政治保障研究”(21AZD021);2021年度华东政法大学科学研究项目“当代美国右翼民粹主义的成因及政治影响研究”。

作者简介:曾森(1990—),男,华东政法大学政府管理学院、政治学研究院助理研究员、师资博士后。

国家治理是作为正式权威结构的国家履行国家意志、发挥国家功能的政治过程。在国家治理过程中,国家与社会的关系是重要的一环。作为国家治理的主体,国家凭借政治权力和资源对社会进行认识、掌控、规训和塑造,成为普遍的治理逻辑。社会作为国家治理的对象化存在,构成了国家治理活动的基本场域。在国家与社会关系的构建中,信息机制无疑发挥了重要的纽带性作用。国家只有对有关社会事实和社会动态的信息有了基本的掌握,才能进行合理决策、有效执行、系统评估等活动,才能对社会进行掌控、规训和改造。不过,国家治理的信息机制有着深刻的技术根源。特定时代的主导性技术手段和技术水平一定程度上决定了国家治理信息机制和国家—社会关系的基本形态。ChatGPT等生成式人工智能技术兴起之后,国家治理信息机制的智能化变革在广度和深度上都有望出现巨大飞跃。那么,ChatGPT等大模型对国家治理信息机制的影响为何?在生成式人工智能时代,国家治理的信息机制面临哪些机遇与挑战,这是本文关注的焦点。

一、国家信息机制及其变革

(一)国家信息机制与国家信息能力

信息是国家治理的关键资源,建立有效的信息机制是良善国家治理的基础。正如安东尼·吉登斯(Anthony Giddens)所说,“没有作为其反身性自我调节手段的信息基础,民族国家的行政权力就不复存在”1。迈克尔·曼(Michael Mann)也指出,国家“存储了并可以立即调用有关我们所有人的大量信息”,并认为,国家基础设施权力最重要的要素之一即是信息2。对于国家治理机制来说,信息发挥着构成性和功能性的作用。在构成性方面,信息机制是国家治理活动的重要体现和构成部分。掌握和处理辖区内有效信息即是国家权威的象征性体现。同时,国家治理活动本就是国家信息汲取、处理和应用的过程。社会信息本质上具有弥散性特征,作为国家治理对象的事实和信息散见于整个社会之中。因此,国家治理活动就是将弥散性的社会信息识别、整合与标准化的过程。例如,在中国古代,国家统治和治理活动往往以文书的形式展开,各项政治行动也以书面记载的方式成为可资后人借鉴的历史3。到了近代,官僚体制的理性化在某种意义上就是信息流的理性化,官僚主义的主要功能即是对信息进行汲取、加工和协调4。

在功能性方面,对信息资源的掌握和运用很大程度上决定了国家治理的功能性发挥。对于任何组织来说,掌握一定的信息资源是其行动的基础。著名管理学家赫伯特·西蒙(Herbert Simon)认为,拥有足够的知识和信息是公共机构合理决策的前提5。对于国家来说,完善的信息机制更是良善治理和合理决策的重中之重。如果说权力是国家治理活动的内核,那么信息就是国家治理体系的神经系统6。一个国家机器如果对其国土上的人口、财产、物产和各项事务缺乏必要的了解,则无法进行征税、征兵和征徭役,也无法为社会提供必要的公共服务以达成其社会经济政治目标7。国家“评估和征税”的权力建立在对辖区人口信息的掌握基础上。在传统国家,这些信息一般通过人口普查、地籍图等资料进行收集和统计8。随着近代以来国家权力的增长,信息资源成为国家推动经济发展9、提供公共服务10、应对公共危机11的关键和前提。概言之,信息机制事实上是国家维护安全、政治汲取、政治决策、感知社会、政治问责等一系列基本活动的核心机制1。

因此,建立完善的信息机制,提升国家信息能力构成了国家能力建设的内在要求。道格·麦克亚当(Doug McAdam)等人认为,国家能力指的是“国家代理人对其政府领土管辖范围内的人员、活动和资源的控制程度”2。这种控制建立在国家对社会人员、活动和资源等信息的了解和掌握的基础之上。托马斯·布兰博(Thomas Brambor)等人将收集、处理和发布有关“国家领土管辖范围内的人员、活动和资源”的可靠信息的能力视为现代国家所依赖的最重要和最普遍的资源3。在研究拉美国家政治运行的过程中,劳伦斯·怀特黑德(Laurence Whitehead)将国家的“认知能力”(cognitive capacity)定义为“收集、处理、分析和提供现代国家所需的社会信息类型,以监测和解释其政策影响,并在政策失效或适得其反时进行调整或重新制定”4的能力。世界银行则以“统计能力”(statistical capacity)来代指国家信息能力,并将其定义为“一个国家收集、分析和传播有关其人口和经济的高质量数据的能力”。基于这一定义,世界银行自2004年以来一直在收集各国“统计能力”的数据5。

在不同时代,由于技术手段和水平的差别,国家的信息能力存在巨大差异。受限于技术发展水平,前现代国家的信息机制极为疏阔,国家对社会信息的了解不够多。詹姆斯·斯科特(James Scott)在其名著《国家的视角》一书中认为,“前现代国家在许多关键方面几乎是盲人”,其对统治对象的财富、土地及产出、居住地以及身份所知甚少。前现代国家既“缺少任何类似详细地图一样的东西来记载它的疆域和人口”,也“缺少能够将它所知道的东西进行‘翻译’的统一标准和度量单位”,因此,前现代国家对社会的干预往往是粗劣和自相矛盾的6。易言之,前现代社会的“可读性”(legibility)甚低7。一方面,受到交通和技术条件的限制,前现代国家的统治辐射范围有限,对广大边缘地带的统治相对薄弱。为了弥补信息不足带来的治理困境,前现代国家往往通过限缩国家功能和借助地方代理人的方式进行统治。在中世纪的西欧国家,国王的统治必须仰赖贵族和领主的才能,因此产生了较高的委托代理成本8。相较而言,中国是一个“早熟”的国家9,很早就建立起相对完善的信息机制。据记载,中国从夏朝开始就展开了大规模的人口统计,之后的历朝历代都进行过全国性的人口和土地调查登记,建立了编户齐民、鱼鳞册和皇册等信息化机制。同时,中国较早出现姓氏制度,这被认为是人口清晰化治理的一大发展。不过,相比于现代国家,中国古代的国家信息机制仍然是有限的,其权力触角无法抵达最基层,而常常以“道德化治理”来取代“数目字管理”1。“皇权不下县”2很大程度上源于技术所限导致的中央难以掌握足够多的地方信息,而必须仰赖地方士绅和宗族来治理乡村事务。

随着民族国家的构建和技术水平的提升,国家信息能力伴随着国家权力不断增长。按照弗朗西斯·福山(Francis Fukuyama)的观点,政治现代化的过程很大程度上伴随着国家的构建和国家能力的扩张3。这种国家构建和国家能力的扩张与现代国家信息机制的建立密不可分。随着国家构建的推进,“信息国家”于17世纪开始形成4。正如吉登斯所说,现代性制度的基本维度之一,即是建立在信息基础上的(直接的和间接的)监控能力。因此,现代国家的协调性行政控制,与对“官方数据”的理性监测是紧密相关的5。迈克尔·曼(Michael Mann)将现代国家的权力分为专断性权力和基础性权力,并认为,现代国家不断获取治理知识和信息,推动社会事实清晰化,其实就是为了获得调节、干预和介入治理对象的能力,从而发展基础性权力6。欧树军认为,现代国家为了获取社会信息,推动社会的清晰化,建立起国家认证制度7。同时,为了强化对所治理辖区的人口和土地等数据的掌握,国家逐渐发展出“制图术”这一治理工具8。经过农业革命、工业革命和信息革命的历史变迁,在信息技术和传播机制革新的推动下,国家“视力”日渐清晰9。

(二)技术变革与国家信息机制

在国家信息机制转型和国家能力提升的过程中,技术发展无疑发挥着至关重要的作用。在过去一百多年间,每一次国家信息机制的转型都建立在技术革命的基础上。第一次科技革命之后,以报纸为代表的大众传播技术兴起,建立在广土众民基础上的代议制度成为早发国家治理的基本形式。第二次科技革命驱动了专业化分工和“流水线”生产模式的形成,推动了电台广播传播方式的崛起,随之而来的是各国建立起韦伯意义上的科层制结构。以计算机技术为代表的第三次科技革命则推动了电视媒体的兴起,并在西方国家助推了包括电子政务、数字政府在内的新公共管理改革,从而实现了对传统科层制和信息机制的自我更新和调试。20世纪末期以来,数字和智能技术兴起并得到广泛应用,人类社会进入第四次科技革命的前夜,国家治理的信息机制面临重大变革和挑战。一方面,现代社会具有高度复杂性、风险性和不确定性,增加了国家准确、全面、即时地掌握社会信息的难度。随着后工业化和全球化的推进,人类已经进入一个高度复杂化的社会,从而给社会治理带来新的挑战10。用社会学家齐格蒙·鲍曼(Zygmunt Bauman)的话说,未来社会将不再是“确定性的王国”11。取其首字母,基于技术发展所形成的社会易变性(Volatility)、不确定性(Uncertainty)、复杂性(Complexity)和模糊性(Ambiguity)的时代特征被称为“乌卡(VUCA)”。乌卡时代的到来导致治理风险的叠加和蔓延,推动国家治理价值的转型1,增加了国家信息治理的难度。另一方面,现代数字智能技术的发展也为国家治理信息机制的变革带来新的机遇。通过嵌入国家治理进程,数字智能技术有助于提升国家治理的数字能力2,增强国家对社会的数字可读性,推动国家治理信息机制的数字化和智能化。

具体来说,在数智时代,国家治理面临的信息态势发生了以下几个方面的变革:

第一,随着现代社会信息的几何级增长,国家治理面临着信息爆炸的局面。现代社会的高度复杂性和活跃性,通信和传播技术的广泛应用,大大提高了信息产生与传播的速度和广度,从而导致现代社会出现信息爆炸(Information Explosion)。进入信息时代以来,人类生产信息的速度呈几何级数增长3。据统计,2020年,人类每隔几个小时产生的信息量差不多等于从人类文明诞生到2003年间所产生的所有信息量4。同时,技术水平的增长也赋予人类存储和处理海量数据的能力。根据摩尔定律,人类的信息处理能力每两年就可以翻一番。算力的增长使得存储和处理这些海量数据成为可能。

第二,在数智时代,国家治理信息变得高度数据化。进入数字时代,特别是智能时代之后,地球上大部分信息都被数据化了。无论是静态的山川河流还是动态的衣食住行,大部分物体和活动都被人类转换为机器可读的二进制代码5。随着大数据、人工智能、云计算和5G技术的快速发展、迭代与渗透,人类社会正快速地走向信息化和数字化。这种数字化转型不可避免地影响到国家治理进程,国家治理的信息机制也开始迅速地以数字化的形式呈现出来。在我国,政府的数字化转型走过了从电子政务到数字政府建设的发展历程,国家治理活动日趋数字化。利用各项数字技术,国家试图将复杂的社会事实全部简化为可读的符号或代码,使整个社会变成可感知、可阅读和可分析的对象6。最重要的是,在数字时代的国家治理中,作为治理客体的人本身也被数字化了。按照尼古拉·尼葛洛庞帝(Nicholas Negroponte)的看法,数字时代的人类很大程度上是“数字化生存”的7。通过物联网技术、智能家居系统和智能穿戴设备,人类的各项活动都以数字化、全景化的形式呈现出来,成为可供分析和解读的对象。在智能时代,甚至连人类最深层次的身体信息(DNA信息)都可以做到数据化8,而成为治理信息的一部分。

第三,数据和数字技术成为国家治理的重要抓手。一方面,通过掌握数据,国家可以实现对社会活动、治理对象的完整性、统摄性掌握。例如,在数字时代,国家治理的重要对象——人口——常常是以数字化的方式呈现的。在传统时代,对人口数据的掌握往往需要通过定期的人口普查来获得。到了数字时代,人口信息和活动可以完全以数字化的方式呈现在治理者面前。作为数字时代治理对象的身体,本就是最为灵敏的社会传感器。通过追踪其“数字足迹”(digital footprints),国家可以实时掌握治理对象大量的时间、空间和行为数据。另一方面,通过掌握和运用数字技术,包括国家在内的治理主体可以高效地实行治理活动。迈克尔·沃尔泽(Michael Walzer)认为,权力的实施需要通过特定媒介来展开,即“支配总是以一套被称为‘主导物品’的社会物品为中介”。在资本主义社会,资本是占主导地位的物品,并可以轻易地转化为权力1。到了数字时代,占主导地位的物品将是数字技术,权力的实施很大程度上是以数字技术为基础的。大卫·弗林特(David Flint)认为,在现代国家的“委托—代理”体制下,数字和文字作为审计工具有助于降低代理偏离委托人利益的风险2。进入智能时代,国家甚至可以通过大数据训练机器学习人工智能系统,以预测和控制被治理者的观念和行为,从而达到特定的治理目标。

二、国家治理信息机制的智能化变革:从生成式人工智能到GPT技术

2022年11月30日,美国OpenAI公司发布新一代聊天机器人程序ChatGPT。ChatGPT本质上是一种大型语言模型(LLM),能够在海量数据和语料库的基础上进行自主机器学习,并智能地生成文字内容。作为基于深度学习和超强算力的大模型,ChatGPT具有非常强大的功能和广阔的应用场景,可以被用来即时聊天、创作故事、撰写新闻、书写代码等。因此,ChatGPT一经推出,很快风靡网络,迅速引起了全球性的现象级关注热潮。仅仅两个多月,ChatGPT的用户数量就超过了一亿,其爆红程度远超Twitter、Tik Tok等以往的社交媒体。2023年3月14日,OpenAI发布了更为智能的GPT-4。相较于ChatGPT,GPT-4在抽象、理解、视觉、编码、数学、医学、法律、理解人类的动机和情感等方面所表现出的卓越能力,令人更为惊叹。一些学者甚至认为,ChatGPT及GPT-4代表着人工智能技术的里程碑式发展,打开了人类通往通用人工智能时代的大门。

作为一种新的信息媒介,从生成式人工智能到GPT的一系列技术发展预示着人类社会正在出现一场新的信息革命。加拿大政治经济学家哈罗德·伊尼斯在其名著《传播的偏向》中指出,传播媒介是有偏向的,新的主导型媒介将推动新文明的诞生3。ChatGPT、GPT-4等大模型不仅作为聊天机器人而存在,且将作为核心技术嵌入到下游互联网平台中,进而成为支撑起整个科技、社会、文化、商业、经济甚至政治的基础性平台4。在未来,随着生成式人工智能和大模型技术的应用场景逐渐拓展,必然会重塑人类社会的信息机制。以GPT技术为代表的生成式人工智能技术有望重塑国家治理信息机制,并对国家治理的信息汲取、信息处理和信息应用产生革命性的影响。

本文拟以ChatGPT技术为例,围绕生成式人工智能技术对国家治理信息机制所带来的变革进行前瞻性的分析。生成式人工智能(Generative AI)技术,指的是一种基于大数据集训练的深度学习模型来创建新内容的人工智能技术。国家治理信息机制是国家治理过程中的信息获取、处理、存储和运用等构成的统一体。从内涵来看,国家治理信息机制的概念体现出治理导向和社会互动的特征:一方面,与国家信息机制的一般性概念相比,国家治理信息机制是国家信息在国家治理活动和实践中发挥作用的机制,体现出强烈的治理导向。那些不具有治理导向的信息机制并不在此概念的关注范畴内。另一方面,国家治理信息机制体现出国家与社会互动的特征。社会是国家治理的对象,也是国家治理信息的主要来源。国家治理信息机制不但关注国家本身的信息动态,也关注社会、国家与社会之间互动所产生的海量信息。在具体的国家治理实践中,国家治理信息机制包括信息汲取、信息处理、信息应用三个方面。本文拟从这三个方面阐述生成式人工智能对国家治理信息机制变革所带来的影响。

(一)信息汲取

信息汲取是国家治理的前提。信息汲取致力于解决信息稀缺难题。只有建立稳定、有效的信息汲取机制,国家治理活动才有可能。因此,具备一定的信息汲取能力是现代国家的必备条件。人工智能技术的兴起和应用大大提升了国家的信息汲取能力。在智能技术的加持下,国家对社会的信息汲取在广度和深度上都达到了史无前例的程度。以ChatGPT为代表的生成式人工智能技术的兴起更是大大提升了国家信息汲取的智能化和高效化水平。本质上,大模型就是信息汲取的产物。主要的生成式人工智能大模型都建立在海量数据的基础之上。数据的生成、存储、学习和利用是生成式人工智能迭代发展的主要动力源1。例如,ChatGPT-3包含1750亿个参数,其迭代版本GPT-4的参数量已达到百万亿级2。随着GPT技术的迭代,其技术模型参数和数据量也在不断倍增。

就成本而言,生成式人工智能和大模型技术大幅降低了国家信息汲取的时间、人力和物力成本。传统意义上的国家信息汲取必须耗费大量的人力物力财力,并通过强大官僚体制的推动才能完成。例如,全国性的人口普查被称作“和平时期最大的社会动员”。据统计,2020年中国进行的第七次人口普查动员了700多万名普查员和普查指导员3。仅山东一省,就安排了9.3亿元预算进行此次人口普查行动4。相较而言,智能化的人口信息采集大大降低了成本。通过构建多智能体的城市人口分布模型,治理主体可以对其辖区的人口数量和空间分布具有更高精度的认识5,并可以对未来人口分布动态进行模拟和预测6。ChatGPT 模型作为大型智能信息采集总中心,可以通过自动抓取、精确识别、自动分类和高度模拟系统,采集海量的数据,降低人口数据收集的成本。

就效率而言,生成式人工智能技术的应用将克服国家治理信息的失准、片面、滞后和肤浅等问题,提高国家治理信息的准确性、全面性、即时性和深入性。

第一,准确性。传统的信息收集机制往往是以人为主体,不可避免地带有人的主观性。不过,ChatGPT、GPT-4等智能化大模型系统是自动化的,信息提供者直接向智能机器人和智能系统提供信息。在用户与大模型的直接交互过程中,用户输出的信息毫无过滤地被收集。在国家治理的过程中,国家依托的大模型系统可以准确地采集社会各项信息,避免信息被扭曲或篡改。

第二,全面性。随着生成式人工智能的发展和应用,信息形式开始急遽多样化。除了传统以文字为主的信息形式大幅增加,图片、视频、声音等信息也逐渐成为信息汲取的重要对象。多样化的信息形式有助于发掘隐没于传统信息机制中的信息,消除国家治理的盲区。

第三,即时性。传统的信息采集机制带有强烈的事后采集的特点,信息采集往往滞后于信息产生的过程。到了人工智能时代,在强大算力的支撑下,信息采集和信息产生几乎是同时发生的。在这种情况下,国家治理的信息汲取过程不仅是静态的,也是动态的。生成式人工智能有助于国家对动态信息和即时信息的掌握。在未来,即时信息系统可能与生成式人工智能系统深度融合,从而提高国家信息采集机制的即时性。

第四,深入性。智能化的国家系统对社会的信息汲取深度远胜于传统时代。通过无处不在的电子监控设备和传感装置,社会的各方面信息几乎都处于智能技术掌握者的凝视之下。在未来,ChatGPT等大模型有可能接入传感器装置,并实时地收集最为隐秘的社会信息。

(二)信息处理

信息处理是国家治理的核心环节。进入数字时代之后,如何将汲取的海量信息进行高效的数字化保存、分类、整合和共享成为现代国家治理的重要议题。生成式人工智能与GPT技术的兴起为国家治理信息处理的智能化发展带来新的机遇。以ChatGPT为代表的生成式人工智能技术将有效提升国家治理信息的交互反馈、分类挖掘、开放共享水平。

ChatGPT等大模型能够推动国家治理信息交互反馈的智能化和全过程化。在运行过程中,ChatGPT等生成式大模型体现出强烈的人机交互的特征1,有助于推动人机内容共创2。根据用户的输入需求,大型语言模型自动生成智能化的答案。因此,用户输入的需求是其训练的内容和依据。ChatGPT根据有监督学习(事先标注数据)和无监督学习(事先无标注数据)的混合训练,识别人类偏好并不断进行自动模仿,自动生成和输出符合用户需求的答案。通过反复的人机交互和强化学习反馈机制,大型语言模型输出的信息越发智能化和个性化。在国家治理过程中,依托于生成式大模型的治理系统的信息交互和反馈是循环往复的。通过多次人机交互,治理相关信息将得到质量上的提升,并转化为国家治理的信息资源。

ChatGPT等生成式人工智能技术将推动国家治理信息的自动分类和有效挖掘。面对规模庞大、排序散乱的国家治理数据,生成式大模型可以建立相应的处理机制,对海量数据进行自动分类和标记。同时,大模型也可以用于分析文本数据,帮助政府部门更好地发掘和利用关键信息。随着生成式人工智能技术的多模态应用,对图片、音频和视频等数据的信息挖掘也成为可能。在国家治理领域,生成式人工智能技术有助于国家从纷繁复杂的社会信息中发掘有益信息和潜在议题,从而提升国家治理的水平和能力。

类ChatGPT应用有助于打破政府各部门之间的信息壁垒,推动信息开放和共享。以往由于人力资源的短缺和数据壁垒的广泛存在,政府部门对数据的开发利用不足。数字技术兴起之后,数字化平台之间的数据共享成为新的难题3。大模型的出现有助于纾解传统的信息壁垒和信息孤岛问题,推动国家治理信息的共享4。作为一个集聚海量数据和信息的巨型平台,ChatGPT可以突破传统“平台化”的信息收集和处理模式,一改以往互联网平台的信息垄断。例如,ChatGPT与Bing融合形成的New Bing浏览器具有超强数据整合能力,这给最大搜索引擎Google带来了巨大的挑战。一方面,ChatGPT、GPT-4等大模型的超强语言学习能力将有效化解跨部门信息交换的困难。依托于同一个大模型的政府各部门可以通过平台共建的方式打破部门间的信息壁垒,整合各部门之间的数据信息,推动政务信息的横向和纵向流动。另一方面,ChatGPT、GPT-4等大模型将推动政府数据向大众开放。一旦大模型得到社会大众的广泛使用,大众获取政务信息的门槛将大大降低,公民可以通过政府支持的大模型平台获得丰富和无差别的知识与信息。

(三)信息应用

信息应用是国家治理的终端。利用已掌握的有效治理信息,推动国家治理结构的转型、国家治理效能的提升以及国家治理体系和能力的现代化,是现代国家治理的实践目标。类ChatGPT大模型将在增强政民互动、强化政府决策和提升预警能力三个方面推动国家治理信息应用的智能化。

在政民互动方面,类ChatGPT应用可以提升公众与政府的互动效能1。随着互联网时代到来,电子政务出现新形态,互联网+政务服务呈现多样化发展。目前,政府主要通过建立相应的交互平台来推动政民互动。然而,当下广为盛行的政府门户网站、政府APP、政务微博、政务微信、政务小视频等大多属Web2.0甚至Web1.0时代,体现出强烈的单一性倾向。因此,在实际运行过程中,都存在回应性低、系统滞后、需求单一化的问题。大模型的产生将带来政民互动的革命。一方面,ChatGPT、文心一言等大模型的超强语言处理、理解和生成能力意味着其可以同时处理大量的公众诉求和咨询而不至于出现系统崩溃和滞后。另一方面,ChatGPT、文心一言等大模型的高度拟人化特征可以提升政民互动的温度和多样化回应能力。因此,黄璜将提供此类智能服务的生成式人工智能称为“数字客服官”(digital customer service,DCS)2。

在政府决策方面,ChatGPT等生成式人工智能可以提升政府决策的智能化水平和效率。在社会应用中,ChatGPT逐渐表现出解决通用问题的能力。通过对海量数据的处理和分析,ChatGPT等大模型可以归纳出特定的政策选项并分析各种选项的机遇和风险。在国家治理过程中,大模型凭借更大的语料库、更高的计算能力、更强的自我学习能力,可以充当政府的智能化政策顾问,提供全面、真实和有效的政策分析,优化政策选项,从而提升政府决策的质量和效率3。例如,在人口政策制定方面,大模型可以高效整合世界各地历年的人口政策和人口变化状况资料,并通过比对和分析,得出人口趋势的一般性规律,从而归纳出适宜中国国情的人口政策。

在监测预警方面,凭借对既有海量数据的处理和分析,ChatGPT还具备预测未来社会发展和推知公众诉求的能力,从而为政府提前主动应对新问题、回应新诉求提供参考。这种预测功能在危机管理中发挥的作用特别显著,可以提升政府危机应急管理的能力。通过对多模态数据(文字、语音、图像和视频等)的识别、汇集和整理,ChatGPT等大模型可以赋能公共管理者,提升对风险和危机的监测及预警能力。

三、国家治理信息机制的智能化风险与挑战

人工智能背后隐含的算法歧视、算法偏见、算法黑箱将给国家信息机制带来一系列的风险与挑战。以ChatGPT为代表的新一代生成式人工智能技术有着更为强大的功能和更为广阔的应用场景,因此有可能引发更为复杂的政治社会风险4。在相关法律法规和监管机制缺失的情况下,ChatGPT与生成式人工智能技术的快速发展和应用可能放大国家治理信息机制的风险。因此,在生成式人工智能技术的应用过程中,国家治理信息机制必须在信息生成与信息污染、国家凝视与社会权利、平台权力与政府治理、技术霸权与国家安全之间寻求平衡。

(一)自动生成加剧国家信息污染

以ChatGPT为代表的生成式人工智能具有强大的信息生成能力。然而,与这种强大的信息生成能力相伴而生的是信息污染问题的加剧5。其一,大型语言模型和生成式人工智能的知识生产源于被“投喂”海量数据,而这些数据的质量难以保证。在实践中,用于预训练模型的数据来源可能未经筛选,夹带着大量的有害信息。带有歧视性、偏见和误导性的信息可能输入到大模型之中,从而对信息生产造成污染。其二,在大模型训练过程中,数据的主要把关者可能夹带偏见和歧视。大模型训练需要标注人员和研究人员的介入,而他们在数据标注和处理中难免会带入自己的主观偏好。这就导致在其客观的信息整合和阐释架构的表面背后,隐蔽着ChatGPT等大模型的预设立场和偏见。其三,生成式人工智能降低了生成虚假信息的成本,极易导致信息污染的泛滥。生成式人工智能大模型具备较强的理解能力和生成能力,可以生成高度“仿真”、真伪难辨的内容。这种强大而拟人化的生成能力极易造成信息的泛滥和污染,从而扰乱国家的信息机制:

第一,对ChatGPT和生成式人工智能自动生成功能的滥用将造成潜在的社会危害,从而为国家治理带来挑战。不法之徒可以利用生成式人工智能大模型,高效地伪造文本、图片、音频与视频信息,并从事诈骗、恐吓、诽谤等犯罪行为1。基于大模型的深度伪造(deep fake)技术将会增强内容生成和传播效率,强化其内容的迷惑性2。目前,利用生成式人工智能进行违法犯罪的行为层出不穷。例如,利用生成式人工智能合成不雅图片和视频的行为日益猖獗,各界已经展开讨论以寻求妥善治理。

第二,以ChatGPT为代表的生成式人工智能技术在政府信息治理中的广泛应用将对政府信息的真实性和权威性构成挑战,从而影响政府公信力3。在未来,由于其高效、拟人化和个性化服务,生成式人工智能将在政府的信息发布和政民互动中发挥重要作用。然而,随之而来的问题是,一旦生成式人工智能成为信息发布与互动的主体,如何保障其内容交互的真实性和权威性就成为关注焦点。

第三,具备强大而高度拟人化信息生产功能的生成式人工智能可能沦为舆论战的工具。在智能化与产业化的基础上,谣言“武器化”的趋势日益凸显。在国际舞台上,谣言甚至可能成为国际对立和对抗的工具,对国家安全构成挑战4。例如,敌对国家可以将大模型和生成式人工智能用于生产“智能水军”,批量生产真假难辨的虚假信息,以达到混淆舆论导向,制造思想混乱的目的。同时,生成式人工智能给极端主义分子制造和传递极端和煽动性信息,从而进行“数据投毒”提供了新的工具。

(二)过度收集侵夺社会信息权利

正如前文所述,ChatGPT等大模型的开发离不开海量数据的支撑,其高效运行也离不开对信息数据的广泛收集。随着国家将大模型和生成式人工智能技术融入国家治理过程,国家对信息的收集能力将大大增强。然而,这将加剧长期以来社会对信息被过度采集的担忧。国家获取社会信息的边界在哪里?这一问题在生成式人工智能时代更加引人深思。在生成式人工智能技术的加持下,国家对公民和社会信息的过度采集现象极有可能发生。在未来,如果生成式人工智能与各类传感器连接起来,信息收集的触角将伸向社会最隐秘的角落。例如,一旦生成式人工智能与人体的穿戴设备连接,人类最为私密的身体信息也将被纳入批量信息收集的范畴,成为国家凝视的对象。

因此,随着信息收集的范围和深度不断延展,可能诱发信息隐私问题。生成式人工智能大模型的训练需要大量数据,这些数据中难免存在一些私密和敏感信息,如医疗记录、财务数据、个人照片等。更为严重的是,在大模型领域,关于隐私保护的法律和制度仍未确立。这导致生成式人工智能驱动的信息收集存在着潜在的信息滥用与信息泄露的风险。一旦大模型与科技公司受到黑客攻击,大模型的发展和信息收集将带来极大的隐私风险1。

对信息的过度采集和运用将赋予信息掌握者巨大的权力,这可能会对社会权利产生侵害危险。如果未来国家加强与科技巨头企业的合作,并将信息过度采集与算法控制结合起来,可能造就福柯等人所设想的全景式监控社会。在数字化时代,平台算法和数据控制下的用户交互将面临更为严密的监控和规训,构成数字时代的生命政治问题2。通过将个人数据和信息上传至虚拟世界,人类可能陷入一种被凝视和规训的生存状态之中。因此,国家对社会信息的过度掌握及其带来的社会控制可能导致公权力的膨胀,强化其重塑社会的信心,从而造成“乌托邦式”计划3的灾难。

(三)数字平台挑战政府信息权力

人工智能时代以前的国家是社会信息的主要收集者、加工者和储存者,也是权力的主要掌控者。不过,在人工智能时代,数字平台获得了巨大的信息与数据优势,并获得挑战国家信息治理地位的影响力。早期关于平台资本主义的研究探讨了数字平台具有的聚合性、垄断性和扩张性倾向,揭示了数字平台可能给国家权力带来挑战4。高奇琦将平台化视为数字革命的基本特征,并认为平台型企业通过掌握数据资源、助力数字监管、构建算法秩序形成了对国家的竞争性权力形态5。通过基础设施媒介化和媒介基础设施化两大逻辑的相互强化,平台权力可能形成新的权力中心,推动国家权力“私有化”和主权“协商化”6。例如,通过建立数字化的认证系统,数字平台为每一位用户创建统一的标识符,从而构建起与国家相竞争的易读性系统,挑战国家的信息权力7。在资本和技术的联姻下,超级网络平台可能形成“超级权力”,侵蚀公权力的界限,异化公权力的实践8。

到了生成式人工智能时代,数字平台对国家权力和国家信息治理的挑战愈加凸显。国家在信息治理中的核心地位很大程度上被平台企业所打破。相反,由于人工智能巨头企业具有的技术优势,人工智能国家治理体现的算法依赖实质上成为对巨头企业的依赖9。在生成式人工智能技术的发展和ChatGPT等大型语言模型的开发过程中,主要科技企业(谷歌、微软、脸书等公司)扮演着关键角色。由于其先发效应,平台企业在信息掌握和存储方面拥有显著优势。目前,一些科技巨头企业掌握了海量的数据资源,其对信息的掌控甚至超过了很多公权力机构。随着技术、市场和资本等资源的不断集中,开发大模型的科技公司及其平台可能比公权力机构更有能力对治理信息施加影响。有学者据此认为,生成式人工智能将打破Web3.0时代数据权力流散化的趋势,成为新的网络集权工具。由于生成式人工智能的出现,以分布式方式散布于用户手中的数据资源可能重新集聚,这种集聚效应通过生成式人工智能与下游平台的结合,将逐渐推动新的互联网寡头的形成1。

因此,生成式人工智能技术及其背后的科技巨头企业可能演变为“准数据权力”机关,挑战国家治理的信息能力。在这种情况下,国家的信息治理实践必须通过与科技巨头企业的合作和协同才能完成。相对于国家机构,主要科技巨头企业拥有技术、人才等方面的优势,可能在公私权力协同的国家信息治理中扮演主导型角色。传统的“政府—相对人”的行政法律关系将演变为“ChatGPT—公民”的支配性法律关系2。这种新的国家信息治理结构可能带来新的价值和主权风险。一方面,由于科技企业本身的逐利性,生成式人工智能驱动的国家信息机制可能被资本力量绑架,导致公共价值的削弱甚至瓦解。另一方面,由于目前主导型的科技巨头企业(谷歌、脸书)主要是以美国企业为主,这极有可能带来新的主权和安全难题。这些美国科技公司可能将经济活动政治化,将掌握和垄断信息转化成政治施压的武器,以达到干涉发展中国家的政治运作和国家治理的目的。

(四)技术霸权威胁国家信息安全

目前,西方(特别是美国)在大模型和生成式人工智能技术发展上处于领先地位。早在2015年,美国Open AI公司就基于自主研发的近端策略优化(proximal policy optimization)算法推出了大型语言模型GPT-1。随后数年,Open AI公司对大模型进行了四次迭代,陆续开发出神经网络(Jukebox)、图像神经网络(CLIP)、人工智能系统(DALL·E)等多项前沿技术,并在2023年推出更为强大的GPT-4。相较而言,国内对大型语言模型的开发起步较晚,技术不够成熟,在GPT技术的赛道上处于追赶阶段3。中国主要科技公司如百度、腾讯、阿里等于2019年才开始涉入这一领域。随着ChatGPT的大火,资本市场嗅到了投资机会,国内主要科技公司纷纷涉足大模型的开发。文心一言、通义千问、混元大模型、360智脑、天工3.5、日日新SenseNova等国内大模型纷纷涌现。不过,目前国内的主要大模型在参数量、算力基础、自然语言理解和生成等方面与GPT大模型仍然存在一定的差距。

美国在大模型和生成式人工智能技术上的领先地位构成了技术霸权风险。在中美博弈的大背景下,这种技术垄断将给我国的国家安全,特别是国家数据主权带来挑战。一方面,作为一家美国公司,Open AI开发的GPT大模型进行的语言交互带有很强的西方价值观色彩,可能给我国的意识形态安全造成负面影响。虽然ChatGPT宣称自己是中立而无价值偏向的,但却内嵌了强烈的美国自由主义价值观4。ChatGPT鲜明的意识形态立场源于其开发者群体的政治倾向和语料库的西方主导性。倾向于西方价值观导向的ChatGPT在全球的流行为西方国家提供了新的意识形态输出工具,有助于强化其意识形态霸权,从而给包括中国在内的发展中国家带来意识形态风险。另一方面,美国在大模型技术的领先地位可能带来数据主权威胁。在数据权利和跨境数据流动普遍性规则尚未确立的时代,如果将GPT技术接入到我国国家治理和数字政府平台中,意味着GPT平台及其背后的Open AI公司将在很大程度上获得我国国家治理“关键性基础信息”的收集权、储存权、处理权和应用权。这将给我国数据主权安全带来严峻挑战。

四、结语

著名经济学家约瑟夫·熊彼特(Joseph Schumpeter)认为,创新意味着不断地从内部革新经济结构,不断在结构上破旧立新,这就是“创造性破坏”(Creative Destruction)理论①。以ChatGPT为代表的生成式人工智能技术也将给人类社会带来“创造性破坏”效应②。作为国家治理的基础,国家治理信息机制正面临着智能化的变革趋势。GPT和生成式人工智能技术的发展在推动国家治理信息机制变革的同时,也带来诸多挑战。一方面,GPT等生成式人工智能技术将大幅提升国家信息汲取的准确性、全面性、即时性和深入性;优化国家信息处理的交互反馈、分类挖掘、开放共享;以国家信息应用推动政民互动、政府决策和治理预警。另一方面,生成式人工智能的自动生成机制可能加剧国家信息污染,信息过度收集则会侵夺社会信息权利,数字平台崛起将会挑战政府信息权力,美国的技术垄断极有可能威胁我国的国家信息安全。

面对生成式人工智能技术给国家治理信息机制带来的挑战,需从以下方面采取相应的对策:第一,完善相应的法律法规建设。生成式人工智能的发展带来新的法律难题和挑战。由于技术的先行性,传统的法律法规针对生成式人工智能带来的知识产权、虚假信息、信息滥用以及技术垄断等方面的难题存在一定程度上的空白和缺失。目前,关于生成式人工智能的相关法律法规正在逐步确立。如中国国家网信办2023年4月发布的《生成式人工智能服务管理办法(征求意见稿)》、美国国家标准与技术研究院(National Institute of Standards and Technology,NIST)2023年1月发布的《人工智能风险管理框架》等。第二,明确生成式人工智能技术的应用范围,确立相应的应用规范。各相关部门应展开讨论,对大模型和生成式人工智能的使用场景、应用领域、作用边界作出规定。例如,当涉及到国家关键核心信息的收集、处理和应用时,对大模型和生成式人工智能的使用应遵循审慎安全的原则。第三,强化技术监管,对大模型平台和生成式人工智能的信息机制进行全流程监管。针对生成式人工智能信息采集、信息处理和信息应用的全过程,监管部门应在健全法律法规的基础上确立相应的监管细则。当生成式人工智能技术和大模型平台出现违规行为之后,应采取适当的方式进行处罚和清单管理等。第四,推动自主科技创新,打破技术垄断。在科技发展方面,中国的新型举国体制具有一定的优势,但也存在着瓶颈。在未来,生成式人工智能和大模型技术的发展需发挥国家的引领作用,在政府统筹的基础上形成合力,并致力于推动数据整合、算力提升、算法突破,打造可供中国国家治理使用的大模型平台和生成式人工智能应用。

责任编辑 申 华

技术编辑 王文浩