不确定环境下我国人工智能产业政策的演化形成研究
2025-02-16朱齐宇李白杨张心源吴应强
摘 要: [目的/ 意义] 本文旨在探究我国人工智能产业政策在不确定环境下的演化路径, 明确我国人工智能发展过程中工作重心的变迁与未来趋势, 为人工智能产业政策进一步完善与高质量发展提供借鉴。[方法/ 过程] 文章结合文献计量、网络分析、共现分析和主题结构演化等方法, 分别从人工智能产业政策数量、联合发布机构和主题结构演化3 个角度进行分析。[结果/ 结论] 研究发现, 我国人工智能产业政策发文数量逐年提高;中央地方政府协调统一; 政策主题日益丰富, 但是还存在人工智能技术创新性较低、政策平衡性欠缺、缺乏国际合作等不足。未来人工智能产业政策需要在技术创新、教育体系、就业问题和国际合作等方面进一步完善优化。
关键词: 人工智能; 不确定环境; 政策演化分析; 主题结构演化; 数字治理
DOI:10.3969 / j.issn.1008-0821.2025.02.007
〔中图分类号〕D63; TP18 〔文献标识码〕A 〔文章编号〕1008-0821 (2025) 02-0072-15
近年来, 随着算力基础设施水平的大幅度提升、数据资源的爆炸式增长和关键算法模型的突破, 以ChatGPT、文心一言、Stable Diffusion 等为代表的生成式人工智能(Generated Artifial Intelligence, GAI)迅速流行, 全球人工智能领域迎来新一轮发展机遇。2024 年2 月, Open AI 公司发布视频生成大模型Sora, 将多模态人工智能生成内容(AI-generatedContent, AIGC)技术发展推至新高潮, 同时也引起了关于深度造假、主权人工智能、技术霸权等方面的争议。一方面, 人工智能技术高速发展并在写作、设计、工业生产等领域产生一系列颠覆性创新应用;另一方面, 数据资源、技术生态、法律监管、伦理道德等面临着多方面不确定风险和复杂挑战。例如,由于特定刑事司法系统中对人工智能预测算法的依赖性增加, 使得算法偏见和种族歧视飙升[1] 。此外,在人工智能训练过程中不可避免地会重新识别一些涉及隐私的匿名数据, 从而加剧隐私侵犯和数据泄露[2] 。再如生成式人工智能所创造的数据所有权归属也对法律法规提出了新要求[3] 。并且由于生成式人工智能的深度造假泛滥, 对我国国家安全和社会公众利益都造成了潜在风险。2023 年7 月, 国家网信办等七部委联合发文《生成式人工智能服务管理暂行办法》, 对生成式人工智能技术发展、服务规范、监督检查和法律责任进行了初步规定。
政策的制定和实施需要最大限度地消除技术发展的不确定性因素。基于此, 本文以我国人工智能产业政策科学决策为出发点, 选取2007—2023 年我国人工智能产业政策为素材, 从多维视角测度我国人工智能产业政策在不确定环境下的阶段性制定、发布和演化规律, 以期服务于我国各级单位制定人工智能产业政策的确定性、指向性和有效性。
1 相关研究述评
1. 1 不确定环境
1. 1. 1 不确定性理论在各学科的解释
不确定性理论研究随机性、模糊性、信息缺失等多重不确定性因素, 在金融、物理、公共政策等领域有着广泛的应用。在经济学领域, 不确定性会影响经济参与者对经济走势的预判, 进而影响政策制定和决策[4] 。在量子力学等领域, 不确定性被广泛用于研究设计、数据分析等研究。在工程领域,不确定性更多被用于提高工程系统可靠性、结构设计与优化、供应链管理等。
1. 1. 2 基于不确定理论的政策科学
2012 年, 著名经济学家Manski C F[5] 在PublicPolicy in an Uncertain World: Analysis and Decisions 一书中引入不确定理论, 认为政策制定者在制定政策的过程中需要考虑不确定性因素, 例如, 国际政治、技术科学、社会文化和政策实施等方面的不确定性,而不是只关注预期结果; Nair S[6] 也认为, 在公共政策的背景下需要考虑不确定性, 以促进决策构成。作为新技术, 人工智能在其收益、风险和未来轨迹方面存在巨大不确定性[7] , 导致人工智能产业政策的制定、实施、评估等也存在不确定性。因此, 如何分析不确定环境下的人工智能政策演化, 最大限度地趋利避害是重要研究问题。
1. 1. 3 人工智能产业发展的不确定环境
人工智能技术和人工智能治理共同构成了不确定环境的两个方面[8] 。人工智能技术的不确定风险来源于算力、算法、数据等方面。例如, 人工智能算力面临算力芯片垄断、断供、限制等问题; 人工智能算法中包含的随机性和不确定性元素可能会引起人工智能的失调、偏见、失控等问题[9] , 人工智能治理方面的不确定性则源于人类驾驭人工智能的能力, 包括国际关系、伦理、滥用等方面的不确定性。目前, 众多学者围绕特定不确定环境进行研究,例如, Scherer M U[10] 提出, 为保障隐私安全人工智能研发应集中于类似谷歌这样的大型可见公司;Erdelyi O J 等[11] 主张通过国际论坛制定国际人工智能标准, 以降低国际关系和军事竞赛方面的不确定性; Garvey C[12] 从军事、政治、经济、社会、环境、心理生理和精神7 个维度分析了人工智能的不确定风险, 并基于民主治理框架提出了替代方案。当前人工智能进入快速发展通道, 在驱动世界进步的同时也带来了众多不确定风险, 不确定环境相关理论为人工智能政策的分析规划和未来发展提供了基本指导框架。
1. 2 人工智能政策的发展
自20 世纪50 年代引入人工智能概念以来, 人工智能经历了多次繁荣与衰落[13] 。近年来, 随着计算能力提升、机器学习算法迭代以及海量数据的可获取性, 人工智能取得了前所未有的发展速度,技术成果与应用场景不断拓展, 已然成为经济发展的重要推动力。
与此同时, 世界各国(地区)纷纷开始制定相关人工智能政策与发展战略, 以提高在人工智能领域的核心竞争力与国际话语权。例如, 在2016 年和2017 年, 中国分别发布具有纲领性的《“互联网+人工智能” 三年行动计划实施方案》和《新一代人工智能发展规划》。美国在2016 年发布了《国家人工智能研究和发展战略计划》和《为人工智能的未来做好准备》两项战略规划。欧盟在2016年和2018 年分别发布《欧盟机器人民事法律法规》和《欧盟人工智能》。2017 年, 英国发布《产业战略———建设适应未来的英国》, 并在2021 年发布《国家人工智能战略》。日本在2017 年发布了《人工智能技术战略》。近年来, 新一代人工智能技术变革性爆发, 为社会带来了众多机遇和挑战。通过人工智能政策可以深入了解有关人工智能技术和产业发展方向及重点领域部署, 分析政策制定和实施过程中各利益相关者与倡议联盟之间的关系[14] 。
目前, 国内外对人工智能产业政策开展了大量研究, 主要集中于3 个方向: ①对国内外人工智能产业政策进行定性分析。陈静等[15] 选取中美人工智能政策和战略进行对比分析, 为我国人工智能进一步发展提供参考价值。②结合相关政策分析人工智能产业或生态系统。Knox J[16] 选取两个中央层面的人工智能政策文件, 探讨人工智能在中国教育产业中的应用和发展。③从整体出发, 探究人工智能政策目标、政策工具或政策相关利益者关系。Yang C 等[17] 选取中央层面所有人工智能政策, 结合文献计量、语义分析和网络分析对政策趋势、政策分布和政策目标做出相关分析和预测。
现有研究普遍聚焦于对小样本人工智能政策进行定性或量化研究, 对政策整体发文趋势、政策分布、政策演化过程的分析有所欠缺。少数研究者围绕中央层面政策进行整体研究, 但对人工智能政策文本内容信息的深入探究、对地方层面人工智能政策的特点分析以及对人工智能不确定风险的分析尚不充分。因此, 本文以不确定理论为分析框架, 搜集全国范围内的人工智能产业政策, 通过建立规则范式、融入KeyBERT 大模型抽取出最能代表政策信息的核心关键词呈现政策重点与演化态势, 并对人工智能发展进行多维度风险分析, 为我国人工智能政策治理与治理框架提供借鉴。
2 研究设计与方法
首先, 本文通过北大法宝数据库检索相关人工智能产业政策文本数据; 其次, 通过建立规则范式和KeyBERT 大模型读取政策中的关键词、发布机构、发布时间等数据; 最后, 结合语义共现和网络分析方法, 揭示不确定环境下我国人工智能产业政策从探索到完善的时空分布、机构联合发布和主题结构演化等具体情况, 如图1 所示。
2. 1 政策文本数据收集
北大法宝是中国法律和政策领域的重要在线法律法规数据库之一, 其收集中国各级政府出台的各种公共政策、法律文献、裁判文书、法学期刊等信息资源, 检索功能支持通过关键词、法规条文等进行全文检索。因此, 本文选择从北大法宝中获取人工智能产业政策文本。为保证检索数据的全面性与准确性, 本文选择以“人工智能” 为检索词进行标题精确检索, 分别获取法律法规单元下中央法规和地方性法规两类政策(检索时间为2023 年11 月15 日)。为确保所得政策文件内容与研究内容一致, 本文按照以下标准进行政策筛选: 首先, 去除重复的政策文件; 其次, 政策类型选择法律法规等正式决策内容, 回函、批复等非正式决策文件不计在内; 最后, 政策内容重点保留与人工智能相关的部分。按以上标准截至2023 年11 月, 本文共筛选得到924 条与人工智能密切相关政策文件, 其中,中央法规108 条, 地方性法规816 条。
2. 2 政策文本处理方法
政策文本与期刊论文在结构和内容上都存在巨大差异, 期刊论文含有关键词、引用文献等外部特征, 政策文本则没有[18] 。为深入探索政策文本语义信息, 需要从政策文本中抽取出富含文本信息最多的句子和词汇进行共现分析和网络分析。
2. 2. 1 关键词抽取
通过政策主题词共现、网络、聚类分析可以较为清晰地呈现出人工智能政策的主体结构和演化态势。为抽取出最能代表政策文本的关键词, 本文对人工智能政策整体文本的语言信息进行深入挖掘。由于政策文本语言中含有大量以顿号隔开的词句,而顿号隔开的词汇表示词语之间的并列, 具有更强的关联性[19] , 因此需要通过建立规则范式, 从政策文本中抽取含有顿号的政策关键句。其中, 关键词抽取采用深度学习算法KeyBERT 模型, 即利用Sentence-transformers 包生成BERT Embeddings, 然后选择Paraphrase-multilingual-MiniLM-L12-v2 作为BERT 预训练模型, 并使用向量余弦相似度计算候选关键词与文本内容间的相似性[20] 以解决语义匹配问题。在此基础上, 建立人工智能主题词表与停用词表, 并用jieba 库对关键句进行了预处理,去除句子中动词、形容词及无意义的名词。通过文本挖掘实验, 将KeyBERT 模型n_gram_range 参数设置为(2,5)最优, 即每个关键句抽取出2~5 个关键词。通过该方式抽取出的关键词, 保留了人工智能政策文本语义全面性和多样性, 更细粒度地反映人工智能产业政策的领域重点与演化趋势。
2. 2. 2 核心关键词抽取
所抽取内容包含大量高频关键词, 以往研究根据经验从关键词词频、关键词共现词频等角度来选取一定数量的关键词进行共词分析, 主观性相对较强[21] , 为进一步优化所抽取的关键词, 本文基于杨爱青等提出的通过g 指数来选取高频词的方法进行词频g 指数的构建。其中g 指数的定义为: 设置某个科学家的分值为g, 当且仅当在他发表的N 篇论文中有g 篇论文总共获得了不少于g2 次的引文总数, 而(g+1)篇论文总共获得了少于(g+1)2 次的引文总数[22] 。同样词频g 指数的定义为: 在研究领域中, 一个关键词的数量分值为g, 当且仅当此研究领域的关键词总量N 中, 有g 个关键词其累计出现频次不少于g2 次, 而g+1 个关键词其累计出现频次少于(g+1)2 次[23] 。相比于从关键词词频、关键词共现频次等角度根据研究人员的经验选出一定数量的关键词的方法, 词频g 指数选出的关键词更为自然客观[21] , 具体计算过程如表1 所示。
2. 2. 3 共现和网络分析
共现分析包括政策发布机构共现和核心关键词共现, 其中政策发布机构共现是通过网络分析的方式构建出政策合作网络[24] 以衡量政策发布机构之间的关联程度。核心关键词共现分析是将每一个关键词视作1 个节点, 每个关键句中抽取出来的关键词彼此之间视作1 次共现, 通过构建核心关键词结构网络并进行聚类分析, 进而揭示人工智能政策的主题结构。在此基础上, 本文还结合时间与空间维度进一步探索人工智能政策在不确定环境下不同地区发文特点以及人工智能政策主题结构的演化特征。
3 实验与分析
本章节重点从3 个方面分析不确定环境下人工智能政策的演化过程: ①从时空角度分析政策的发布阶段和分布趋势; ②从层级视角分析中央政策发布机构之间的合作和引用关系; ③从主题视角分析人工智能政策主题词结构与演化。
3. 1 政策发文趋势时空分析
从国内筛选得到的924 条与人工智能密切相关政策文件进行统计分析, 如图2 所示, 其中x 轴代表政策的发布年份及划分阶段, y 轴代表政策每年发布数量。此外, 还对816 条地方性法规进行区域划分, 绘制政策分布热力图并且针对其中发布政策总数前10 的地方政府绘制政策堆积图来呈现地方政策的分布和演化, 如图3 和图4 所示。
通过对政策发布的趋势变化进行分析, 本文将人工智能政策的发布历程划分成4 个阶段:
萌芽期(2007—2016 年)。在此阶段, 人工智能作为新兴技术的不确定性较强, 因此无论是中央还是地方都采取保守的政策制定策略。发布的政策中主要针对某些特定智能技术的行业规定、标准和实施建议。例如, 卫生部在2009 年印发《人工智能辅助诊断技术管理规范(试行)》, 针对人工智能的医疗方面提出具体要求和规划。萌芽期涉及的领域比较局限, 全局统筹我国人工智能全行业发展规划纲要的政策文件尚未出现。
过渡期(2016—2018 年)。经历了萌芽期的初步探索, 我国对人工智能的应用场景逐渐明确, 开始从宏观角度出台人工智能政策文件。自2007 年人工智能首次写入政府工作报告以来, 我国人工智能产业培育进入更加确定的赛道。2017 年7 月, 发布了《国务院关于印发新一代人工智能发展规划的通知》, 2017 年12 月, 工信部发布《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》,以3 年为期限明确了多项任务的具体目标。在党中央、国务院密集政策指导下, 各部委和地方政府也针对人工智能特定领域发布了相关政策加强人工智能产业发展, 并且在教育、办公、医疗等关键领域形成试点示范应用。例如2018 年, 教育部印发的《高等学校人工智能创新行动计划》和工业和信息化部印发的《新一代人工智能产业创新重点任务揭榜工作方案》在成都、广州、福建等地都得到了部署和应用。
发展期(2018—2021 年)。在过渡期间, 中央机关及各部委人工智能政策的颁布为人工智能发展排除了众多不确定因素, 人工智能作为新兴战略产业的重要性得以确认, 配套政策制定和实施也进入快速发展阶段。该阶段发布的政策集中于持续完善人工智能相关产业发展措施, 如智能制造、智能汽车、智能医疗、智慧健康养老等。在培育人工智能产业的同时, 我国政府也愈加重视人工智能发展中的“双刃剑效应”, 如数据隐私、信息安全等不确定性风险。2021 年, 全国信息安全标准化技术委员会秘书处与国家新一代人工智能治理专业委员会分别发布《网络安全标准实践指南—人工智能伦理安全风险防范指引》与《新一代人工智能伦理规范》,将伦理道德融入人工智能全生命周期, 为从事人工智能相关活动的自然人、法人和其他相关机构等提供伦理指引。随着中央各项政策的指导, 各地政府对人工智能应用及风险的把握愈加明确, 纷纷出台相关政策加强人工智能技术创新与产业发展。
稳定期(2021—2023 年)。在人工智能高速发展后, 政策的发布频率逐渐下降, 但政策总体数量还保持在较高的水平。在这一阶段颁布的政策中除了持续关注人工智能与产业的融合, 还积极探索如何用人工智能促进经济发展以及人工智能治理。相关核心政策有《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》(科技部等六部门, 2022)、《最高人民法院关于规范和加强人工智能司法应用的意见》(最高人民法院, 2022)。2022 年, 以ChatGPT 为代表的生成式人工智能产品引发了人工智能新一轮技术热潮, 带来更多产业应用的同时也产生了众多新的不确定风险。2023 年8月, 国家互联网信息办公室联合国家发展和改革委员会等7 部门联合发布《生成式人工智能服务管理暂行办法》, 对生成式人工智能技术的使用和应用提出了暂行的规定和限制, 各地政府也依据中央政策的规定, 结合自身特点, 出台相关政策对生成式人工智能进行推进和限定。
为分析不同地域对人工智能的态度, 本文结合816 条地方法规, 从时空角度绘制了地方政策时空演化图, 以上述划分的人工智能政策演化阶段为时间段进行绘制, 颜色越鲜艳表示发表的政策数量越多, 并且选取政策数量排名前10 的地方政府绘制政策堆积图。如图3 所示, 在2016 年之前我国人工智能政策数量较少且主要集中于东部沿海地区,在2017 年国务院颁布《国务院关于印发新一代人工智能发展规划的通知》之后, 我国人工智能政策数量整体提升, 基本实现全地域覆盖。由图4 可见,从2018 年之后人工智能政策数量明显提升, 以广东省、山东省和福建省为代表的东部沿海地区的政策增长速度最快, 中部地区的增长速度较慢, 而偏西北部的地区增长速度不明显。综上所述, 面对不确定性因素较高的人工智能技术, 各地方政府都紧跟中央政策规划, 结合自身地方优势推动与人工智能相关的产业融合与经济发展。
3. 2 不确定视角下中央部门联合发布网络图
人工智能产业政策需多部门协同制定, 既有“中央—地方” 纵向协同, 也有“部委—地方” 的横向协同, 多部门协同有利于最大限度减少人工智能产业发展中的不确定性。中央部门在政策颁布过程中具有权威性和全面性等优势, 不同部门涉及不同领域方向, 各部门通过联合发文的形式协调统一,可以有效地分配资源。本文以39 个中央部门联合发布的108 条中央法规为数据来源分别绘制了中央部门联合发布网络图和演化图, 如图5、图6 所示。
如图5 所示, 每一个节点代表1 个中央部门,节点大小代表该部门发表人工智能政策的数量, 连接节点的边表示部门间的关系和互动过程, 每一次连线表示部门之间有1 次联合发文。此外, 本文还通过Gephi 中基于模块化的算法对网络图中的部门进行聚类分析来显示部门的网络合作关系, 并且计算每个部门的特征向量中心度, 从而确定政策颁布过程中的主管部门, 如表2 所示, 在总计108 条中央政策中, 有18 个部门采取了联合发布的形式颁发了23 条政策, 占比达21. 3%。由图5 可知, 大部分联合发文由工业和信息化部、教育部、科学技术部、国家发展和改革委员会等部门组成的核心部门集群有关, 结合表2 中各部门数据也可以发现联合发文多的部门特征向量中心度也高, 在网络图中占据核心主导地位。可见, 在我国人工智能政策的颁布过程中, 中央部门的政策紧紧围绕工业和信息化部、教育部、科学技术部、国家发展和改革委员会等核心部门进行发布。结合实际政策可以发现, 核心部门针对人工智能技术提出了总体布局, 并在各项政策中对人工智能技术的未来发展和领域应用做出了规范与指导, 大大降低了人工智能技术发展的不确定性, 也为其余部门在自身领域情境下融合人工智能打下基础。例如, 工业和信息化部印发的《促进新一代人工智能产业发展三年行动计划(2018 ―2020 年)》对我国在2018—2020 年人工智能产业发展提出了宏观布局。在保持高质量独立发布政策的情况下, 核心部门还发挥着协调规划的作用, 结合其余部门特有资源对人工智能部署作出进一步详细规划。例如, 国家发展改革委、科技部、工业和信息化部、中央网信办联合颁布的《“互联网+” 人工智能三年行动实施方案》, 为人工智能在“互联网+” 行业的发展作出明确行动纲要。
为明确各时期各部门的政策发布情况, 本文使用ITGinsight 软件绘制中央部门发文演化图, 如图6所示, 图中方块的大小表示该年部门颁布的政策数量, 连线反映部门间的联合发布关系。在2009—2016年早期人工智能探索中, 由于不确定因素较大, 颁布人工智能产业政策的部门较少, 主要由教育部、科学技术部、工业和信息化部进行政策颁布。从连线密切程度来看, 早期人工智能产业政策虽然数量较少, 但多数政策都是由各个部门协同合作、联合发布的, 有效降低了人工智能技术早期探索阶段的不确定风险。2016—2018 年是人工智能产业政策的过渡期, 可以看出此阶段政策数量明显减少,但在2017 年, 国务院发布的《国务院关于印发新一代人工智能发展规划的通知》和工信部发布的《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》, 明确了我国人工智能技术国家战略及多项任务的具体目标, 为之后各部门大量政策出台提供理论基础。2018—2021 年, 人工智能产业政策出台量和参加颁布政策的中央部门数量明显增加,并且部门间的联合发布情况也日益紧密, 这表明在中央核心政策的指导下, 各部门逐渐认识到人工智能对国家发展的战略意义, 开始围绕人工智能进行深入探索。但由于人工智能技术可能涉及多个方面,导致其不确定性增加, 所以各部门也逐渐开始协调资源和权力, 使得部门间联合发布的政策越来越多。2021—2023 年, 我国人工智能产业政策发展已经步入稳定期, 人工智能产业政策颁布量逐渐放缓, 但在此期间多出了许多新的部门, 且各部门间的连线也逐渐密切, 这表明我国积极推动人工智能技术在新领域的创新产业升级, 各部门之间的协调程度也逐渐成熟。
3. 3 人工智能产业政策主题词演化
为详细了解人工智能产业政策主题词结构与演化, 本文结合共现分析与网络分析绘制时间维度下人工智能产业政策主题词演化图和主题词结构演化图, 如图7 和图8 所示。
3. 3. 1 人工智能产业政策主题词时序演化
人工智能的发展一直受算力、算法、数据等因素制约, 随着社会发展需求与环境变化, 可能导致以往的人工智能产业政策不再适用, 在新的不确定环境下, 政策制定者需要综合考虑多种不确定因素的影响, 客观制定出符合我国国情的政策。基于此,通过ITGinsight 软件绘制了人工智能产业政策主题词演化图, 如图7 所示。
由图7 可知, 2007—2016 年, 有关人工智能产业政策主题词数量和频次都较少, 从“管理条例”“医疗机构” “建筑行业” 和“网络安全” 等主题词可以看出, 早期人工智能产业政策主要围绕探索人工智能技术场景应用和完善管理方法。
2016—2018 年, 主题词逐渐增多, 出现了“产业化” “行动计划” “信息化” 和“公共服务” 等词, 说明此阶段受国务院与工信部的政策影响, 人工智能产业政策重心放在人工智能产业部署与创新升级等方面, 以促进社会信息化改革。
2018—2021 年, 人工智能产业政策主题词增长速度最快。从图7 演化趋势可以看出, “信息化”“产业化” “机器人” “知识产权” 和“公共服务”等主题词脉络一直存在, 表明此阶段的政策旨在加快人工智能技术研发、产业融合、知识保护等整体布局, 强化“产学研” 协调推进。
2021—2023 年, 主题词频次与数量逐年减少。从出现的“试验区” “科学技术” 和“核心技术”等主题词可以看出, 这一阶段的政策主要围绕人工智能试验区、人工智能技术创新等方向。
从各年份之间主题词连线的密度和粗细也可以看出, 在2016 年之前, 主题词之间联系较少, 表示此前我国对人工智能的探索比较独立分散, 尚未形成系统规划和发展措施。随着2017 年国务院《新一代人工智能发展规划》的发布, 主题词连线日益密切, 表明我国已开始逐步确定人工智能工作重点,新颁布的政策逐渐围绕前期工作基础进行完善规划或新领域拓展。
3. 3. 2 人工智能产业政策主题词结构演化
为了更细粒度分析我国人工智能产业政策从不确定到确定过程中工作重点变化, 本文绘制了政策主题词结构演化图。首先, 本文按人工智能产业政策演化的4 个阶段分别使用关键词抽取与词频g 指数从政策文本中抽取出核心关键词视作人工智能产业政策中的主题词; 其次, 通过主题词在同一句中相互共现来创建主题词关联; 最后, 利用Gephi 将每段时期的主题词绘制成对应的人工智能主题词网络图, 如图8 所示。
如图8 所示, 网络中每个节点都是政策主题词,节点数字代表其出现的频次, 节点越大表明目标主题词出现次数越多, 网络中连接节点的边表示两个主题词在一个政策文件中同时出现, 代表其间具有关联性, 通过计算每个节点的特征向量中心度, 如表3~6 所示, 可以识别各个时间段中政策主题词网络中的主题词。核心主题词是特征向量中心度较高的节点, 特征向量中心度越高, 表明主题词在网络中具有重大意义, 并且与之相连的其他主题词往往也更重要。通过对核心主题词及其关联主题词分析,可以清楚地了解每个时期的重要战略目标及演化方向, 对未来政策的进一步完善具有重要借鉴意义。
1) 2007—2016 年(见表3), 我国初步引入人工智能概念, 其相关政策在制定过程中需要处理大量的不确定性, 例如, 哪些是人工智能关键核心技术, 算力、算法、数据三要素之间的关系和发展态势, 人工智能治理安全风险等。结合图8 与表3 可知, 此阶段“技术” 是词频和中心度最高的核心主题词。从结构图中可以发现, 与之相连接的主题词主要包括“医疗” “智能辅助” “智能制造” “工业机器人” 等。可见萌芽阶段我国政策对人工智能技术的探索主要集中在智慧医疗、智能建筑和智慧制造等方面。“人工智能” 是词频第二高的核心主题词, 与之关联程度较高的主题词含有“理论” “工业” “信息化” “实施方案” “企业” 等, 表明萌芽阶段的政策已经明确人工智能技术对我国信息化改革与工业改革的战略性意义, 并针对人工智能提出理论概念、行业规定与实施建议。
2) 2016—2018 年(见表4)迎来了人工智能产业政策的过渡期, 此阶段的主题词数量与词频明显增多。“人工智能” 和“技术” 依旧是词频排名前二的主题词, 但出现了许多新的高频主题词, 说明过渡期人工智能产业政策是在前一时期的基础上更新完善的。此阶段与“人工智能” 密切相关的主题词新增了“高校” “金融” “政务” “农业” 等,部署领域涉及智慧教育、智慧金融、智慧政府和智慧农业等。与“技术” 关联的主题词新增了“物联网” “人脸识别” “虚拟现实” 等关键技术词汇,人工智能领域核心技术的部署越来越丰富。这表明在国务院《新一代人工智能发展规划》的指引下,此时期的政策极大拓展了人工智能技术的深入研究与领域应用。此外, “产业” 和“企业” 两个主题词都上升到了第四、五位, 体现出受工信部2017年颁布的《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》政策影响, 此阶段政策有效针对人工智能加强产业部署, 促进企业发展。
3) 2018—2021 年(见表5)是人工智能产业政策的发展期, 这一阶段的主题词数量和词频得到进一步增长。其中高频主题词与过度期的高度重合,表明在过渡期我国已基本把握人工智能发展趋势,初步构建出人工智能发展体系, 而发展期在此基础上进一步完善。值得注意的是, 与“人工智能” 关联的“法律” “网络安全” 等主题词词频明显增加,意味着此阶段的政策注意到人工智能技术带来的不确定风险问题, 包括社会伦理、法律安全、网络安全等, 通过出台相关政策加强前瞻预防与约束引导,最大限度降低人工智能不确定性风险。此外, “企业” 由之前第五位上升到了第二位, 与之关联程度较高的词包括“生态” “龙头企业” “领军企业”“高校” 等主题词, 表明此阶段我国政策促进产学研结合, 支持龙头企业与上下游中小企业协同创新,为人工智能企业的发展创造良好的生态环境。另外,“技术” “产业” “产品” 等高频主题词表明此阶段我国政策依旧将信息技术与制造技术深度融合为主线, 推动新一代人工智能技术的产业化与集成应用, 发展高端智能产品。
4) 2021—2023 年(见表6), 我国人工智能产业政策发展进入稳定期。“人工智能” 和“技术”仍然是词频前二的主题词, 并且大部分主题词依旧与前一段时期类似。可见稳定期总体目标与发展期基本一致, 将政策重心放在完善人工智能领域的产业化与应用部署。值得注意的是, “算法” 出现在高频主题词中, 与之高度关联的主题词包括“数据” “算力” “模型” 和“核心技术” 等, 表明在稳定期我国政策更加注重人工智能内核, 希望通过技术创新形成自己的核心竞争优势。
此外, 主题词之间连线的密集程度反映了主题词之间的交叉协作和相互作用。可以看出, 除了在萌芽期间各主题词相互较为分散外, 其余时期的主题词彼此之间联系都很紧密。侧面反映出自过渡期以来, 我国人工智能产业政策从整体布局, 协调各领域的工作, 全方位共同推进我国人工智能产业化发展和领域应用。总的来说, 本小节通过主题词结构演化图、网络图和主题词表, 呈现出我国人工智能产业政策在4 个阶段中工作重点的迁移和演化。可见即使每段时期的总体目标基本一致, 但各时期的工作重心都有所侧重, 这与当下时期的社会、文化、经济的发展密切相关。特别是在2022 年, 以ChatGPT 为代表的通用人工智能技术的诞生, 从多角度对我国人工智能产业政策提出了新的发展和治理要求, 我国政策依旧在经历更深层次的演变, 以应对其带来的发展机遇和不确定风险。
3. 3. 3 不确定视角下人工智能产业政策主题结构分析
在人工智能领域, 技术快速发展、社会文化改变、国际关系改变等因素带来众多不确定性挑战,并时刻影响着人工智能产业政策的制定和实施, 政策制定者需要及时了解当下社会文化情况, 制定出针对性的政策来引导和治理人工智能。
首先, 是人工智能技术的不确定风险。人工智能技术的发展路径复杂多样, 很难预料其最终演化形态, 因此我国萌芽期的人工智能产业政策便覆盖了机器学习、图像处理、数据挖掘、智能机器人等多项技术, 并为随后各个阶段新出现的人工智能技术制定对应的政策指引。通过及时调整政策来推动我国人工智能技术发展, 在语音识别、视觉识别等领域实现核心关键技术的重要突破。然而, 2022年以AIGC、ChatGPT 为代表的新一代人工智能工具标志着人工智能技术的一次飞跃, 也让政策制定者意识到我国人工智能技术的发展缺少重大原创成果。在稳定期人工智能产业政策的制定中产生了许多以算法为核心的主题词社区, 表明此阶段政策重心放在人工智能基础理论和核心算法的研究。可见我国政策对人工智能技术的态度一直是鼓励多样化发展, 并逐渐重视技术的创新发展, 降低其演化过程中的不确定性风险。
其次, 社会文化的改变也为人工智能产业政策的制定带来众多不确定性风险。社会文化的不确定性体现在行为规范、伦理道德、法律法规、价值观和经济等方面。在萌芽期, 我国政策侧重于制定人工智能技术应用的行业标准和实施建议, 较少涉及法律层面, 而由于人工智能算法及数据等特殊性,在实际应用中带来侵犯个人隐私、冲击法律与社会伦理等问题。因此, 我国人工智能产业政策逐渐重视人工智能法律体系, 为人工智能的健康发展创造良好生态环境。与此同时, 我国政策也高度重视人工智能在经济文化方面带来的变革性影响, 从主题词演化过程中可以看出, 我国政策一直鼓励人工智能的多领域融合, 产学研一体化发展, 并依据市场需求及时调整政策战略, 开拓新市场。目前, 我国政策制定者及时处理社会文化变革中带来的不确定风险, 为人工智能的可持续发展打下坚实基础。
最后, 是国际政治中的不确定性风险。国际政治的不确定性主要体现在大国竞赛和国际贸易竞争。自人工智能技术诞生以来, 运用其推动经济复苏和可持续发展已逐渐成为全球共识。在此背景下, 美国、英国、日本、韩国等世界主要国家(地区)纷纷制定人工智能国家发展, 抢占人工智能竞争赛道。我国也在2017 年出台《新一代人工智能发展规划》,为我国人工智能发展提出先进指导思想、战略目标、重点工作和保障措施, 并逐年增加我国人工智能产业政策出台数量。此外, 国际贸易的不确定性也对政策的形成产生重要影响。2022 年10 月, 美国通过延长全面出口管制, 收紧对尖端人工智能芯片的出口管制, 阻碍我国人工智能算力发展。从稳定期的政策可以看出, 我国政策逐渐重视人工智能核心算法、关键设备和高端芯片等方向, 提高自身核心竞争力, 降低国际贸易带来的不确定性。
综上所述, 人工智能在发展过程中存在着众多不确定性风险。我国政策在大力发展人工智能的同时, 也需要高度重视其带来的安全风险挑战, 加强前瞻预防与约束引导, 最大限度降低潜在风险, 保障人工智能安全可控发展和社会和平稳定。
4 讨论和总结
4. 1 讨 论
结合分析结果, 本文总结出以下几个值得注意的问题, 为之后人工智能产业政策治理的进一步完善提供借鉴。
1) 重视技术创新和硬件设施发展。驱动人工智能技术发展的3 个核心要素分别是算法、算力和数据。算法方面, 政策需要通过投入研发资金、建立创新生态环境等措施来鼓励企业、研究机构等在算法方面的创新。算力的发展源自基础设施和物理硬件, 未来的人工智能产业政策应当鼓励和支持硬件基础设施的建设, 包括云计算、超级计算机、边缘计算等, 提高我国高性能计算能力。数据层面的发展受限于其存在的不确定风险, 包括信息泄露、网络安全、法律道德等, 需要政策完善法律法规确保数据的安全发展。通过3 个方面协调发展, 可以促进我国人工智能技术安全可持续发展。
2) 完善我国人工智能教育体系。结合图8 可知, 目前我国政策在人工智能教育方面占比较少,表明在政策制定过程中低估了教育的重要性。教育可以为我国带来更多专业的人工智能人才, 是人工智能发展的重要因素。未来政策需要建立合适的人工智能教育生态系统, 着重培养年轻一代人工智能素养, 深化人工智能学科交叉融合, 为后续人工智能发展提供持续的领域人才。此外, 政策还可以推广人工智能普及教育, 从使用的角度对群众进行规范引导, 减少由人工智能不恰当使用带来的虚假言论、法律版权和深度伪造等风险。
3) 重视人工智能引发的就业问题。在人工智能与人类的交互活动中, 存在着两种主要模式: 合作模式与替代模式[25] 。合作模式中, 人类通过与人工智能相互协同工作, 实现目标或价值。在此基础上, 政策需要加强人工智能产业部署和法律法规建设, 为其合作打造适宜的人工智能生态环境。而替代模式中, 人工智能可能取代人类, 承担起原本由人类执行的工作任务。这需要政府积极引导社会适应新技术, 减少由人工智能技术发展带来的社会分化。此外, 政策还应通过促进灵活就业市场、提高社会保障、推广培训教育等方法减少由人工智能替代带来的不确定性风险。
4) 承担大国责任、加强国际合作。在全球化和数字化的大背景下, 人工智能的发展需要各国(地区) 共商共建。首先, 我国人工智能产业政策要明确“以人为本” 的发展理念, 保障人工智能更好地造福于人类; 其次, 努力促进国际合作和知识共享, 让全球各国(地区)平等、和平地发展人工智能; 最后, 需联合各国(地区)制定跨国界的人工智能标准框架和监管体制, 避免人工智能技术的滥用和不当竞争, 为人工智能健康发展筑牢安全屏障。
4. 2 总 结
本文结合文献计量、共现分析和网络分析等方法, 探讨了不确定环境下我国人工智能产业政策时空分布、中央和地方发文趋势及主题结构演化态势。并依据分析结果总结出我国人工智能发展过程中可能存在的一些问题, 对我国人工智能产业政策进一步完善具有一定参考价值。需要指出的是, 本文的研究仍然存在一些不足之处: ①受限于数据库收录政策数量, 本文的政策文本可能不够全面。②本文从全国整体探讨人工智能主题结构演化, 缺乏从各地区角度分析地方政策差异。因此, 未来的研究将进一步扩大政策样本, 并融入更多维度, 分层次、分区域挖掘人工智能产业政策的结构内涵。
参考文献
[1] 贾诗威, 闫慧. 社交媒体用户算法偏见感知的批判性话语分析[J]. 现代情报, 2023, 43 (6): 14-23.
[2] Esmaeilzadeh P. Use of AI-Based Tools for Healthcare Purposes:A Survey Study from Consumers Perspectives [ J]. BMC MedicalInformatics and Decision Making, 2020, 20 (1): 170.
[3] 李白杨, 白云, 詹希旎, 等. 人工智能生成内容( AIGC) 的技术特征与形态演进[J]. 图书情报知识, 2023, (1): 66-74.
[4] 洪永淼, 刘俸奇, 薛涧坡. 政府与市场心理因素的经济影响及其测度[J]. 管理世界, 2023, 39 (3): 30-51.
[5] Manski C F. Public Policy in an Uncertain World: Analysis andDecisions [M]. Boston: Harvard University Press, 2012.
[6] Nair S. Addressing Uncertainty and Ambiguity in Policymaking:Advancements and Dilemmas [ J/ OL]. https: / / china.elgaronline.com/ view/ edcoll/9781789904970/9781789904970.00011.xml, 2023-12-03.
[7] Wallach W, Marchant G. Toward the Agile and Comprehensive In⁃ternational Governance of AI and Robotics[ Point of View] [ J/OL]. Proceedings of the IEEE, 2019, 107 (3): 505-508.
[8] Perry B, Uuk R. AI Governance and the Policymaking Process:Key Considerations for Reducing AI Risk [ J]. Big Data and Cog⁃nitive Computing, 2019, 3 (2): 26-32.
[9] 郭小东. 生成式人工智能的风险及其包容性法律治理[J]. 北京理工大学学报(社会科学版), 2023, 25 (6): 93-105, 117.
[10] Scherer M U. Regulating Artificial Intelligence Systems: Risks,Challenges, Competencies, and Strategies [J]. Harvard Journal ofLaw & Technology, 2016, 29 (2): 353-400.
[11] Erdelyi O J, Goldsmith J. Regulating Artificial Intelligence: Pro⁃posal for a Global Solution [ M/ OL]. Rochester, NY, https: / /papers.ssrn.com/ abstract=3263992, 2023-12-03.
[12] Garvey C. AI Risk Mitigation Through Democratic Governance:Introducing the 7-Dimensional AI Risk Horizon [ C/ OL] / / Pro⁃ceedings of the 2018 AAAI/ ACM Conference on AI, Ethics, andSociety. New Orleans LA USA: ACM, 2018: 366-367. https:/ /dl.acm.org/ doi/10.1145/3278721.3278801, 2023-11-25.
[13] Cath C, Wachter S, Mittelstadt B, et al. Artificial Intelligenceand the ‘Good Society’: The US, EU, and UK Approach [ J].Science and Engineering Ethics, 2018, 24 (2): 505-528.
[14] Sabatier P A, Weible C M. The Advocacy Coalition Framework:Innovations and Clarifications [M]. Theories of the Policy Process,Second Edition. Routledge, 2019: 189-220.
[15] 陈静, 黄萃, 苏竣. 中美人工智能治理研究比较分析———基于文献计量视角[J]. 电子政务, 2020, (12): 88-98.
[16] Knox J. Artificial Intelligence and Education in China [J]. Learn⁃ing, Media and Technology, 2020, 45: 298-311.
[17] Yang C, Huang C. Quantitative Mapping of the Evolution of AIPolicy Distribution, Targets and Focuses Over Three Decades inChina [ J]. Technological Forecasting and Social Change, 2022,174: 121188.
[18] Huang C, Wang S T, Su J, et al. A Social Network Analysis ofChanges in Chinas Education Policy Information Transmission System(1978—2013) [ J]. Higher Education Policy, 2020, 33 ( 2):323-345.
[19] 侯圣峦, 刘磊, 曹存根. 基于语义文法的网络舆情精准分析方法研究[J]. 计算机科学, 2014, 41 (10): 225-231, 237.
[20] Qian Y L, Jia C C, Liu Y M. Bert-Based Text Keyword Extraction[J]. Journal of Physics: Conference Series, 2021, 1992 ( 4):042077.
[21] 唐果媛. 基于共词分析法的学科主题演化研究方法的构建[J]. 图书情报工作, 2017, 61 (23): 100-107.
[22] Egghe L. Theory and Practise of the G-Index [ J]. Scientomet⁃rics, 2006, 69 (1): 131-152.
[23] 杨爱青, 马秀峰, 张风燕, 等. g 指数在共词分析主题词选取中的应用研究[J]. 情报杂志, 2012, 31 (2): 52-55, 74.
[24] Huang C, Su J, Xie X, et al. A Bibliometric Study of ChinasScience and Technology Policies: 1949—2010 [ J]. Scientomet⁃rics, 2015, 102 (2): 1521-1539.
[25] 赵志君, 庄馨予. 中国人工智能高质量发展: 现状、问题与方略[J]. 改革, 2023, (9): 11-20.
(责任编辑: 郭沫含)
基金项目: 教育部人文社科青年项目“全球数据主权博弈背景下健全我国数据跨境流动规则体系研究” (项目编号: 21YJC870019)。