基于文本相似度计算的我国人工智能政策比较研究*
2021-02-01马海群
张 涛 马海群
(1.黑龙江大学信息管理学院 哈尔滨 150080;2.黑龙江大学信息资源管理研究中心 哈尔滨 150080)
0 引 言
自1956年麦卡锡首次提出人工智能概念后,经过60多年的演进,直到大数据出现后才加速推动了人工智能的跨越式发展。此后世界各国纷纷通过制定人工智能国家战略加速产业发展[1],我国也出台了一系列国家层面的人工智能政策文件,其中包括《“互联网+”人工智能三年行动实施方案》《新一代人工智能发展规划》(以下简称规划)、《促进新一代人工智能产业发展三年行动计划》,顶层设计彰显了人工智能的重要性[2],在此之后各省市相继发布了本地区关于人工智能产业的发展规划、行动计划、实施方案等政策文件。2019年3月在政府工作报告中首次提出“智能+”的概念,与此同时还强调要继续深化大数据、人工智能等研发应用[3],这意味着“智能+”将正式接棒“互联网+”,我国人工智能即将开启和互联网一样的规模化落地之路,在未来几年内将快速在各行各业落地。2020年2月习近平在中央全面深化改革委员会第十二次会议中强调要鼓励运用大数据、人工智能等技术,在疫情监测分析、防控救治、资源调配等方面发挥支撑作用[4]。一系列重磅政策使人工智能受到社会各界的广泛关注,在对人工智能政策研究中发现,虽然人工智能政策制定的总体目标相同,但由于区域特色不同,各地区所发布的政策差异较大,因此对国家与各地区间人工智能政策的比较研究就变的尤为重要,研究不但可以通过政策间的相似性探寻重点关注内容,还可以通过政策间的差异性探寻区域发展特色。文章基于文本相似度计算对我国人工智能政策进行比较研究,以实现对不同地区间政策文本数据化分析,进而实现为政府决策提供科学化建议。
1 文献综述
目前,国内外学界围绕人工智能政策比较研究形成了一系列成果,在国内研究成果主要分为两类:第一类是国内人工智能政策比较研究。如汤志伟等[5]从政策工具和创新价值链维度对我国地方政府人工智能政策进行内容分析。章小童等[6]通过主题词共现分析对我国人工智能政策进行研究。李良成等[7]通过构建“目标—工具—产业链”的三维人工智能政策框架对人工智能政策进行定量分析。李明等[8]通过构建“政策外部结构—政策工具—政策主题特征”的三维分析框架对我国央地政府人工智能政策进行比较研究。第二类是不同国家间的人工智能政策比较研究。贾开等[9]对美国、英国、德国、中国人工智能政策的历史沿袭进行了回顾,并对其当前政策框架的主要特征进行了归纳,对中国人工智能公共政策的未来改革提出建议。高杰等[10]通过对中德在2013—2018年发展政策与战略布局的对比分析,借鉴与吸取德国经验,获得启示并给出我国人工智能产业发展的政策建议。毛子骏等[11]以政策工具为视角对中、美、日、英、法五国的人工智能政策进行比较分析。汤志伟等[12]从三个维度选择17个政策变量,运用二元回归方法比较中美两国人工智能产业政策的差异。国外对人工智能政策的研究成果相对较少,如YangHeeTae[13]提出政府要从政策制定角度出发,提高人工智能的透明度,完善与隐私和责任相关的法律制度。V.Ozdemir[14]提出工业5.0计划,要通过安全、创新技术政策来解决人工智能在产业应用过程中存在的问题。S.Rao等[15]提出人工智能政策需积极促进产业发展,但要审慎监管并应对存在的安全隐患。A.Lauterbach[16]介绍了人工智能的关键技术、风险和战略的发展趋势,通过社会治理框架来确保人工智能的安全性。
综上所述,近两年国内对人工智能政策比较研究多以政策工具和主题特征为视角,缺少从政策文本内容上较为全面比较研究成果,而国外多是集中在利用人工智能技术解决政策科学性问题的成果,针对人工智能政策本身的研究成果较少。由于不同研究视角可以形成多元化的分析结果,通过文本相似度计算可以科学化的揭示不同区域间人工智能政策内容上的相似性和差异性,再结合各地区的实际情况,最终为我国各地区人工智能产业的发展提供政策建议。
2 研究方法与过程
文本相似度计算在不同领域具有重要作用并被广泛应用[17]。D.Lin从信息论的角度阐明文本相似度的共性和差异关系[18],通过以上理论可以假定政策文本间相似度值越高,则共性越大,相似度值越低,则差异性越大。现对将研究方法与过程[19]分解如下,如图1所示。
a.政策文本采集:把人工采集的政策文本录入到自建语料库[20]中来,语料库信息分为三部分存储,①元信息:主要记录发布时间、发布机构、有效时间、政策类别等字段;②内容信息:以*.txt文本文档(UTF-8格式)的形式存储在服务器中;③语句片段信息:按句子划分进行语句单元存储。
b.文本预处理:将与人工智能政策相关的383条政策词语并导入程序中,利用python语言jieba工具对文本进行分词、去停用词等预处理操作,将文本数据转换为可分析处理的初始格式。由于超短语句(字符小于5的语句)对所计算的结果影响较大,因此需要去除此类无效语句。
c.相似度计算:本文将人工智能政策文本按语句片段划分为短文本,共分为4 296条语句,总计252 185字符数,利用python语言Gensim工具中的BOW模型、TF-IDF模型和余弦相似度[21],对《规划》中六大重点任务与各地区人工智能政策文本进行语句相似度计算。
图1 基于文本相似度计算的政策比较研究过程图
d.生成政策框架:抽取《规划》中六大重点任务形成人工智能产业发展任务一级类目,每部分任务中的具体内容作为二级类目,由于文本已经进行预处理操作,因此可以认为待分析政策文本语句都具有实际意义,并具有可比性,本文提取相似度最高的语句作为待分析样本,将语句中最大相似度数值填充到框架中来,最终形成下文中的分析结果。
e.政策比较研究:计算结果在一定程度上可以反映出《规划》中六项重点任务与各地区人工智能政策文本相似性和差异性,再结合各地区人工智能发展的实际情况,进行综合比较研究,最终给出各地区人工智能发展科学化的政策建议。
3 实证研究
3.1样本选择本文主要研究对象有两类,均来源于团队自建语料库[20]:一是《规划》,该文件是国务院发布人工智能产业布局的战略性政策,描绘了我国新一代人工智能发展蓝图,确立了“三步走目标”和“六项重点任务”,其中六项重点任务是人工智能政策执行的核心部分,也是各地区人工智能政策制定的重要依据,主要包括:任务1:构建开放协同的人工智能科技创新体系;任务2:培育高端高效的智能经济;任务3:建设安全便捷的智能社会;任务4:加强人工智能领域央地融合;任务5:构建泛在安全高效的智能化基础设施体系;任务6:前瞻布局新一代人工智能重大科技项目。文章将此部分内容提取并形成框架,将其作为比较对象。二是2016-2019年我国20个地区发布的省级政府层面人工智能发展行动计划、实施意见或实施方案,把这些政策文件作为被比较研究对象,详见表1。
表1 各地区省级政府人工智能政策文本(按发布时间排序)
3.2基于《规划》重点任务的政策比较分析《规划》是国家对人工智能产业发展的顶层设计,其中六项重点任务是人工智能产业从理论研究走向实际应用的关键部分,将《规划》六项重点任务中的具体内容作为参照,与各地区人工智能政策文本作比较分析有利于挖掘人工智能产业发展过程中的重点关注及区域特色内容[22],现对重点任务中具体内容分析如下:
3.2.1 构建开放协同的人工智能科技创新体系 在重点任务1中主要包括建立新一代人工智能基础理论体系(简称“基础理论”)、建立新一代人工智能关键共性技术体系(简称“关键共性技术”)、统筹布局人工智能创新平台(简称“创新平台”)、加快培养聚集人工智能高端人才(简称“人才队伍”)四项具体内容。
a.基础理论。该部分数值范围是(0.2272~1),其中安徽省最为突出,数值为1。安徽省在2018年印发《安徽省新一代人工智能产业发展规划(2018—2030年)》中将加强人工智能基础理论和核心技术研发作为重点任务之一,且每年要编制人工智能基础理论和核心技术导向计划,指导企业、高校、科研院所等组织实施人工智能技术重大科技专项。辽宁省为0.8787、陕西省为0.7339、广东省为0.7129,这些地区的政策文本中基础理论层面的内容较为明确,充分发挥高校及科研院所科研优势,实现理论研究的超前布局。
b.关键共性技术。该部分数值范围是(0.3167~1),其中浙江省、安徽省最为突出,数值分别为1和0.9621。浙江省在2019年印发《浙江省促进新一代人工智能发展行动计划 (2019-2022年)》中在数字经济重大科技专项中分设人工智能专项,以“数据、算法、硬件”为核心,聚焦人工智能关键算法、软硬件协同和专用系统等重点领域,鼓励产学研用相结合。而安徽省则是依托企业、高校、科研院所在人工智能和大数据核心算法方面的研发基础,整合资源,加强核心关键技术的研发。辽宁省为0.8491,数值也较高,辽宁省在2017年《辽宁省新一代人工智能发展规划》中明确对关键共性技术的持续研究,并加强支撑下一代智能技术的前瞻布局。
理论基础和关键共性技术研发是人工智能产业发展的基础,这需要该区域有较好的人工智能前期发展基础并具有一定研发能力,并非所有地区的人工智能政策中都把这部分作为重点内容,因此从数据上呈现出地区政策的差异性。
c.创新平台。该部分数值范围是(0.2157~0.6753),数值整体较低,只有辽宁省、广东省略高,数值分别为0.6753和0.6647。辽宁省在规划中提出要统筹布局人工智能创新平台,并基于地区特点建设工业智能制造管控平台、海陆空智能机器人平台、机器人质量检验与性能测试平台和人工智能软硬件开源平台。广东省在规划中提出要推进人工智能领域建设若干国内领先的开放创新平台,构建开放协同的创新平台体系。由于在《规划》中提出的布局人工智能创新平台是国家总体性部署,各地区会根据区域特点有针对性的进行创新平台建设,因此导致该部分整体数值较低。
d.人才队伍。该部分数值范围是(0.2833~0.9595),其中甘肃省和福建省最为突出,数值分别为0.9595和0.8506。2018年甘肃省印发的《甘肃省新一代人工智能发展实施方案》和福建省印发的《福建省人民政府关于推动新一代人工智能加快发展的实施意见》中都对人工智能人才培养和引进尤为重视,均将其作为该省人工智能发展的重点任务之一。吉林省为0.8331、安徽省为0.7656、贵州省为0.7379,数值也较高,这些地区的政策文本中均明确提及了培养聚集人工智能高端人才。而在数值较低的地区只是重点关注《规划》中培养聚集人工智能高端人才中的一部分。
重点任务1中安徽省(0.8128)、辽宁省(0.7376)数值较高,如图2所示。其中安徽省依托中国科学技术大学、中科院合肥物质科学研究院、合肥工业大学、科大讯飞等在人工智能和大数据核心算法方面的研发基础,加强对前沿基础理论的研究并开展核心关键技术攻关,并从加快本地人才培养、加大高水平人才引进力度和加强人工智能领域学科建设方面全力建设高素质人才队伍。辽宁省在政策中提出的建立新一代人工智能基础理论体系、突破人工智能关键共性技术和统筹布局人工智能创新平台,这与《规划》中的内容基本一致,而且辽宁省将人才保障进行单独划分以突出其重视程度,并通过引进、培养和留住人工智能人才的管理办法来推进人工智能领域人才队伍建设。
图2 重点任务1与各地区政策相似度数值表
3.2.2 培育高端高效的智能经济 在重点任务2中主要包括大力发展人工智能新兴产业(简称“新兴产业”)、加快推进产业智能化升级(简称“产业升级”)、大力发展智能企业(简称“发展智能企业”)、打造人工智能创新高地(简称“创新高地”)四项具体内容。
a.新兴产业。该部分数值范围是(0.2184~0.8893),其中辽宁省和安徽省最为突出,数值分别为0.8893和0.8057。辽宁省在主要任务培育高端高效智能经济中将大力发展人工智能新兴产业作为重要内容,所提出智能软硬件、新一代工业机器人、特种智能机器人、智能运载工具、智能终端等建设内容和《规划》中内容基本一致。而安徽省依托重大新兴产业基地良好的产业基础,通过组织开展人工智能创新应用试点示范,推动人工智能成果转化、重大产品集成创新和示范应用,进一步推进新兴产业基地发展。
b.产业升级。该部分数值范围是(0.4529~0.8580),其中甘肃省和福建省最为突出,数值分别为0.8580和0.8490。甘肃省在大力发展人工智能新兴产业和推动人工智能与各行业融合创新方面较为重视,在智能软件、智能机器人、智能制造、智能农业、智能金融等方面都做了较为明确的要求。而福建省提出强化人工智能示范应用,加速推进人工智能在全省各行业示范应用,大力培育新产业、新技术、新模式和新业态,进而提升经济发展质量和效益,增强公众对人工智能的获得感、幸福感。
c.发展智能企业。该部分数值范围是(0.3711~0.9554),其中辽宁省和福建省最为突出,数值分别为0.9554和0.8057。辽宁省在大力发展智能企业中将深入实施智能制造工程推动企业智能化升级、加强智能工厂关键技术和体系方法的应用示范作为重要内容,这与《规划》中内容密切相关。而福建省把握新一轮科技革命和产业变革机遇,将人工智能与实体经济深度融合,立足各地产业基础,突出以福厦泉国家自主创新示范区、国家级高新技术产业开发区和省级高新技术产业园区为重要载体,推动各地进行差异化产业布局,抢占先机,形成福建特色人工智能产业优势,推动经济高质量发展。
d.创新高地。该部分数值范围是(0.2761~0.8907),其中广西壮族自治区和辽宁省最为突出,数值分别为0.8907和0.7560。广西壮族自治区依托广西大学、桂林电子科技大学等高校搭建人工智能领域新型创业服务机构,建设一批低成本、便利化、全要素、开放式的人工智能众创空间,通过完善孵化服务体系来支持人工智能创新创业。而辽宁省全力推动沈阳中国智谷建设,加快大连软件产业园升级发展,全力打造以沈阳和大连为核心的人工智能创新高地。
在重点任务2中,新兴产业和产业升级是密切联系的,很多地区都在加快培育人工智能产业的龙头企业,但鉴于多方面因素,只有北京市、上海市、广东省、浙江省、安徽省等地区龙头企业较为突出,北上广坐拥人工智能高科技企业数百家,以百度、腾讯、华为等龙头企业为引领,浙江省的阿里巴巴,安徽省的科大讯飞等企业都在人工智能领域具有国际竞争力。如图3所示,在此部分辽宁省、吉林省、安徽省、福建省、广西壮族自治区综合数值较高,综合分析主要原因有二:一是部分地区出台人工智能政策中明确将培育高端高效智能经济作为重点之一,而其内容与《规划》内容也基本一致,因此数值较高,如辽宁省、吉林省;二是部分地区确实要通过人工智能政策推动产业升级发展,全力打造以关键城市为核心的人工智能创新高地,如辽宁省、安徽省、福建省、广西壮族自治区。而辽宁省包含以上两方面因素,因此数值最高。
图3 重点任务2与各地区政策相似度数值表
3.2.3 建设安全便捷的智能社会 在重点任务3中主要包括发展便捷高效的智能服务(简称“智能服务”)、推进社会治理智能化(简称“社会治理”)、利用人工智能提升公共安全保障能力(简称“公共安全保障”)、促进社会交往共享互信(简称“共享互信”)四项具体内容。
a.智能服务。该部分通过加快人工智能创新应用,围绕教育、医疗、养老等迫切民生需求为公众提供个性化、多元化、高品质服务。数值范围是(0.2516~0.9873),其中安徽省、吉林省、贵州省最为突出,数值分别为0.9873、0.9824和0.9344。安徽省在人工智能政策中将拓展人工智能服务领域作为重要内容,推出具有行业特点的专用人工智能软件及服务。重点支持深度学习、语音识别、语法语义分析、图像识别、智能微创、辅助诊疗等云服务发展,吸引应用开发者,开发丰富的行业应用,构建人工智能产业发展生态圈。而吉林省是由于在重点内容中提到的发展便捷高效的智能服务和《规划》中的内容基本一致,因此数据较高。贵州省在《智能贵州发展规划(2017-2020年)》中对本地区的人工智能发展描绘非常细致,基于贵州省良好的大数据发展基础,在主要任务中明确了推进智能服务业的发展思路,并细化至物流服务、金融服务、商贸服务及其他各类专业的智能服务。
b.社会治理。该部分数值范围是(0.1743~0.9646),其中吉林省、广西壮族自治区、安徽省最为突出,数值分别为0.9646、0.9221、0.9150。除吉林省与《规划》内容制定较为一致以外,广西壮族自治区在人工智能政策中提出从智能政务、智慧法庭、智慧城市、智能交通、智能环保、智慧水利等方面开展社会治理智能化应用与示范。安徽省针对传统社会治理领域存在的结构性信息壁垒,综合运用大数据、云计算、物联网等信息技术,提升社会治理的智能化水平。
c.公共安全保障。该部分数值范围是(0.0856~0.6601),整体数值较低,其中辽宁省、云南省、安徽省数值略高,分别为0.6601、0.6310、0.6035。辽宁省提出构建智能化监测预警与综合应对平台,提高安全事故预警能力,降低安全事故发生率,提高应急决策和重大事故救援和处理能力。云南省为进一步促进人工智能在公共安全领域的深度应用,在全面推进公共服务智能化中提出了数字公安,并积极推动构建公共安全智能化监测预警与控制体系。安徽省结合社会治安综合治理形势提出智能化公共安全保障,使人民群众的安全感不断增强。虽然有些地区的确对该部分内容关注较少,但还有很多地区通过开展公共安全智能化应用与示范对该部分进行了非常细致的部署。
d.共享互信。该部分数值范围是(0.0971~0.5500),整体数值最低,只有安徽省数值相对略高为0.5500。由于《规划》是我国人工智能领域到2030年的战略规划,因此社会交往共享互信体系的构建需要人工智能具备一定基础,在理论研发及关键技术攻关层面有较大突破后才能促进共享互信体系的形成,部分地区的人工智能规划是到2020年或2022年的实施方案或行动计划,因此综合分析多数地区并没有在政策中过多关注该部分内容。
重点任务3需要在重点任务1和重点任务2的基础上进行建设。如图4所示,在此部分安徽省数值为0.7639最为突出,综合分析主要原因有二:一是安徽人工智能发展基础较好,产学研紧密结合,以龙头企业为引领,带动地区人工智能产业转型升级,在智能服务、社会治理、公共安全保障等具体内容均有所体现;二是安徽在规划制定时以《纲要》为基础将此部分内容进一步细化为发展人工智能产品和服务、实施“人工智能+”行动计划、建设安全便捷的智能社会3部分,通过细化内容使任务更加明确,进而加快人工智能在社会领域的深度应用。
图4 重点任务3与各地区政策相似度数值表
3.2.4 加强人工智能领域央地融合 在重点任务4的数值范围是(0.1982~1)。此部分跨度较大,如图5所示,辽宁省、吉林省、广西壮族自治区的数据均为1,这3个地区的政策央地融合部分与《规划》中对该部分提及完全一致。安徽省次之为0.7306,安徽省实施智能汽车央地融合发展专项,推动车辆电子控制、雷达、微机电系统等自主知识产权军用技术的转化应用,该地区是把央地融合理念融入到具体行动计划中来,具有较强的实施性。其他地区的数值相对较低,山东省(0.1982)、江苏省(0.2217)、福建省(0.2237)等地区数值最低,这些地区并未在政策中对人工智能领域央地融合进行专项部署。将央地融合和人工智能发展紧密融合是国家的重要战略部署,从基础理论和核心技术上看,军事智能和通用人工智能具有共通性,而应用技术研究要着眼于国家重大需求,尤其是军事需求,研发关键应用技术,进而实现推动我国人工智能领域的央地融合。
图5 重点任务4与各地区政策相似度数值表
3.2.5 构建泛在安全高效的智能化基础设施体系 在重点任务5的数值范围是(0.2250~0.8624)。如图6所示,其中安徽省数值最高,为0.8624,安徽省把强化基础设施保障作为人工智能政策中重点任务之一,提出加快建设信息基础设施、推动数据开放共享、提升信息安全保障能力等具体建设内容。甘肃省数值为0.8421,甘肃省在政策中明确将加强人工智能基础平台建设作为重点任务之一,同时提到搭建人工智能创新平台、布局人工智能的5G增强技术研发及应用和加强大数据基础设施建设等内容。贵州省、辽宁省、吉林省、北京市和云南省在人工智能政策中也不同程度关注此部分内容,但其它地区的确关注较少。
3.2.6 前瞻布局新一代人工智能重大科技项目 在重点任务6的数值范围是(0.2453~0.7508),详见图7所示。该部分整体数值偏低,但黑龙江省数值最高,为0.7508。黑龙江省为推动人工智能建设在《黑龙江省人工智能产业三年专项行动计划(2018—2020年)》中明确要培育一批人工智能重点项目,包括产业化项目、孵化培育项目和技术攻关项目。依托哈尔滨工业大学、哈尔滨工程大学等高校先进的人工智能技术,通过产业化项目、孵化培育项目、技术攻关项目等方式引导扶持哈工大机器人集团、大数据集团、中国云谷、哈尔滨科技创新城等创新主体做大做强,形成集聚效应,发挥人工智能产业集群的人才资源汇聚和科技辐射能力,进而带动配套产业发展。甘肃省数值为0.7020,甘肃省在政策中明确每年实施1~2项新一代人工智能科技计划项目用于解决人工智能发展的迫切需求和薄弱环节,形成以重大项目为核心、现有研发布局为支撑的人工智能项目群。
图6 重点任务5与各地区政策相似度数值表
图7 重点任务6与各地区政策相似度数值表
3.3《规划》六项重点任务间政策比较分析通过对《规划》中六项重点任务在各地区相似度平均值分析,可以探寻人工智能政策重点内容及各地区政策间的共性,也可以勾划出人工智能政策的基本框架。如图8所示,具体分析如下:
图8 《规划》六项重点任务的具体内容相似度平均值图
产业升级(0.6496)、新兴产业(0.6461)、人才队伍(0.6161)、社会治理(0.6067)、智能服务(0.6008)在各地区人工智能政策中平均值较高,这些内容是各地区政策中最为关注的核心。大力发展人工智能新兴产业(新兴产业)、加快推进产业智能化升级(产业升级)是人工智能政策中培育高端高效的智能经济中的重要组成部分,此项内容是通过人工智能促进经济社会发展的核心部分,也是人工智能政策中的主要内容,因此从数值上可以看出各地区政策对此部分内容尤为重视。加快培养聚集人工智能高端人才(人才队伍)是构建开放协同的人工智能科技创新体系的主要内容之一,是人工智能产业发展的重中之重,在经济发达地区人工智能高端人才聚集情况较好,而其它地区存在着不同程度人才流失与缺失的情况,因此如何培养并聚集高端人才成为人工智能产业发展的关键问题。发展便捷高效的智能服务(智能服务)和推进社会治理智能化(社会治理)是建设安全便捷智能社会的主要内容,智能社会建设是以提高人民生活水平和质量的目标,智能化服务会有效提升全社会智能化水平,会使人们能够最大限度享受高质量服务和便捷生活。社会治理智能化水平是智能社会的另一个重要体现,行政管理、司法管理、城市管理、环境保护等社会治理的热点难点问题是各地区社会治理智能化的重点建设内容,虽然在经济发达地区已经初步构建社会治理智能化的各类应用,但多数地区尚属建设过程中[23]。
数值较高的部分反映出各地区政策制定的共性,也是各地区人工智能政策的核心内容。数值较低的部分主要分为以下两类情况:一是由于各地区规划有效时间参差不齐,多数规划是到2022年左右,而《规划》是国家对人工智能直到2030年的长期战略部署,因此部分地区并未能体现出此部分内容,如公共安全保障(0.3315)、共享互信(0.1678)等。二是由于部分地区经济信息产业基础均较为薄弱,基础设施建设相对滞后,并不具备人工智能基础理论及关键共性技术研发能力,因此从人工智能政策制定层面对该内容关注较少,如基础理论(0.4955)、基础设施体系(0.4837)等。
3.4地区间政策比较分析《规划》中重要任务与各地区人工智能政策平均相似度较高可以体现出人工智能政策制定的完整与全面,也突显出这些地区人工智能产业发展的区域特色,如图9所示,具体分析如下:
图9 各地区人工智能政策平均相似度数值图
从数值上看安徽省和辽宁省数据较高,其中《安徽省新一代人工智能产业发展规划(2018—2030年)》中较为全面体现了该地区的人工智能产业发展思路及特点,安徽省人工智能产业发展势头较好,将中国声谷作为安徽人工智能产业发展核心区[24],创立了产学研用相结合的创新体系,科大讯飞、华米科技等骨干企业实现省内产业应用落地,中科大、合肥工大等知名高校实现教学、科研双轨并行,这使安徽省语音产业由技术研发高地向全国语音产业发展高地迅速转变,已经逐渐成为产业特色鲜明、产业集群优势突出、产业规模和影响居国际前列的产业园。辽宁省拥有东软、新松机器人、沈阳机床厂、中科院沈阳自动化研究所等优秀人工智能技术、应用企业和科研院所,并拥有东北大学和大连理工大学两所优秀高校,大连培育千亿级人工智能产业集群,推动人工智能研究领域产业发展和技术成果应用等取得较大突破。辽宁省形成了以沈阳市和大连市为两点一线的人工智能发展产业群,以此带动辽宁省人工智能产业的快速发展。这两个地区人工智能产业发展路径较有特色,且取得了一定效果,在国内具有一定的示范效应。
甘肃省在2018年发布的《甘肃省新一代人工智能发展实施方案》是到2030年的长期规划,整体数值为0.5411,但任务5和任务6的数值均相对较高,分别为0.8421和0.7020。甘肃省建设的三维大数据物联网智能制造产业园项目是推进工业大数据应用示范,在经济欠发达的甘肃省逐渐形成以重大项目为核心、以现有研发布局为支撑的人工智能项目群,以此推动该区域的人工智能产业发展。黑龙江省在2018年发布的《黑龙江省人工智能产业三年专项行动计划(2018-2020年)》是一部三年行动计划,整体数值为0.3794,但任务6的数值最高,为0.7508。黑龙江依托哈尔滨工业大学、哈尔滨工程大学、东北林业大学、东北农业大学等高校,发挥专业领域及研发优势,培育一批人工智能重点项目,以市场需求为牵引,积极推进一批基础较好、应用前景明确的产业化、孵化和技术攻关项目。实现校企合作、全力推进人工智能产业的发展。
人工智能政策文本相似度数值仅能从某个层面体现地方政府对人工智能发展的重视程度,并不能全方位的展示人工智能发展总体情况。北京市、上海市、广东省、浙江省、江苏省这些地区的政策文本相似度数值并不突出,但从实际情况上来看,这些地区人工智能产业基础较好、人才体系健全、科研实力雄厚,已经形成了较好的企业孵化环境和产业生态环境[25]。而其他地区由于信息产业发展相对滞后,优势产业也不突出,且缺少良好的产业发展环境,因此这些地区需通过探寻区域特点及优势资源来形成特色的人工智能产业发展道路。
4 结论与建议
文章基于文本相似度计算对《规划》中六项重点任务与各地区人工智能政策进行了综合比较研究。新兴产业、产业升级、人才队伍、智能服务、社会治理等内容在各地区人工智能政策制定层面整体关注最高,呈现出政策制定的相似性。安徽省、辽宁省从数值上看总体表现最好,由于地方政府重视程度较高,人工智能产业呈现出发展迅速、重点任务明确等特点,而甘肃省、黑龙江省作为经济欠发达地区,部分内容较为突出,逐渐形成人工智能产业发展的区域特色,呈现出政策制定的差异性。基于以上结论,笔者对各地区人工智能产业发展提出如下建议:
第一,应加强人工智能基础理论及关键技术研发能力。基础理论及关键技术研发是人工智能产业发展的核心基础[26]。在《规划》中提出的三步走原则:到2020年技术和应用与世界先进水平同步;到2025年基础理论实现重大突破,部分技术与应用达到世界领先水平;到2030年理论、技术与应用总体达到世界领先水平。在这些基础理论及关键技术研发部分数值较高的地区,都充分发挥了知名高校及科研院所的科研优势,在人工智能专业领域基础理论及关键技术方面取得了一定突破。如:安徽省中科大、中科院合肥物质科学研究院、合肥工大;辽宁省东北大学、中科院沈阳自动化所、大连理工大学;陕西省西安交大、西北工大、西安电子科大。人工智能的基础理论和关键技术研发应作为人工智能产业发展的重要环节,各地区要根据实际情况利用区域优势资源来推进人工智能技术理论与关键技术的突破,要以区域知名高校及科研院所为依托,通过建立高水平人工智能研究实验室,培育一批符合区域发展特色的人工智能基础理论与关键技术重大科技专项,重点支持有潜能的研究团队,进而推动区域人工智能产业的发展。
第二,应加快培养并聚集人工智能领域高端人才。人才队伍是各地区人工智能政策中最为重视的内容之一,而加强人工智能领域学科建设是夯实人才培养的基础[27]。要通过以下方面实现培养聚集人工智能领域高端人才。一是要鼓励各区域高水平大学积极设置人工智能相关专业,形成“智能+”的复合专业培养新模式,加强产学研合作,鼓励高校、科研院所与企业等机构合作开展人工智能学科建设。二是加大人工智能领域高端人才的引才力度,完善引进人才创新环境。通过引导高校、科研院所和企业建设人工智能创新团队,实现领军梯队的方式,为本地青年科研人员创造良好的环境,加强对人工智能相关研究的支持力度,着力培养本地的人工智能高端人才。2019年初,安徽省在全国率先开设人工智能本科专业,以中科大、合肥工大等院校为首,初步形成了人工智能人才培养的体系。而在其它地区,如东北大学、大连理工大学、哈尔滨工业大学、西安交通大学、兰州大学等高校都开设了人工智能专业,高水平大学可以促进区域培养并聚集人工智能高端人才。
第三,培育特色龙头企业带动区域人工智能产业发展。培育特色高水平企业是人工智能区域发展的关键,应加大对区域高水平企业的政策倾斜与扶植,其中以数值较高的安徽省和辽宁省为例,科大讯飞是特色高水平企业带动区域人工智能产业发展的典范,安徽省重点打造科大讯飞在语音识别领域的突出优势,使成立20年的公司迅速攀升至国内乃至国际人工智能领域的龙头企业,其语音识别的核心技术已经保持国际领先,基于企业传统语音识别的技术优势,近几年在机器翻译、医学影像、人脸识别、自然语言理解等领域发展迅速。其它地区也重点发展并打造区域龙头人工智能企业,如辽宁省东软集团将人工智能应用拓展到健康、交通等领域。在尹丽波[25]人工智能发展报告中提出,北京市、上海市、广东省、浙江省是人工智能产业发展较好的地区,不仅人工智能企业超过百家,而且均有人工智能龙头企业作为地区的引领,如:百度、阿里、腾讯、华为、京东等企业,这些企业利用技术优势在人工智能领域快速发展。有些地区具有专业特色的企业也发挥了重要作用,如:华大基因的智能医疗、海康威视的智能安防、小米科技的智能家居等均为行业智能化的领跑者。
第四,应加强人工智能安全保障及共享互信体系建设。大数据作为新一代人工智能的重要支撑,两者是相互促进密不可分的,此部分在数值呈现上最低,人工智能基础理论和关键技术发展到一定阶段后,所带来的安全问题会变得尤为重要。人工智能是一把双刃剑,随着人工智能技术的发展,数据分析和挖掘能力不断增强,不但会使数字基础设施遭到攻击的可能性大幅增加,还会使数据泄露、深度伪造等事件发生概率大幅提升,而这些问题会对公民权益、社会稳定乃至国家安全带来深远的影响,因此要高度关注人工智能带来的安全风险,通过构建有效的风险防控保障体系来实现人工智能的安全保障[28]。2019年10月习近平总书记在中共中央政治局第十八次集体学习时强调,加快推动区块链技术和产业创新发展,协作与共识机制是区块链技术的核心理念,通过促进区块链与人工智能技术的融合,对当前人工智能与大数据间协同性的研究,构建新型社会的协作与共识机制,进而形成共享互信体系,最大限度降低人际交往成本和风险。
单从数据分析结果上看,部分地区的数据并不能反映出人工智能产业的实际发展水平,这需要进一步结合区域发展实际情况进行综合分析。当前人工智能政策中对技术及应用层面关注较多,但对人工智能产业发展过程中所带来的安全问题关注较少,因此笔者将在该领域持续研究,继续收集人工智能政策相关解读、报道、评论等文本,在未来有针对性的对人工智能政策和大数据政策协同做前瞻性研究,以期为政府制定政策提供决策支持。