APP下载

基于文本挖掘的我国人工智能产业政策量化研究

2019-01-17于敏敏陶于祥龚振炜刘继明

中国电子科学研究院学报 2018年6期
关键词:工具规划人工智能

袁 野,于敏敏,陶于祥,龚振炜,刘继明

(1.重庆邮电大学经济管理学院,重庆 400065;2.中国电子科学研究院,北京 100041)

0 引 言

2017年以来,国务院先后出台了《国务院关于印发新一代人工智能发展规划的通知》、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》等一系列人工智能产业相关的政策文件。随后,各省市地方层面的人工智能产业发展规划也相继出台,截止2018年6月,一共有16个省市出台了人工智能产业规划。作为战略性新兴产业和《中国制造2025》的重要发展领域,人工智能的发展已经成为推动我国经济社会发展的新引擎。基于此,本文选取了2017年6月至2018年6月之间,16个省级层面的人工智能产业规划作为研究样本,运用Python、Gephi等文本挖掘与数据可视化方法,从高频关键词和内容关联度着手,对政策主体、研究热点、重点领域和相关举措进行分析。本研究对进一步厘清我国不同区域人工智能产业布局具有重要参考价值,并提出了我国未来人工智能产业高质量发展的相关政策建议。

1 研究设计

1.1 研究方法

随着大数据技术的广泛应用,文本挖掘技术越来越多被应用于产业政策等方面的研究,国内外已有大量学者对科技政策类文本进行挖掘与分析。张永安、闫瑾等学者基于文本挖掘的方法对科技成果转化政策内部结构关系与宏观布局进行研究,在此基础上构建了科技成果转化政策三维结构框架,以帮助政府部门及时把握科技成果转化政策的制定与实施[1]。苏敬勤、许昕傲等基于共词分析对我国技术创新政策结构组成以及中央政策和地方政策的内部关系进行探讨[2];张晓、周霞等基于扎根理论和文本挖掘的方法对2006-2016年的中国科技服务业政策进行分析并得到中国科技服务于政策的量化的演变。[3]国外,Massey等学者通过文本挖掘对两千余份政策文件进行分析,对政策文件的可读性及内容进行评估。[4]Junseop Shim等人通过语义网络分析研究了美国、英国、德国等六个国家的核能政策,并构建了政策框架。[5]

基于此,本文采用文本挖掘的方法对人工智能政策进行量化分析。首先对国内各省市发布的16份人工智能规划进行搜集整理,再使用Python的Jieba分词对文本内容进行中文分词,得到关键词量化分布特征,在此基础上使用gaphi绘制关键词关联度图谱并对其进行分析。通过对人工智能政策的高频关键词进行研究分析,进一步探索了人工智能产业发展过程中政策主体、政策布局以及主要政策工具等。这些研究发现一方面可以帮助人工智能产业政策制定者及时把握政策制定情况,另一方面帮助政策执行者更好的理解政策并付诸实施。

1.2 数据来源

自国家发布人工智能政策以来,各省积极响应,加快人工智能产业布局。其中,北京、上海、湖北等省市最先制定人工智能规划,其他城市紧随其后。截止到2018年6月,有北京、上海、广州、天津、江苏、浙江、福建等16个省份发布了人工智能产业规划。这些省市主要集中在东南地区及东北地区,除直辖市北京、天津外,其他省份河南、山西、陕西、甘肃等地暂未出台人工智能产业发展规划。本研究选取的16份人工智能产业政策规划文本如表1所示。

表1 各省市出台的人工智能规划

2 政策文本的数据挖掘分析

2.1 关键词词频分析

在政策文本挖掘中,关键词分析能够体现该政策文件的重点、要点和相关政策力度的使用情况。本研究主要利用Python的分词功能对各省规划文本进行分词后得到关键词及词频分布,然后按降序方式对关键词进行排序并剔除“的”、“关于”等与研究主题无关的词,对排名前30的关键词进行分析.

从关键词词频分布情况看,各省市人工智能规划中排名前30的关键词分别为人工智能、技术、产业、应用、发展、企业、创新、平台等,如表2所示。

表2 排名前30的关键词频

2.2 关联度图谱分析

关联分析是一种简单、实用的分析技术,主要用于发现存在于大量数据集中的关联性或相关性,从而描述事物中某些属性同时出现的规律和模式。对人工智能政策文件进行关联度分析,有利于发现政策文本相关实体中存在的某些关键属性,掌握实体之间的关联程度以及关联模式,反映各省人工智能规划中相关内容的整体情况。

本文采用Gephi软件进行政策文件的关联度分析。Gephi能够对复杂数据集产生有价值的可视化效果,经常被用于社会网络分析。郭燕燕、杨朝峰等学者采用Gephi软件对部委情报机构网站间的链接关系进行可视化展示,进而分析情报机构链接网络结构。[6]邹伟、刘永学等学者采用网络爬虫工具获取网络新闻数据,对爬取到的数据进行中文分词、建立信息数据库后,使用Gephi软件进行可视化,从而发现中菲黄岩岛争端事件的整体面貌。[7]相比较于Citespace、Hiscite等文献分析工具,Gephi对文献量和数据源的要求不高,具有社会复杂网络统计分析简便、易操作和图谱美观等优点。借助Gephi对各省市人工智能产业政策的主要内容进行社会复杂网络可视化分析,可以直观地展示人工智能产业政策方面目前参与主体、政策布局以及政策工具之间的关联性。

本研究在使用Python对16份政策文本内容进行分词和关键词共现后,通过Excel形成关键词共现网络,运用可视化软件Gephi对关键词矩阵进行图谱分析得到政策关联度图谱,如图1。

图1 关联度图谱分析

根据关联度图谱,第一类关联的是企业、高校、市场、政府在内人工智能产业参与主体,第二类是技术、产业、应用等当前关注的热点领域,第三类是促进产业发展所采取的一些措施,例如人才培育、平台建设等。

3 政策工具的量化分析

3.1 政策主体

发展人工智能涉及的政策主体有企业、政府、高校和科研院所和市场。其中企业是创新主体,高校和科研院所提供技术人才支持,市场是人工智能发展的主导力量,政府发挥规划引导作用,如图2所示。

图2 政策主体的词频量化分析

“企业”在各省规划中出现总频次高达615次,从事人工智能的企业数量越多,该地区的人工智能产业发展水平越高。根据中商产业研究院整理的数据显示,2018年中国人工智能企业共有4千多家,其中北京人工智能企业数量达到1千多家,超过全国企业数量的1/4,企业数量及能力都远超其他城市。这些企业类型覆盖了硬件制造、软件技术研发、通用平台支持、终端产业应用等各个产业链环节,使得北京市人工智能产业的发展水平遥遥领先。

高校和科研机构为企业提供相应的技术和人才。各省规划都提到发挥高校和科研机构的创新作用来加强人工智能关键领域技术前瞻布局和研发攻关,同时通过产学研合作,在高校设立人工智能学院,开设人工智能相关课程,为企业提供有用的人才。目前已经成立了人工智能学院的高校有天津大学、南开大学、西安电子科技大学、南京大学、中国科学院大学等。

政府主要发挥规划引领作用。政府通过参与人工智能规划引导、政策支持、安全防范、市场监督、政府数据开放、环境营造、伦理规划、知识产权保护等过程,提供政府决策与服务,为人工智能产业发展提供良好的环境,加快形成各省市人工智能技术和产业的竞争优势。

从技术和产业的发展规律来看,市场作为人工智能产业发展的主导力量,在配置资源起到了决定性的作用。发展人工智能产业要以市场需求为导向,围绕市场消费热点,开展人工智能应用试点;遵循市场规律,加强市场监管,形成市场竞争优势。

3.2 政策布局

通过对规划中关注的热点词频分析,可以看出,目前对于人工智能相关技术的研究,尤其是芯片等核心技术与产品的研发与突破是各省发展人工智能产业的重点任务;同时,更加注重人工智能技术同产业与应用场景的结合,实现产业化、应用化是人工智能产业发展的目标。如图3所示。

图3 政策布局的词频量化分析

人工智能产业的发展需要加强技术创新。虽然近年来人工智能取得快速发展,但是距离成熟应用尚存在技术瓶颈。“技术”一词贯穿于各省人工智能产业规划的始终,在指导思想、基本原则、主要任务到保障措施等各个环节中,多次强调发展人工智能产业需要着力突破人工智能关键技术。例如北京等多个省市都提到将突破人工智能芯片及传感器技术、开发人工智能操作系统和基础软件等底层技术作为人工智能产业发展的目标之一。[8]

“产业”和“应用”在各省人工智能规划中提到的次数分别为725次和665次,仅次于主题词“人工智能”和“技术”。说明政府的重点正在从技术转向技术与产业、应用的结合,更加重视人工智能相关技术的落地。另外,在产业融合过程中,各省人工智能规划体现出因地制宜的特点。例如黑龙江农林业发达,在规划中强调人工智能技术与黑龙江的制造业、农林业、医疗健康等优势产业深度融合;福建等沿海城市在规划重大工程时,围绕“智慧海洋”工程建设目标,启动海洋智能机器人发展工程。

3.3 主要政策工具

政策工具是达成政策目标的手段,因此政策工具分类方式的选择也会根据政策目标的不同进行调整。已有学者基于政策工具的视角对不同类型的政策进行分析。李运华、王滢淇等基于政策工具分析了了新时代我国职业教育政策,将政策工具分为权威、象征和劝诫工具、激励工具、能力工具和系统变革工具五种。黄新华、于潇等学者将环境规制政策工具分为命令控制型、市场激励型、公众参与型和自愿行动型四类用以检验环境规制对经济发展的影响效应。本研究从人工智能政策文本中提取到的主要政策工具包括创新工具、人才工具、平台工具、和融合工具。主要政策工具如图4所示。

图4 主要政策工具的词频量化分析

创新是人工智能产业发展最根本的动力,加强各省市创新平台建设,就是要让科技在各省市经济社会发展中发挥更大作用,让科技成果更快地转化为现实生产力,让各类人才的作用得到更好发挥。

人工智能科研前瞻布局还需要加快各类平台建设。规划中提到的平台主要涉及创新平台、应用平台、技术研发平台等。其中,针对制约人工智能产业发展的“数据孤岛”问题,一些省市的规划中多次提到探索建立数据资源开放共享机制,加快推动政府数据开放等措施。加快各类平台建设有利于人工智能产业的更好发展。[9]

人才保障也是各省发展人工智能产业中的重要举措。各省规划中都提到加强人工智能高端人才引培,具体措施主要涉及户籍政策、生活补贴、购房优惠。人工智能产业的高速、高质发展需要引人、育人、留人,用人三方面同时进行,才能充分发挥人才对产业的促进作用。

4 结 语

人工智能作为引领未来的颠覆性、战略性技术,成为国际竞争的新焦点和经济发展的新引擎。本研究通过文本挖掘与数据分析,得到如下结论:东北和东南地区人工智能规划出台较为集中,其他部分省市暂未出台相关规划。政策参与主体方面,企业是我国人工智能产业创新的主体,高校和科研院所提供技术人才支持,市场是人工智能发展的主导力量,同时政府在人工智能产业发展中发挥规划引导作用。政策布局方面,以智能芯片为代表的人工智能技术和以AI+医疗为代表的技术的产业化、应用化是当前人工智能领域关注的重点,创新、平台、人才和融合发展是发展人工智能产业的主要政策工具。通过对我国各省市出台的16份人工智能产业规划的分析,具体可以从以下四个方面采取措施,加快我国人工智能产业的布局及规划的实施。

4.1 抢抓机遇,加快布局

把人工智能放到未来经济建设的核心位置。对我国而言,人工智能是未来技术制高点和经济增长点,是把握未来发展先机并提升国际竞争力的重要途径。全国各省市应积极响应《促进新一代人工智能产业发展三年行动计划(2018-2020年)》等系列国家层面人工智能产业规划。其中,人工智能产业发展较好的东南地区和东北地区应紧紧围绕各省规划中提到的人工智能产业目标,积极执行并落实各省人工智能规划。其他暂未人工智能产业规划的省市,应加快产业布局,学习借鉴其他地区发展人工智能的相关经验,顺应科技发展趋势。各省市协调发展,把握好人工智能的历史机遇,提升中国科技创新能力。[10]

4.2 提升创新能力,建设创新平台

各省人工智能产业规划中多次强调“创新”和“平台”。第一,突出企业创新主体地位,充分发挥企业在人工智能产业发展中的创新作用,鼓励科技型企业创立,培育具有国际影响力的行业领军企业;第二,积极推动产学研协同创新,全力构建全球顶尖的人工智能创新生态,加快形成具有国际竞争力和技术主导权的人工智能产业集群;第三,注重芯片等关键技术的研发与制造,从根本上提高国家自主创新能力;第四,打造人工智能产业高端创新平台,提高科技创新与成果转化的支撑与服务能力,加快技术成果转化,为智能科技产业的创新发展提供持续动力。

4.3 赋能现有产业,打造现代服务业新引擎

人工智能产业的发展离不开“产业融合”。应突出新一代人工智能在经济、社会等各个领域的需求应用,坚持应用与需求导,将AI赋能战略性新兴产业,打造现代服务业新引擎。我国正处于全面建成小康社会的决胜阶段,人口老龄化、资源环境约束等挑战依然严峻,人工智能相关技术通过赋能现有产业,与医疗、教育、养老、环境保护、司法服务等领域广泛结合,能够极大提高公共服务精准化水平,全面提升人民生活品质。

4.4 强化人才支撑,发挥引领作用

坚持人才优先发展战略,创新人才引进和培育机制。第一,引进高端人才,紧扣人工智能发展需求,加大柔性引才力度,引进一批人工智能领域国内外顶尖科学家、科技领军人才和高水平创新团队以及优秀青年人才。第二,培育高素质人才团队,重点培养一批具有发展潜力的人工智能领军人才,加强人工智能基础研究、应用研究和运行维护等方面专业技术人才。第三,推动人工智能学科建设,完善人工智能领域学科布局,鼓励有条件的高等学校在原有基础上拓宽人工智能专业教育内容,加强人工智能与其他学科专业教育的交叉融合,形成“人工智能+X”复合专业培养新模式。

猜你喜欢

工具规划人工智能
我们的规划与设计,正从新出发!
波比的工具
波比的工具
2019:人工智能
准备工具:步骤:
人工智能与就业
规划引领把握未来
“巧用”工具
快递业十三五规划发布
数读人工智能