基于文献分析的教育人工智能产业发展比较研究
2020-07-20王少青
王少青
摘 要: 人工智能新的浪潮正在教育领域引发深层次的变革,技术正在重塑教育的形态。教育人工智能的发展问题归结为处理谁来研究、在哪研究、研究什么、研究成果等问题的4W模型。通过对2017—2019年公开的论文和专利等文献的检索与分析,反映出教育人工智能的学术研究和科技创新总体上成果颇丰,在关键技术上侧重于学习算法的研究,而在应用领域更加关注智能机器人和教育游戏;相较于企业,高校的研究占据了主导地位。
关键词: 教育人工智能 文献分析 4W模型 产业发展
人工智能的概念是1956年在美国达特茅斯学院确立的,指让计算机像人那样思考、学习和认知,即用计算机来模拟人的智能[1]。大数据智能的出现、群体智能引起的关注、混合智能在人机一体化技术中的引入、跨媒体智能的兴起、无人系统的迅速发展等都初步崭露了新一代人工智能技术的锋芒。
一、研究背景
人工智能已逐渐渗透到社会的各个领域,多个国家已将人工智能提升为国家战略,出台了相关政策和规划,力争抢占科技的制高点。2017年,国务院首次将人工智能写入政府工作报告,同年发布了《新一代人工智能发展规划》,部署了我国发展人工智能的重点任务。工业和信息化部随即印发《促进新一代人工智能产业发展三年行动计划(2018-2020)》,全力助推人工智能的发展。2018年,教育部印发《高等学校人工智能创新行动计划》。旨在进一步提升高校人工智能领域科技创新、人才培养和服务国家需求的能力。人工智能新的浪潮正在教育领域引发深层次的变革,技术正在重塑教育的形态。在此背景下,研究如何应用新技术推动教育事业的发展具有重要意义。
二、发展概况与文献综述
2006年Hinton等人提出的深度学习技术拉开了新一代人工智能的序幕。ImageNet竞赛代表了计算机智能图像识别领域最前沿的发展水平,2015年基于深度学习的人工智能算法在图像识别准确率方面第一次超越了人类肉眼,人工智能实现了飞跃性的发展。伴随着机器视觉的研究获得前所未有的成功,深度学习在语音识别、数据挖掘、自然语言处理等不同研究领域相继取得突破性进展。2016年,微软将英语语音识别错词率降低至5.9%,可与人类相比肩。如今,人工智能已由实验室走向市场,无人驾驶、智能助理、新闻推荐与撰稿、搜索引擎、机器人等应用已经走进社会生活的各个角落。
教育人工智能领域已经涌现出一批相关研究,闫志明团队概括了人工智能的内涵、技术与应用等内容,侧重对美国政府两个人工智能报告的解读,分析了教育人工智能的内涵、关键技术与应用趋势;探索了机器学习在教育中的应用[2];贾积有探讨了人工智能教育应用的热点问题[2];唐烨伟团队分析了人工智能与STEM等课程的融合[4];吴永和团队构筑了人工智能+教育的生态系统[5]。
三、文献检索
(一)理论模型
教育人工智能的发展问题可归结为处理谁来研究、在哪研究、研究什么、研究成果等问题的4W模型(见表1)。
(二)数据来源
嘉兴数字图书馆是以浙江省文化信息资源共享工程和全省公共图书馆的数字资源为基础、应用先进的互联网技术打破空间的约束、提供一站式的各类数字资源检索和文献服务的区域性数字资源统一平台。嘉兴数字图书馆拥有CNKI中国知网、研究成果(论文、著作、专利)[KH-1][KH*3/4D]国研网、Springerlink图书等国内外近50种专业数据库资源,涵盖期刊、图书、学位论文、视频等多种类型,提供数字文獻资源的全文检索、浏览和下载[6]。
(三)检索范围
1.检索对象。长江三角洲地区是我国经济最活跃、信息产业发展最快的区域之一。这里汇聚了众多的高水平大学和科研院所,学术研究气氛浓郁,科技创新环境优越;许多科技企业在此建立研发中心和产业孵化平台。浙江大学等高校在信息技术领域具有扎实的人才培养基础和深厚的学术研究背景;阿里巴巴等企业在IT行业也拥有显著的影响力和创新能力。
2.检索主题词。人工智能的内涵十分丰富,算法模型、运算力和数据量是构成人工智能技术的三要素,深度学习、云计算和大数据三大核心驱动力共同促成了人工智能的突破性进展,语音识别、视觉分析、自然语言理解和情感识别等人工智能的关键基础能力迅速提高,商业智能对话和推荐、智能穿戴设备、自动驾驶、语言翻译、智能导航、新经济预测等智能产品应用正快速进入到实用阶段。因而,准确把握教育人工智能的关键技术和典型应用,适当控制检索范围有利于抓住核心问题,确保数据的采集过程具有良好的可操作性。
3.检索文献类型。常见的文献类型有期刊论文、硕博学位论文、中文图书、专利等。教育人工智能领域的人才培养、学术研究、技术和应用的创新等文献数据中的信息蕴含着十分巨大的信息量。如何准确有效地提取出反映问题本质的关键信息并揭示出它们之间的内在联系非常关键,在此基础之上尝试对教育人工智能的未来做一些合理的预测成为可能。
4.时间跨度。2017年起,发展人工智能产业呈现爆发式增长。三年来,围绕这一新兴产业的人才、资本、项目等资源要素纷纷聚集,新技术新产品等表现出向各应用领域全面渗透的态势,分析这一时期教育人工智能产业的发展具有重要的现实意义。
(四)检索方法
嘉兴数字图书馆可使用高级检索和专业检索功能进行高度定制化的检索方式。通过赋予专业检索工具准确的通用字段、文献类型和非通用字段等信息生成检索式,可以按照使用者的意图输出精确的检索结果。检索式的编写可参考专业检索页面的使用说明。
检索举例:检索浙江大学2017—2019年教育人工智能领域发表的博士学位论文数量。
四、基于文献分析的教育人工智能产业发展比较研究
(一)教育人工智能关键技术及典型应用文献比较分析
从总体角度分析,深度学习和机器学习的文献数量最多,分别占到了去重后文献总数的49.49%和32.05%;智能导师、智能测评、智能代理和情感计算极少,加起来也不到文献总数的2%。从文献类型分析,期刊论文数量占有绝对优势,专利数也比较可观;博士论文数量和中文图书相对较少,分别占文献总数的2.47%和2.10%,但绝对数量还是较多的。从技术和应用角度分析,以人工智能关键技术为主题的文献占有主导优势,达到87%;而单从应用角度来看,智能机器人和教育游戏的研究较热(见表2)。
(二)长三角地区部分高校教育人工智能领域文献比较分析
浙江大学、上海交通大学、东南大学、中国科技大学和南京大学在调研的14所高校中公开的文献数量总体上最多;合肥工业大学、华东师范大学、浙江工业大学分别在硕士学位论文数、期刊论文数、专利数3个分项指标中排到了前三位。宁波大学、浙江师范大学和浙江理工大学3所高校在教育人工智能领域的文献较少(见表3)。
(三)部分企业教育人工智能领域文献比较分析
从文献类型角度分析,企业明显热衷于申请专利,而对发表论文并不积极,总体上的比例大约是8:1。从企业间的横向比较来看,腾讯、百度和阿里巴巴这3家IT巨头的专利申请量远远大于联想、小米和科大讯飞,科研创新上的差距较为明显(见表4)。
五、结束语
研究表明,教育人工智能的学术研究和科技创新总体上成果颇丰,在关键技术上侧重于深度学习和机器学习算法的研究,而在应用领域更加关注智能机器人和教育游戏。浙江大学等一批重点高校既注重学术理论上的探索,又加强了技术成果的转化,论文和专利数量都远大于企业,在教育人工智能领域占据了主导地位。
产业发展的关键在人才,人才的培养是壮大人才队伍的重要途径,而高校又是培养人才的主陣地。一所高校在教育人工智能领域产出的文献数量越丰富,可以说明该校在这一领域的研究越活跃,也能反映该校的师资力量在这一领域也越强,强大的师资是人才培养的有力保障。重点关注文献产出丰富的高校,深入调研这类高校在各层次、各类型上培养人工智能专业人才的规模和方向,就能够对人工智能专业人才的总体供给水平产生具体的认识。
参考文献:
[1]潘云鹤,人工智能2.0与教育的发展[J],中国远程教育,2018(5).
[2]闫志明等,教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《国家人工智能研发战略规划》报告解析[J],远程教育杂志,2017(1).
[2]贾积有,人工智能赋能教育与学习[J],远程教育杂志,2018(1).
[4]唐烨伟等,基于教育人工智能支持下的STEM跨学科融合模式研究[J],中国电化教育,2017(8).
[5]吴永和等,构筑人工智能+教育”的生态系统[J],远程教育杂志,2017(5).
[6]嘉兴数字图书馆,〈http://www.jxelib.com/>.