自然语言处理项目式教学策略探究
2020-06-08罗世奇田生伟
罗世奇 田生伟
摘 要 结合地方院校的特点,发挥鄂东南地区的战略地位与优势,在目前人工智能概论课程的基础上,增加课程互动环节、翻转课堂,探索在新形势下进行自然语言处理项目式教学,为数据科学与大数据技术专业的开展奠定坚实的基础。
关键词 人工智能;自然语言处理;项目式教学;大数据技术
中图分类号:G642.0 文献标识码:B
文章编号:1671-489X(2020)04-0104-02
Introduction of Natural Language Processing Project Teaching Strategy//LUO Shiqi, TIAN Shengwei
Abstract This paper combines the characteristics of local colleges and universities to give play to the strategic position and advantages of the southeastern region of Hubei. On the basis of the current intro-duction to artificial intelligence, increase the interactive part of the course, flip the classroom, explore the introduction of artificial inte-lligence and natural language processing project-based teaching in the new situation, and lay a solid foundation for the development of data science and big data technology.
Key words artificial intelligence; natural language processing; pro-ject-based teaching; big data technology
1 前言
随着人工智能时代的发展,数据海量爆炸式增长。从20世纪中叶人工智能被提出,到现在的深度学习、知识图谱、区块链,人工智能技术经历了一系列的起伏。湖北理工学院于2018年申报数据科学与大数据技术专业获批,从2018年9月开始,在全校范围内开设人工智能概论公选课,之后将继续开设大数据概论公选课。人工智能人才培养已经成为社会发展的趋势。本文将探索项目式教学,增加课程互动环节、翻转课堂,为企业培养“三用”(能用、好用、耐用)人才。
2 背景
湖北理工学院地处黄石市,是以工科为主,重点培养应用型人才的省属普通高等学校。学校设置“数据科学与大数据技术”专业势在必行。
2015年8月19日,国务院发布《关于促进大数据发展的行动纲要》,提出信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源。随后的11月,中共中央十八届五中全会提出国家大数据战略,将大数据上升为国家战略。我国在“十三五”规划中提出:“实施国家大数据战略,推进数据资源开放共享。”2016年12月18日,工业和信息化部印发《大数据产业发展规划(2016—2020年)》,制定了“创新驱动、应用引领、开放共享、统筹协调、安全规范”的发展原则,全力推进“中国制造2025”。在这样的契机下,大数据领域必将迎来建设高峰和投资良机。
2016年9月,湖北省为贯彻落实《国务院关于印发促进大数据发展行动纲要的通知》,頒布《湖北省大数据发展行动计划(2016—2020年)》,该计划就立足本省的固有优势,发展湖北省大数据产业的主要任务、推进思路和发展目标等方面提出明确要求。
2017年8月,湖北省黄石市政府发布《黄石市智慧城市建设“十三五”规划》,规划指出以推进大数据建设、“互联网+”行动计划为契机,全面加强信息基础设施建设,加快推进产业转型升级,培育发展经济新动能,不断提高社会管理精度,主动创新民生服务新模式,挖掘改革创新和融合发展的新潜力,打造创新驱动和智能转型新优势,全面实现“兴业、惠民、善政”的目标,推动全市经济和社会发展迈上新台阶。
从上文可以看出,发展大数据产业和培养大数据人才,不仅是国家的发展战略选择,而且是湖北省实现科学发展、转型升级的必然选择,还是黄石市实现跨越发展、后发赶超的有效途径。截至目前,全国有250所高校开设“数据科学与大数据技术”专业,湖北省开设“数据科学与大数据技术”专业的高校有11所,分别是中国地质大学(武汉)、武汉理工大学、武汉轻工大学、武汉工程科技学院、湖北大学、湖北工业大学、湖北工程学院、中南财经政法大学、华中农业大学、华中师范大学、武昌理工学院。可以看出,鄂东南地区没有一所高校开设该专业,武汉地区有10所高校开设该专业,占总数的90%。2018年,湖北理工学院申报“数据科学与大数据技术”专业并获得批准。
3 项目式教学探究
应用型本科院校不仅要培养学生扎实的理论知识,更重要的是培养学生的实践动手能力。理论是实践的基础,实践是理论的升华,扎实的实践能力是学生就业强有力的保障,同时为企业培养“三用”人才也是高校的社会责任。通过项目式教学,高校的专业/课程需要与时俱进,结合地方应用特征,同时发挥学科优势。人工智能概论课程是“数据科学与大数据技术”专业的基础,这门课程涵盖了多学科的知识。人工智能概论研究领域广泛,通过多学科技术的融合,能培养复合型人才。通过人工智能+X模式,结合其他学科的知识背景,运用项目式教学的相关理论,达到活学活用的效果。
自然语言处理是研究计算机处理人类语言的一门技术,包括分词,词性标注,命名实体识别,实体关系抽取,句子/段落/篇章级别情感分析,地域、宗教、性别歧视识别,机器翻译,信息检索等研究领域。利用项目式教学研究人工智能+自然语言处理,主要是利用深度学习知识对自然语言文本进行处理与分析。目前国内研究比较好的高校有哈尔滨工业大学、清华大学、北京大学、中国科学院、苏州大学、新疆大学等。地处“一带一路”建设要点的新疆大学,对于中亚语系的研究较深,主要涉及汉语、维吾尔语、哈萨克语、藏语、土耳其语等。通过参考这些领先院校的先进经验,为项目式教学奠定坚实的基础。
首先,从网络媒体中抽取相关的语料,建立相应的语料信息。语料库的构建并不是一蹴而就,需要经历一个漫长的时间。结合地方语言构建语料将是一个很好的选择。2019年年初,学校公共文化研究中心随州方言调查项目完成并通过验收。通过地方语言的研究,挖掘方言所承载的地方文化精髓,为建设湖北方言文化多媒体平台、出版湖北语言资源集、保护与传承湖北方言文化、建设国家语言资源库作出新的贡献。语料信息构建完成之后进行分词,目前分词工具眾多,代表性的有两种。
1)语言云,以哈工大社会计算与信息检索研究中心研发的语言技术平台(LTP)为基础,为用户提供高效精准的中文自然语言处理云服务。
2)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),是中科院计算所研制的中文词法分析系统,2009年调整命名为NLPIR分词系统,主要功能包括中文分词、词性标注、命名实体识别、新词识别,同时支持用户词典,支持繁体中文,支持GBK、UTF-8、UTF-7、UNICODE等多种编码格式。
如图1~图5所示,分词之后,根据词性以及句子成分对文本进行实体关系抽取、词频统计分析、文本分类、情感分析等。
4 结语
本文通过项目式教学方法,剖析新形势下人工智能概论课程同自然语言处理知识相结合的教学理念,相信具有地方特色的人工智能培养思路及培养模式改革,可面向地区经济发展构建可持续的专业课程体系和培养体系,也必将对湖北理工学院应用型人才培养产生深远意义及影响。
参考文献
[1]黄美仪,陈长城,张立.培育面向人工智能大时代的创新人才:佛山市禅城区创新创客教育实践探索[J].教育与装备研究,2017(12):9-12.
[2]田生伟,于炯,帕里旦·吐尔逊,等.实践教学在软件工程专业教学中的改革与建设[J].中国教育技术装备,2011(27):20-22.
[3]田生伟,于炯,帕力旦·吐尔逊,等.软件工程创新创业实践人才培养模式改革[J].中国教育技术装备,2013(21):54-56.
[4]钱育蓉,于炯,王卫源.产学研结合的软件工程专业硕士研究生培养模式:以新疆大学软件学院为例[J].教师,2014(17):22-24.
[5]贺文武,刘国买.数据科学与大数据技术专业核心课程建设的探索与研究[J].教育评论,2017(11):31-35.
[6]欧卫华,夏道勋,等.“数据科学与大数据技术”专业实践教学体系构建研究[J].软件导刊,2018,17(5):107-109.
项目来源:湖北理工学院2019年校级教学研究项目(基金编号:2019C07);新疆维吾尔自治区科技人才培养项目“自治区重大教改项目:边疆区域环境下的卓越软件工程师培养模式研究”(基金编号:QN2016YX0051);湖北理工学院2019年度校级科研项目(19XJK03Y)。
作者:罗世奇,湖北理工学院,助教,研究方向为恶意代码(435003);田生伟,新疆大学软件学院院长,教授,博士生导师,研究方向为自然语言处理(830046)。