APP下载

基于人工智能技术的“自然语言处理”课程教学模式改革与探索

2020-08-14艾山吾买尔买合木提买买提汪烈军

无线互联科技 2020年10期
关键词:自然语言处理导师人工智能

艾山·吾买尔,买合木提·买买提,汪烈军

(新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046)

1 开设“自然语言处理”课程满足人才需求

随着互联网技术和人工智能技术的普及,尤其是近年来人工智能技术的迅速发展,使自然语言处理技术也成为学术界和工业界的热点研究方向之一,国内外许多计算机专业学位点全部开设了“自然语言处理”课程。自然语言处理(Natural Language Processing,NLP)是未来所有人工智能技术的基础和根本。微软创始人比尔·盖茨曾经表示:“语言理解是人工智能领域皇冠上的明珠”。随着人工智能技术的普及,尤其是深度学习技术渗透到人工智能领域的各个研究方向,自然语言处理成为全社会热点之后,学习该课程的学生人数猛增。随着社会需求的不断提高,研究机构和企业对自然语言处理人才的需求也不断提高,国内面向研究生开设“自然语言处理”课程的高校也越来越多。“自然语言处理”是一门交叉学科,需要掌握数学、语言、计算机编程、心理学等多个学科的相关知识[1-3]。在大数据和人工智能快速发展的背景下,如何利用“自然语言处理”课程提高学生对该领域的认识,让学生掌握理论原理、具备实践能力,是一项非常具有挑战性的课题。

新疆大学作为“双一流”建设大学,具有计算机科学与技术一级学科博士学位授权点,长期以来开展“自然语言处理”课程,培养了不少该方向的高学历人才。为了适应新的发展趋势,在已有的基础有机融合数学基础、机器学习方法、深度学习基础、自然语言处理基础,对已有教学方案进行改革势在必行,制定以团队授课、导师参与、多阶段多元化考核方式的案例式教学模式,使得学生掌握理论知识,同时,提高实践能力。

2 教学现状分析

根据前期教学情况的分析,对学生后续研究能力和科研成果的观察发现,以前的授课模式存在以下问题:

(1)单人授课难以覆盖全部知识点。因为自然语言处理是交叉学科,研究内容多,算法模型多,任务本质有差异,所以,任课老师难以深入、全面地讲授所有内容。虽然大多数研究人员熟悉基本原理,但是在对每一种任务、方法的细节之处进行掌握和理解方面可能存在薄弱点,授课过程中可能会弱化对某个部分的深入讲解。

(2)学生基础差异较大。虽然录取的研究生都超过了招生的分数线,但是毕业于不同学校的学生、跨学科的学生在本科阶段所学习的相关课程、编程基础、外语能力等方面都具有差异,会影响本课程的学习效率。尤其是随着近年来人工智能技术越来越受到社会的关注后,不少学生选择跨专业学习计算机科学与技术专业,虽然也会补学部分课程,但是难以在短时间内掌握相关知识。

(3)课程教学与导师的研究脱节。选修“自然语言处理”课程的研究生导师一般也会从事相关研究,导师希望自己的学生能够很好地学习基础内容,为进一步在具体研究领域的深入打好基础。自然语言处理的研究进一步细化为词法句法分析、语义分析、知识表示学习、问答系统、对话系统、阅读理解等多个细分返岗,每个方向都有不少知识需要学习。在目前的教学模式中,导师不参与课程教学环节,也不参与考核阶段,导致授课教师顾及不到每一名学生的具体方向,只能安排比较笼统的或者同质化的大作业来锻炼学生能力,课程作业与导师没有建立联系,学生可能仅是为了任务而独立完成作业,得不到导师更加细致的指导,可能会出现大作业流于形式的情况。

3 教学模式改革

3.1 教学目标

自然语言处理是以利用计算机程序模拟人类理解自然语言的过程,根据专家学者对人类学习和理解语言的认知行为的理解,与计算机程序的运行原理和处理能力结合提出的相关经验方法、统计方法的总和[4-6]。目前,自然语言处理的主要研究内容为词法分词、句法分析、语义分析、文本分类、摘要抽取、机器翻译、知识挖掘、问答系统、对话技术等,其中,词法分词、句法分析、语义分析等属于基础性技术,文本分类、信息抽取、摘要抽取、机器翻译、知识挖掘、问答系统、对话技术、阅读理解等属于直接应用技术。对自然语言的处理方法包括基于规则的方法、基于统计的方法、基于深度学习的方法等;从分析任务方法本质来说,可分为序列标注任务、分类任务、端到端的生成任务。

新疆大学“自然语言处理”课程的教学目的是让学生熟练掌握自然语言处理基础技术的原理和实践能力,熟悉语料库标注过程,熟练掌握不同的方法和不同性质任务的算法,了解不同研究任务的基本原理,熟练掌握该项技术,并以此为目标制定教学内容和考试内容。

3.2 教学内容及考核方式设置

根据目前存在的问题和技术发展趋势,笔者制定了团队授课和导师参与的多阶段多元化考核的教学模式,达到利用该门课程让学生学会基本原理和实践能力的目的,同时,引导导师参与具有针对性知识单元的教学、指导、评价,激发学生学习的积极性,加强对学生的过程考核,比较全面和客观地评价学生的真实能力。在新疆大学硕士研究生的培养方案中,本课程具有2学分,每周学习2学时,教学周期为16周,每个阶段的学习结束后,按照教学计划进行笔试测试或者大作业评分比例核算最终成绩,其中,任意笔试测试中成绩低于50分,直接定为不及格。具体如表1所示。

表1 主要教学内容设置及考核方式、考核比例

可以看出,本课程通过多阶段、多样化考核和多人参与的方式,弥补了期末考试+大作业考核方式中存在的难以让学生深入学习每一个知识单元的问题。通过单元化多人教学+导师引导的方式,引导学生从基础知识入门到自己将来研究领域的入门。利用笔试测试+实践性作业考核,引导学生同时具有掌握理论原理和算法实现能力。通过要求自学的方式巩固Python编程学习和机器学习,利用现有网络课程资源,对学生的编程能力进行有效提升,进一步加强学生的自学能力。

4 结语

让学生在一学期内巩固数学基础、强化编程能力、学习机器学习、深度学习基础,全面、深入地了解“自然语言处理”课程中基础技术的理论原理、掌握实践能力,在自然语言处理细分研究方向上更加深入地学习,让学生的学习内容与目前的技术基本保持一致,是具有较大挑战性的教学活动。针对传统教学模式存在的问题和发展趋势,新疆大学计算机科学与技术学科硕士研究生“自然语言处理”课程教学和实践应紧密结合技术发展趋势,制定、改革新的教学模式,以达到课程学习与研究方向有机融合的目标,能够有效提升教学效果。

猜你喜欢

自然语言处理导师人工智能
执着创新 坚毅豁达——追忆我的导师郭景坤先生
2019:人工智能
人工智能与就业
V eraW an g
导师榜
数读人工智能
基于组合分类算法的源代码注释质量评估方法
面向机器人导航的汉语路径自然语言组块分析方法研究
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析