基于大数据技术的模式识别课程教学改革
2019-09-10马家君张利谢泉
马家君 张利 谢泉
摘 要:针对模式识别课程教学过程中学生难以理解的问题,应用大数据分析技术,对模式识别课程学习的难易度、课程教授的满意度和模式识别课程的重要性三个方面进行了统计分析,并明确了模式识别课堂教学过程中学生难以理解的主要原因,进而从课堂讲授和实验教学两个方面对模式识别课程的教学方法与教学模式进行了调整与改革,解决了模式识别教学过程中学生难以理解的问题。
关键词:教学改革;大数据技术;模式识别
中图分类号:G642 文献标识码:A 文章编号:1674-7615(2019)04-0137-04
DOI:10.15958/j.cnki.jywhlt.2019.04.024
Abstract:Aiming at the problem of pattern recognition course teaching which is difficult for students to understand and applying big data analysis technology, the present paper made a statistical analysis of the difficulty in learning pattern recognition course, satisfaction of the course teaching and the importance of the course, clarified the main reasons why it was difficult for the students to understand the process of pattern recognition classroom teaching and innovated the teaching methods and adjusted modes of pattern recognition from the two aspects of classroom teaching and experiment teaching and solved the problem of teaching pattern recognition.
Key words:teaching reform; big data technology; pattern cognition
模式識别(Pattern Recognition,PR)是利用计算机对模式进行分类识别,通过对获取的原始数据的预处理、特征提取、分类器的设计,并在分类错误率较小的条件下使分类识别的结果与物理对象相符合的技术[1]。模式识别课程是大数据科学与技术、云计算技术、大数据挖掘、物联网工程等课程的核心基础课,是一项充满智慧的课程,是现代人工智能必不可少的基础技术,也是计算机技术的一个重要分支[2]。模式识别课程对计算机视觉、人工智能、工业自动化、智慧农业、智慧交通管理和大数据挖掘等领域的研究有重要意义。模式识别课程具有很强的理论性、实践操作能力要求高,与计算机编程、算法设计等课程内容融合高,是一门与工程实践紧密结合的综合性的课程[3]。模式识别课程对数学基本理论性的要求非常高,在大数据、物联网的培养计划中具有极其重要的地位。在模式识别方法的理论方面,该课程既结合了概率论与数理统计、数值分析、矩阵论等数学基础理论,同时又为数据挖掘、人工智能、深度学习等专业课程的学习奠定了理论基础[4]。模式识别课程中算法的理论分析涉及到高等数学、线性代数等大量的基础数学知识,由于大部分学生数学基础薄弱,学生很难深入理解模式识别方法的数学思想[5]。另外,在实验教学方面,大部分学生的计算机编程能力较弱,即使掌握了模式识别的具体算法,很难将模式识别算法通过计算机编程实现。模式识别课程算法理论学习机实验编程能力的训练,能为学生在工程实践及科学研究中打下坚实的理论和实践基础。另外,在模式识别的本科教学过程中,让学生切身体会模式识别具体算法的应用,对教师教学能力提升也具有很大的挑战[6]。
本文应用大数据技术,对近两年主修模式识别课程的教师和学生进行了数据采集。分别从学生对模式识别课程重要的认识、学生对模式识别课程难易度以及学生对教师授课满意度等几方面进行了分析,并明确了目前模式识别课程教学中学生难以理解的主要原因。在大数据技术的支撑下,从课堂教学和实践教学两方面对现有模式识别教学内容、教学模式做出相应的调整与改革,这部分研究对模式课程进行全面的优化建设与实践具有重要意义。
以2016至2018年讲授和主修过模式识别课程的教师与本科生为数据采集对象。从集体问卷访谈、课程教学视频、学生作业完成情况和试卷分析中获取模式识别教学相关数据。在集体问卷访谈方面共发放400份问卷,其中教师问卷10份,本科生问卷390份,专业包括物联网工程、信息管理与信息系统、电子信息工程3个。本次问卷访谈共回收问卷387份,回收率96.75%。在学生的问卷调查方面,我们设计了课程理论推导难易度、实验课程重要性、课堂讲授满意度和课程设计合理性四个调查项进行数据采集;在课程教学视频上,从教室监控获取视频数据,并采用大数据技术通过深度学习获取课堂学生听课状态相关信息;在学生作业完成情况和试卷分析上,根据教师统计的相关数据进行分析。综合以上3种数据源进行大数据统计分析,分析结果如表1所示。
大数据分析表明,认为模式识别课程理论推导较难的学生占75%以上,实验课程较为重要的学生占80%以上,课堂教学较为满意的学生不到40%。课程设计较为合理的学生不到50%。在以上统计分析的基础上,我们认为导致学生对模式识别课程难易理解的主要原因是:学生理论基础薄弱,学习过程中主动性不强,教师教学方法落后。首先,模式识别算法的理论推导部分,涉及到很多数学分析、工程优化、矩阵论等数学基础理论,甚至还涉及到小波分析、随机过程等更高层次的数学理论;其次,模式识别实验教学过程中涉及到C语言、C++语言、MATLAB编程等计算机编程语言,很多学生计算机编程基础较为薄弱;最后,教授模式识别课程的老师缺乏相关的工程训练项目,在课程体系的设计上缺乏创新性。
在国家大力发展大数据技术的背景下,模式识别课程教学的改革对进一步推动大数据相关核心课程的学习,促进大数据科学与技术学科的发展具有重要的意义。
近几年,模式识别课程建设和教学改革取得了很多成果,但在大数据的新形势下,尤其是模式识别课与大数据相关理论课程的深度融合上还存在很多问题[7]。模式识别课程教学改革将从课堂教学改革和实践教学改革两个方面进行。
1.课堂教学改革
模式识别课堂教学的基本要求是灵活应用紧致性处理模式之间是否可分的问题;通过掌握判别阈值法,明确模式识别的基本处理方法,模式识别是如何分析解决现实问题的;掌握特征生成方法中的提取和选择,对于给定实物特征能领会提取实物的有用信息。在大数据背景下,除了要求学生掌握模式识别的基本概念、基本理论、基本方法外,还要要求学生能将所学模式识别知识应用于车牌号识别、人脸识别、手写识别、文本语意识别、指纹识别等大数据工程领域中[8]。模式识别课堂教学改革主要从以下几个方面进行。
实施虚拟化演示教学。模式识别课程中的PAC降维、感知器算法、贝叶斯分类算法、近邻法等包含了较多的数学理论推导过程,学生在学习过程中感觉枯燥乏味。采用虚拟化演示教学能在很大程度上提高学生的学习兴趣。在模式识别课程中的虚拟化演示教学中,主要针对数学推导较多的fisher线性判别法、贝叶斯分类法、PCA降维等,采用MATLAB的可视化技术,通过在命令空间编写程序,或者直接编写M语言程序,生成与fisher线性判别法、贝叶斯分类法、PCA降维相应动画或图像,在课堂上通过虚拟化技术演示fisher线性判别法、贝叶斯分类法、PCA降维等算法的推导过程,让学生直观体会到模式识别算法图像效果,结合理论推导,从感观上加深对模式识别方法的深入理解。在模式识别课程教学中,虚拟化演示的教学方式中需要注意两方面的事项:一方面,在选择具体演示的模式识别算法时,尽量选择公式推导过程中数据易于可视化的例子,如通过医学图像处理中的图像的亮度均值、亮度标准方差二维数据来对医学图像进行分类;另一方面,MATLAB在运行过程中,可以采用分部运行,程序执行过程更加清楚,学生更容易理解。
实施“启发式”教学模式。在启发式教学法中,一方面,需要引导学生思考模式识别知识的具体应用有哪些;另一方面,需要将学生所掌握的模式识别算法怎么通过计算机编程来解决工程实际问题。从模式识别绪论部分的讲解开始,引导学生明白模式识别课程是用来解决如人脸识别、指纹识别、车牌号识别、产品是否合格、工业机械设备运转是否正常等实际问题,并启发学生思考模式识别在日常生活还能解决的实际问题有哪些,通过这种启发式的教学模式,学生积极思考回答问题,加深对模式识别课堂的理解。另外,引导学生在京东、天猫等网商场上搜索与模式识别相关的智能产品,例如指纹打卡机、验钞机、智能机器人,引导学生思考模式识别相关产品的工作原理,以及要用到的模式识别基础理论知识,采用哪些相关的技术手段来实现。
实施“强化練习”的教学模式。在模式识别的教学中运用强化练习的教学方式,对每一个模式识别的知识点,通过具体的例子讲解,然后再通过相应的练习题,让学生在课堂上练习,并根据学生的完成情况,调整强化练习的具体项目,将强化练习分为基础、深化、提高三个层次,逐步提高学生主动学习的兴趣和持续学习的动力。
将目前学生比较感兴趣的微信跳一跳游戏外挂开发、人脸识别、指纹识别等技术引入课堂教学。并进行实际案例的演示,让学生能直观地知道模式识别的具体应用,提高学生学习兴趣。
采用虚拟化演示教学方式。在模式识别的课程讲授过程中,通过计算机编程,将模式识别过程中难以理解的公式推导或模式识别的具体算法,采用虚拟化技术,设计视频演示,有效丰富模式识别教学内容,激发学生在模式识别过程中积极思考和积极学习的热情。
2.实践教学改革
在模式识别的实验教学过程中,锻炼学生编程能力及运用模式识别具体算法解决工程实际问题的能力是很重要的。目前,模式识别实践教学过程中通常存在两个方面需要解决的问题:一方面,实践教学时间短。模式识别课程在本科阶段一般作为考查课,课时通常为36学时,通常30个学时用于课堂教学,在6个学时的实践教学过程中,设计高效的实验教学内容是极为重要的;另一方面,模式识别实验教学过程中面临实验项目不好选择的问题。模式识别实验过程中fisher线性判别法、贝叶斯分类法、PCA降维等模式识别具体算法很复杂,直接让学生通过计算机编程实现的工作量非常大,在有限的实验教学学时的时间内很难完成。
对于模式识别实验教学过程中时间短的问题,在实验课上让学生集中进行编程练习,并在实验课后安排学生具体的模式识别项目,利用学生课余时间完成。这样可以在一定程度上解决学生模式识别实践教学时间不够的问题。另外,实践教学过程中的原理部分可以在课堂教学过程中作为案例进行详细讲解,节省实践教学过程中进行原理性讲解的时间。另外,在模式识别实践教学选题方面,除了选择实现一些例如人脸识别的经典问题外,可以选择与大数据、云计算相关的一些课题。例如,基于MapReduce思想,编写车牌识别程序。实现对贵州某两处监控图片中的车牌的识别,完成对除贵州省车辆外的外省车辆的统计,并完成对两处监控中套牌车辆的识别,并得出结果。在这样的实践课程环节中,学生不仅能将模式识别的方法运用到具体工程实践中,还能巩固所学的MapReduce编程思想,能够利用所学的Java调用已封装好C++的so动态库完成车牌的识别,然后利用MapReduce完成对车牌的统计和对套牌车的识别。最后将在云计算服务器上其执行。
在模式识别实践教学过程中,可以采用的编程语言有C语言、C++语言、MATLAB语言、Verilog HDL硬件描述语言、JAVA语言、Python语言等。由于MATLAB编程语言将很多的模式识别算法中需要用的矩阵求逆、矩阵求特征值、神经网络等封装成具体的函数,编程结构简洁明了,能凸显模式识别算法及实践教学的工程实用性,因此模式识别实践教学以MATLAB编程语言为主,配合Java等编程语言练习。列入对于简单的将人脸识别系统可以分解为:数据预处理、特征提取、分类器训练、分类识别等几大模块,在设计数据预处理部分,可以在MATLAB中通过imread函数直接读取图片并转换为向量,在特征提取部分,可以采用eig函数直接获取矩阵的特征值和特征向量,程序编写简单易懂。
设计精品实验。模式识别课程是大数据挖掘、大数据可视化、云计算技术等课程的基础课程,同时,也需要C语言、C++语言、MATLAB语言编程及Python编程语言的基础。因此,可以考虑将基于云计算、大数据平台的人脸识别、车牌号识别、语音识别等项目设计为精品实验,可以将学生所学理论知识有机结合在一起,提高学生综合运用所学知识解决工程实践问题的能力。这为优秀本科生留下足够施展才华的空间,同时也为本科生的课外实践、设计竞赛、SRT项目申报和本科毕业设计提供贮备。
设计层次实验。在模式识别的教学过程中,部分学生理论基础较好,实践动手能力较强,而大部分学生理论基础较为薄弱,计算机编程能力不足,另外还有少部分学生,几乎没有编程能力。因此,考虑到模式识别实验教学过程中学生的层次化特点,可以将模式识别试验设计为层次化。例如,对于人脸识别的实验教学,将实验分成人脸图像的读取、PCA降维、K均值算法识别、贝叶斯分类识别、近邻法识别、K近邻法识别、线性判别函数识别和神经网络识别几个部分。其中,人脸图像的读取、PCA降维给学生提供部分编程代码,基础比较薄弱的学生可以一边抄写一边理解。对于基础较好的学生可以综合运用K均值算法识别、贝叶斯分类识别、近邻法识别、K近邻法识别、线性判别函数识别和神经网络识别,以提高最终的识别率。通过层次化实验设计,可以锻炼不同层次学生的实践动手能力。
本文应用大数据分析技术,对模式识别课程理论推导难易度、实验课程重要性、课堂讲授满意度和课程设计合理性四个方面进行了统计分析,大部分学生认为模式识别课程理论推导较难,模式识别实验课程重要,不到50%的学生认为模式识别课堂教学较为满意,模式识别课程设计较为合理。并明确了模式识别课堂教学过程中学生难以理解的主要原因是学生理论基础薄弱、学习过程中主动性不强、教师教学方法落后。本文结合大数据应用技术,从课堂讲授和實验教学两个方面对模式识别课程的教学方法和教学模式做出调整与改革,提出了解决模式识别教学过程中学生难以理解的问题。在课堂教授方面,提出了“虚拟化演示”教学、“启发式”教学、“强化练习”教学的改革方式,以解决模式识别课程教学过程中学生难以理解的问题。在实验教学方面,提出了精品实验和层次实验的教学改革方式,并将大数据、物联网相关的项目融入到实验中,解决模式识别实验教学过程中教师实践经验不足的问题。本文应用大数据技术,对现有的模式识别教学模式与教学内容需要做出合适的调整与改革,该改革方案对模式识别课程进行全方位的优化建设与实践具有重要意义。
参考文献:
[1] 张学工.模式识别[M]. 北京: 清华大学出版社,2010:45.
[2] SERGIOS T. Pattern Recognition[M]. San Diego: Academic Press,2006:39.
[3] 张芳,肖志涛,韩晓军,等. 模式识别课程教学改革思考[J]. 计算机教育,2012(4): 45-47.
[4] 刘雨,孙即祥,余莉. 模式识别课程开放式案例教学设计[J].电气电子教学学报,2011 (3): 103-105.
[5] 戚玉涛,刘芳,焦李成. 模式识别教学实践与课程改革[J].计算机教育,2010(19):24-26.
[6] 吴有富,吴应加. 信息分类中的一种模糊技术[J]. 贵州大学学报(自然科学版),2001 (1): 9-15.
[7] 许道云.大数据计算的基础理论探究[J]. 贵州大学学报(自然科学版),2016 (4): 1-11
[8] 张伟,程颖.基于大数据技术的研究生教育管理系统构建与应用[J]. 贵州大学学报(社会科学版),2018 (2): 134-138.
(责任编辑:赵广示)