新工科背景下数字图像处理课程实训改革与实践
2021-07-31杨森泉陈景华刘建军胡松喜
杨森泉,丁 凡,陈景华,刘建军,胡松喜
(韶关学院 智能工程学院,广东 韶关 512005)
0 引 言
“新工科”人才指的是具备工程实践能力、创新能力、国际竞争力的高素质复合人才,不仅要求学校培养跨学科、跨专业人才,同时要求培养学生能够将所学技术与经济、社会、管理等方面知识进行融合,引领未来科技和产业的发展[1]。
在“新工科”背景下,要求电子信息类学生能够紧跟时代发展,着重提升自己的创新思维、持续学习能力和实践能力[2]。数字图像处理是电子信息类专业课程体系中一门多学科交叉融合的专业课,它涉及了高等数学、线性代数、信号与系统、数字信号处理等多门课程内容[3]。
在5G、人工智能等新兴产业技术的推动下,数字图像处理技术发展日新月异,对数字图像处理课程的教学模式、教学方法和教学手段都提出了针对性的要求[4]。本文探讨了新工科背景下,基于企业实训的数字图像处理课程改革实践,以韶关学院电子系和广州粤嵌校企共建的“众创空间”为平台,发挥广州粤嵌通信科技股份有限公司的行业优势,通过“以训促学”的“穿透式”教学改革思路,以实训项目成果作为人才培养成效的外化评价指标,消除新工科人才培养需求与企业实训和需求之间的鸿沟,着力于提高新工科人才培养质量,充分体现新工科人才培养特点的立体化教学资源[5]。
1 数字图像处理课程存在的问题
大多数应用型本科大学的电子信息专业都开设了数字图像处理课程。但是,由于知识点繁琐、散乱,而数字图像课程理论起点高、公式复杂,而且学生的物理知识和信号处理知识基础普遍不牢固,因此很难理解课程本身知识体系[6]。而对于教师而言,在数字图像处理课程教学实践中普遍存在以下问题:
(1)该课程教学存在课程内容多、教学实验学时少的矛盾,如何在有限的课时时间内解释课程的基本理论和相关应用知识点是一个挑战。
(2)课程的实验仅停留在验证性实验上,缺乏全面性和创新性,知识点单一,无法培养学生的综合编程能力和解决实际应用问题的能力。
(3)理论知识难以掌握的问题。该课程理论知识的算法原理难度大,对于一些基础知识掌握不扎实的学生来说,在理解学习上存在较大障碍。
(4)在传统的教学过程中,实验大多使用一些基本知识内容,难以有效地调动学生的学习积极性和主动性,更谈不上培养学生的创新和实践能力[7-8]。
针对以上问题,本文从课程实训方面讨论应用广州粤嵌科技实训项目在数字图像处理课程实践的改革,采用线上线下相结合的方法,线上采取观看录制好的训练营课程,以作为教材不同章节内容的补充;实训方面通过与广州粤嵌校企共建教学实验室和实习实训平台,促进与企业先进技术的对接,激发学生学习热情和积极性,提高学生动手实践能力。
2 教学实训内容改革
教学实训作为电子信息类人才培养的关键环节,而且数字图像处理是一门实践性非常强的课程,通过实践课程有利于加强学生对算法的理解,巩固对图像处理的理论知识,提高动手能力和知识综合运用能力。
下面简要列举韶关学院与广州粤嵌校企共建的三个实训内容,分别是CIFAR-10图像分类、人脸表情分类和车牌识别。
2.1 CIFAR-10图像分类
CIFAR-10图像分类是一个公开的测试集,其涵盖了飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船以及卡车10个类别图像,如图1所示。
图1 CIFAR-10图像分类示例
实训过程中使用经典的Residual Network残差网络模型进行识别[9],在一个带GPU的电脑上进行训练后,能达到最高70%的识别精度。通过这个实训课程,让学生懂得深度学习的三个步骤:建立模型、损失函数和参数学习。同时,可以进一步引导学生通过修改网络模型、设置不同的学习率以及使用不同的损失函数,提高识别准确率。
2.2 人脸表情分类
通过一个简单的图像二分类识别,将图片中的人脸表情分为正面和负面表情。如果表情为微笑、兴奋,则分为正面表情;如果为伤心、哭泣,则为负面表情。模型示例如图2所示。
图2 人脸表情分类示例
本实训首先是对图像脸部中心区域进行检测,识别出人脸感兴趣区域,其次对识别出的脸部中心区域进行裁剪,然后再对图片进行归一化处理。构建包含两个卷积层、一个全连接层和一个激活层的简单神经网络模型对归一化后的图像进行训练,训练完成后再利用测试集进行测试,通过调整参数和网络层,识别准确率最大能达到95%。
2.3 车牌识别
车牌识别实训是一个图像多分类任务,需要将车牌图像中的每个字符进行分割后识别,最后将车牌图像转换为文字输出,如图3所示。
图3 车牌识别实例
本次实训使用一个车牌字符数据集,包含了32 370张大小为20×20像素的图片,总共有66组数字和字符,数据集的90%图片用于训练,10%图片用于测试;网络使用经典的AlexNet网络[10];训练过程采用动量优化法参数学习,学习率设为0.01,动量大小为0.9,迭代次数设为100;损失函数使用交叉熵损失函数。经过以上训练过程,车牌的识别率达到97.6%。
3 结 语
本文在“新工科”更强调学科的实用性、交叉性与综合性背景下,从校企联合协同育人出发,对数字图像处理课程实训进行改革,设计相关教学实训案例。通过实训案例,学生可以接触到当下图像处理的主流技术,并能体验真实企业项目常用的方法;可以让学生从实训中学习相关的操作及其实际运用,加强学生实践动手和解决问题能力,为其在日后投入工作提供了较好的技术支持与帮助。