社会智能化趋势下图像处理与机器视觉课程教学新实践
2022-08-10付贵忠牛福洲沈晔湖
付贵忠 牛福洲 陈 浩 谢 鸥 沈晔湖
(苏州科技大学机械工程学院,江苏 苏州 215009)
0 引言
随着中国经济的不断发展,中国的制造业也朝着自动化智能化提升,对工业产品的设计,生产和检测也提出了更高的要求。国务院关于印发新一代人工智能发展规划的通知中明确了“人工智能的迅速发展将深刻改变人类社会生活、改变世界。”机器视觉检测通过摄像机来记录物体的表面状态,然后通过相应的软件来分析材料的表面状态,由于这种方法检测速度快,设备投入低,获得了广泛的研究和应用。将机器视觉技术和人工智能方法相结合可以获得更自动化智能化的工业解决方案。机器视觉及相关课程的学习对于学生的专业知识强化、实践能力培养和思维意识的创新至关重要。因此本文将分析目前图像处理与机器视觉课程的教学现状与不足,提出了进行教学新实践探索。
1 目前图像处理与机器视觉教学现状
目前国内本科学校在图像处理与机器视觉的教学中,采用的教材版本较多,各个院校使用的版本也不尽相同,主要为冈萨雷斯著《数字图像处理》,章毓晋著《图像工程》等。相关教材都能够覆盖图像处理与机器视觉的主要内容,通过传统课程教学的方式来进行授课时,可以帮助学生掌握本课程必备的专业知识,了解主要专业内容。但是在社会智能化趋势下,就图像处理与机器视觉课程而言,目前的传统教学模式存在以下的问题:
1.1 教学过程中的师生互动深度浅
近年来随着数字化教育的兴起,同时还受到新冠肺炎疫情的影响,线上教育成为越来越重要的一种教育形式,有着多种优点,但是师生互动深度浅也成为其缺陷之一。
1.2 贴近学生生活的应用案例匮乏
教材中出现的例题大多数案例相对枯燥,缺乏贴近学生生活的应用案例。
1.3 对于最新的技术前沿发展介绍较少
近几年和图像处理与机器视觉相关的汽车、自动化和互联网行业都处于发展较快的阶段,教材往往无法及时更新因而缺乏相应的前沿技术介绍。
1.4 学生解决实际机器视觉问题能力较弱
学生学习了相关的基础理论后,如何在实际问题中运用相关知识成为主要欠缺的方面。
2 图像处理与机器视觉教学新实践
为了针对性地解决本课程教学过程中可能出现的不足,提出以下教学新实践举措:
2.1 举一反三式例题讲解
在讲课过程中,相比于书本上生硬的理论知识学生更愿意听更加具体的例题,在例题中引入知识点及理论的研究目的,引导学生思考。以笔者本课程教学所用教材图像工程为例,讲解第二章图像分割基础时,在例题中分析了图像的梯度散射图,如图1所示。经过详细的理论讲解和例题难点分析后,学生一般都能够对本例题有所理解。但是在讲课时这个知识点到此结束并不合适,原因有两个方面,一方面是讲解教材中的纸面内容,难免有些枯燥;另一方面是教材中例题所选取的图像是灰度图像,而人类生活中所接触的绝大多数影像都是彩色图,灰度图虽然简单,却丧失了信息的丰富度。因此在选取例题举一反三目标时,该目标的引入既要自然生动,又要尽可能贴近学生的生活状态,这样更容易引起学生的学习兴趣进而接受所学习的知识。因此,可以再选择一个彩色的高尔夫球图像作为研究对象,采用Matlab软件编写从输入图像到梯度散射图的执行代码。通过给学生展示实际彩色图像和讲解代码,使学生的代入感更强了,更有利于学生提高听课兴趣,学习对应的编程方法。在教材例题的输入图像中,只有前景和背景,引入的高尔夫球照片例子则具有两个背景,对应的梯度散射图更加复杂,讲述这样的例子更有利于学生加深对知识点的理解。
图1 采用举一反三的方式讲解梯度散射图例题
此外,线上教学时采用常规简答题提问的模式会削弱学生参与的积极性,其答案往往有较多的内容需要说明,而在线上课程时让学生说明大量的内容并不方便,采用选择题的方式则可以让学生参与互动的积极性更高。在本例中可以通过类似“天空背景像素对应着梯度散射图中ABCD的哪块区域?”的方式进行提问,学生们会通过聊天窗口迅速给出自己认为正确的答案项。综上所述,采用举一反三式例题讲解,选择更生动有趣的例子,以更适合线上教学的提问形式,可以强化学生的思考积极性,提升师生的互动深度。
2.2 引入生活中常见的机器视觉应用
在本课程的教学中,每个详细的知识点书中会有一定的例题讲解,但是有时学完整个课程后,同学们的对于各个知识点的联系还停留在教师的理论讲解上,大脑中尚未构建起具象的知识网络。因此在本课程的教学计划中,还设计了一次实际的机器视觉应用案例讲解,如图2所示。
图2 基于机器视觉的车牌号识别过程讲解
基于机器视觉的车牌号识别过程包含多个实现步骤,依次为图像采集、车牌区域定位、车牌号区域提取和字符识别,其中需要涉及多个知识点的使用。在牌照定位和分割的过程中,需要选择合适的颜色空间,考虑RGB、HSV和灰度色彩模式各自的特点等;在倾斜牌照的矫正过程中,可以通过投影变换的方式找到倾斜角;车牌号区域提取可以让学生明白如何选择合适的阈值,选择合适的形态学操作和边界去除方法;字符识别将介绍模板匹配理论。在本案例中,基于机器视觉的车牌号检测方法是学生生活中常见的车牌识别,该场景每个学校的校门口都有。看到这个熟悉的场景时学生们会很感兴趣地去思考其内部算法构成,进而提高听课效率,深刻理解相对完整的知识点网络,有利于激发学生进一步学习和探索的兴趣。
2.3 行业技术发展前沿介绍
由于教材编写、修订和出版等环节的存在,教材内容具有一定的延迟性和滞后性,教材里关于当时技术发展的前沿介绍可能在当下已经不是最新的,特别是最近几年社会智能化趋势愈加强烈。因此本课程在授课时需要及时补充最新的相关技术知识。如图3所示,是本课程其中额外补充的一些示例,其中图3(a)所示是本课程图像工程第一章,介绍机器视觉的相关概念和应用时,阐述视觉增强现实方法的落地案例,一款可以在户外通过视觉增强现实技术抓捕小精灵的游戏。图3(b)是介绍图像工程—图像处理第九章图像编码基础时引入的案例,图鸭科技团队于2019年获得CVPR机器学习图像压缩挑战赛CLIC赛事的四项指标第一,图鸭科技是国内在图像编码技术领域的佼佼者。图3(c)是介绍图像工程—图像处理第十四章视频图像处理时引入的案例,基于视频图像处理的无人驾驶技术近年发展迅速,图森科技公司是国内首批实现L4级量产无人驾驶卡车的公司。综上这些案例有利于学生了解不同行业和技术发展的最新动态,有利于学生开拓视野。
图3 机器视觉的前沿技术
2.4 结合专业特点的创新实践
通过课程的教学使学生学会理论知识,对于实践动手能力的培养还需要设计合适的创新实践项目,为此设计了一项机器视觉创新实践项目—基于卷积神经网络的人流量计数和口罩识别项目。本项目将多学科的知识都进了交叉,包括电子工程、信息科学和人工智能等,同时结合当下的疫情防控需要,有很强的现实意义。通过本项目可以有效强化学生的图像处理与机器视觉及其他学科的专业知识,促进动手能力的培养,对学生的长期发展起到良好的推动作用。
3 结语
本文针对产业自动化智能化发展新形势下的图像处理与机器视觉课程教学存在的不足,提出了举一反三式例题讲解、引入生活中常见的机器视觉应用、行业技术发展前沿介绍和结合专业特点的创新实践项目等教学过程中可以应用的新实践内容。可以为社会培养更多的具有扎实机器视觉专业知识、实践能力和开拓视野的优秀人才。