计算机视觉与数字图像处理课程融合的研究①
2018-04-09张重,黄美艳,司统振,刘爽
张重,黄美艳,司统振,刘爽
[摘 要] 计算机视觉主要是利用一些机械设备代替人类完成对目标的跟踪、检测和分类等任务,是应用广泛的一门综合性学科。数字图像处理是将图像与数字进行相互转化并且能够被计算机识别,通过计算机对图像进行操作的一门学科。计算机视觉是数字图像处理课程的进一步延伸,将两者融合在一起能够让学生熟练掌握理论知识,并进一步将知识迁移到计算机视觉学习上,使学生由浅入深学习,开阔视野。
[关 键 词] 计算机视觉;数字图像处理;课程融合
[中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2018)10-0080-01
计算机视觉对三维重建、物体分类以及目标检测等起着重要的作用。随着技术的发展,应用计算机视觉的领域更加广泛,其中包含了图像的处理与图像内容理解。该技术主要是通过计算机软件对图像进行具体操作与分析,使计算机能够分析理解。计算机视觉与数字图像处理相融合,有利于使学生快速掌握图像处理的基本原理和操作方法,能够快速地把图像理论应用到计算机视觉当中,达到理论知识与实际操作的有效结合。为此,我们以学习理论知识、进行软件基本操作以及学习与计算机视觉有关知识点为主线进行叙述。
计算机视觉与数字图像处理课程融合的研究方案主要包括下面几个步骤:(1)学习数字图像处理的相关知识,能够让学生快速入门;(2)理论结合实践,利用MATLAB对图像进行处理;(3)学习与计算机视觉相关的知识点,对图像处理的知识点进行拓展。
一、数字图像处理基本内容的学习
数字图像处理的本质是对图像像素点的处理,主要掌握三个方面,分别是通过对图像进行空间、色彩、亮度的变化提高图像的视觉质量;把提取的图像特征用于计算机分析,来研究图像;图像的编码和压缩用于图像的分类存储。掌握基本的数字图像处理算法:图像变换,如傅里叶变化;图像保真压缩;简单的图像分割算法;图像描述,应用于对目标的二维描述向三维描述的发展;多种类型图像识别算法。
在学生理解数字图像处理的基本知识及常用的处理算法之后,为了证明图像处理中的相关知识与计算机视觉的分类问题密切相关,我们要求学生掌握Bag-of-words(BoW)结构框架。学习BoW框架中包含的特征提取、聚类等操作,熟练掌握编码和池化的算法以及如何进行分类等一系列完整的图像处理和计算机识别过程。
二、利用MTALAB对图像进行处理
利用MATLAB对图像进行处理是书本知识与实践相联系的重要方式。把MATLAB应用在该领域,不仅能够促进对理论的理解,更能提高学生的学习兴趣。
(一)学习MATLAB基础知识
了解MATLAB的工作区域、快捷键、工具箱和一些基本函数,学会调试程序,设置断点,改正程序的简单错误等。
(二)在MATLAB中实现常用的图像处理操作
利用MATLAB中的相关函数或者参考相关程序对图像进行变换、分割等基本操作。通过实际动手操作和MATLAB形象化的展示让学生更加深刻地掌握图像处理的基本操作方法。
(三)在MATLAB下运行BoW代码
首先在MATLAB下运行BoW代码,学会设置路径、单步运行、调用软件包等操作。然后单步运行程序,并进入程序内部查看重要函数,了解图像分类的基本原理并在这个过程中熟练应用MATLAB的快捷键。
三、学习计算机视觉的相关知识点
计算機视觉进一步延伸了图像处理知识,我们从三个方面深入学习与该技术相关的知识点。首先,从图像的边缘检测到图像匹配再到图像三维重建。图像的边缘检测是图像匹配的前提,通过边缘检测对图像进行分割、特征提取,进一步进行图像匹配,对匹配好的二维图像进行三维重现。其次,从滤波器到卷积神经网络。滤波器在图像处理中主要用于去噪,而在计算机视觉中用于卷积层的特征提取。最后,从直方图到图像内容理解。直方图体现图像像素出现的频数,将直方图生成思想用于图像的表示,可以进一步加强学生对图像内容理解领域的了解。
四、结语
本文提出计算机视觉与图像处理课程融合的研究方案,以学习理论知识、进行软件基本操作以及学习与计算机视觉的相关知识点为主线引导学生循序渐进。从图像处理的基本知识点延伸到计算机视觉的知识,拓宽了学生的知识面,极大地提高了学生的创新能力。
参考文献:
A Krizhevsky,I Sutskever, GE Hinton.Imagenet classification with deep convolutional neural networks[J].International Conference on Neural Information Processing System,2012,60(2).