第4版《图像工程》教材的特色
2018-09-10章毓晋
摘 要:文章介绍2018年出版的第4版《图像工程》系列教材的编写思路和特色。首先具体讨论了该版系列教材编写中的总体规划和考虑,包括所覆盖的内容范围和结构安排层次,以及拟对应的课程和对教学的思考。接下来介绍了各册书内容的选取和安排,包括选材原则、各册内容划分,册内单元划分、单元内具体内容的概况,并与国外同类图书在选材方面从科研角度进行了对比。最后从方便教学和读者出发,列举了总的编写特点和一些具体措施,包括章节设置和安排,习题及解答、彩色图片、资源提供等。
关键词:教材建设;图像工程;图像处理;图像分析;图像理解
中图分类号:G640 文献标志码:A 文章编号:2096-000X(2018)19-0124-04
Abstract: This article introduces the compilation ideas and features of the fourth edition of "Image Engineering" series published in 2018. First, the overall planning and consideration in the writing of this version of the teaching materials are discussed in detail, including the scope and structure of the covered contents, as well as the corresponding courses and reflections on teaching. Next, the selection and arrangement of the contents of each book in this series are introduced, including the principle of material selection, the division of the contents in each book, the division of units within a book, and the outline of the specific contents of units. It is also compared with similar books of foreign countries from the perspective of scientific research in material selection. Finally, from the perspective of convenient for teaching and readers, it lists the general writing features and some specific measures, including chapter setting and arrangement, exercises and answers, color pictures, and resource provision.
Keywords: textbook construction; image engineering; image processing; image analysis; image understanding
一、概述
图像工程是一门系统地研究各种图像理论、技术和应用的交叉学科,是一个将数学、光学等基础科学的原理结合在图像应用中积累的实践经验而发展起来的,将各种图像技术集中联系起来的,对整个图像领域进行全面研究和应用推广的新学科[1]。
图像工程的研究方法与数学、物理学、生理学、心理学、电子学、计算机科学等学科相互借鉴,它的研究范围与模式识别、智能系统、计算机视觉、计算机图形学等专业互相交叉,它的研究进展与人工智能、神经网络、遗传算法、模糊逻辑等理论和技术密切相关,它的发展应用与生物医学、通信网络、文档处理、机器人自动化、遥感、测绘和军事侦察等许多领域紧密结合[1]。
图像工程技术所涉及的内容跨越教育部学科目录中的多个一级学科下的二级学科,包括“信息与通信工程”一级学科下的“信号与信息处理”二级学科,“控制科学与工程”一级学科下的“模式识别与智能系统”二级学科,以及“信计算机科学与技术”一级学科下的“计算机应用技术”二级学科。
《图像工程》教材是对各种典型图像技术的原理和方法的进行综合介绍的一套教材。该教材从1999年第一版出版以来,逐渐更新扩展,得到了广泛的重视和关注。前三版的累积印刷量已达到20多万册,在高校得到了广泛的使用。
2018年,《图像工程》系列教材出版了第4版。该版包括了上、中、下三册,还有一个合订本[2-5]。
下面,分总体规划和思路,内容选取和结构,方便教学和读者对第4版的特色进行介绍。
二、总体规划和思路
本节首先介紹对教材的整体考虑。
(一) 覆盖范围
《图像工程》教材希望比较全面地覆盖各种图像技术。图像技术在广义上是各种与图像有关的技术的总称。计算机图像技术包括利用计算机和其他电子设备进行和完成的一系列计算工作,例如图像的采集、获取、编码、存储和传输,图像的合成和产生,图像水印的嵌入和提取,图像的显示和输出,图像的变换、增强、恢复、修复和投影重建,图像的分割,目标的检测、跟踪、表达和描述,目标特征的提取和测量,序列图像的校正,3-D景物的重建复原,图像数据库的建立、索引和抽取,图像的分类、表示和识别,图像模型的建立和匹配,图像和场景的解释和理解,以及基于它们的判断决策和行为规划等[6]。另外,图像技术还可包括为完成上述功能而进行的硬件设计及制作等方面的技术。
(二) 内容层次
《图像工程》教材所覆盖的内容可以分为三个层次。从信号处理的角度看,对图像的加工可能有不同的需求,也需要有不同的输出。首先,图像是用来“看”的,提高图像的视觉质量应是基础的要求,这是(狭义的)图像处理所要解决的问题,图像处理的输出应是视觉质量有改善的图像。其次,人们常常对图像中的特定目标更感兴趣,对目标进行检测和提取,测量它们的定量指标非常有用,这是图像分析所要解决的问题。图像分析的输出应是对图像中感兴趣目标的描述数据。最后,图像是对客观世界的反映,所以要通过对图像内容含义的理解得出对原来客观场景的解释,从而指导和规划行动,这是图像理解所要解决的问题。图像理解的输出应是更为抽象的场景描述。
(三) 对应课程
第4版《图像工程》教材根据图像工程的三个内容层次分为三册,即上册“图像处理”、中册“图像分析”和下册“图像理解”。这样,每册对应一个图像工程的层次,可用于不同类型的教学工作。其中:1. 上册“图像处理”可用以开设本科生专业基础课,48~64学时。2. 中册“图像分析”可用以开设本科生专业基础课或研究生专业选修课,32~48学时。3. 下册“图像理解”可用以开设研究生专业选修课,32~48学时。
(四)教学考虑
从教学的角度考虑,第4版的三册《图像工程》教材有如下共同特点:1. 尽快进入主题:三册书都从各自的第2章开始介绍课程正式内容,都把先修或预备内容分别安排在需先修部分的同一章之前,没有安排专门的基础知识章。这样从教学角度来说,更加实用,也突出了课程主线的内容。2. 内容模块化:三册书的正式内容都分别结合进4个相关的学习单元,每个单元都围绕一个主题(自成体系,见下节),如图1所示。这样既加强了全书的系统性和结构性,也有利于复习考核。3. 结构一致:三册书均包含15章正文和一个附录,它们结构相同,长度相近,均可用于一次授课。每章都有一节“总结和复习”,包括“各节小结和文献介绍”及“思考题和练习题”。4. 提供主题索引:各册书后均仍有主题索引(并给出了英文),这样既方便在书中查找有关内容,又方便在网上查找有关文献和解释。事实上,该教材也是许多科研工作的参考材料,主题索引是很有需求的。
三、各册书内容选取和安排
其次介绍对内容的具体选取思路和结果。
(一)选材原则
第4版保留了上一版中有代表性的经典内容,还参考了许多新的文献充实了近年的一些最新研究成果和得到广泛使用的典型技术,以适应图像技术的飞速发展。
第4版结合了作者的一些研究工作和成果以及这些年来的教学教案和教学实践,增加了许多例题,其中有些是介绍一些新的选学内容,有些则从其他的角度来补充解释已有的概念和方法。这些例题可根据课时安排、学生基础等选择使用,比较灵活。
(二)图像处理内容
第4版上册在保持上一版主要内容的基础上,还增加了一章“图像去雾”,增加了一节“图像认证和取证”,还增加了对“图像质量”“最大似然-最大期望重建算法”“基于稀疏表达的超分辨率重建”和“基于局部约束线性编码的超分辨率重建”等内容的介绍。
第4版上册分为4个单元,每个单元有3~4章,如图2所示。
第1个单元介绍图像增强技术,既包含频域图像增强,也包含空域图像增强。后者还分为基于点操作的方法和基于模板操作的方法。
第2个单元介绍图像恢复技术,既包含了传统的无约束恢复和有约束恢复方法,也包含了近期对图像的修补方法,还包含了针对大气雾霾进行消除的技术。另外,还介绍了从投影重建图像这类特殊的图像恢复技术。
第3个单元介绍图像编码技术,既包含了基本的编码定理及典型的熵编码、预测编码和(离散余弦和小波)变换编码方法,还讨论了符号编码、准无损编码、基于内容的编码等特殊方法。
第4个单元介绍拓展图像技术,既包含有关图像信息安全的数字水印技术、图像认证和取证技术以及图像信息隐藏技术,也包含从灰度图像处理向彩色图像处理的拓展、从静态图像处理向视频图像处理的拓展以及从单尺度图像处理向多尺度图像处理的拓展。
(三)图像分析内容
第4版中册在保持上一版主要内容的基础上,还增加了一章“显著性和属性”,增加了两节“从像素单元到目标单元”和“不变量交叉比”,还增加了对“方向微分算子”、“二阶导数检测角点”、“哈里斯兴趣点算子”和“随机样本共识”等内容的介绍。
第4版中册分为4个单元,每个单元有3 ~ 4章,如图3所示。
第1个单元介绍图像分割技术,既包含了分割定义及方法分类等基础,也包含了对一些典型实用算法的介绍和分割高维、运动、彩色图像的扩展方法,以及对图像分割技术的全面评价比较等。
第2个单元介绍表达描述技术,既包含对目标的表达和描述方法,还包含了对目标特征测量影响因素的讨论和对测量2的分析。
第3个单元介绍特性分析技术,既包含对纹理特性、形状特性和运动特性的详细分析,也包含对目标显著性和属性的分析方法。
第4个单元介绍一些相关的数学工具,既包含了數学形态学方法,分别针对二值图像和多值(灰度)图像;也包含对图像模式进行识别的方法。
(四) 图像理解内容
第4版下册在保持上一版主要内容的基础上,还增加了一章“压缩感知与成像”,增加了两节“图像和视频检索原理”和“主体与动作联合建模”,还增加了对(图像理解)“基本概念和定义回顾”、 (高层次)“图像技术发展情况”、(目标匹配)中的“对应点匹配”“压缩感知图像融合”和“综合特征检索”等内容的介绍。
第4版下册分为4个单元,每个单元有3~4章,如图4所示。
第1个单元介绍图像采集技术,既包含了对采集立体信息的摄像机设备的原理及其标定方法的介绍、也包含了近年在成像方面得到广泛应用的压缩感知理论,还包含了对3-D景物的表达描述方法等。
第2个单元介绍3-D景物重建技术,既包含立体视觉的方法,也包含从多种深度线索恢复3-D景物的方法。前者可分为基于双目的方法和基于多目的方法,而后者又可分为基于单幅图像的方法和基于多幅图像的方法。
第3个单元介绍场景解释技术,既包含对对场景知识和过程知识的表达和推理,也包含对像素层之上的目标层和概念符号层的广义匹配方法,还包含了几种典型的场景分析和语义解释技术,如模糊理论、遗传算法、语义标记和概率隐模型等。
第4个单元介绍三个相关方向的研究示例,既包含得到广泛应用的多传感器图像信息融合,也包含得到深入研究的基于内容的图像和视频检索;还包含得到密切关注的时空行为理解。
(五)内容对比
相比于国内外同类的教材图书(如[7],[8]),《图像工程》教材与最新科研成果结合比较快,将许多内容引进教材也比较早。除前面介绍的第4版新增内容外,前几版也比多数教材除基本的典型内容外还较早加入了许多新内容:1. 1999年~2002年出版的第1版《图像工程》教材已加入了:投影重建,分割评价,3-D边缘检测,16-邻域,特征测量误差,多目立体匹配,特征内容匹配,图像代数,基于内容的图像和视频检索等。2. 2005年~2007年出版的第2版《图像工程》教材已加入了:半调和抖动,形态变换,拉东变换,盖伯变换,图像水印,数字化模型,距离变换,SUSAN检测算子,分形,体视学和图像分析,共聚焦显微镜3-D成像,广义匹配,多传感器图像信息融合,人脸和表情识别等。3. 2012年~2013年出版的第3版《图像工程》教材已加入了混合滤波,图像修复,准无损编码,全彩色滤波和消噪,视频图像处理,超分辨率技术,图割分割法,均移聚类,局部二值模式,背景建模,运动目标跟踪,图像识别,SIFT算子,SURF算子,场景分析和语义解释,时空行为理解等。
总的来说,相比于国外同类的教材图书,《图像工程》教材更符合我国教育体系,与国内高校相应选修课程结合更密切,引入新的相关科研进展更及时,同时也比较适合我国大学学期和课程的长度需要。
四、方便教学和读者
从教学和学习的角度也有一些考虑和措施。
(一)总体考虑
第4版在编写的方针上,仍力求具有理论性、实用性、系统性、实时性,比较适合专业教学的需求。
第4版在内容叙述上,仍力求理论概念严谨,论证简明扼要。另外,也提供了许多例题,以方便读者选择学习。
第4版结合了作者的一些研究工作和成果以及这些年来的教学教案,力求使对概念的介绍和解释能比较清晰和生动。
总体来说,第4版的内容覆盖面更广,介绍更全面细致,整体篇幅比第3版有约20%的增加,使教学和学习有一定的灵活性。
(二)具体措施
另有几个方便教学和读者的具体细节:1. 在每个单元里,对其中所包含的各章都有专门的概括介绍。这既可以提供该单元的总体情况,也可以帮助读者根据需要选择学习。2. 从深入学习和开展科研的角度出发,在每章结尾处都有各节小结以及为读者扩大视野和进一步研究而提供的一些相关参考文献的介绍,以帮助读者有的放矢地进行检索和查阅。3. 各章均提供了相等数量的练习题。每章都对少部分练习题给出了解答(统一在书末给出),这样使教师可以更方便灵活地选择布置。更多的习题和其余的习题解答将会放在出版社网站上,除会提供给使用教材的教师,也便于进一步及时补充和改进。4. 第4版还增加了一项新的举措。书中使用的图片有一些是彩色图片,但在书面印刷后均成为了黑白图片。但第4版在这些图片旁增加了一个二维码,读者可以通过手机扫描图片旁的二维码,调出存放在出版社网站上的对应彩色图片,从而获得更多的信息和更好的观察效果。5. 第4版还在出版社网站上提供了一些相关教学和学习的资源。这包括教师用的讲稿、发给学生的讲义、辅助教学的演示(Flash)和再印刷时的修改表。
五、 结束语
本文介绍了新一版《图像工程》系列教材的编写思路和特色。书的出版只表示总体规划和具体措施的实体实现,但是否能满足教学需求和达到教学目的还需要在实践中检验。目前,这三册教材已分别安排供三门课使用:“图像处理”——本科生专业基础课,48学时;“图像分析”——高年级本科生和研究生专业选修课,32学时;“图像理解”——研究生专业选修课,32学时。在接下来的教学中,将验证其内容范围和结构安排的合理性。可能需要制定相应的“评价量表”来评价所设计措施有效性[9]。另外,还将考虑与不同的教学模式的结合[10],使教材能发挥最大的作用和实现最好的效果,并为进一步改善提高积累经验和素材。
参考文献:
[1]章毓晋.中国图象工程:1995[J].中国图象图形学报,1996,1(1):78-83.
[2]章毓晋.图像工程(上册)——图像处理(第4版)[M].北京:清华大学出版社,2018.
[3]章毓晋.图像工程(中册)——图像分析(第4版)[M].北京:清华大学出版社,2018.
[4]章毓晋.图像工程(下册)——图像理解(第4版)[M].北京:清华大学出版社,2018.
[5]章毓晋.图像工程(合订本)(第4版)[M].北京:清华大学出版社,2018.
[6]章毓晋.英汉图像工程辭典(第2版)[M].北京:清华大学出版社, 2015.
[7]Gonzalez R C, Woods R E. Digital Image Processing, 2nd Ed. UK Cambridge: Pearson,2002.
[8]Gonzalez R C, Woods R E. Digital Image Processing,3rd Ed. UK Cambridge: Pearson,2008.
[9]史蒂文斯,利维(美).评价量表:快捷有效的教学评价工具,第2版[M].陈定刚,译.广州:华南理工大学出版社,2014.
[10]乔伊斯,韦尔,卡尔霍恩(美).教学模式(第8版)[M].兰英,等译.北京:中国人民大学出版社,2014.