数字视频技术在“数字图像处理”课程教学中的应用
2015-02-23王忠芝
孟 倩 王忠芝
(北京林业大学信息学院,北京 100083)
数字视频技术在“数字图像处理”课程教学中的应用
孟 倩 王忠芝
(北京林业大学信息学院,北京 100083)
伴随着网络的发展和学习的多元化,仅仅依靠课堂的讲授已经远远不能满足学生的学习需求,于是数字视频技术在教学中的应用就显得尤为重要。首先,阐述了数字视频技术的发展及其优势;其次,介绍了数字视频技术在“数字图像处理”课程教学中的应用实例;最后,对数字视频技术在“数字图像处理”课程教学中的应用方式进行了探讨。
数字视频;数字图像处理;虚拟教师;教学视频
传统的教学模式是教师站在讲台上为学生传道授业解惑,学生坐在下面听讲。19世纪中期,世界各地的大学开始兴盛,原本的教师口述,学生口记的教学方式,因为学生人数的增多而越来越显现出它的不便。因此,欧洲和美国开始把原本小型、非固定的黑色布告栏增大,以便远处的学生抄写教师的口述。但随着现代科学技术的迅速发展,各种现代化科技成果被运用到教学中,既推动了教学手段的更新,又促进了教学方法的改革。现如今互联网已进入千家万户,通过网络进行视频教学的工作已被提上议事日程。
一、数字视频技术的发展及优势
20世纪90年代后期,以多媒体技术和网络技术为代表的信息技术得到了迅猛发展。这些技术在教育领域的应用,引起了“教育思想、教育内容、教育方法、教育模式、教育过程”等诸多方面的变革[1]。网络多媒体技术的发展使得教师和学生从传统教学模式的禁锢中解脱出来,学生真正成为了教学的主角,学生的学习不再是单调和枯燥的,而是充满了乐趣的探索。
另外,随着科技的发展,越来越多的数字视频技术介入到教学活动中。与单纯的视频录像相比,数字视频可编辑性更强而且有更加生动的图象,这使得数字视频技术的应用更加多元化。
二、数字视频技术在“数字图像处理”课程教学中的应用
普通的教学模式由于受到时间和空间的限制,导致学生不能尽情地汲取教学中的精华,使得教师的教学存在一定的局限性。为了打破这种局限性,笔者制作了数字视频教学课件。本课件采用虚拟教师与真实教室相结合的形式,对课上内容进行了重现性教学。
(一)应用中遇到的技术难点问题及其处理
在将数字视频技术引入到“数字图像处理”课程教学中时,笔者遇到了以下3方面的技术难点。
1.虚拟人物与真实环境的融合问题
要想实现三维虚拟教师与真实环境的融合,就必须要考虑到一个现实的问题,即运动匹配,也就是说如何让三维教师与真实拍摄的摄像机拥有同样的机位运动路线。针对上述问题,笔者首先采用3ds max建模的方式制作了三维虚拟教师的模型,同时用摄像机在教室拍摄了教室场景。然后采用二维画面跟踪技术解决运动匹配问题。但二维画面跟踪技术有着自身的局限性,在后期合成阶段,二维画面跟踪技术只能跟踪“画面内”物体的运动,而对于“画面外”摄像机的运动则显得无能为力。另外,画面中被跟踪物体的透视变化也只能通过“四点跟踪”技术模拟出来,这同实际拍摄中的物体透视变化有着本质的区别,因此当被跟踪物体出现被遮挡或出画面的情况发生时,“四点跟踪”技术就往往无法完成精确的跟踪操作,这时就需要采用摄像机运动轨迹反求技术。摄像机运动轨迹反求技术是根据画面中像素的明度、饱和度、色相3大要素筛选出画面中具有“特征”的像素,并跟踪这类像素的运动轨迹,从而获得拍摄该画面的摄像机在每帧的运动轨迹和参数变化。在获得这些参数后,创作人员可以在三维动画软件包中加入一个与实拍环境下摄像机运动相匹配的虚拟摄像机,从而给机位运动的画面添加合成用的3D物体或背景,得到与运动匹配的图像。其工作流程图见图1。
图1 技术工作流程
2.教学音频的制作问题
为实现声音与虚拟的三维人物的匹配,并保证声音的稳定性,此次教学音频的制作采用了文字转声音软件。经过试验笔者发现运用TTS语音引擎转化的声音既符合虚拟的三维人物的形象又不会太过机械化。
TTS是Text To Speech的缩写,即“从文本到语音”,它是人机对话的一部分,它让机器能够说话。它的特有的智能语音控制器使得文本输出的语音音律流畅,让听者在听取信息时感觉自然流畅,没有机器语音输出的冷漠与生涩。另外,采用文字转声音输出音频文件的方法还解决了录制音频的口音、口误、语调、语速和耗时等问题。
3.动画与声音的匹配问题
为了使动画同声音基本同步,实现动作与声音的匹配,笔者采用声音时长调节动画帧数的方法解决问题。首先,获得音频内容;其次,根据其时长调节人物口型动画以及结合讲解内容调节人物动作;最后,使声音和画面同步匹配。
(二)数字视频教学课件的制作
1.前期准备
(1)素材准备
首先,收集整理现有的有关数字图像处理的课件资料,根据资料内容安排每堂课的具体内容;其次,对上课的内容进行整合,把PPT转化为JPG图片,并在Photoshop中批量转化尺寸,用于后期视频的制作;最后,收集教室、课堂的实际环境的图像和视频资料,以此为参考设计摄像机的机位与画面的景别等,制作出分镜头脚本。
(2)软件准备
此次制作中涉及到的软件比较多,下面简单介绍一下常用软件。①图像处理软件(Photoshop软件)。应用此软件对部分图片进行尺寸和色彩的处理。②三维动画渲染和制作软件(3ds max软件)。应用该软件进行人物和部分场景的建模渲染。③摄像机跟踪软件(Boujou软件)。应用此软件可以自动跟踪视频中的特征点,从而反求出摄像机运动轨迹,实现与三维软件和后期软件的对接。④文本转语音软件TTSUU(Text-to-speech Universal Utility)。应用此软件把授课内容中的文字内容转化为语音进行输出。⑤屏幕录像和编辑的软件(Camtasia Studio软件)。应用此软件对一些具体操作内容进行屏幕录制,方便学生理解操作。⑥视频剪辑及设计软件(Affter Effects软件)。应用该软件把分层渲染的素材进行合成输出。⑦视频编辑软件(Premiere软件)。应用此软件对视频、图片、音频等素材进行合成和最终输出。
2.中期制作
(1)真实场景的录制
根据前期调研好的机位和景别,依照分镜头脚本,调整好摄像机的各项参数后在教室中进行拍摄。
需要注意的是为了方便后期的合成制作,拍摄的素材为空视频,即没有人物只有场景的视频。这样可以减小后期制作的难度。
(2)虚拟人物的搭建
在三维动画渲染和制作软件3ds max中进行虚拟人物的搭建。首先,建立人物模型,并给模型添加材质和贴图;其次,进行灯光的架设;最后,绑定骨骼,以便进行动作的调节。
(3)教学音频的制作
此次教学音频的制作主要是采用微软TTS软件的语音引擎功能对讲解内容进行音频转化。
TTS软件的文本转语音技术已经逐渐成熟,市场上也出现了一些优秀的TTS软件,比较有代表性的是一款叫做TTSUU(Text-to-Speech Universal Utility)的国产文本朗读软件,此款软件能朗读和复读几乎任何语言的文本内容,把文本导出成WAV和MP3格式文件。
TTSUU文本朗读软件使用起来方便快捷,朗读声音质量满足要求。可以采用手工输入、拷贝粘贴、打开TXT文本文件、WORD文件以及PDF文件等方式对文本内容进行朗读,进而迅速地导出音频文件。只要输入课堂讲解的文字内容,就能轻松地得到音频文件。
(4)虚实场景的融合
把真实的课堂与虚拟的三维人物进行合成。此过程使用到的软件为Boujou与3ds max。
Boujou软件的核心技术便是跟踪功能。对导入素材进行调整处理后,Boujou软件就能根据图像素材自动跟踪视频画面中的特征点,从而智能跟踪出素材中各物体运动轨迹信息。Boujou软件中的Track Features功能将针对图像素材完成跟踪。在Boujou软件的跟踪结果中,可以得到数量众多的跟踪点,点的运动直接反映出图像素材中物体的运动,同时通过这些跟踪点,Boujou软件即可智能反求出对应的摄像机的运动轨迹信息。Boujou软件还提供了方便快捷的输出工具Export Camera。输出格式多样而且十分快捷,实现了Boujou软件与其他三维软件和后期特效软件的对接,例如3ds max软件和Affter Effects软件的对接。此例中使用了Boujou软件与3ds max软件的对接,信息输出后,打开3ds max软件运行脚本,导入从Boujou软件中导出的信息,此时在3ds max软件中就会出现一个完整的摄像机运动轨迹。为了进一步确认轨迹的正确性,可以导入背景视频进行对照验证,然后就可以在场景中构造需要的三维虚拟物体,这样就实现了虚拟与现实的融合。
(5)合成场景的动画调节与渲染输出
在三维动画渲染和制作软件3ds max中对人物的动作进行调节,分层渲染输出。
由于人物动作与声音要协调一致,所以调节口型动作以及人物动作时要特别注意根据音频的时长调节好帧数。为了方便后期虚拟人物与真实环境的合成,笔者采用分层渲染的方式,增加层次感。
(6)特殊内容的视频制作
对一些操作性强和讲解性强的部分采用屏幕录制的方式,让学生一边观看图像一边聆听讲解,以便更加迅速和深刻地了解授课内容。此次采用的是Camtasia Studio屏幕录制软件,这个软件视频画面清晰、操作方便快捷。
3.后期合成
在视频剪辑及设计软件Affter Effects中进行图层的后期合成输出,需要注意的是物体的遮挡问题。例如:讲桌和教师存在遮挡关系,讲桌所在图层应位于教师所在图层之上。根据实际情况排列好图层位置后,进行图层的后期合成输出,就会得到多个虚实合成场景的视频片段。
图2 视频输出效果
最后把视频片段、图片文件和音频文件导入到视频编辑软件Premiere中,进行画面、声音以及字幕的最终合成,并导出清晰的视频格式,视频输出效果见图2。
三、数字视频技术应用于“数字图像处理”课程教学的展望
伴随着网络的发展和技术的进步,采用数字视频技术进行教学的方式越来越被广大学生所接受,本文只是探索了虚拟人物与真实课堂相结合的教学方式,今后还将继续探索研究虚拟人物与网络用户的互动方式,目的是提升用户的沉浸感和产品的互动性。而真正实现让学生随时随地想学就学,并且进一步提高学习的趣味性,让学生学得开心、学得牢固、学以致用。
随着数字视频技术走向成熟,数字化的教学资源逐步被人们熟知和使用。它能把书本知识变得更为直观形象、图文并茂、情景交融,让学生通过多种感觉接收知识,这有利于学生获得技艺,提高学生理解运用知识的能力[2]。而随着数字视频技术的不断发展,单纯的视频录像已经不能满足学生的需求,21世纪的大学生,在探求知识的道路上,已经不再满足于“填鸭式”的被动的传统教学模式[3],数字视频技术的发展为教学带来了更大的灵活性、便利性和趣味性。教师运用数字视频技术,可以更加生动形象地表达出授课的内容,让学生更加便捷地理解和接受知识。因此,笔者相信数字视频技术的发展会为大学课堂教学带来更加美好的前景。
[1] 孙冀宁.数字视频技术在外语教学中的应用[J].常熟理工学院学报,2007(12):96-98.
[2] 祁冰.多媒体教学资源中的数字视频技术[J].光盘技术,2008(8):53.
[3] 李华,吴云勇.“互动式”教学模式论析[J].沈阳师范大学学报,2008,32(3):77-79.
(责任编辑 孙艳玲)