数字音频技术实验教学改革研究
2014-03-25高玲
高 玲
(哈尔滨师范大学 传媒学院,黑龙江 哈尔滨 150080)
一直以来,影视传媒专业的学科属性与行业的科技化发展决定着其人才培养,不但要有扎实的理论知识,还要有较强的设备操作与技术创新等实践能力[1]。这促使作为培养影视传媒人才基本实践能力的数字音频技术实验教学,要不断适应影视传媒行业科技发展及人才需求的趋势,进行教学资源上的更新优化与教学实践上的创新发展。当前,为满足培养高水平影视媒体人才的需求,高校纷纷对影视传媒专业的实验设备进行了升级、换代,建立了设备配置先进、系统完善的综合化影视媒体实验教学实验中心,为提升数字音频技术实验教学的质量奠定了基础[2]。但从现有数字音频技术实验教学现状来看,教学硬件设施的日趋完善与教学内容创新不足的发展差异,不但影响了学生专业知识的综合运用与创新发展,也无法满足影视传媒行业对创新型人才的需求。因此,结合影视传媒行业对人才的需求特征,提出基于语音编码下的实验教学改革思路,对语音编码的听觉场景分析、韵律认知和音频合成在数字音频技术实验教学中的应用进行了研究与实践探索。
1 影视传媒行业人才需求特征与数字音频技术实验教学存在的不足
1.1 影视传媒行业人才需求特征
数字音频技术是对数字化音频文件进行编辑、编码、解析等工作的统称,是影视传媒行业人才所要掌握的基本技能之一。随着数字媒体技术的飞速发展,在声音信息分析和媒体处理理论的深入以及市场对消费类声音质量的趋高要求,使当代影视媒体行业对数字化的声音信息处理的需求不断提升,而这种数字化声音信息处理过程,是以数字融合的方式将不同音效整合在一个交互式的整体信息文件中[3]。此时的音频文件的数据量是非常大的,要实时处理和传输这些庞大的数据,就必须对数据信息进行编码压缩,但由于数字化音频数据具有大数据量、集成性、实时性、非解释性、非结构性等特性,在数据模型的选择、数据库管理、数据的编码和数据创编等方面需要考虑许多新的特点和要求,否则就会因数据编辑的不正确,造成合成、压缩和传输解压后的音频数据出现失真现象,影响声音的播放效果。此外,由于当前音频数据不同格式的标准不一(表1),使得音频文件在格式转换中存在的误差,必须由专业人员重新进行分析、识别与合成。因此,导致当前影视传媒行业对人才的需求以必须掌握数字音频技术为基础。
表1 不同数字音频格式
1.2 数字音频技术实验教学存在的不足
数字音频技术实验教学,是影视传媒专业培养学生对音频信号处理基本概念、基本方法和基本理论的一门基础性核心实验课程。课程主要包括对音频信号的产生与感知原理、声道模型参数的估计方法、矢量量化的原理及算法、音频信号时域处理的手段、语音压缩编码的常用算法、实现手段,语音识别的发展状况和基本原理、声道模型的参数估计以及语音压缩编码的算法等内容[4]。学生通过该课程的学习,可以掌握多媒体系统结构和多媒体技术的分析与设计,了解语音信号的各种编码方法和音频合称、听觉分析的原理,提高认知语音信号的特点与编辑语音信号的操作能力,对于培养学生数字音频技术应用的创新意识、实际解决问题的能力以及知识综合运用能力具有非常重要的作用。
当前,高校为了提高学生数字音频技术的实践能力,通过完善教学仪器、建设综合新多媒体实验平台和影视传媒实验中心等,尽可能覆盖数字音频编解码标准、信道纠错编码、数字调制通信技术等教学实践操作范围,为提高学生的音频信号处理水平、拓宽思维境界、发展创新能力,提供了良好的实验教学环境[5-9]。但音频信号处理实验教学当前仍存在一些问题,主要表现为:
(1) 教学过程主要是对仪器和软件编辑功能的学习与操作,忽视了音频技术基础理论在实践中的指导作用;
(2) 教学内容大多是针对特定音频文件的编、解码,缺乏对音频文件声音调节、降噪、合成等发挥学生创新思维的编辑教学;
(3) 影视传媒专业的实验教学本身就是一种艺术创作过程,而教学中教师和教学管理者往往忽略了这一点,形成实验教学机械式的重复过程,使本应具有的艺术文化内涵严重缺失。
这说明,实验教学质量的提升不仅要靠硬件(仪器、设备)的现代化,还要靠软件(教学内容)与行业的发展和需求接轨。这种仅限于硬件的提升而忽视课程教学内涵和行业需求的教学过程,是无法培养出影视传媒行业所需的创新型人才的,因此,必须不断地完善当前数字音频技术实验教学所存在的不足之处,就是要丰富课程的教学内容、提升文化内涵和发展学生的创新能力与思维,达到培养影视传媒人才基本能力的目标。
2 数字音频技术实验教学改革思路
语音编码下的数字音频技术实验教学改革,就是以影视传媒行业对人才需求的基本特征和培养学生数字音频技术应用的创新意识、实际解决问题的能力以及知识综合运用能力为导向,以对语音编码技术中的听觉场景分析、韵律认知和音频合成在实验教学中的应用研究与实践探索,建立以认知结构为基础、以语音编码为过程、以思维创新为特征的实验教学改革思路(见图1)。
图1 基于语音编码下的数字音频技术实验教学改革思路
学习是学习者神经系统中发生的各种过程的复合,是学习者对来自环境的信息进行内在的认知加工的过程[10]。语音编码以听觉场景分析、韵律认知和音频合成的技能操作,形成基于信息创编下的对语音物理信号的识别、分析、认知、加工;通过理论结合实践的复合学习过程,使学习者的神经中枢系统对来自外界环境的刺激形成稳定的记忆过程,使学习者在认知结构和输入的信息之间,建立起相互联系、相互配合的新认知结构特征。这种新结构以不断纳入新的信息对音频进行编、解码和文件合成,是建立在认知结构下体现个人思维创新特征的信息加工过程,是使学习者的学习层次得到逐级发展和提高、实现理论知识与技能融合的创造性实践。
把对影视传媒人才基础能力的培养,融合在对语音文件的个性化创编之中,通过将不同的音频素材组合成为高质量的语音效果,彰显学生对数字语音技术的理解、数字媒体技术的文化内涵和系统化的具有影视媒体专业素养的智能行为。
3 语音编码技术在数字音频技术实验教学中的应用
语音编码就是对模拟的语音信号进行编码,将模拟信号转化成数字信号,从而降低传输码率并进行数字传输的过程[11]。随着数字媒体信息技术的发展,压缩语音信号的传输带宽、增加信道的传输速率,一直是人们追求的目标,而语音编码在实现这一目标的过程中,通过技术上的处理和加工使语音信号的比特数目最小、音效达到最佳[12]。虽然数字音频技术实验教学中也包含音频信号时域处理的手段、音频压缩编码的教学内容,但在音频降噪、分析、识别和编译上的处理能力还不能满足对高品质影视音效艺术的追求和影视媒体行业发展的需求,因此,将语音编码应用于数字音频技术实验教学之中,就是要充分发挥语音编码在听觉场景分析、韵律认知和音频合成3个方面的技术优势。以音频编辑的创新思维和技能操作,把对影视传媒人才基础能力的培养,融合在对语音文件的个性化创编之中(见图2)。
图2 语音数据认知思维编、解码流程图
3.1 听觉场景分析
听觉场景分析是用来分析、研究听觉系统如何对外界刺激进行组织加工,找出能够使声谱成分组合到一起,或使它们分离成独立的听觉流或表象的声学特征,并把不同声音感觉元素分配到相应组别中的声音信息加工过程[13]。它延伸了传统听觉理论主要从生理学角度解释人的听觉过程,以格式塔原则的初级分析和图式为基础的知觉组织应用于解答、展示人听觉信息的加工过程和特征。在丰富听觉组织理论的同时,使之在实践分析中更加易于操作和实际应用。
在数字音频技术实验教学中,以格式塔原则为基础的声频初级分析通过序列整合,帮助引导学生把具有相似特征或时间接近的音知觉从复杂的环境声中突出出来,并按时间出现的顺序纳入一个知觉流,然后按低音、高音和频率的变化关系排列成新的顺序,并构成一个新的序列。此时该序列能否产生曲调则取决于音之间的频率关系,当2组音的频域相同时曲调将消失,但如果2组分别在2个没有重叠的频率范围内,则曲调便被听成一个独立的流。以图式为基础的知觉组织,是把环境中特定的声音信号存入记忆中形成的认知图式,这是一个自上而下的信息加工过程,知识和注意在这一加工过程中起着重要作用。学生在学习中以有意注意对信息的选择进行控制,其学习任务一旦要求注意,参与图式就会出现。其图式形成的过程就是学生获得刺激知识的过程,同时学生也可以利用获得的知识对刺激的变化趋势进行预测。让学生在理论学习→实践刺激→技能提升→认知形成的学习中,不断提升数字音频技术的实践能力。
3.2 韵律认知
韵律是自然口语的共同特征,它通过对比组合音段信息使说话者的意图得到较好的表达和理解[10]。韵律决定了语言的自然度,对于提高语音合成的自然度和识别语音的准确性来说是至关重要的。因此,韵律认知日益受到语言学界和语言工程学界的重视。因此,在对语音流文件的分析中提高对音段信息和韵律信息的认知,有助于丰富音色,掌握语音流文件的韵律特征。
汉语韵律是复杂的,在音频文件中语音的韵律特征主要包括重音、语调和韵律结构。这种段特征以音高对比和音长对比的形式由语势重音配合而成,并通过信息聚焦了实施超语法的功能语义。因此,学生在对音频文件的韵律认知中,应首先从语言的树型关系出发,按照表达的需要,利用有声形态有限的分解度来安排节奏重音,以多层叠的节奏单元和语势重音、节奏重音分别调节音域的高音线和低音线;其次,把语调构造各部分的音域特征综合在一起,通过韵律结构中的韵律词、韵律词组和韵律短语区分不同的语调类型,以表达人在不同语境下的不同韵律特征;第三,以对语音信号中具有语言学功能的韵律特征进行韵律标注,实现其韵律特征的定性描写。这就要求学生在学习中要牢记汉语的语音规范,通过对音频数据的不断实践提升韵律认知能力,完善数字音频技术技能。
3.3 音频合成
音频合成是直接利用泛音,按照一定的谐波规律得到的音高素材直接运用的过程[14]。它主要是通过声音的合成、还原与创新来实现对声本体的研究,使合成声音不再由武断的规则、死板的结构来体现,按照声音的本质属性去组合声音,把声音的合成过程变成艺术的体验、创作,以数字媒体技术与声音本质的透视、解析、合成,实现科学与艺术的高度融合。
目前,虽然音频合成编码通常用计算机和专用合成软件来实现,但音频信号具有以下的特点:
(1) 音频信号是时间的连续媒体,对时序性要求很高,如果在合成时间上有25 ms的延迟,人就会感到断续;
(2) 人接收声音有2个通道,计算机模拟自然声音也应有2个通道;
(3) 语音信号不仅仅是声音的载体,同时还携带了情感的意向,这决定着音频合成编码实际上就是一个艺术创作的过程,是建立在特定的参数模型之上对声音的艺术描述,所以多媒体系统中的语音要包含语意等其他信息。
这些特点要求学生在学习中,首先要以自我的实践,逐步认识并掌握如共振峰合成、LPC合成、PSOLA拼接合成、LMA声道模型等不同音频编码技术在合成上的优缺点,实现在音频合成创作中通过多种技术的有机结合,或将一种技术的优点运用到另一种技术上,克服单一技术存在的不足;其次,在音频文件的编辑与合成过程中,需要对声音文件进行多种特殊效果处理,如静噪、淡入淡出、往返放音、交换声道及声音移位等,在这繁杂的操作中,教师应随时指导学生,帮助学生建立正确的操作程序和技能规范,防止因不正确的操作行为导致的音频合成失败;第三,在音频合成编码中要以艺术的美感解析、选择、组合音频素材,以对音乐旋律、音域、音调的认知,把选择的素材在头脑中串联起来,通过想象空间的构化形成独具个性的音乐创意,让学生的声音创造力不仅体现在对现代音频合成设备的操作技能与应用能力上,更以不断完善对声音艺术的认知实现艺术的文化修养与声音艺术的文化表达。
4 结束语
影视传媒行业人才必须掌握数字音频技术的需求特征,因此对影视传媒专业实验教学提出了更高的要求,其数字音频技术实验环节必须要更加重视对学生基础能力的培养。基于语音编码下的实验教学改革思路,就是以影视传媒行业人才需求为特征,通过丰富课程内容与方法,让新一代的影视传媒人才能够以扎实的基本功迎接社会的挑战。
[1] 于海礁.关于媒体广告实验室建设的探索与思考[J].实验技术与管理,2012,29(8):185-187.
[2] 杨寿堂,王轶群.音视频基础课教学实验室评估的实践与探索[J].实验技术与管理,2007,24(10):157-160.
[3] 高俊,黄滨,周江波.数字融合视角下的体育文化创新[J].体育学刊,2013,20(2):15-18.
[4] 殷海兵,李茜,洪波,等.“数字视音频技术”课程体系改革探索[J].科技信息,2010(30):43-44.
[5] 刘玉清,杜莹.新闻传播教学全媒体实验平台建设探讨[J].实验技术与管理,2012,29(11):169-173.
[6] 杨晟.试析新闻传播类专业实验教学理念创新[J].实验技术与管理,2009,26(7):136-138.
[7] 杨寿堂.虚拟演播室系统分析及应用[J].实验技术与管理,2005,22(12):83-86,96.
[8] 马静岩.我国高等院校影视传媒专业实验教学改革研究[J].实验技术与管理,2013,30(4):166-168,189.
[9] 徐晓风,施长君,陶亚兵,等.国家级艺术实验教学示范中心建设的探索与实践[J].实验技术与管理,2011,28(7):7-9,31.
[10] 史忠植.智能科学[M].北京:清华大学出版社,2006:104,253.
[11] 沈静,阮若林.音频信号的感知编码技术研究[J].咸宁学院学报,2007,27(3):75-77.
[12] 杨晟.试析新闻传播类专业实验教学理念创新[J].实验技术与管理,2009,26(7):136-138.
[13] Godsmark D,Brown J.A black board architecture for computational auditory scene analysis[J].Speech communication,1999(27):353-366.
[14] Murail,Tristan.The Revolution of Complex Sounds [J].Joshua Cody,translated.Contemporary Music Review, 2005, 24(2/3):121-135.