APP下载

从语言学角度探讨录音内容辨听的若干注意事项

2019-01-26孙宏吉杨俊杰

中国司法鉴定 2019年2期
关键词:重音录音普通话

孙宏吉,杨俊杰

(1.山西大学语言科学研究所,山西 太原 030006;2.山西大同大学,山西 大同 0370092;3.山西警察学院,山西 太原 030401)

在司法鉴定领域,录音内容辨听是通过听辨,必要时借助录音处理等技术手段,书面整理录音资料所反映的对话内容[1],在国外被称为“Forensic Recording Transcription”[2]或“Audio Transcription”[3]。作为录音资料检验的一个重要组成部分,司法录音内容辨听在审判中发挥着重要作用,尤其当案件录音因录音设备、录音方式、录音距离、录音环境等的影响所导致录音内容不清楚或录音内容涉及外语、方言等情况时。

在许多人看来,将录音内容整理成文字材料是一件极其容易的事情,但有过文秘工作经历的办公室人员却懂得,这一工作貌似简单,但若想准确出色完成却也绝非易事。而用于各种诉讼证据的录音内容辨听则更加复杂,因为其录音质量通常不是很好,有些甚至需要进行增强处理。但无论如何,准确可靠的司法录音内容辨听是非常重要的。因为在案件侦查或审判中,辨听整理的文字内容也是证据之一。如果辨听人未能准确辨听整个录音内容或关键内容,不管其认为自己辨听的是否准确,他都在无意中改变着证据[4]。因此,司法录音内容辨听要比普通的会议录音辨听、外文或方言翻译要更加严谨、准确[5]。本文将结合工作实践,从语言学角度来探讨司法录音内容辨听时需要注意的一些问题。

1 借助语音识别软件来进行司法录音内容辨听

语音识别技术,是将人说话的内容和意思转换为计算机可读的输入,例如按键、二进制编码或者字符序列等[6]。从20世纪50年代至今,尽管随着隐马尔科夫模型(HMM)、人工神经元网络(ANN)等技术的成功应用将语音识别研究进一步走向深入,但其对具体测试语料识别的准确率也仅为95%~97%左右,离开测试语料其准确率则会不同程度的降低,尤其是在发音方式、说话方式、环境噪音、传输信道衰落等因素的影响下,其性能更难以令人满意。正因如此,国内著名的语音识别研发机构才将其语音识别转写系统分为机器快转 (适用范围:标准普通话、语音清晰、无背景噪音)与人机精转(适用范围:略带方言口音、有噪音、含专业领域)[7]。对于录音内容辨听,笔者认为通常不可以仅使用语音识别软件,因为案件中涉及录音资料的语音清晰度往往不高,语音也不是标准的普通话,还经常存在不同程度的背景噪音或信道的影响,难以满足机器快转的要求。尤其是案件录音中通常会存在多个说话人,难以满足识别训练需求。而当录音中的语音内容为普通话且信噪比比较高时,人机结合的精转似乎更能满足实际工作,但也会存在后述的一些问题。

2 检验人员或辅助辨听人的选择

在司法录音内容辨听案件中,经常会涉及到方言录音内容。对于此类录音,当前的共识是,检验人员或辅助听辨的听音人应当能听懂录音中所涉及的方言(即检验人员或辅助听辨的听音人应尽可能与被听辨录音的说话人是同一地方的人)。但是,在辨听实践中,则会存检验人员或辅助听辨的听音人与被听辨语音的说话人是否属于同一方言点或方言小点的问题,这是因为,汉语方言极其复杂。

首先,汉语不仅有官话、晋语、吴语、徽语、赣语、湘语、粤语、平话、客家话等十大方言,更有“隔河而语异”、“十里不同音”的现象。即使听辨者与说话人同属同一方言区而不属同一方言点,也可能会出现听不懂的情况,甚至是同一方言点,也会存在不同小点间难以完全听得懂的情况。例如:山西省襄汾县就存在四个方言小点,其中汾城话与河东话则明显不同,河东人对汾城话就存在难以听懂的情况,并且这一现象在中国南部的福建、广西、广东等地尤为突出。有些地方“明明是一马平川的一个平原,不隔山,不跨水,右边的潮汕村讲潮汕话,左边的广府村落讲粤语白话,中间的客家村落讲客家话”[8]。

其次,汉语中还存在着众多的方言岛。由于历史上的军事、政治、经济等移民运动,讲一种方言的一部分人迁入另一种方言的人的地盘,其所带来的方言在本地方言的包围下就形成了方言岛[9]。方言岛在广东、福建、海南乃至北方很多地方也是常见现象。方言岛的大小不一,可以是县,也可以是镇、乡,还可能是村。例如:四川达州市达川区安仁乡的安仁话与湖南涟源话同源,与安仁乡周围其他地方的话就明显不同。

再次,汉语方言中还存在大量的文白异读现象(在不同的语言环境中,同一个字有两种不同的读音:一种是读书识字所使用的语音,称为文读;另一种是平时说话时所使用的语音,称为白读)。“文白异读是汉语方言特有的一种语音现象。一般来说,长江以南、黄河以北的广大汉语方言区里有文白异读,而处于长江和黄河之间的官话方言这一现象罕见。在有文白异读的方言里,以闽语,特别是闽南话、南部吴语及晋语文白异读的情况最为复杂。”[10]。这些复杂性不仅表现在官话方言与晋语区的文白异读与闽语、吴语等南方方言的文白异读相反(一般情况下,文读音较接近于普通话读音,而白读音与普通话读音偏差较大),还表现在并不是某个方言区的所有地区都有文白异读。例如:山西省的中区、西区、南区、北区临中区的市县都有文白异读,而东南区、东北区及北区的多数县市没有文白异读,也表现在有些字的文白异读在声母,而有些字的却在韵母[11]。此外,当录音中涉及外语或少数民族语言时,也同样存在方言问题。

最后,在辨听工作中,即使辨听者自认为能够听懂说话人的语音,也可能会出现听错的情况,因为方言之间或方言与普通话之间存在大量同形异义词[12-14]。所谓同形异义词是指语音形式和汉字书写形式都相同而意义并不一样的几个词。不同方言之间也会有语词的同形异义现象。这主要是由于语言的发展演变在不同的地区走着不尽相同的道路,另外一个原因则是不同方言在造词时的形式上的耦合[13]。其中,方言与普通话的同形异义词主要表现在亲属称谓上的显著差异、同名异物、古今词义的差异、词性的差异、泛指与特指的差异、含义迥异等方面。例如:在山西汾城方言中“爷”既指自己的爷爷,还指对爷爷辈人的尊称,只是声调不同(爷[iɑ31]是自己的爷爷,爷[iɑ13]是对爷爷辈人的尊称),而山西左权方言中“爷”则指“爸爸”,回民话中的“爷爷”也是指“爸爸”;北京话、山西太原话中的“大爷”指“伯伯”,与普通话及许多方言不同。山西霍州方言、河南洛宁方言的玉米读[thaoȿhu] ,而汾城方言中的[thaoȿhu] 则是指高粱。如果说这些同形异义词之间还有一定关联的话,有些词则是词形相同而含义却相差甚远。例如:“注”在普通话中是“流入,灌入”之意,而在长沙方言中则是指 “用不正当手段把次品推销给对方”[14]。“出众 ”在普通话中是“超出一般人”之意,而在长沙方言中则指是“举止大方”(多用于姑娘)。“打住”在普通话中是“停下来,不要再继续下去”之意,而在长沙方言中却是“住宿”之意。“打破”在普通话中是“使物体破坏、损伤”而在长沙方言中却是“劝阻”之意。诸如此类形同义异的词汇,在各方言区中均有不同程度的存在[14]。

最后,方言中还存在弱化、合音、吞音、增音等语流音变现象,这些音变只有本母语的人才能识别。作者曾经在一起案件录音的辨听中对自认为能够听得懂的录音内容进行了书面内容整理,在随后邀请本地人进行核对的过程中发现,大量的合音字、吞音词等都没有听出来,严重影响到了内容的准确度。因此,在实际辨听工作中,在选定辨听人或邀请方言听辨的辅助人员时,其母语应该与被听辨语音的说话人属于同一方言点或方言小点,并在录音内容整理报告中予以注明。在受理案件时,也一定要询问清楚录音中涉及的方言是否存在方言岛现象。

3 不同语言或方言与普通话之间存在的不对等现象

准确、客观的法律翻译(包括录音内容辨听)是保证法律面前人人平等的一个工具[15]。但是,即使听辨人与说话人同属同一方言点,能够完全能够听清听懂录音内容,在对其进行听辨整理时也并非易事。这是因为,语言和文化密不可分,各民族所处自然地理、人文历史和文化环境等的不同,使得他们对外部世界反映产生的印象和概念也会有差异,因而产生了包含不同文化意义的语音、词汇和语法,即语言的不对等性[16]。虽然语言的不对等性使世界变得丰富多样,但它也给跨文化交际带来了一些障碍,更给司法实践中录音内容转写增添了一定的困难。对于双语间存在不对等问题,不仅语言翻译工作者公认的难题,更是司法诉讼领域常常遇到的,最令人头疼的棘手问题,因为凡有双语现象的地方,都有可能因为语言问题而引起法律问题[15]。

学过外语搞过翻译的人知道,所以很难想像将英文、法文、俄文、德文等外语文章翻译成中文,原来的意思可以保留多少[17]。因为在大多数情形下,虽然可以找到完全嵌合的词汇,但也有很多情形,由于文化不同,根本找不到同样的词汇,转换就很困难了。别说外语,连汉语普通话与方言之间,有时也找不到一个完全适合的词汇,这一点会说方言与普通话的人都有体会。因此,在录音辨听时,对于语言间的不对等性需要在整理出的文字后用括号加以注释说明。

4 注意副语言信息的准确体现

语言符号在传递信息时是有局限性的,常有“词不达意”、“只可意会,不可言传”或“此时无声胜有声”等情况。因此,在言语表达中经常会使用一些非语言的辅助手段作为语言的补充,参与交际。其中,语音停顿、重音、语速、语气、笑声等副语言成分对准确理解和破译所蕴含的语义具有重要作用。

副语言有狭义及广义之分。狭义的“副语言”是指说话时附带的有声现象,如说话时提醒别人不要说的咳嗽声、尴尬的笑声、拖腔、紧张的结巴声、神秘的压低嗓音说话声等等。这些声音是伴随话语而发生或对话语有影响的,有某种意义,但意义并非来自词汇、语法或一般语音规则。而广义的“副语言”还包括无声而有形的现象,即与话语同时或单独使用的手势、身势、面部表情、对话时的位置和距离等等,这些也能表示某种意义,一般有配合语言加强表达能力的作用[18]。司法实践中,内容辨听有时检材是录音资料有时则是音视频混合资料,因此,需要考虑广义的副语言信息。

在交际活动中,副语言信息单个或结合运用就可以表达语言的特定意思(友好的或嘲讽的,兴奋的或悲哀的,诚恳的或虚假的)。事实上,人们在语言交流时,同一句话,同一个字,使用不同的副语言便会给人不同感觉。例如:拿礼貌用语中的“请”字来说,语调平稳,通常会显得客气,满载盛情;语调上升,并带拖腔,便可能意味着满不在乎,无可奈何;而语调下降,语速短促,就可能被理解是命令式的口气,怀有敌意。又例如:当一个说话人正准备说一件事情的时候,另一人故意咳嗽了一声将其打断,这种副语言所传递的潜在信息甚至强于用一句话的准确表达。

正是由于副语言所暗含的潜性信息意义重大,有时甚至“此时无声胜有声”,因此,在录音内容辨听时要结合语境准确辨识并进行备注解释。

5 防止歧义表述

日常生活中我们经常可以看到一些网络调侃内容。诸如,“一对恋人约定见面的地点,女的对男的说:“咱们地铁口见,如果你先到,你等着;如果我先到,你等着!”;“冬天能穿多少穿多少,夏天能穿多少穿多少”;“剩女产生的原因有两个,一是谁都看不上,二是谁都看不上”。诸如此类调侃,揭示了语音、语法等对语义的严重影响。在录音内容辨听中尤为需要重视,否则将可能产生语义迥异的整理材料。

语音停顿会对语义、句法结构产生重要的影响。停顿是说话时出现的间歇,是通过控制言语交际时间来传递信息的一种手段。停顿有两种,一种是正常停顿,一种是超常停顿。正常停顿即语法停顿,是指词语、句子、段落间的停顿。正常停顿能够使话语顿挫有度,语义分明。超常停顿是指在不该停顿的地方进行停顿,它是口语表达中一种重要技巧。超常停顿往往为表达某种特定的语音或情感,强调某一观点或突出某一事物。正如马克吐温所说:“恰如其分的停顿经常产生非凡的效果,这是语言本身难以达到的。[19]”但是这种停顿是不已产生歧义为前提的。

当人们言语交流时,对语义的理解是在语流中实现的,如果语音停顿不同则可能形成不同的句法结构与语义理解。例如“咬伤了猎人的狗”这句话如果按照“咬伤了 猎人的狗”来停顿的话,其语义与“咬伤了猎人的 狗”的语义则明显不同。又如,人事部门考核干部,向有关人员了解情况,当问到某人时,对方回答,“他呀——。”“怎么样?”“他——嗨,我不大了解。”这里的两次欲言又止的停顿表明被访问者对考核对象所持的非肯定态度。

在司法诉讼言语交际中,被害人、证人、当事人、犯罪嫌疑人等说话过程中的停顿也有多种含义,我们要结合语境分析停顿的语义含义。

语音的轻重会对句法结构与语义产生重要的影响。重音是说话时故意把某些词语讲的特别清晰响亮或加强音强与语调的现象。重音的特点表现在扩大音域、延长音节的时间、增加音节强度上。汉语是声调语言,但也有轻重音。虽然汉语中的轻重音不像英语那样重要,但轻重音的不同对句法结构与语义也会产生重要的影响。重音可以分为语法重音与逻辑重音。

语法重音是根据语法结构的特点,某些语法成分重读的现象。一般来说谓语中的主要动词常常重读,如“我们买挂面去了”。语法重音是按照语法成分在句子中的地位自然形成的,一般不表示什么特殊意义。

逻辑重音也叫强调重音。它是在不同语境下,言语人为表达某种意义而对某些词语重读的现象。例如,“我想起来了”这句话,如果重音在“想”上,则表示说话人想起某件事情了;如果重音在 “起来”上,则表示说话人不想躺了,而是想站起来或坐起来。而下面一句话重音成份的不同,更能显示语音轻重对语义影响的重要性。

我相信你愿意学好。(他不信,我信)

我相信你愿意学好。(我没有怀疑过你)

我相信你愿意学好。(别人我可不敢说)

我相信你愿意学好。(是自愿,不是被迫)

我相信你愿意学好。(你明白是非,不愿学坏)

在完整、连贯的语境中,语音停顿、语音重读可能会造成的语义歧义可以根据上下文的呼应而得到正确理解。但是,当检验人员在把听到的内容整理成文字材料时,如果不注意停顿、轻重音的准确表达,则很容易产生歧义,违背录音谈话原始意思的表达。因此,在工作中,我们不仅要仔细分辨语音停顿、重音所隐含的准确含义,更要注意文字表述的准确性,防止歧义表述。

6 录音辨听内容的使用

通过前面的论述可以发现,由于多种因素的影响,录音辨听整理成的书面材料同原始录音相比总是具有一定的局限性。因此,对录音辨听内容不应当单独使用,而应当在法庭上与增强后的录音一起使用。需要牢记,录音辨听内容是为了辅助录音的听辨,是为了让每个人都能更好地理解录音中所说的具体内容[20],而不是用它来替代原始录音材料。

7 结语

通过前文所述,可以将录音内容辨听的注意事项总结如下:

(1)如录音内容不是标准普通话且信噪比较高,应避免仅使用语音识别软件进行辨听;对于标准普通话的识别结果一定要进行详尽的人工校对。

(2)辨听人或辅助听辨人母语应该与被听辨语音的说话人属于同一方言点或方言小点。

(3)对于语言间的不对等性需要在整理出的文字后用括号加以注释说明。

(4)要结合语境对副语言信息准确辨识并进行备注解释。

(5)对辨识整理的文字材料要进行准确表述,防止歧义。

(6)在检验意见书中需注明辨听内容需与录音文件结合使用互相印证。

猜你喜欢

重音录音普通话
阿基与乌龟之重音
单词重音
Funny Phonics
funny phonics
重音在“文学作品朗读”中的运用
Listen and Choose
Listen and Color
我是中国娃爱讲普通话
浅谈语句重音的把握
17