APP下载

基于语料库的“普通话”地域性言语识别技术

2014-02-03

中国司法鉴定 2014年1期
关键词:官话重音韵母

王 虹

(1.中国刑事警察学院 文件检验技术系 文件检验鉴定公安部重点实验室,辽宁 沈阳110035;2.东北大学自然语言处理实验室,辽宁 沈阳110004)

1 引言

言语识别是刑事科学技术的分支学科之一,是“运用语言学和侦查学以及相关学科的知识、原理和方法,研究各类群体言语人的言语特点和规律,分析、鉴别各类文件物证的言语特征,并以此判断涉案言语人的社会群体属性,为案件侦查确定方向、范围的一种专门技术手段”[1]。地域性言语识别是言语识别技术的重要组成部分,是通过分析言语材料的方言特点、地域性文字特点和地域性言语内容特点来判断言语人的所在地区或籍贯,为侦破案件确定方向和范围的一种刑事科学技术手段。

汉语方言特点具有明显的地域属性,是进行地域性言语识别的主要依据之一。因此,从事案件言语识别教学、研究、办案工作的刑事科学技术人员也一直致力于汉语方言的学习、调查与研究。

近年来,随着普通话的推广、市场经济的发展、各地交际的日渐频繁,犯罪分子作案时多故意使用普通话发音,这给我们利用犯罪分子的语音材料来分析其籍贯等属性带来了很大的困难。因此,我们开始研究利用汉语“普通话”进行地域性言语识别。拙文《利用汉语“普通话”语声进行案件地域性言语识别的可行性研究》[2]从理论上论证了这一技术的可行性。随后,我们严格遵照中国社会科学院李爱军教授作为国家863项目研究成果提出的“语音库制作过程和一般规范”,建立了《面向案件言语识别应用的汉语“普通话”语料库》,包含15个方言点150个发音人的22350个语音文件;并研发了《汉语“普通话”语音数据库查询检索系统》,可按方言点、发音人年龄段、职业、文化、性别进行查询检索,并进行播放演示,亦可将查询结果导出、打印。在此基础上,我们展开了相应的汉语“普通话”地域性差别研究,希望能够从理论和实验上探讨从有限的以普通话发音的语音材料中提取出更多地域性特征的途径和方法,更有效为案件分析定向服务。

1 汉语“普通话”的地域性差别研究

通过对语音数据库中语料的初步分析,我们发现方言区的人在说普通话时会不同程度的出现其母语方言的固有特点,大体上是年轻人、知识分子、市区人方言特点出现得少一些,老年人、与外界很少交往的人、郊区人方言特点出现得多一些。这些方言特点主要表现在语音、词汇、语法等各个层面。

1.1 语音特征

语音是语言的外壳,方言区的人在说普通话时,往往最容易在语音上露出马脚。有方言特点的普通话在语音上主要表现为声母、韵母、声调、重音等方面的特征。

1.1.1 声母特征

汉语普通话有22个声母(包括零声母),多数方言音系的声母与普通话有差别,这就导致方言区的人在说普通话时会不同程度的保留其原有的方言声母 特征。 通过分析,我们发现 z[ts]、c[ts‘]、s[s]与zh[tʂ]、ch[tʂ‘]、sh[ʂ]相混、[n]和 [l]不分、合口呼零声母音节读[v]声母、开口呼零声母读[n]或[ŋ]声母、送气声母与不送气声母常相混、h[x]、f[f]相混等是方言区人讲普通话时常出现的声母特征。

例如:西南官话区的成都人说普通话时,常把翘舌音读成平舌音,如把“昼”读作[tsou];把 h[x]读作f[f],如“怀”读[fai]、“皇”读[faŋ]等。

又如:吴语区上海人说普通话时不能很好地区分翘舌声母与平舌声母,因为上海话的声母系统中没有翘舌声母,不存在平翘舌的音位对立。[ʐ]声母常被错发成[l]声母,与上海话自身的音系中不存在这个音有关。 [n]声母和[l]也存在一定的混淆,常把[n]发成[l]。同时我们发现:由于受其自身音系系统的影响,上海人在说普通话时,往往会将某些音位混淆,造成发音错误,且其声母较之韵母更容易发生音变。

粤语区广州人说普通话常把[tʂ]组读成[ts]组或[tɕ]组,如把“知道”的“知”读作[tsɁ]或[tɕi];常把 f[f]读作 h[x],如把“飞机”的“飞”读作[xuei]等。

1.1.2 韵母特征

汉语普通话有39个韵母,多数方言音系的韵母与普通话有差别,这就导致方言区的人在说普通话时会不同程度的保留其原有的方言韵母特征。通过分析,我们发现[y]和[i]的混淆、前后鼻音不分、复元音韵母的互混等是方言区人讲普通话时常出现的韵母特征。

例如:吴语区上海人说普通话时经常混淆[y]和[i],将[y]发成[i]的情况较多。前后鼻音不分的现象更普遍,很多普通话比较好的上海人都会把[əŋ]和[iŋ]读成[ən]和[in]。

又如:粤语区广州人说普通话分不清前后鼻音,常把前鼻音读作后鼻音,如把“沾”读作[tʂɑŋ],“愤”读作[fəŋ];常出现复元音韵母的互混现象,如混淆[au]和[ou],把“昼”读作[tʂau]。

西南官话区成都人说普通话除了常把后鼻音读作前鼻音外,还常将[ye]、[uo]、[ɣ]与[o]相混,如把“靴”、 “妥”、“勒”等字的韵母均读作[o];将合口呼韵母读作开口呼,如把“峦”读作[lan];将齐齿呼韵母读作撮口呼,如把“先”读作[ɕyεn]。

1.1.3 声调特征

声调特征是语音特征的一个重要方面,很多方言区的人可以把声母、韵母说得很接近标准普通话,但往往会在一两个声调的调型或调值上露出方言味儿。

例如:东北官话区的沈阳人说普通话,尤其是年轻人说普通话时声母、韵母发音都很接近标准普通话,但声调却与标准普通话不同。沈阳人说普通话时声调的调值分别为阴平44、阳平34、上声213、去声41,明显低于普通话阴平调读55,阳平读35,上声读214,去声读51的调值。

又如:粤语区广州人说普通话时声调的调值分别为阴平44、阳平24、上声212、去声51,不同于标准普通话的调值。由于广州话中没有上声曲折调,年龄大一点的广州人读不好曲折调,年轻人则基本能念好,只是调值上有些差别。

中原官话区郑州人普通话中的降调就比较多,常把“河南”[xɣ35nan35]读作[xɣ41nan41]。

1.1.4 重音特征

重音是语义上的着重、强调和聚焦的一种语音手段,是各个语言中必不可少的韵律特征。汉语作为一种声调语言,虽然重音对汉语来说,不存在区别意义的作用,但是整个语句语音的轻重配置会使得语言中产生语音上的抑扬顿挫。而这种抑扬顿挫也是每一种语言生动表达必不可少的方式。因此,重音在汉语中具有极其重要的作用。重音在各个语言及方言中的表现不尽相同。

例如:吴语区上海普通话和标准普通话的词重音表现不同。首先,在词重音的分布模式上有着一定的差异。两者词重音在调类中的分布大概相似,都是去声最易重读,上声最不易重读,其次依次为阴平和阳平。但是上海普通话去声重读趋势比普通话去声的重读趋势强一点。在词重音位置分布上,上海普通话比普通话更不易于前字重读。其次,从词重音的声学表现上看,两者在音高和时长等方面存在差异。在音高上,上海普通话词重音的音阶比普通话的普遍要高,普通话的调域比上海普通话的调域普遍要宽,且两者音高最大值、最小值及均值与地区这一因素相关显著。在时长上,上海普通话阴平、阳平和去声词重音的时长要短些,而其上声词重音的时长比普通话长些。同样,两者在词重音时长上的差异与地区这一因素相关显著。从这里可以看出上海普通话和普通话两者在实现重读的方式上不尽相同。上海人说普通话音阶比北京人说普通话高些,音域却小些;时长由于上海方言的影响,不同声调有不同的差异;在没有音高降升曲折的阴平、阳平和去声中,上海普通话词重音时长没有普通话长;在有降升曲折的上声这种声调中,上海人却因为自身方言中没有降升调而拉长了时长,使得上海普通话上声词重音时长长于普通话。

又如:粤语区广州普通话和标准普通话相比,在单念的二字词中,标准普通话倾向于前重,而广州普通话倾向于后重。从重音的声学表现看,广州普通话比标准普通话更倾向于拖音。从语流中的两音节重音分部来看,广州普通话和标准普通话都倾向于前重,但是普通话的前重倾向更加明显,从重音的声学表现看,标准普通话比广州普通话更倾向于拖音。

1.1.5 儿化特征

儿化指某些音节和韵母er的结合变成卷舌韵母的读音。儿化韵母里的“儿”不是一个单独的音节,只是在一个音节末尾音上附加的卷舌音。普通话中的儿化有区别词性、词义及带有不同感情色彩的作用。而南方各大方言中闽、客、赣、粤、徽、平话诸方言都没有儿化音现象。因此导致不同地方的人说普通话时在儿化上的表现有很大的差别。

例如:北京官话区的北京人说普通话时儿化音特别多,运用广泛,这是北京普通话的最大特点。普通话虽然以北京语音为标准音,但并不是北京话任何一个语音成分都是标准音,都成为普通话成分。北京话往往滥用儿化音,只有约定俗成的才能进入普通话。

又如:粤语区的广州人说普通话时总使人感觉生硬、急促,没有高低起伏、抑扬顿挫,意义表达不够明确,感情表达也不够准确。所谓“广式普通话”,除了发音时声母、韵母不准确,没有卷舌音外,就是不注意儿化和轻声。广州普通话往往把“儿”作为一个单独的音节念,把“儿”和前面的音节割裂开来,而且念“儿”不卷舌,把“儿[]”念成“鹅[ɣ]”。

1.1.6 轻声特征

轻声指对某个音节的轻短读音。汉语的每个音节都有一定的声调。有的音节在一定场合里失去原调,变成一种既短又轻的调子,就叫轻声。一般来说,我国北方的各大方言中轻声现象较普遍,而南方各大方言中只有吴、闽有轻声现象。因此导致不同方言区的人说普通话时在轻声上的表现不同。

例如:北京官话区的北京人、东北官话区的沈阳人等都能很好的掌握和运用轻声,尤其是在口语中双音节词的第二个音节经常读作轻声,如“分析”、“紧张”、“快乐”、“窗户”、“晚上”等。

而粤语区的广州人则由于粤语中没有轻声现象而在讲普通话时发不好轻声音节,经常是将两个音节都重读。

1.2 词汇特征

词汇是人的言语习惯中最不稳定的特征,方言和普通话相比,有大量词汇是相同的,但也有不少有明显的区别。一般地说,政治、经济、文化等方面的词彼此相同的较多,但在日常生活方面所使用的词彼此有较大的差别。方言区的人在说普通话时,往往最容易出现用方言词汇代替普通话词汇的现象。

例如:粤方言区广州人说普通话时会用“好彩”代替“幸运”,用“搞掂”代替“做好”,用“顶不顺”代替“受不了”,用“利事”代替“红包”等等。以至于有些词已经超出粤方言区人使用的范畴,开始向普通话进军,如“巴士”(公共汽车)、“镭射”(激光)、“朱古力”(巧克力)、“靓”(漂亮)、“写字楼”(公司办公室)等。

又如:东北官话区的沈阳人说普通话中常出现这样的句子:“这屋子里可真埋汰(脏)”。“那个人怎么傻啦吧唧的(傻),馒头掉地上了还捡起来吃。”“太累了,让我抽棵烟(抽支烟)歇会儿(休息一会儿)”。这也是用方言词汇代替普通话词汇的典型特征。

1.3 语法特征

一般情况下,北方各方言区的人在说普通话时出现的语法特征较少,因为北方主要是官话区和晋语区,其方言语法与普通话的语法差别不大。南方各大方言区的人说普通话时出现的语法特征能够多些,这也会因普通话水平的不同而有不同的表现。

例如:粤语区广州人说普通话会把“我没胆量”说成“我不够胆”,把“说普通话”说成“讲普通话”,把“我先走”说成“我走先”,把“一百五十”说成“百五”,把“给他一支笔”说成“给支笔他”等等。

闽语区福州人说普通话时会把 “妹妹来了吗”说成“妹妹有没有来”,把“做得完”说成“会做得完”,把“把书给我”说成“书拿给我”等等。

2 利用汉语“普通话”语声进行案件地域性言语识别途径和方法

2.1 特征价值分析

2.1.1 单个价值较低的特征

平翘舌不分、[n]和[l]不分、[x]和[f]相混等声母特征,后鼻韵母[iŋ]、[əŋ]与前鼻韵母[in]、[ən]相混,韵头[u]、[i]脱落等韵母特征是方言区人说普通话时常出现的语音特征,出现频率极高。但是这些特征在不同方言区的人中普遍存在,就单个特征而言,价值不是很高,须在多个特征印证中综合运用,互相补足,可用于综合评断。

某些词汇特征,如“巴士”、“朱古力”、“写字楼”等由于广播电视的影响,也被很多不同方言区的人使用,其单个特征价值也不是很高,须结合其他特征使用,综合评断。

2.1.2 单个价值较高的特征

普通话一些零声母读成方音的辅音声母字、送气声母与不送气声母常相反等声母特征,[ye]、[uo]、[ɣ]与[o]相混的韵母特征等是在某个方言普通话中较为突出的特点,一般出现率也很高。这些特征对于帮助我们确定发音人地域属性有一定的价值。但我们不能只依据这类特征作出判断,仍然要与其他特征结合起来进行综合评断。

2.1.3 单个价值高的特征

声调特征、轻声特征、儿化特征、某些特殊的词汇特征和方言语法特征等是最不容易被注意到又最难以改变的特征,就好像笔迹检验中的笔顺特征,对于确定发音人的方言归属有着十分重要的作用。比较而言,是价值最高的特征。

2.2 识别方法

针对上文的特征价值分析,我们提出了利用汉语“普通话”语声进行案件地域性言语识别方法如下:2.2.1以调值特征为中心,声韵特征相结合

声调是方言区人学习普通话时容易忽略的地方,它的受关注度要明显低于声母、韵母和词汇。由于汉语各方言之间、方言与普通话之间声调差异较大,再加上,方言区人学习普通话声调时往往容易满足于接近就好的程度,因此导致很多方言区人说普通话时声调都是不标准的。这样就使调值的系统性差异特征成为我们形成判断结论的一个可靠依据,我们在识别时一定要格外重视,紧紧抓住。要通过仔细辨听,确认发音人的方言味普通话实际调值的系统性特点,得出判断结论,切忌只凭其中的一个声调调值上的相似形成判断。

同时,我们也要注意充分挖掘其他的声韵特征,争取描绘出发音人的语音系统轮廓,与该方言区语音特点相互印证,对比符合点和差异点,从而形成较为准确的判断。

2.2.2 利用各类特征的总和进行综合评断

如上文特征价值分析中所述,方言味普通话的特征有的分布地域较窄,特殊性较强,可以帮助我们初步判断出发音人的方言区属,但这样的实际案例并不多。更多的特征分布比较广泛,带有一定的普遍性。据此很难把发音人的所在地区、籍贯确定在一个比较准确的范围内。如发音人“陈”与“程”不分,反映[ən]与[əŋ]不分的方音特征,这一特征在吴语、湘语、客家话、晋语、西南官话、江淮官话、兰银官话等方言区都有分布。这样我们只有根据言语特征的总和表现出的总体特殊性才能准确的判断发音人所说的是哪种方言味的普通话。同时我们还要注意,在识别中要排除言语的变化、伪装和假象等情况的干扰。

3 案例应用

3.1 案例1

2009年9月6日北京市某公安机关送来了绑架案中绑匪与被绑架人老伴通话的语声录音,要求通过对语声的分析,判断绑匪的籍贯。绑匪语声为带有方言味的普通话。我们将绑匪语声输入到了VS3.0语音工作站,从中分别切分出短语、词、音节、音素等进行了仔细反复的辨听和分析,选取出地域性言语特征如下:

(1)四声声调普遍偏低,阴平声调调值在44或更低;

(2)“郑”[tʂəŋ]、“这”[tʂɣ]、“知”[tʂʅ]、“转”[tʂuan]、“承”[tʂ‘əŋ]、“是”[ʂʅ]等字读标准的卷舌音;

(3)“让”、“人”、“任”等字读标准的“[ʐ]”声母;(4)用词和语调上,与东北官话接近。

综合以上特征,我们又组织了来自相关地区的学生进行了辨听,最后倾向认为绑匪为东北官话区黑松片齐齐哈尔一带人。

3.2 案例2

2010年3月8日,沈阳市某公安机关送来了两份某杀人案中10086服务热线录制的嫌疑人电话录音,请求帮助分析拨打电话的人是不是沈阳市郊区平罗镇本地人,如果不是,其籍贯是哪里。

利用VS-99语音工作站,我们对两份检材进行了反复的审听。发现两份检材均为言语人拨打10086服务热线给手机报停机的电话录音,时长都很短,检材一时长为40秒 67,检材二时长为46秒83。且两份检材录音中以10086服务热线接线员的语音居多,被检言语人较长的成句语声总共只有三句,其余均为“嗯,有”、“好的”、“对”等简单答话,且均为带有方言味的普通话发音,检验难度较高。

经过反复审听,我们找到了被检言语人的如下方言语音、方言词语特征,未发现有特殊的方言语法特征:

(1)“我想”一词中“我”发音为[uɣ],不是普通话读音[uo]。

(2)“办理”、“停机”、“暂时,暂停业务”等词中“办”、“停”、“暂”三个字的读音分别为[pan]、[tiŋ]、[tsan],前后鼻音分得很清楚。

(3)“那个”、“办理”等词中“那”发音为[nei],“理”发音为[li],声母 n、l分得很清楚。

(4)“时候”、“暂时,暂停业务”等词中“时”发音为[ʂʅ],“暂”发音为[tsan],平卷舌分得很清楚。

(5)使用疑问语气词“吗”,如:“行吗?”

(6)表示肯定的回答用:“恩,有”、“好的”。

随后我们又带着录音笔到重点怀疑地区平罗镇实地调查了平罗人说话的言语特点,得出结论:被检言语人不是土生土长的平罗本地人;应为东北官话区哈阜片人。建议重点侦查在平罗镇居住或活动的东北官话区哈阜片人。

不久后此案得以侦破,抓获了犯罪嫌疑人侯某,内蒙区通辽市科尔沁区人(正属于东北官话区哈阜片),在平罗镇某饭店打工。

4 结论

从地域方言的影响上来看,带方言味普通话就像丰富复杂的方言一样色彩纷呈,利用“普通话”语声进行言语人地域性识别是一条可行的途经。只要检材中有较好的特征表现,而我们又能够认真的去分析和判断,就一定能在“普通话”中发现言语人的地域性归属。

参考文献:

[1]岳俊发.言语识别与鉴定[M].北京:中国人民公安大学出版社,2007:3.

[2]王虹,华凡倩,于天昱.利用汉语“普通话”语声进行案件地域性言语识别的可行性研究[J].中国刑事警察学院学报,2006,(2):42-43.

[3]傅灵.方言与普通话的接触研究—以长沙、上海、武汉为背景[D].苏州大学,2010:5.

[4]吴琼.徐州口音普通话初探[D].华中师范大学大学,2004.

[5]高山.“武汉普通话”语音考查[D].华中师范大学大学,2009.

[6]陈蒙.“济南普通话”语音研究[D].山东大学,2009.

[7]吕文蓓.吴语、南京话和普通话的接触研究[D].苏州大学,2010.

[8]张瀛月.“地方普通话”文献综述[J].文教资料,2012,(5):27-28.

猜你喜欢

官话重音韵母
声母韵母
阿基与乌龟之重音
单词重音
重音在“文学作品朗读”中的运用
单韵母扛声调
《湘水韵》及其编撰原理要点
浅谈语句重音的把握
征集官话易祛除官话难
俗话说,官话说
官僚不除,官话难已