APP下载

新媒体话语中错误
--修补分析*——以新语体QQ聊天为例

2019-01-15徐赳赳

当代修辞学 2018年2期
关键词:错误率语料话语

徐赳赳

(中国社会科学院语言研究所,北京 100732)

提 要 本文考察作为新媒体的网络聊天中出现的错误及修补问题,通过对144万字、3.5万个话轮网聊语料的量化分析,试图发现网聊错误的程度和进行修补的手段,重点探讨造成网聊错误的原因,分析作者对错误的修补策略,旨在揭示新媒体话语的语言特征。研究发现:从错字错词来看,我们的语料中有0.84%的话轮出现错误,远远超出国家新闻出版广电总局对于错误率不超过万分之一的界定。进一步分析后发现,错误的情况虽然有各种类型,有少字、多字、错字等,但主要的错误是由同音造成,占80%,很明显这跟拼音输入法密切相关。从修补来看,一共发现三种情况:作者自觉修补,读者指出后修补,不修补。这三种情况中,错误只有0.07%得到修补,而绝大部分错误不予修补,这是因为大多错误并不影响网聊者对整个句子的理解,这是网聊话语中一个非常特殊的现象。本文的研究对揭示网聊这种新语体的语言特征提供了有益的借鉴。

一、 引 言

媒体指的是传播信息的媒介,对于新媒体,现在还没有确切的定义。本文暂且把近十几年出现的、用网络技术等渠道,采用电脑、手机等终端,提供语言、声音、图像等信息的传播和交流形态,称为新媒体。学界对新媒体中的语言现象和语言特征已有所关注,如李战子(2016)、杨鹏、唐三勇(2012)、赵雪、曹彦男(2012)等。本文把QQ网络聊天(网聊)看作是新媒体的一种,跟传统的媒体相比,网聊是既有书面语特征,也有口语特征的一种新的语体。

网聊中的一个特点就是经常出现错字错词(简称“错词”),这也是语言规范者经常批评网络语言的一点。从上传方(发话方)来说,网络聊天是打字上传,由于时间的关系,通常不会逐词逐句“校”后再上传,所以经常出现错词,并且上传后就无法改动(现在的微信可以在短时间内撤回)。从接收方来说,有的错词一看就知道是上传方打错字了,如果读者能推断出上传者想表达的内容,一般也不会指出上传者的错误。对有些引起误解的错误,读者有可能会问一下上传者是什么意思。

先看下图两个网上流传打错字的例子:

(1)

图1a (选自百度贴吧)

图1b (选自百度贴吧)

本项研究所用的研究语料,是自己收集的QQ聊天会话,共144万字,话轮共35,892个。

下面是语料中出现错词的例句(划线的词可能是错误的词,括号内的词是笔者加的,推测是正确的词):

(2) a.为什么没有收获地址啊?(收货)

b. 上部了官网了,爱投资跑了(上不了)

c. 伦敦市长做一号线怎么没把他挤死的。(坐)

d. 本来今天想买点爱投资的,看到这句话,该主意了(改)

e. 西长安街88号位置及佳啊(极佳)

f. 这是要渔工移山啊(愚公移山)

g.乃们要把这里变婚介所么?(你们)

二、 错 词 的 比 例

根据《中华人民共和国新闻出版总署令》(简称“总署令”)第26号(2004年)第五条规定,“差错率不超过1/10 000的图书,其编校质量属合格”,“差错率超过1/10 000的图书,其编校质量属不合格”。那么网聊话语中差错率具体情况如何呢?(下表中显示的错误,是指在一个话轮中,有错误的情况),见下表:

话轮(个)差错(个)比例%358923000. 84

表1 错误率

表1显示,在35 892个话轮中,有300个话轮中有错字。从比例看,100个话轮中,有0.84个话轮中有错误。按照上面介绍的《总署令》的标准,网聊中的差错率已经“超标”了。

三、 错 词 的 类 型

我们再来考察网聊话语的错误类型。

3.1 同音字错误

我们的语料显示,错词中同音字错误占多数。在面对面的语音对话中,完全同音就是正确的,近音字的错误对方可能听出来。而电脑打字就很明显看出错误(有时是根据上下文推测出是错误),如下所列都是同音词错误:

(3) a. 3个月,估计又是夏门的机场……(厦门机场)

b. 我们公司网络不行,我冲了几下搞不来,干脆不冲了(充)

c. @Shirley 各自在演讲,OY,咋们继续吃饭(咱们)

d. 网袋有风险,入市须谨慎(网贷)

e. 今天提现,明天周六可以到张吗?(到账)

f. 我纲要说(刚)

我们收集到的300个有错误的话轮中,由同音词(近音词)所造成的错误的比例如下:

差错(个)同音(个)比例%30024380%

表2 同音词错误率

表2显示,由同音词所造成的错误占了整个错误率的80%。这么多同音词错误明显是由汉字的拼音输入法造成的:打进某个词的拼音,同音词一起出现,然后选一个,选错了,就造成同音词的错误。这跟用笔写字不同,用笔写字,通常不会有这么高的同音词错误。可能的情况是这个字少一点、那个字少一笔这类错误会增多。电脑输入不会有某个字写错,因为所有的字都由字库决定。

我们再深入一步考察,又可发现同音字错误中“语气词”和“叹词”错误占了多数。

胡裕树(1995:298)认为:“语气词的作用是附着在整个句子的末了,表示语气。”他举例的语气词是“的、了、吗、呢、吧、啊”。“叹词包括表示感叹和应答的词,如‘唉’‘呀’‘哟’‘哎哟’‘喂’‘嗯’‘唔’等。”由于这两种词的功能比较接近,都有表示“情感”的功能,我们就把两类词放到一起分析。

同音错(个)其中叹词语气词(个)比例%2438133%

表3 同音词中叹词语气词所占的错误率

表3显示,叹词语气词的错误率占了同音错误率的三分之一。

错误的主要表现是少口字旁,如“嗯”写成“恩”。

(4) a. 那么付息是担保公司在第二个工作日开始偿付。如果不付,是否要给违约金阿?(啊)

b. 如果发生风险,可能会引起延期的。就算是第二个工作日赔付,也是延期了的牙(呀)

c. 可惜政府机构职能的脚步总跟不上社会潮流,得问题大范围爆发才会触发国家设立这样的机构把(吧)

d. 003,我只是说理论上有这种可能!但你不会转我1 000万的!是马?(吗)

e.恩哪,金馆长我最爱(嗯)

f. 他们在讨论我的网名拉(啦)

下表是叹词语气词错误统计表:

叹词语气词错(个)比例%恩(嗯)4656.7%阿(啊)2125.9%拉(啦)78.6%其他78.6%总计81100%

表4 同音词错误率

表4显示,“嗯、啊”两个字的错误最多,占了80%,其他都很少。

3.2 其他错误

我们的语料显示,其他的错误由各种情况造成(注意划线部分)。

(5) a.真相不会是网速过慢吧……

b. 当然,我是相信爱投资的!也相信件003!更相信小言不会辜负神话和千树

c. 第一提现

d. 钱来的容易被

e. 没人买我后台买

f. 不知那个百万的土豪在不在我们二君

g.加碘言

例(5a-b)中,错词的类型是多字。例(5a)中的“真相”是多的,去掉句子就通了,“不会是网速过慢吧……”;例(5b)中的“件”是多的,“当然,我是相信爱投资的!也相信003!更相信小言不会辜负神话和千树”,这里的“件”可能是打了“信”后,自动跟出来的,一不小心就选上了。

例(5c-d)中, 错误的类型是少字。例(5c)中,是少了“次”,“第一次提现”;例(5d)中,知道少了字,但不知少什么字。另一位聊天者,推出少了“什么就”,就替这位少字的聊天者补上可能少的字“都被这些投资者给宠坏了,什么垃圾项目都能在几天内搞定”。

例(5e)中,“后天”打成“后台”。

例(5f)中, 单字打错了:“群”打成“君”。

例(5g)中, 看了上下文,推测是“加碘盐”。

3.3 可能是故意打错

有些情况比较复杂,看起来是错的词,其实可能是“对的”,是发话者故意“打错”的。

(6) a.纳睡光荣,逃睡可耻!

b. 正规的通过淫行汇进去,每天2万,同户名8万。或通过兑换店无限制,无手续费,比淫行好的兑换率。

c.灰主流也可以

d.女猪脚很漂亮

e. 女的建议I疯

f. 真受不鸟

g.默事的

h. 阿弥托福

我们判别错误有多样标准:有自我改错的情况,有接受者指出的情况,还有的是违反规范标准且只出现一次。例(6)的情况是出现两次以上,有的是多次,有的是多人用,所以有理由怀疑是“故意所为”。可能是“前网语”,也可能本身就已经是网语了。

四、 错 词 修 补

上面讨论的是网聊话语中的错误情况,下面我们讨论错误修补情况。错误修补指的是发话人知道有字打错,进行了修补,见下例:

(7) a. 邮箱

油箱

b. 第一提现

第一次

c. 其实呢,也某些了资金的外流

谋杀

d. 第

第三方支付,是需要拍照的,资质的。 不是随便开的。

e. 不知打

f. 前几天我在招嫖

找票

例(7a-f)中,一行是一个话轮,第一个话轮是作者发现打错了,第二个话轮马上就修补,上传打错的那个词,不是把整个正确的句子上传。

研究发现,修补共有三种情况:作者自我修补、他人指出后修补、不予修补。

4.1 作者自我修补

(一) 一般自我修补

例(7)中的例子,都是作者一看打错了,马上在第二个话轮中补上。就是我们这里讲的一般自我改进的情况。

(二) 自己指出自己错误,然后修补

下面的例子是先告诉大家自己打错了,然后说出正确的字词:

(8) 快慢又不是你我掌控的,急啥

不好意思打错字了,我是想说满满满,不是慢

(三) 有时作者自我发现错误,但是改正慢了一拍,中间已经插进其他人的话轮了,如:

(9) a. 网聊1 祖国尚未统一,无心上边……

网聊2 也行

网聊1 上班

b. 网聊1 北房,居住证,学区,找入,高中可以

网聊2 言简意赅

网聊1 打错好几个字

例(9a)“网聊1”发现“上边”打错了,就赶紧打上正确的“上班”,但中间已插进其他话轮(网聊2)中的“也行”。例(9)网聊1上上传的几个字,除了“找入”不通,其他几个词,不看上下文无法判断有错。“网聊2”上传“言简意赅”其实跟“网聊1”讲的内容感觉没什么关系,不知是对“网聊1”说的,还是对别人说的。接着,“网聊1”说自己“打错了好几个字”,但没讲打错了哪些字。

(四) 下面的例子是作者做了修补,同时又加上新的信息:

(10) 太奶奶给的

她的奶奶给她的

例(10)中,单看第一句“太奶奶给的”,感觉没错,按辈分,“太奶奶”指的是“奶奶的妈妈”,但作者表达的不是这个意思,先是改为“她的”,然后“给的”中间加了新信息“她”。

(五) 还有给错误找理由的

(11) 算了,不是你的搓

是月亮惹的祸

例(11)的作者先是在下个话轮中把正确的字“错”打上,在下一个话轮中,还套用张宇唱的“都是月亮惹的祸”给“你的错”找个错误的理由。

4.2 读者指出后修补

下面的例子是读者发现提出疑问,或者指出错误。

(12) 网聊1 穿瑶更适合你

网聊2 传谣是啥

网聊1 琼瑶

网聊1 也是写小说的

(13) 网聊1 最近 房事状况如何 妞妞

网聊2 只有2套能办到房产证,

网聊3 云淡,你的是第几套?

网聊2 房事?

网聊4 西城的

网聊1 房产形势

网聊5 买那多干嘛

网聊2 我以为你问她夫妻生活……

网聊1 擦

网聊1 房事 一般指的 房产

网聊3 有的政府限价的房比同小区二手房都便宜,真是买到就赚啊

网聊1 夫妻生活 跟我什么关系

网聊2 第一次听到这样的简称

网聊1 限价房 现在有吗

网聊2 房市是这样写的吧?

例(12)把“琼瑶”打成“穿瑶”,网聊2以为是“传谣”。

例(13)中网聊1说“房事”,引起网聊2的疑问;网聊1还不认错,认为是简称;网聊2指出,应该是“房市”。

4.3 不予修补

我们的语料显示,基本情况是对错误不予修补,这是因为大多错误读者可以发现,并通过语境找到正确的答案,因此并不影响对整个句子的理解。表5显示,修补只占了0.07%。

错误改错(例)比例%300210.07

表5 错误修补率

五、 小 结

徐赳赳(2010:第四章)中也发现了网聊话语中错误-修补的情况,但没有进行深入量化研究。本项研究显示,在100个话轮中,有0.8个话轮中有错词。造成错误的原因很多:如跟拼音输入法有关、上传者没有校对就上传;大多错词对方都能发现,但不影响理解等等。

对错词类型的研究中发现,在错词中80%是同音词错误,这跟拼音输入法也有很大关系,几个同音词一起出现,一不小心就可能选错了。研究显示的叹词语气词错误比例高,而且有些人知道是错误的,也就这样用了,比如“嗯”是规范的,网聊者打“恩”不规范,但通常不影响对方的理解。

姚剑鹏(2008:147)研究的是面对面会话的修补,他认为:“会话自我修补是说话者在监测到话语错误后所采取的一种自我纠正行为,是会话修补的主要表现形式,也是常见的自然话语间断语流(disfluency)观象。”Nooteboom在分析了Meringer的口语语料库后,发现说话者75%的语音错误和53%的词汇错误均由本人修补(转引自Levelt 1989: 463 )。Levelt在他的颜色命名实验中发现,实验被试所犯的472处错误中有218处错误是由被试本人修补的(Levelt 1989: 463)。”我们的语料显示,修补错误在错词中的比例是很少的,100个错词也只有0.07个作了修正,而且是既包括自我修补,也包括他人修补。这跟Levelt (1989)的研究结果相差很大,这可能就是面对面交谈和网络交谈的不同之处。QQ网聊话语中,作者即使发现错了,只要作者认为读者能理解,通常就不会修补。一般的情况是,如果作者自己修补,通常作者认为对方可能误解。对方指出错误的,通常是读者感到难以理解的。

猜你喜欢

错误率语料话语
基于归一化点向互信息的低资源平行语料过滤方法*
现代美术批评及其话语表达
小学生分数计算高错误率成因及对策
正视错误,寻求策略
解析小学高段学生英语单词抄写作业错误原因
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
降低学生计算错误率的有效策略
话语新闻
话语新闻