APP下载

性别研究视角下的博客话语研究

2012-11-01江润洁栾述文徐万治

关键词:词频男女代词

江润洁,栾述文,徐万治

(中国石油大学 文学院,山东 青岛 266580)

语言与性别研究可上溯到17、18世纪的欧洲,那时传教士与学者便发现了男女语言形式的差异,后来社会语言学家一直对性别差异的语言使用进行研究。但直到20世纪70年代,在Lakoff的著作《语言与女人的位置》发表后,对语言使用中性别差异的系统性研究才正式开始。自20世纪70年代中叶始,学者们从不同的视角研究这个问题,比如对英语语言中性别歧视的研究,对男女语言中发音与语法差异的研究等。上述语言学家都在致力于现实中面对面交流中的性别语言行为研究,而互联网这种新型语境的出现却为语言学家的研究提供了新的视角。互联网出现后,女性主义者希望能够利用这个平台塑造真正平等的男女文化。她们被称为“网络女性主义者”。而网络女性主义者又被分为自由的、前卫的(硬的)网络女性主义与传统的(软的)网络女性主义。前者为乐观主义者,后者为悲观主义者。悲观主义者认为互联网并非“新”科技,它仅是一种有文化性别特色的科技,传统的性别偏见与有性别特点的规则仍存在。因此,悲观者认为在性别研究中,互联网绝非网络乌托邦。

近年来网络博客的兴起引起了学者的兴趣。Herring,Kouper,Scheidt与 Wright,Huffaker与 Calvert,Herring与 Paolillo开始对博客语言进行性别研究。但如何解释差异仍是问题。博客是一个理论上人们可以自由发言的虚拟空间,而博主是否真正可以摆脱现实中面对面交流那样的束缚而发言这个问题仍待解决。目前,这个领域的研究多是西方学者在做,而中国的博客语言多从社会学、经济学、交流与法律的角度进行研究,鲜有从语言学视角进行的研究。本文基于对博客现象与语言性别研究的兴趣,尝试对中国博客语言进行性别特征分析,旨在呈现乐观女性主义者所认为的网络乌托邦并不存在。

一、研究问题

本研究随机选择了中文博客(不论它们是否著名网站的博客)调查性别语言关系,最终目标是展现男女网络博客语言的运用与现实语言运用无差异,从而可见没有乐观女性主义者所认为的可免去男女性别差异的网络乌托邦。以往研究已表明了博客中性别决定语言使用,那么本文的研究问题即,是否性别在中文博客中是语言变化的预测指标,中文网络博客语言使用与现实环境语言运用的关系是什么。笔者为研究提出两个假设:(1)男性博客作者书写不同于女性博客作者;(2)男性与女性博客语言使用差异类似于现实环境中男女语言的差异。

(一)数据搜集方法

2011年7月末,中国互联网上很多博客都在讨论温州动车追尾事故。据媒体报道,此次事故导致4节车厢脱轨,至少死32人、伤191人(保守估计)。笔者通过百度或谷歌搜寻事件相关文章,大部分文章来自人人网这个新兴网站,另外一些来自新浪或其他网站的BBS,博主是中国普通民众。因此,本研究拟通过分析人人网、新浪网等网上因温州动车事故所写的博客文章,调查博客中的性别—语言关系。

(二)数据样本

为了构建此研究的语料库,笔者首先搜集了第一作者的博客文章。但并非所有博客都适合,只有满足本研究目的的博客文章才被选择。数据包括50篇来自人人网、新浪网的与温州动车事故相关的博客,撰写时间在2011年7月23日至2011年8月21日。

首先,博客作者性别必须被确定。只有那些明确博主性别的博客文章才可在研究中使用。其次,为了研究性别—语言关系,笔者仅关注作者本人的评论语言,由作者转述的评论文章不包括在内。最后的样本包含了主要来自两个网站的50篇博客文章。其中28篇是男士所写,22篇是女士所写。见表1。

表1 博客数据样本

(三)数据分析方法

通过两步来进行数据分析。首先是定量单词频率分析,这可反映男女博客语言使用的相似与差异。其次,在原文中对相关词汇进行分析,这样的定性话语分析进一步提供了男女博客语言使用的信息。

1.词频的定量分析

为研究性别与男女博客词汇之间的关系,笔者在两个计算机软件程序ICTCLAS and NoteTab Pro的帮助下计算词频。这样,可以得到男女博客语料中特定单词的出现频率。

2.特定词汇的定性分析

文本分析者注意到由于词汇组合而导致的多义性,高词频不应是定义特定词汇特征的唯一标准,所以须审视词汇是如何被组合的,以及它们如何应用于特定语境中等。为了研究男女博客中个体词汇的具体使用,笔者回到文本仔细审视男女博客多用词汇使用的语境。

二、数据分析与发现

综上,笔者已对所选话题进行了简要描述。下面是对话题的具体阐述。这是一次悲剧的动车事故。事故动车是 D字头的动车 D3115与 D301。2011年7月23日20时34分,在温州双屿下岙路段,从杭州开往福州D3115动车组与北京—福州的D301发生追尾,造成D301次列车第1至4位脱轨,D3115次列车第15、16位脱轨;造成至少百人伤亡。官方最初提供的事故原因是由于雷击造成的设备故障。(从最新调查看,实为组织管理不善)事故发生后,在互联网上引发了热议。许多博主对官方最初提供的事故原因表示疑虑,或谴责政府行为或对遇难者家属与伤员表示同情。因为博主们讨论的是同一话题,可以发现在男女博客中,除了像“的”、“了”、“着”这样频繁被使用的词,像“事故”、“动车”、“铁道部”、“温州”、“生”和“死”这样的词也被重复使用。下面笔者将呈现高频词汇与它们在原文中的应用,以进一步论证观点。

(一)词频分析结果

NoteTab Pro产出成百上千的词汇,所以不可能全部分析。笔者选择了至少出现频率为0.10%的词汇进行分析,但这并不意味着词频低于0.10%的词汇就无法表示出性别差异。省略分析有两个原因:首先,词汇数量巨大无法全部囊括;其次,如果词频过低,就无法广泛应用。

表2与表3表示的是男女博客中词频至少为0.10%的常用词汇。

上述词汇是性别差异化了的吗?男女博客中的重叠词汇表明并非如此,然而细究便发现男女博客话语在某种程度上是性别化的。男性博客中像“社会”、“人民”、“赔偿”等话语就与社会和社会问题紧密相关,而在女性博客中像“血”、“亲”、“愤”这样的词多用来表达同情与情感。因此,男性博客对探讨社会问题感兴趣,而女性博客则多从情感与关爱视角探讨问题。

下面将展示男女博客的共享词汇与男女特定词汇,以进一步理解男女博客的交流风格。

表2 男性博客中的常用词汇

表3 女性博客中的常用词汇

(二)共享词汇

在常用词汇中,有些词像助动词“的”是因其语法功能而成为常用词,像“了”、“过”、“着”是形成特定时态的,表示某些动作的持续或完成;像介词“在”、“对”、“上”、“向”、“给”主要表示方向或位置等功能。然而,在共享词汇中还有其他表明男女词汇使用差异的特定词汇。笔者在所选词汇中设定了主观限制,即包括名词、代词、形容词、动词和副词,但这并不意味着其他词类在性别差异分析中不重要。在批评话语分析中,大量研究表明,语言形式与理想立场并无必要关联,语言分析的所有层面理论上都是相关的。当前研究仅仅提供了有限然而重要的男女博客话语使用范例。

笔者从名词、代词、形容词、副词与动词的角度对比男女博客语言使用。男女博客中共用的名词有“人”、“事故”、“动车”、“家”、“民”、“铁道部”、“问题”、“责任”、“官”与“国家”;男女博客共用的代词有“我”、“他”、“我们”、“你”、“温州”、“什么”、“他们”、“这个”;男女博客共用的形容词有“高”、“安”;共用的副词有“不”、“就”、“也”、“都”、“还”与“很”;共用的动词有“是”、“有”、“到”、“会”、“要”、“生”、“来”、“说”、“想”、“让”、“去”、“没有”、“死”、“等”、“给”与“做”。男女共用名词、代词、形容词、副词与动词的词频可参照表2与表3。

1.对比发现

首先,通过对比男女博客共用的名词词频,笔者发现女性更多地讨论“人”与“家”,而男性多用词为“铁道部”、“社会”与“问题”,“责任”与“官”。在男性博客语料中,发现了像“社会信息”、“社会财富”、“社会管理”、“社会公平”、“社会责任”、“社会道德”这样的词汇。这表明男性更关注与社会相关的话题。形成对照的是,在女性博客中,除了像“社会黑暗”与“和谐社会”这样的词汇,没有其他与社会相关的话题。令女性感兴趣的是与人类关系有关的话题与词汇。比如,她们更倾向于用“人”这个词。因此可说男女看待问题的视角不同,男人从社会的角度而女人则从人类关系的视角看问题。

Tannen指出:男人把与社会相关的信息看做最重要的,而女人把人与人之间的关系视作她们生活的中心。[1]因此,男人从社会视角探讨问题而女人从人际关系视角处理问题。在当前的研究中,男性博主与女性博主表现出了与现实交流风格相似的倾向。

其次,通过对比男女博客共用的副词词频,表明女性更喜欢用强调词汇。英汉高级词典把强调词汇看做“一个单词,尤其是一个形容词或一个副词,比如,‘如此’或‘非常’,强调另一个词汇的意思”。在词频上有明显对照的两个词引起了笔者的注意,像“很”与“都”。在新华字典里,单词“很”意味着“有很高的水平”,通常用来修饰形容词以强调语气,像“很多”、“很简单”、“很气愤”等。单词“都”有三个常用的意思:完全地、非常地、已经。这三个意思都强调某人的语气。在当前研究中,女性博主比男性博主更多地使用强调词。Lakoff指出:女性使用更多的强调词汇(尤其像“如此”与“非常”)来强调她们想要获得共识或缓和关系。[2]同样,在博客中,女性会用更多的强调词来加强她们的观点。结果与女性在现实生活中的交流风格一致。

最后,对比男女博客共用的代词词频,表明女性偏好使用代词,像第一人称代词“我”、“我们”,第三人称代词“他”、“他们”,代词“什么”;男性更倾向于使用第二人称代词“你”。这类在汉语中指对方时,属于非礼貌词汇。但在此例中,女性也使用“你”的现象值得注意。

根据Heylighen与Dewaele的研究,性别被证明是语境中最重要的变化指标之一;“女性使用明显更语境化的交流风格”[3]。在他们的观察中,I指示语用来测试语境程度。他们发现女性比男性使用更多代词。除此之外,Argomon与 Koppel研究了代词的使用并定义了女性与男性偏好特征。[4]321男性偏好特征为:定冠词(这个与一个);指示数词(一,二,第一,第二等);所有格代名词(它的);其他量词。女性偏好特征为所有的人称代词:第一人称单数(“我”、“我的”、“我的东西”);第三人称单数(“她”与“他”的形式)与复数(“他们”、“他们的”)。Argomon、Koppel与Shimoni把男性偏好特色描述为“信息的”(特指物体与概念),把女性偏好特色描述为“相互作用的”(指人)。[4]346大体上,目前的研究与之前在代词使用上的性别差异研究结论一致。更重要的是,Heylighen与Dewaele通过对现实中口语的分析得出结论。Argomon、Koppel与Shimoni的性别分析来源于对正式书面语的研究,这再一次表明了博主们文章中对代词的使用十分类似于现实中的交流。

以上研究可从两方面概括,即观点与风格上的差异。男性总是使用与社会相关的词汇,比如“社会信息”、“社会财富”、“社会管理”、“社会公平”、“社会责任”、“社会道德”;而女性喜欢使用“人”与“家庭”这样的词汇来强调关系。从交流风格方面说,女性使用更多的强调词加强话语语气,更多的人称代词谈论涉及的人。男女博客语言的差异与现实环境中的差异相似。然而,能证明如此性别语言特色的资料并不明显,所以对原文本的仔细研究十分必要。

2.男性/女性特定词汇

除了共有词汇,还有词频至少在0.10%的男女特定词汇。男性特定词汇有:“责任”、“官”、“赔偿”、“高铁”、“社会”、“说”、“信”、“赔”、“保”;女性特定词汇有:“血”、“孩子”、“生命”、“家属”、“亲”、“愤”、“痛”、“急”、“善”。

在男性特定词汇中,与社会相关词汇再次出现,像“社会”、“官”、“责任”、“高铁”、“赔”。词汇的语义表明男性从社会问题、官员、铁道官员责任、解决办法与赔偿方面探讨问题。男性从宏观角度考虑问题并考虑中国的社会背景。以下是男性博客的讨论。

“近日,7·23动车事故应该是舆论的热点、媒体的焦点甚至成了全社会的沸点……我觉着无非两点,一个是社会不够公平,另一个是普遍道德沦丧……也是加强党的自身建设、改进政府服务水平、增加透明度的强大动力。”①

“之所以称之为7·23惨案,是因为造成这一惨剧的并不是天灾而是人祸,这次40名无辜乘客的惨死将向人民揭示这些个国有垄断企业中所存在的严重问题……因此技术缺陷、玩忽职守、贪污腐败等问题在这些个国有垄断企业中层出不穷,他们这些人就是国家的蛀虫。”②

上例可见,男性博主都从宏观角度探讨问题并通过理性分析社会提出解决办法。

相反,女性博客的特定词汇有“孩子”、“生命”、“家属”、“血”、“愤”与“痛”。这些词汇表达理解与情感,强调人类关系等。这表明女性话语偏好分享个人感受与经验以示支持,表达同情与情感,看重家庭与孩子,这再一次不同于强调社会问题的男性话语。

“看看这样惨烈的一幕幕画面,真的让人揪心,我看到其中有一位失踪的准妈妈,和我一样,已经怀孕七个月了,……这样的打击太大了,我真心的为这位妈妈及所有受伤和失踪的人员祈祷,祈祷他们平安。”③

“不知道当这些家庭面临灭顶之灾时,不知道当一些老人听到儿子甚至儿子全家遇的噩耗晕厥时,不知道当幼小的孩子在得知父母双双惨遭不幸、永远离开自己昏迷时,不知当满怀期待的少妇在听到丈夫已经不在人间不省人事时,那些铁道部高官要员又是作何感想?是否内心深处会萌发些许不安、愧疚、自责、自省?即使会,难道非得用鲜血去唤醒吗?”④

综上,男性/女性特定词汇进一步证明了男性话语更多以社会为中心,而女性话语以关系为导向。

三、结语

总体来说,男性与女性话语在观点与风格上存在差异。男性倾向于从社会视角看待问题,提出解决问题的办法;而女性不太关注事件的社会背景,通常以自身经历来表示对他人的理解与同情。女性更多地使用强调词加强语气,使用更多的人称代词暗示人际关系,几乎不说粗话。这些差异在现实的交流中也可发现。作为一种新的互联网技术,博客给人们的印象是无性别、无年龄、无种族的,但细究起来便会发现博客语言类似于现实语言交流,是现实交流的一种延伸。博客仅在理论上是一个自由的区域,博主仍受到特定文化中所形成的语言习惯的制约。因此,并不存在乐观网络女性主义者所提的网络乌托邦。

注释:

①参见 http://blog.renren.com/blog/165981737/743985984#comments。

②参见 http://user.qzone.qq.com/442827488/blog/1313569782?ptlang=2052。

③参见 http://bbs.cntv.cn/thread-14807877-1-1.html。

④ 参见 http://blog.zzedu.net.cn/user1/linger1979/archives/2011/354156.html。

[1]TANNEN,D.The Power of Talk:Who Gets Heard and Why[J].In Harvard Business Review,1995(5):138-148.

[2]LAKOFF,R.C.Language and Woman's Place[M].New York:Harper&Row,1975:548

[3]HEYLIGHEN & DEWAELE.Variation in the Contextuality of Language:An Empirical Measure[J].Foundations of Science,1998,7(3):293-340.

[4]ARGAMON,SHLOMO,KOPPEL,etc.Gender,genre,and writing style in formal written text[J].Text,2003(23).

猜你喜欢

词频男女代词
复合不定代词点拨
基于词频分析法的社区公园归属感营建要素研究
代词(一)
代词(二)
男女有别
这样将代词考分收入囊中
男女交往最忌讳什么
感觉那时男女很平等
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索