微博话语的多维实证研究
2014-12-04焦新平李经伟饶岚
焦新平,李经伟,饶岚
(1.国防科技大学 人文与社会科学学院,湖南 长沙 410074;2.解放军外国语学院 英语系,河南 洛阳 471003)
微博等新兴媒介正在蓬勃发展,导致传播通路激增,海量信息堆积以及表达意见多元化[1]。Cross的专著认为博客和微博等社会化媒体引发新的网络话语的范式革命,其对大众文化的影响力大到无法预测[2]。《2010年中国语言生活状况报告》(教育部2010年发布)提到,“微博体”彰显普通人的语言创造力。对微博话语的研究有利于丰富社会语言学和话语分析的研究内容和领域。微博上的丰富的评价语言资源,为我们分析微博用户的人际互动和情感态度提供了极佳的手段。微博是社会语言学和话语分析的沃土。微博话语是中国社会发展话语和网络话语的集成。到目前为止国内对微博进行语言学和话语分析的研究较少。本研究将从社会语言学和话语分析的角度丰富中文微博话语研究。
一 微博话语研究的理论背景
2010年以后,学界开始广泛关注微博话语。Zappavigna从系统功能语法角度出发对奥巴马获胜后Twitter微博用户对奥巴马获胜这一事件进行了评价语言的分析[3]。贺倩从系统功能语言学代表人物韩礼德的语域理论出发,从语场、语旨和语式等角度对新浪微博语言的特征做了详细的研究①。但是,大部分研究议题集中在有关微博的认知、社会影响、反思以及发展前景等概要性的介绍上,应用实证研究少。这一点和杨喆②等人对新闻传播领域微博研究的分析结果相似。从语言学以及话语分析的角度对微博进行系统、深入的研究尚不多见。而且已有研究的语料样本不够多、研究对象不够全面,其研究结果的客观性和研究方法的科学性有待加强。国内学界对微博进行基于语料库的研究寥寥无几。此外,国内已有的微博语言和话语研究基本上把微博话语实践者作为一个抽象的同质集体加以考查。其实,微博平台是现实社会的缩影。因此,有必要从多个社会因素角度对微博进行话语分析。总之,已有对微博进行的研究显得方法单一,视野狭窄,研究创新性和科学性有待提高。
本研究把微博话语看成是一个有序的异质体(orderly heterogeneity)③。本研究参考社会语言学、系统功能语言学和语料库语言学有关理论,试图建立微博话语分析的信息性、情感性和社会性三维分析研究框架,见图1。在本文中,话语的信息性指话语的结构形式和概念意义,包括词、句、篇等语言和图片符号等非语言的信息,话语的情感性指人际意义和情感倾向,话语的社会性指社会文化和政治意义。
图1 微博话语三维分析框架图
二 微博话语实证研究的方案设计
1.研究问题:从语场(field)和语式(mode)看,微博话语的信息特点;微博话语如何通过语旨(tenor)、评价和委婉等手段来建构人际和情感意义;微博话语如何通过话语社区和话语广场来表征和建构社会与文化现实。
2.研究工具:本研究结合定性和定量、归纳和演绎的方法。采取问卷调查、文献研究、内容分析等手段,利用语料库软件Wordsmith5.0,数理统计软件SPSS17.0,微博下载工具Sinawbbf,语料预处理软件Rost CM,微博平台第三方应用软件“微博关键词”、“知微”、“话题分析师”以及“问卷星”调查系统等工具,对新浪微博话语进行多维度、多视角、多变量的分析研究。
3.研究对象:本研究选取的微博平台是新浪微博。所利用的微博语料库可以分为两部分。第一部分为在线随机检索的语料库。第二部分为通过专门软件工具下载的新浪微博离线语料库。在线语料库的语料来自新浪微博的在线实时检索结果。如针对热门话题、用户的微博及相关评论的检索结果。离线语料库则是利用专门的微博下载工具从新浪微博下载。离线语料库由7类用户的语料组成:名人(文化、科技、娱乐行业)、机构(政府、企业、媒体和草根用户);地域微博用户;代际微博用户;亚文化即同性恋微博用户;不同职业的微博用户以及不同性别微博用户。
三 微博话语实证研究的发现
(一)信息性特点
我们从微博话语调查、微博语料的语场和语式3个方面研究了微博的信息性特点。首先,我们的微博话语调查的结果表明超过7成的人认为微博图文并茂、表情符号丰富;微博语言是口语化的书面语;微博语言的新颖性和趣味性强。
其次,从微博话语的语场来讲,和兰开斯特大学汉语语料库(LCMC)相比,微博语料的词汇密度大、丰富多样、外语比重高、新颖独特,反映了当代中国社会各方面的最新进展和变化。这在表1中可以得到体现。
表1 微博语料库和LCMC语料库的文本统计对比④
男性名人用户和高学历用户的微博语料的词云密度和信息性要强于其它用户;机构用户微博的词云密度和信息性也很强。草根和名人微博的生活类话题明显多于机构微博。而名人和机构微博的严肃话题明显高于草根微博。图2是机构微博用户“平安北京”的微博关键词的词云图,该图反映了较强的词云密度和信息性。
图2 机构微博用户“平安北京”的关键词词云图
再次,从语式角度来看,微博话语是融合网络语、口语、书面语、多模态元素(音频、图片、视频、表情符号和超链接)以及中文外语于一体的混合话语。名人和草根微博的口语和网络词汇特点更为明显。机构微博的书面语特点更为突出。名人和机构微博的多模态特征比草根微博更为突出。名人和草根微博的表情符号比机构微博更为丰富。机构比个人用户更倾向于使用话题符号。名人和草根用户比机构用户更倾向于使用称呼符号@提及其它用户。3类用户在微博中均倾向首先使用图片,其次是超链接,再次是视频,音乐的使用最少。
例1:外交小灵通V:亲,你大学本科毕业不?办公软件使用熟练不?英语交流顺溜不?驾照有木有?快来看,中日韩三国合作秘书处招人啦!这是个国际组织,马上要在裴勇俊李英爱宋慧乔李俊基金贤重RA IN的故乡韩国建立喔~此次招聘研究与规划、公关与外宣人员6名,有意咨询65962175-不包邮http://t.cn/aY8Nb g
例1是外交部在新浪的官方微博所发的一篇博文,充分体现了微博话语的语场和语式的特点。“亲”、“有木有”等词语体现了网络语言的特点。表情符号、电话符号和超链接地址均体现了微博的多模态话语的特点。RAIN(韩国明星的英文名)一词体现了多语种融合的特点。
(二)情感性特点
我们主要从微博话语调查、语旨、评价资源和委婉语等角度研究了微博话语中的情感性特点。
1.微博话语调查。从微博话语调查的结果可以看出,受访者普遍比较认同微博用于表达观点和情感的角色。其中女性比男性的受调查者更加认同微博表达观点和情感的功能。但是总体上看,受调查者对于微博维护和拓展人际关系的角色认同比例不高。年长和职业较为稳定的群体对于微博的人际关系功能的认同比例要高于年轻和职业不固定的群体。
2.语旨。在语旨中的权势(power)关系方面,机构微博中表示权势和等级差异的词语最多,其次是名人微博,最少的是草根微博。在等同(solidarity)关系方面,名人微博所使用的等同称呼词最多,其次是草根微博,最少的是机构微博。结合中国社会文化实际情况,我们增加了谦卑、鄙夷和亲昵3种语旨关系。研究表明3类微博中谦辞的频率都很少,而机构微博中谦辞最少。在亲昵的语旨关系方面,草根用户的亲昵语旨信息最多,其次是名人,最少的是机构。在鄙夷的语旨关系上,3类微博中出现的频率并不高,不过草根微博的鄙夷词语在3者中最多。
3.评价资源。我们借鉴了Martin⑤等人的评价系统,对微博语料中的态度、介入和级差3个方面的评价资源进行了研究。
在态度维度,我们着重分析了微博话语的情感词、判断鉴赏词以及否定词。结果表明,名人和草根用户表达否定态度的力度远大于机构用户。名人和草根微博中显性的判断和鉴赏词汇多于机构微博。在乐、怒、哀、惧、恶、惊6类情感词汇方面,名人和机构微博中的“乐”的情绪高于草根微博;名人和草根微博中的“怒、悲、惧、恶”的情绪高于机构微博。在介入维度,本文重点研究了借言资源。名人用户和和草根用户比机构用户更多采用显性的直接借言的介入方式。机构用户则更多采用自言和隐性借言的方式发微博。在级差维度,我们只分析了实现语势的两种手段:强化副词和强化符号。名人微博的极性语势强化词语最多,其次是草根微博,最少的是机构微博。
4.委婉词语。微博的委婉词主要是涉及有关政治和色情的主题等。涉及政治的委婉词语包括对于政党、政府官员、政府部门、政治体制、政治事件和相关概念的委婉说法。涉及色情的委婉词语包括对于性器官、性行为和粗鄙詈骂行为的委婉表达。委婉词语的形式有谐音、拼音、字母缩写、拆音、拆字、形近字、隐喻、模糊语义和淡化处理等。研究结果表明,涉黄、涉性的粗鄙色情委婉词语在微博平台出现的总频次要高于涉政的委婉词语。涉黄的词语以谐音、拆音、拆字和隐喻为主。而涉政委婉词以拼音、缩写、字母和汉字混合的形式为主。另外两种委婉词语均存在不同的变体。总体上,绝大多数的委婉词语是由非认证的草根用户使用。认证用户使用比例较多的委婉语是政治委婉语,而其涉性委婉词语使用比例较低。
(三)社会性特点
我们从微博话语调查、话语社区和话语广场等方面对新浪微博进行了社会性内容的分析。
1.微博话语调查。微博话语调查表明绝大多数人认同微博增强了平民百姓的话语权,有利于公众参与社会管理。不过他们也认为名人和机构拥有更大的微博话语权。39.32%被调查者认同微博有利于地域方言的发展。认同微博语言粗鄙化很严重的比例最低。仅有36.14%的人认同微博是80和90后等年轻人的舞台。
2.话语社区。在话语社区方面,我们主要分析了地域、年龄、性别、职业、边缘团体等微博话语社区。在地域社区方面,我们选择了长沙、广州以及台北这3个城市的用户作为研究对象。结果表明,长沙地区的用户语料中更多出现“哒”、“咯”、“恰”、“滴”、“脑壳”、“别”、“杂”、“晕”、“冒”等长沙方言词语。长沙用户微博语料和台北用户相比,还更多出现表情符号。广州用户语料和长沙用户相比,更多使用粤语词汇:“系”(是)、“唔”(不)、“仔”(亲切称呼的后缀)、“睇”(看)、“嘅”(的)、“佢”(他,她)、“嘢”(事情)、“食”(吃)、“咗”(了)、“咁”(这),字母谐音词“D”和某些繁体字。广州用户和台北用户相比,还出现了更多表情符号。台北用户语料中出现了更多出现英语和字母词汇、日语词汇、台湾地理和文化词汇以及商业词汇。
在年龄话语社区方面,我们选择了50后、70后和90后的用户作为研究对象。在3个年龄段微博用户语料中的流行词汇的频次方面,差异非常明显,其结果如图3所示。
图3 不同年龄段微博用户的流行词汇频次
在边缘团体话语社区方面,我们研究了同性恋用户的微博语料。男同用户和女同用户相比,语料中更多出现的词汇包括男性和力量词汇、表情词汇、某些同性恋词汇、情色和体貌词汇。女同和男同相比,语料中更多出现的词汇包括一些英语词汇、女性词汇、情感词汇、群体词汇、时尚和休闲词汇以及问题词汇。
在性别话语社区方面,我们研究了普通男性和女性的微博话语差异。和女性相比,男性语料中更多出现男性词汇、力量词汇、表情词汇和新闻时政词汇。和男性相比,女性语料中更多出现女性词汇、时尚美容服饰词汇、礼貌词汇、群体词汇、娱乐休闲和宗教词汇。
在职业社区方面,我们研究了外企白领、大学老师和在校大学生社区的话语差别。和大学教师相比,外企白领的语料中更多出现的词汇包括英语词汇、星座、娱乐休闲、时尚和商业词汇。大学教师和外企白领相比,语料中更多出现的词汇包括教育科研、社会时政、助词、副词、介词以及抽象词语。在校大学生和大学教师相比,语料中更多出现的词汇包括星座、时尚休闲、网络新词、流行词汇、情感和与学习有关的词汇。
3.话语广场。在话语广场方面,我们运用了巴赫金⑥的狂欢理论,选取热门微博、热门话题和相关的评论来探讨各类微博用户在新浪微博平台如何通过热门微博和狂欢评论的途径来构建当代中国社会的网络公共领域。
在热门微博方面,郑渊洁以其犀利的批判视角,对哈尔滨塌桥等事件提出了自己的看法和评价,承担起了名人的社会责任,热心推动合理、开放、透明、公正的新型公共领域的建设工作,这在下面的例2中可以得到体现。
例2:郑渊洁V:哈尔滨政府公布塌桥原因:大桥设计和施工没有问题,是交警导致的。由于交警未能拦阻超载车辆,致使超载车辆压垮大桥。哈尔滨政府发誓要追究交警责任。桥塌了赖交警,童话都不敢这么写。照此,天津小青青遇难也是天津交警造成的:交警没能阻拦恶魔驾校车上路。交警风吹日晒维护交通,哈府执政无底线。
转发(85050)评论(33212)2012-9-20 09:41来自新浪微博
在热门话题方面,我们的研究结果表明当前新浪微博中对于经济、文化、娱乐和环境的话语数量较多,而对于政治、外交和军事的话语较少。在话题的分布地区方面,北京地区的用户对于政治和军事话语的热议比例最高。江苏地区对于经济话题的热议比例最高。上海地区用户对于文化的热议比例最高。
在狂欢评论方面,我们选取了对周克华被击毙事件的评论。评论者既有草根、名人,也有机构。评论的立场有质疑警方、调侃周克华、批判谣言和错误价值观、支持和赞扬警方以及中立的反思和评价等。评论的口吻有幽默、戏谑、温和、理性、激进,不一而足。充分体现了热门话题在微博平台上引发的各种观点和思潮的正面交锋和交响激荡。微博真正成为全民发声的话语狂欢广场。不过,值得警惕的是,在对周克华被击毙的事件的讨论中,有部分微博用户的民粹主义倾向非常明显。
总之,微博网友对热门微博和热门话题从各个角度和立场展开了巴赫金笔下的话语狂欢和戏谑,充分利用了微博这一话语广场提供的开放自由的平台和氛围,建构了有别于政府主导的大众新闻传播领域和个人人际传播领域之外当代中国网络公共领域,其影响力超过以往任何传播领域和媒体。
在话题传播的网络和性别关注度的差异方面,我们对有关辽宁号航母和周克华被击毙事件等5个热门话题进行了分析。从5则微博博文的用户传播的性别比例可以看出,男性更多传播军事、国防、外交和时政要闻。而女性更多传播明星的私人生活等新闻。
结 语
本研究融汇社会语言学、系统功能语言学和语料库语言学等多学科的养分,立足中国社会与文化现实,探索网络信息新技术条件下人际话语和机构话语的多维特点。结合质化和量化的方法,尝试研究微博话语这一新型社交和媒体话语形态。在前人的研究基础上,结合中国微博话语实际情况,构建了微博话语多维分析模型,用其来分析新浪微博话语,借此关注当代中国社会发展话语,探索话语与社会变迁的辩证关系。结合中国文化实际,在情感性维度的语旨关系研究上,除了权势和等同以外,增加了谦卑、鄙夷和亲昵3种语旨关系,丰富和拓展了语旨关系研究。我们对机构、名人和草根的微博话语特点和话语策略进行的分析,有助于丰富微博话语研究的广度和深度,指导各类微博用户合理运用话语策略建构形象和身份,进行建设性的互动,实现多方最优的互动效果。成果可应用于新闻舆情分析、精准营销、跨文化交流、知识信息获取等领域。
注 释:
①参见贺倩《语域理论视角下的微博语言研究》第17-22页,太原理工大学硕士论文,2011年。
②参见杨喆、冯强《微博研究回顾:主题、理论与方法——对6份CSSCI新闻传播类期刊相关文献的定量分析(2010-2012)》,载《广东社会科学》2013年第4期第210-216页。
③参见Weinreich,U.,W.Labov and M.Herzog.Empirical foundations for a theory of language change.In W.P.Lehmann and Y.Malkiel(eds.)Directions for Historical Linguistics.University of Texas Press,1968.
④类符(type)统计的是词汇类别数量,形符(token)统计的是词形出现总频次。标准化类符/形符比(STTR)用于衡量词汇类型丰富性和词汇密度。
⑤参见Martin J R,Rose D.Working with Discourse:Meaning beyond the Clause.New York:Continuum,2003.
⑥参见巴赫金《陀思妥耶夫斯基诗学问题》,三联书店1988年版。
[1]喻国明.传播的语法革命——“碎片化”市场条件下的电视运营法则[J].广告人,2008(8):132.
[2]Cross M.Bloggerati.Twitterati:How Blogs and Twitter Are Transforming Popular Culture[M].Praeger Frederick,2011.
[3]Zappavigna M.Ambient affiliation:A linguistic perspective on Twitter[J].New Media&Society,2011,13(5):788-806.