APP下载

政务微博新闻语体计量分析

2014-05-13

沈阳大学学报(社会科学版) 2014年4期
关键词:书面语语体语料

张 瑛

(中国传媒大学文学院,北京 100024)

政务微博新闻语体计量分析

张 瑛

(中国传媒大学文学院,北京 100024)

从计量的角度分析了政务微博新闻的语言特点及语体特征。认为政务微博新闻虽然是新闻语体的下位分支,但相对于传统的新闻而言,其正式程度较低,语气丰富,语言亲切活泼,主要体现为词汇密度较低,较多使用语气词,语句的破碎度较高等。

新闻;政务微博;计量;语体特征

随着互联网的迅速发展,微博的影响力已渗透至各个领域。政府部门也逐渐意识到微博在舆情监测和舆论引导中的重要性,并纷纷开设政务微博。2013年10月,国务院办公厅发布的《关于进一步加强政府信息公开回应社会关切提升政府公信力的意见》中指出,“各地区各部门应积极探索利用政务微博等新媒体,及时发布各类权威政务信息,尤其是涉及公众重大关切的公共事件和政策法规方面的信息,着力建设基于新媒体的政务信息发布和与公众互动交流新渠道”[1]。政务微博已经成为政府部门发布新闻资讯的重要平台,对政务微博新闻语言特征的研究也越来越多,例如王林枫从话题和主位推进的角度研究政务微博新闻语篇特点[2],赵巍从系统功能语言学语域的角度分析了政务微博的语场、语旨和语式[3],王宏则应用费尔克劳夫的批评性语篇分析三维框架,从语篇、话语实践和社会实践三个角度研究了政务微博语篇[4]。这些研究多从质化角度出发,以分析政务微博语篇特点为主。然而,由于微博平台限制和网络语言环境的影响,政务微博新闻虽然下属于新闻语体,但它还具有一定网络语体的特征,其语言特征较为复杂。为了更客观地分析政务微博新闻的语言特点,本文使用计量的方法,基于真实语料,观察了政务微博新闻在词和句层面的使用,并分析这些特点所反应的语体特征。

一、语料与方法

计量语体学认为“语言结构在不同体裁的文本中的分布差异是客观存在的”[5]25。因此,不少学者通过对大规模真实语料中各类语言特征进行统计,寻找其分布规律,并探寻这个规律产生的动因。本文从计量语体学视角出发,基于语料与现代统计方法,考察政务微博新闻语体的语言特征实际分布情况。笔者首先从10个政务微博①这10个政务微博分别是:江西省公安厅交警总队、河北公安网、河南省青少年发展基金会、湖北民生、江苏省公安厅、国家教育部、山东省公安厅交警总队、微成都、重庆市人民政府新闻办公室、微博江苏。随机各抓取了100篇,共1 000篇新闻作为研究样本,构建了政务微博新闻语料,以下简称“语料”。语料规模为115 957字。

笔者首先使用国家有声媒体语言资源网传媒语料库在线分词标注系统②系统网址为http:∥ling.cuc.edu.cn/cucseg/,按照粗颗粒度③粗颗粒度与细颗粒度切分标准请参看《面向语言监测的自动分词标注规范研究报告》。对语料进行了切词和词性标注,提取了词层面的相关数据。随后,采用简单的句法分析器对句层面的相关数据进行统计。在获取数据之后,分析了政务微博新闻语体用词、用句特点及其所体现的语体特征。

二、数据与分析

丁金国曾指出计量语体学首先需要解决的问题就是“从自然语言中提取那些具有区别性的语体标记,这些标记的基本要求是可形式化”[6]。其次,这些可供计量的标记还必须具备“共时性、普遍性和层次性”。鉴于学者们目前仍然未能就提取哪些标记达成共识,本文以语言单位为标准,选用词和句两个层面的部分语言特征进行了统计。

1.词符总体分布

对语料词语和标点符号的整体使用情况进行了统计,包括词型例比、标点符号比例及标点符号种类总数(见表1)。

表1 词符总体分布

词型例比(type to token ratio)是指词总次数(词例)与词种类数(词型)的比例,计算公式如下:

词型例比反映了语篇词汇的丰富程度。计算结果显示语料的词型例比为5.557 1。黄伟、刘海涛曾对《新闻联播》和《实话实说》的词型例进行统计,结果分别为2.962 4和5.541 8[5]26。《新闻联播》被认为是“书面语体的口头表达形式”,而《实话实说》则被认为是口语体的典型代表。通过对比,政务微博新闻语料的词型丰富程度较低于《新闻联播》,与《实话实说》相近。这说明政务微博新闻虽然属于新闻语体,本应书面化程度较高,但实际上其更倾向于口语语体。

Ure将词汇密度定义为语篇实词数与词汇总数之比,计算公式如下:

经过计算,语料的词汇密度为61.706 6%。Ure的研究表明,口语语体的词汇密度约为40%[7];王彬等的研究表明,书面语体《新闻联播》的词汇密度高达87.16%[8]。通过数据对比,可以看出政务微博新闻语体介于口语语体和书面语体之间虽属于书面语体,但其书面化程度较低。

“标点符号是辅助文字记录语言的符号,是书面语的有机组成部分,用来表示停顿、语气以及标示某些成分(主要是词语)的特点性质和作用”[9],其具备标示意义和关联命题的功能。表1显示,语料中标点符号比重较高,并且种类繁多。这是由于政务微博新闻篇幅较短,通过标点符号可以有效地衔接语句,丰富篇章结构和语句语气。

值得注意的是,笔者将“@”号和双“#”号纳入了本文标点符号统计范围。原因在于这两个特殊符号由于微博平台的特殊性,可在政务微博新闻中起到标示成分的作用。“@”具有标示专名的作用;双“#”则与方头括号“[]”功能相似,标示报道开头的功用(见例1)。

例1 #春运安全提示#紧张的春运即将到来,在此提醒大家外出时注意安全,不要在候车室里睡觉或打盹,避免行李遗留或失窃,祝大家过一个平安快乐的春节!@微博河北@罗山交警(来自河北公安网新浪微博)

语料中“@”号和双“#”号使用频次较高,分别出现237次和247次。“@”号和双“#”号在政务微博新闻中具有互动性功能,“@”号可提示相关其他用户阅读该条新闻,双“#”号可将该新闻与同话题新闻形成链接。可见,政务微博新闻与传统新闻有所不同,具有一定的互动性,而这一特性较多出现在口语语体中。

2.词层面数据分析

参照《现代汉语语法信息词典》词类划分标准[10],排除前接成分、后接成分、语素和非语素字这四类非词,将词类划分为21个类别,并统计了不同词类词语在政务微博新闻语料中使用的比值、均值以及标准差(见图1)。从词类的使用总比值可以看出,语料中大量出现名词和动词。这是由于名词和动词承载的信息量较高,能够有效地表述新闻事件,符合了政务微博新闻的信息传播需求。习用语、缩略语和成语都属于惯用语。语料中,习用语和缩略语的使用总比值较高,成语的使用总比值相对而言较低。习用语多出现于口语中,而成语多出现于书面语。这间接说明,政务微博新闻更倾向于使用具有口语色彩的词汇。缩略语是一种经济的语言表达形式,政务微博新闻通常篇幅简短,使用缩略语可以有效提高新闻信息量。语气词、叹词和拟声词都属于口语色彩较浓的词语,较少在新闻语体中出现。然而,语料中语气词的使用总比值并不算低,明显高于叹词和拟声词,可以推断政务微博新闻语气较为丰富。

图1 政务微博新闻语料词类统计

3.句层面数据分析

在语句层面,笔者对语料的句子破碎度,句长分布和句类比值进行了统计,分析了语料在句子中的使用特点。

(1)破碎度。“破碎度,是指一句话中停顿的次数,即一句话的零散程度”[11]47。一般而言,书面语体语句流畅,句内停顿较少,破碎度较低,而口语语体语句中插入语较多,常出现停顿,破碎度较高。破碎度的计算公式如下:

黄伯荣、廖序东指出,“点号主要表示语句中的各种停顿”[12]147,并将点号分为句末点号和句内点号(见表2)。

表2 7种点号的名称和形状[12]

笔者认为,句末点号数量反映了语料中的总句数,句内点号反映了句中的停顿。所以,以句末点号和句内点号为标记,笔者对语料中句子进行了切分和统计,并按照公式3计算得出的破碎度为2.73。阚明刚的研究表明,书面语体破碎度为2.6,口语语体破碎度为2.9[11]47。以此为参考,笔者认为,语料的破碎度表明政务微博新闻语体介于书面语体与口语语体之间。

(2)句长。小句通常是指最小的独立性语法单位,包括单句和复句中的分句。句子则是表达完整意、体现说人意图的语法单位,包括单句和复句。笔者对语料中小句句长的分布和句子句长分布进行了统计,得出分布图(如图2所示)。

句长影响着信息传播的经济性。长句由于含有更多的修辞成分,可以更为准确、清晰地描述事物、陈述事实和表达思想,往往承载着更大的信息量;短句修辞成分较少,语言结构简单,但是语义简洁明了,节奏更为轻快活泼。长句较多出现于书面语体,而短句较多出现于口语语体。从图2中可以看出,语料小句和句子句长多为50字以上。这表明政务微博新闻仍然以信息传播为主要目的,句长分布具有一定的书面语体特征。图2中无论是小句还是整句,其50字以下的句长分布都较为均衡。可见,政务微博新闻较注重长短句交替使用,使用各种长度的句子来丰富语篇的语句型式。

图2 政务微博小句和句子句长分布图

(3)句类。句子按照预期功能划分可以得出——四个不同的句类,即陈述句、疑问句、祈使句和感叹句。笔者对语料中这四个句类的使用比值进行了计算(见表3)。

表3 政务微博新闻不同句类使用比值 %

句类中,陈述句用于叙述和说明事实,疑问句的主要交际功能是提出问题、询问情况,感叹句的特点在于可表现情感,祈使句用于表示命令、禁止及劝阻等。通过表3中的数据,可以看出陈述句在语料中比值较高。对于新闻语体而言,其主要目的在于传播消息。陈述句用于提供确切的信息内容,而疑问句中信息具有不确定性,感叹句和祈使句情感色彩浓厚,不符合新闻语体对客观性的要求,较少被使用。然而,黄伟、刘海涛曾对140篇《新闻联播》中陈述句和疑问句的平均使用总比值进行统计,结果分别为99.62%和0.22%。通过数据对比,可以推测政务微博新闻中虽以陈述句为主,但其疑问句、感叹句和祈使句的使用比值要高于典型新闻。这说明,政务微博新闻语气比典型新闻要丰富得多。众所周知,政务微博新闻虽然是一种新闻资源,但更是政府部门与公众共享信息的新方式。为了树立亲民形象,避免流露过于正式化的“官腔”,政务微博新闻往往会采用更丰富的语气,使新闻显得更加生动活泼。政务微博新闻的书面化程度也随之降低。

三、结 语

通过对政务微博新闻语料进行计量分析,得出政务微博新闻具有书面语体的特征,例如:词汇密度高于口语语体,极少使用叹词和拟声词,较多使用长句。同时,政务微博新闻虽然是新闻语体的下位语体,但相对《新闻联播》为代表的典型新闻而言,其书面化程度较低,具有较多的口语语体特征,在词层面主要体现为词型例比较高,词汇密度较低,较多地使用语气词;在句层面体现为句子破碎度较高,疑问句、感叹句和祈使句的使用比值较高。分析结果表明,政务微博新闻语体正式程度低于典型新闻,语气丰富,语言更加亲切生动。基于计量的语体有助于人们更加客观地分析政务微博新闻的语言特点,并从语言学的角度解释这些使用特点产生的原因。如何选择适当的语料和标注体系,添加语义、语用等深层统计数据提高分析质量,将是今后值得继续深入研究的课题。

[1] 关于进一步加强政府信息公开回应社会关切提升政府公信力的意见[EB/OL].中央政府门户网站http:∥www. gov.cn/zwgk/2013- 10/15/content_2506664.htm

[2] 王林枫.政务微博发布的新闻消息的语篇特点研究[J].赤峰学院学报:汉文哲学社会科学版,2012,33(11):150 -153.

[3] 赵巍.语域理论视角下的中国政务微博研究[J].吉林省教育学院学报,2013,322(29):98- 100.

[4]王宏.中国政务微博批评话语分析[D].海口:海南大学,2013.

[5] 黄伟,刘海涛.汉语语体的计量特征在文本聚类中的应用[J].计算机工程与应用,2009,45(29):25- 27,33.

[6] 丁金国.基于语料库的语体风格研究:兼论量化与质化的关系[J].烟台大学学报:哲学社会科学版,2009,2(22): 114- 120.

[7]Ure J.Lexical Density and Register Differentiation[M]∥Perren G E,Trim J L M(eds).Applications of Linguistics:Selected Papers of the Second International Congress of Applied Linguistics.Cambridge:Cambridge University Press,1971:443- 452.

[8] 王彬,王依然,文采菊,等.基于标注语料库的《新闻联播》语言特征统计分[M]∥第三届学生计算语言学研讨会论文集,2006:285- 290.

[9]GB/T 15834- 2011.标点符号用法[S].北京:中国标准出版社,2012.

[10]俞士汶.现代汉语语法信息词典详解[M].北京:清华大学出版社,2003.

[11] 阚明刚.几个语体参数的定量对比研究:以新闻报道和访谈对话为例[J].语文学刊,2011(9).

[12]黄伯荣,廖序东.现代汉语[M].北京:高等教育出版社, 2007:148.

【责任编辑 王立欣】

Quantitative Analysis on News Style of Microblog of Government Affairs

Zhang Ying
(School of Chinese Language&Literature,Communication University of China,Beijing 100024,China)

The linguistic features and stylistic features of news on government affairs microblog. Although the news on the government affairs microblog is a subgenre of news style,it is much different from traditional news.It is more oral,less official and gets more various moods.It has lower lexical density,more modal particles,and a high degree of fragmentation in sentences,etc.

news;microblog of government affairs;computation;stylistic feature

H 0

A

2095-5464(2014)04-0538-04

2014- 03- 17

河北省科技厅项目(144576690)。

张 瑛(1987-),女,湖北京山人,中国传媒大学博士研究生。

猜你喜欢

书面语语体语料
“口语和书面语转换”备考指导
关于初中学生书面语感的思考与提升策略
汉语书面语与口语的特征
基于语料调查的“连……都(也)……”出现的语义背景分析
语言表达与语体选择
语体语法:从“在”字句的语体特征说开去
华语电影作为真实语料在翻译教学中的应用
语体转化的量度与语体规范
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法