APP下载

对2007年新词语的动态监测

2016-01-16韩黎

关键词:动态监测

对2007年新词语的动态监测

韩黎

(北京师范大学文学院,北京100875)

摘要:采用网络调查法和计量分析法,对2007年新词语进行词频和发展曲线的动态监测。2007年新词语的使用度并不乐观,绝大多数都处于低频和超低频的区间内。只有极少数的词语稳定下来,成为常用词汇。根据2007年新词语的特点,将其发展曲线归为九大类,即增长型、衰减型、孤峰型、双峰型、周期型、凸起型、波动型、间歇型、孤点型。增长型和周期型词语未来的复现率都为100%,衰减型、孤峰型、凸起型、间歇型词语处在“即将退隐”的状态,孤点型词语已经退隐。

关键词:新词语;频次;发展曲线;退隐;动态监测

作者简介:韩黎,在读硕士,北京师范大学2013级。研究方向:现代汉语。 白鑫,在读硕士,云南师范大学文学院。研究方向:语言学及应用语言学。

文章编号:1672-6758(2015)07-0141-6

中图分类号:H136

文献标识码:A

Abstract:This paper monitors the frequency and progress curve of neologisms appeared in 2007 dynamically by means of searching online and quantitative analysis. The usage of neologisms appeared in 2007 shows a less optimistic prospect. The overwhelming majority of the words has low frequency or ultra-low frequency. Only a very small number are steadying and become everyday vocabulary. According to the features of neologisms appeared in 2007, they are divided into nine categories, namely the form of growth, attenuation, isolated peak, double-humped, periodic, upward heave, fluctuation, intermittent, acnodal. The recurrence rates of growth and periodic type are 100% in the future. The types of attenuation, isolated peak, upward heave and intermittent are in the condition of “going to be latent”. The types of acnodal are already latent.

基金项目:本文系国家社会科学基金一般项目(项目编号:12BYY103)的阶段性成果,研究同时得到教育部人文社会科学研究青年基金项目(项目编号:10YJC740143)和云南省教育厅科学研究基金项目(项目编号:2010Y035)的资助。

世界万物都处在不断变化发展的过程中,一成不变的事物是不存在的。语言词汇也不例外,既是稳定的,又是动态变化的。词频是了解一个新词语动态发展情况的重要指标。从一个较大的语料中搜索得出的使用次数,便可知道一个新词语的流行度。使用次数越多,说明该词语的生命力越强,流行度越高。2007年出现的新词语如今的“命运”如何呢?需要我们回过头去看。本文旨在监测2007年新词语的使用频次,追踪其生命轨迹,刻画其生命曲线。

本文选择的调查范围来自于新浪网2007年到2014年的新闻。监测对象是《2007汉语新词语》[1]一书中的所有新词语,加上《2008汉语新词语》[2]附录中补收的2007年新词语72条,共计492条。

一频次的动态监测

要实现对语言的动态监测,经常用到的两个概念是频次和频率。在日常生活中,这两个概念是可以混用的,词典对二者的解释也不那么清楚,意义区别不大。但是,在统计学中,这两个词有着明确的分工。频次,是指所监测的词语在调查语料中出现的次数,是进行计量研究的基础。在统计的语料范围内出现了几次,那么频次就是几。“频次是一个具体数字,它直观地反映了某个词语在语料中真实、原始的使用情况。”[3]频率,是所监测词语的频次与所有调查词语的总频次的比值,反映某个词语的使用情况在整个语料中的比重。

使用频次是一个“量”的标准,能够反映新词语的真实发展状态,它既代表着词语所代表事物或概念的影响力,也代表着人们对该词语接受和认可的程度。因此,从新词语每年的使用频次上,我们就可以大致推断出该词语生命力的强弱。

我们以新浪网新闻为文本语料,按年份分别统计出每个新词语每年在该文本中出现的次数,将频次输入到Excel中,求出每个新词语从产生到2014年之间的总频次,从高到低排序。为了对频次高低有一个定性的衡量,我们规定:总频次1万以上为“超高频”;1000-10000为“高频”;100-1000为“中频”;10-100为“低频”;1-10为“超低频”。

表1 07年新词语频次水平汇总表

由上表可知,2007年新词语的使用情况不容乐观。低频和超低频词语占了一半以上,高频和超高频只占11.5%。

通过观察示例词语,我们可以发现,超高频和高频的新词语往往是当年影响重大的事件或是与人们日常生活息息相关的事物,正因为关系重大,所以才会被频繁提及,就像2007年的“金融海啸”“次贷危机”一直到2014年,二者的使用频次都一直保持在每年1000以上,可见词语所指代的事件影响力之深远。而那些低频尤其是超低频的新词语要么指代极少数人群,要么指代不起眼的新闻事件,要么指代一个非生活必需品,要么是词语显得过于新颖怪异,陌生度太高,这些都是造成使用度极低的原因。还有很多新词语在产生之初频率很高,所代表的事件或人物在当年的关注度很高,词语显示了一定的生命力,但随着时间的推移,慢慢就销声匿迹了。

二动态发展曲线

刘长征(2011)将新词语的历时生命力曲线分为孤点型、断续型、连续型、周期型、成长型、衰减型、凸起型、凹陷型等八种。《中国语言生活状况报告(2012)下编》根据新词语在各年度使用的变化趋势,将其分为高稳、低稳、上升、下降、起伏、偶现六种类型。[4]

本文综合上述两种分类方法,并根据2007年新词语频次走势的具体特点,把新词语发展曲线分为:增长型、衰减型、孤峰型、双峰型、周期型、凸起型、波动型、间歇型、孤点型等九类。下文中所展示的新词语发展曲线图,横轴都表示监测时点,纵轴都表示使用频次。

1.增长型。

增长型,也叫上升型、成长型。它所代表的新词语在产生当年,频次不算太高,但是随着时间的推移,频次会逐渐增长或突然增长,虽然中间可能会有波动,但是总体趋势都是上升的。这类新词语从产生后,逐渐被大众所知晓、熟悉,最后被接受和认可,流通度、使用度越来越高,在达到一个峰值之后,频次往往会略微降一点,但降幅不会很大,继续保持稳定的发展态势,最终会成为社会生活中的常用词。

(1)

(2) 图1 增长型新词语示例 (1)道德模范(2)小长假

增长型又可以分为平稳增长、波动增长、高速增长三种类型。前二者增幅较小;而高速增长型的增幅非常大,频次可以从几百一下增涨到几千甚至几万,呈现出爆发的增长态势,如“小长假”的频次从最初的451(2007年)突增到6229(2008年),然后继续保持高速增长,到2012年,频次达到了一个峰值17009。2012年之后,“小长假”每年的使用频次有所下降,但依然保持在9000以上。该词语经历了从产生到高速发展再到成熟这样三个阶段。对于这类词语,即使频次在达到峰值之后有所下降,也应该归为“增长型”,关键要看其整体发展趋势,以及峰值之后的使用频次的高低。

这些词语往往与社会生活紧密相关,随着频次和知晓度的增加,大部分会逐渐消失其新颖色彩,变为通用词语。因此,增长型词语不仅不会退隐,而且很可能进入基本词汇,被规范的语文词典收录。如“脑残”产生以后,迅速发展,2010年以后频次均保持在1000以上,再如“动车”,频次从最初的656,到2011年达到最大值23150,之后则保持每年5000以上的使用频次。这两个高频词语都已被《现代汉语词典》(第6版)收录。

(1)

(2) 图2 被《现代汉语词典》收录的增长型新词语 (1)脑残(2)动车

2.衰减型。

衰减型,也叫下降型。它所代表的新词语是在产生之初频次很高,但随着时间的推移,使用频次逐年下降或波动下降,流通度、使用度都越来越低,甚至归0。

(1)

(2) 图3 衰减型新词语示例 (1)阳光工场(2)次级债危机

衰减型走势图也包括三种情况:平稳下降、波动下降、骤降。前二者减幅较小;而骤降型的降幅会高达90%以上,如“次级债危机”,在07年和08年都是高频词语,每年的频次都在3500以上,而到了2009年,随着事过情迁,频次跌落至200,降幅达94.68%,此后一直维持低频萎缩状态,趋于隐退。

衰减型的新词语有很多,约占39%。这类新词语多表示突发事件或某个有影响力的特定事件,具有很强的时间性和事件性,如:正龙拍虎、行业限批、去功能化、恶意取款、滤油粉、黑砖窑事件。它们在产生之后,往往会在人们的视线里活跃一段时间,但这个活跃期很短,一般不超过三年,然后便随着该事物或事件影响力的降低,新词语的生命力也随之逐渐衰弱直至隐退。这些词语的衰减,也适应了汉语词汇系统新陈代谢、吐故纳新的要求。

3.孤峰型。

孤峰型,也叫单峰型、“骤升骤降”型。它的发展态势总是先骤升达到一个峰值之后再骤降,是“骤升型”和“骤降型”的组合。

这类新词语往往代表一个轰动全中国甚至全世界的重大事件,新词语在事件发生的前一年处于萌芽期、预备期,频次不高,而到了第二年就会处于爆发期,突增到一个峰值,到事件发生之后的第三年,使用频次就会迅速下降。

(1)

(2) 图4 孤峰型新词语示例 (1)次贷(2)祥云火炬

图4反映了2008年的次贷危机和北京奥运会这两个重大事件。这些事件在十年的时间之内一般不会重复发生,曲线图呈现单峰状态。2007年产生的新词语“次贷”“祥云火炬”“金融海啸”“奥运体验场”的使用频次都在2008年达到顶峰,而一旦这个事件过后,它们的使用度会大幅降低,直至退隐。这些词语曾经风靡一时,而如今已经失去了往日的显赫。

4.双峰型。

双峰型,也叫“M型”,它的曲线走势是“增-减-增-减”。这类新词语在产生之后的七年时间里,达到过两次高潮,因而呈现出双峰状态。

(1)

(2) 图5 双峰型新词语示例 (1)楼疯(2)歧视门

由图可知,“楼疯”的使用高潮期在09年和12年,分别是由于房价疯涨和香港楼疯而引起的。请看:

(1)“楼疯”两周年来到。从2007年十月楼市最高位,到2009年金九银十的当下,楼市经过惊天逆转,又惊人地回归,市场疯狂再度唤醒我们的记忆。(《购房者也疯狂 从07年的盲目追涨到09年的精神分裂》《羊城晚报》2009年09月27日)

(2)QE3火上浇油 香港“楼疯”重现 (《中国证券报》2012年09月21日)

“歧视门”的使用高潮期在08年和12年,分别是由于“IBM辞退抑郁症员工”和“伦敦残奥会”等事件而引起了较高的关注度。请看

(3)IBM辞退抑郁症员工陷歧视门(《新闻晚报》2008年06月22日)

(4)伦敦残奥会曝“歧视门”(《扬子晚报》2012年08月30日)

双峰型新词语多表示一个具体的事件。与单峰型词语不同的是,双峰型新词语所代表的事件的影响力不会特别重大,它有可能多次发生。事件每发生一次,使用频次就会达到一个高峰。

5.凸起型。

凸起型,也叫“缓升缓降”型。与“骤升骤降”型(孤峰型)相比,二者都有一个峰值,但是凸起型新词语的整体发展过程比较平缓,增幅和降幅都比较小,没有大起大落。

(1)

(2) 图6 凸起型新词语示例 (1)公共单车(2)农事村办

2007年的凸起型新词语约占10%,它们所代表的事件或人群的影响力比较小,总体频次水平也不高。除了“公共单车”“农事村办”以外,还有“宅人”“试客”“碳汇林”“格子铺”“毕婚族”“疯果盒子”等词语都属于这一类。它们在产生后前三年平稳增长,一般在2010年或2011年便会达到一个小高峰,后两年便开始走“下坡路”。

6.周期型。

周期型,也叫循环型。这类新词语在产生以后的监测时段内,使用频次呈现出有规律的高低起伏的波浪形。周期型新词语数量不多,指代的多是“定期出现或举行的某种现象或重大活动,如会议、节日、运动会等等”。[5]

(1)

(2) 图7 周期型新词语示例 (1)非遗节(2)快男

“非遗节”,即国际非物质文化遗产节,每两年举办一次,首届非遗节在2007年5月23日开始。因此这个新词语的频次在07年、09年、11年、13年分别达到一次使用高峰,在其他年度,则保持低频使用。可以预计,只要这个节日存在,那么该词语在此后的2015年、2017年、2019年都会高频使用。

“快男”,“快乐男声”节目的简称,三年一届。使用频次在07年、10年、13年分别达到高潮,其发展曲线也呈现出一条波峰波谷交替进行的有规律的波浪线。

周期型与双峰型新词语虽然都会有两次以上的使用高潮,但二者的不同也很明显:双峰型的高潮期是无规律的,难以预测;而周期型的高潮期则是有规律的,可以预测。

7.间歇型。

间歇型,也叫断续型、偶发型、时隐时现型。这类新词语在各个监测时点上的表现是:有时出现,有时不出现,即使出现,频次也不会很高。但是,到底何时隐,何时现,几乎没有规律可循。而且,有些词语间歇的时间很长,长达四五年,已经趋于退隐了,但又会突然“冒”出来,具有很强的偶然性,如“粉色航空”从2009年到2013年已经退隐了长达五年,却在2014年复现了,但频次仅1次。

(1)

(2) 图8 间歇型新词语示例 (1)火疗店(2)粉色航空

只要调查对象在监测范围内有一年频次为0,我们就将其归为“间歇型”。2007年间歇型新词语有很多,约占30%,比例在衰减型之后,位居第二。这类词语以记录新的科技发明、新鲜事物、新鲜的社会现象为主,并不与人民生活息息相关。间歇型新词语的分布:多分布在低频和超低频词语中,如“懒购”“华漂”“违法门”“童心节”“非银时代”“公厕户口”“隐性家教”“3Q宝宝”“天堂邮局”“良知消费”“心灵超市”“人肉多米诺”“中华学位服”“阿尔法女孩”“积木型住宅”;中频词语中只有极个别的情况,如“光能手机”“零利肉”。这些词语都处在“半退隐”的状态。

8.孤点型。

孤点型,从广义上说也属于衰减型。它与衰减型不同的是,衰减型的新词语在产生之后还有一个发展期,而孤点型是刚刚“出生”一年便夭折,属于最不被大众认可的一类了。由于这类词语太过特殊,数量也不少(2007年新词语中有12%属于孤点型),因此我们将其单列一类。

孤点型新词语的“词龄”[6]为1年,即在产生的当年被使用几次之后,就再也无人问津。这类新词语的生命力极低,存活1年甚至短短几个月的时间即告退隐。

(1)

(2)

(3) 图9 孤点型新词语示例 (1)鼠条(2)机器人鸟(3)道德恐高症

“鼠条”,“鼠年贺岁金条”的简称。词龄只有1年的原因是:第一,该简称与“薯条”同音,会出现表达不明的问题,造成交际障碍;第二,该词语只能运用于鼠年贺岁之时,可用期限太短;第三,金条属于奢侈品,并不是普通民众日常生活不可或缺的东西。“机器人鸟”由于是专业性词汇,使用人群受限,使用范围狭小,缺乏普遍常用性。“道德恐高症”由于不是我国社会主流文化所推崇的现象,生命力自然很低。与“道德模范”“孝老爱亲”等宣传真善美、传递高尚品质的新词语相比,“道德恐高症”显然处于劣势,退隐是必然的。

9.波动型。

波动型,也叫起伏型。这里指的“波动”并非波动增长或波动下降,它并没有明显的或增或减或隐的走势,而是忽高忽低,忽升忽降,难以捉摸,发展极不稳定,没有规律可循。波动型词语的频次往往会随着社会的变化和媒体的关注程度而发展变化。这类词语不太多,约占3.9%。

(1)

(2) 图10 波动型新词语示例 (1)近月点(2)时空邮箱

三结语

通过对2007年新词语进行词频和发展曲线的动态监测,我们发现,2007年新词语的使用度并不乐观,绝大多数都处于低频和超低频的区间内。根据2007年新词语的特点,将发展曲线归为九大类,即增长型、衰减型、孤峰型、双峰型、周期型、凸起型、波动型、间歇型、孤点型。当然,新词语纷繁复杂,其发展曲线也不止这九类,需要我们继续跟踪监测。增长型和周期型词语未来的复现率都为100%;衰减型、孤峰型、凸起型词语的频次逐渐降低,处在“即将退隐”的状态;间歇型词语属于“半退隐”;孤点型词语已经退隐。

对于新词语,我们不仅要研究其静态的共时状况,还要用发展的眼光关注其后续的动态变化情况。新词语产生之后,受不受欢迎,有没有被大众认可,哪些被保留了,哪些被淘汰了,原因是什么,这些问题都需要不断地进行动态监测。本文只能作为对该问题的初探,期望有更多学者投入到新词语的动态研究中来。

参考文献

[1]侯敏,周荐.2007汉语新词语[M].北京:商务印书馆,2008.

[2]侯敏,周荐.2008汉语新词语[M].北京:商务印书馆,2009.

[3]苏新春.词汇计量及实现[M].北京:商务印书馆,2010:291-292.

[4]教育部语言文字信息管理司.中国语言生活状况报告(2012)[M].北京:商务印书馆,2012.

[5]刘长征.基于动态流通语料库的新词语监测研究[M].北京:世界图书出版公司,2011:117.

[6]于根元.词语的时空分布[J].世界汉语教学,1997(4):21-24.

Dynamic Monitoring of Neologisms Appeared in 2007

Han Li

(School of Literature, Beijing Normal University, Beijing 100875, China)

Key words:neologisms; frequency; progress curve; latent; dynamic monitoring

Class No.:H136Document Mark:A

(责任编辑:蔡雪岚)

猜你喜欢

动态监测
区域动态气象干旱强度指数与应用探讨
动态心电心阻抗监测系统的研究
动脉血乳酸动态监测在心脏外科重症患者围手术期的临床应用
浅谈实现电网经济调度运行的可行性措施探究
动态监测C反应蛋白评估重症社区获得性肺炎疗效和预后的临床研究
浅谈工业冷却循环水系统节能优化技术及应用
浅谈A/B级洁净区的动态监测
心脏瓣膜置换术后动态监测血栓前体蛋白的临床价值分析