APP下载

语言规范下的媒体口语生态:电视新闻节目字母词使用状况调查*

2018-08-07舒笑梅

现代传播-中国传媒大学学报 2018年7期
关键词:缩略词频语料

■ 舒笑梅 张 彤

一、引言:语言规范与语言规划

改革开放以来,随着外语教学的普及,双语人群不断壮大,且随着国际交流的不断深入和互联网的全面覆盖,中外语言接触更加密切,人们在汉语中使用的外来成分越来越多。本世纪以来,汉语中的字母词呈现爆发式增长,不但新版《现代汉语词典》中收录的西文字母词数量不断增加,专门的字母词词典也层出不穷,如《字母词词典》(2001)、《实用字母词词典》(2002)、《汉语字母词词典》(2009)、《中国媒体常用字母词词典》(2012)、《实用字母词词典》(2014)等,收词量从一两千条增长到五千余条,语种也越来越多。但字母词的使用既给人们带来了便利也带来了困扰。

字母词鲜明的异质性在语言使用和语言研究领域引起了极大的争议。世纪之交的中国语言学界围绕字母词的使用展开了论战。反对字母词使用的学者认为异质成分的渗透“污染”了汉语本体,使汉语变成不伦不类的大杂烩,破坏了汉语的生态,影响了汉语的语言声望(Language prestige),要求保持汉语的“纯洁”,需像法国、俄罗斯等国家那样采取“纯洁语言”、清除外来语言影响的行动。而支持字母词使用的学者则以英语为例,认为英语中的外来词占多数,却是目前使用最广的通用语,所以语言应有容纳性,不必排外。对字母词态度的分歧曾经一度引发学界关于字母词使用合法性的讨论。为了规范外来词的使用,2010年广电总局下发通知,要求在主持人口播、记者采访和字幕中,不能再使用诸如NBA、GDP、WTO、CPI等外语缩略词。这政令一度被解读为要屏蔽字母词,引起舆论哗然。

面对字母词的大量使用和语言规范政策饱受诟病的现状,我们需要通过语言调查来摸清字母词使用的特点和主要问题,为政策的制定提供参考依据。笔者认为字母词使用调查有两方面的意义, 一方面,语言规范要为字母词的使用定规矩,属于规定主义语言学(Prescriptive linguistics)的范畴,而现代的规定主义是建立在描写主义语言学(Descriptive linguistics)充分地观察、充分地描写、充分地解释基础之上的。语言学界对于字母词结构的静态描写比较充分,但是对于字母词使用的动态描写研究欠缺。因此,进行字母词使用状况调查可以弥补动态描写研究的不足。

另一方面,语言规范化(Language standardization)是语言规划(Language planning)中本体规划(Corpus planning)的重要组成部分。①语言规划作为社会语言学的主要关注领域之一,同样遵循社会语言学定量分析、定性描写的研究方法。《语言交融及其影响因素研究》通过对外来词进行定量统计和定性分析,运用统计模型测算出现代汉语中外来词量为总词汇量的9.88%±2.58%,②与俄语(10%)③、法语(12%)④的情况最为接近,远低于英语(80%)⑤、德语(75%)⑥、日语(46%)⑦的外来词比例,认为汉语被污染的担忧显得没有太大必要了。但是,由于《语言交融及其影响因素研究》的外来词样本为21世纪之前的、且其中没有字母词;因此,字母词使用之争的关键问题,如汉语中有多少外来词、有多少字母词、外来词和字母词的比例多少是合适的、汉语被污染的标准是什么?依然需要我们本着客观、科学的态度进行语言调查,通过数据来说明人们的字母词使用状况,从而决定需制定什么样的规范方略。这也为本研究的开展提供了动力。

二、调查背景

长期以来,媒体由于引领语言使用的潮流而成为字母词的研究与规范重点关注的领域。由于字母词词形在报刊和网络中易于甄别,便于搜集语料,所以对媒体书面语中的字母词使用和规范研究较多,相对而言,媒体口语中的使用情况研究较为薄弱。

本世纪针对报刊或网络语料的字母词抽样调查和研究主要有《我国大众传媒中字母词使用状况的调查与分析》⑧《从〈文汇报〉看汉字字母词的历史演变》⑨《汉语真实文本字母词语考察》⑩,以及硕士论文《经济新闻中字母词的使用状况与公众态度调查研究》等。此外,《报纸、广播、电视、网络(新闻)字母词与使用状况调查》《权威媒体字母词使用状况的调查与分析》《2015年与2006年媒体字母词语使用比较分析》等研究则是以纸媒的抽样为主,有声媒体的口语语料为辅。

广电总局的政令曾被误读为要屏蔽字母词,在全球化的时代大背景下,想要屏蔽字母词是不可能的,但作为语言规范的政策和措施之一对媒体口语中的字母词使用肯定会起到一定的作用。在这种前提下开展的语言调查主要考察的是语言规范下的媒体口语生态。

三、调查对象与目的

针对媒体口语的字母词使用研究相对薄弱的现状,我们确定以媒体口语作为切入点进行调查研究。媒体口语也包含多种语体形式和专业领域。语体形式上有播新闻、说新闻、脱口秀主持、访谈、现场采访等。就语言使用的正式程度而言,播新闻应该是最正式、最规范的口语形式。专业领域方面有政治、财经、体育、娱乐、健康、美食、旅游等节目,不同领域的字母词使用差别很大,财经、体育、娱乐节目字母词使用明显较多,而中医养生方面的健康类节目则很少使用字母词,相对而言综合类新闻能较好地平衡不同语体形式领域间的差别。

在综合考虑媒体口语的语体形式特点、专业领域平衡和受众范围这些因素的基础上,本研究将调查对象确定为综合性电视新闻;研究目的为:(1)考察电视新闻中字母成分的使用状况和规范程度;(2)分析综合性电视新闻中字母词的特点;(3)考察字母词使用的媒体差异或地域差异。

四、调查方法

(一)电视新闻语料的抽样与处理

根据已确定的研究对象与目的,语料抽样需在一定程度上兼顾到时间上的随机和地域上的平衡。根据这一原则,本调查选取了2016年中央电视台综合频道(下称“中央1台”)、北京电视台、山东电视台、安徽电视台、云南电视台的综合性电视新闻节目各52期(共260期),覆盖260天(详见表1)。

表1 2016年电视新闻节目抽样表

调查删除了抽样语料中的新闻编辑技术标签词,如“导语”“正文”“同期声”“现场”“转场”等,保留了出现在字幕中的新闻标题、采访对象的身份标签和其他可视文字内容。最终用于字母词提取的新闻语料规模(详见表2)为总字符数1839333,总词种数45133,总词次数868669,平均词频19.2。

表2 抽样新闻语料规模

(二)字母词的提取与分类

抽样新闻语料中字母词的提取,由中国传媒大学国家语言资源监测与研究有声媒体中心侯敏教授运用该中心研制的字母词监测软件CUCLems完成,所有带字母的单位通过软件提取,并自动进行分类和标注。

软件提取使用的分类系统将含字母的成分分为三大类16个子类,我们根据必要的程度合并了其中的3个小类。最终的分类体系为三大类14个子类:(1)典型字母词,包含8个子类型:普通缩略、带汉字缩略、缩略机构名、排序替代、量词、特殊字母词、带汉字字母词(字母非缩略)、化学符号;(2)非典型字母词,包含4个子类型:专有名词(由“人名”“机构名”“其他专名”合并而来,非缩略的机构名称被归入此类)、型号、交通(车次路线)、车牌号;(3)非字母词,包含英文单词和邮箱网址2个子类型。

由于我们提供的是口语语料转写的文本,存在大小写不统一等问题,软件处理有少数分类和标注不准确。因此,我们对字母成分提取的结果进行了人工复核,修正了拼写、分词和分类标注当中存在的问题(见表3)。

表3 人工修正标注的词条

五、调查结果统计与分析

(一)样本中字母成分的总体状况(表4)

在1,839,333字的抽样语料中,含字母形式的词311种,共出现890次,其中字母词284种,占全部语料总词种数的0.63%,字母词共出现863次,占全部语料总词次数0.1%,每个字母词平均出现3次,远低于19.2次的总语料平均词频。仅从数量和频次来看,综合类电视新闻中字母词的使用比例极低,可以认为是微不足道的。倘若260期节目以每期30分钟计,则平均每隔9分钟会出现一次字母词。

表4 含字母成分单位的统计

在抽样语料所含的字母形式单位中,字母词占条目总量的91.3%,使用频次占含字母形式单位总词频的97%(具体情况见表5);非字母词仅27种,在语料中各出现一次,其中只有5个英文单词,其他为邮箱、网址。英文“Hello”“It’s perfect”出现在采访对象的同期声当中,英文人名“Kevin Nolan”显示在采访对象信息的字幕中。在284种字母词中,意大利语1条,5条是罗马数字,其余均使用英文字母。

表5 字母词总体状况

(二)抽样语料中的字母词分布和使用特点

1.缩略类字母词占绝对多数

样本字母词中的主体是典型字母词,而在8类典型字母词当中(见表6),不论是从数量还是从使用频次上来看,普通缩略字母词都是绝对的主角,词种和词次均排第一。带汉字缩略字母词(3G时代、APEC会议、B超、IT公司、K歌、ph值、PQ认证、TNT炸药、U盘、V密、X光机、大V等等)居第三位。缩略机构名虽然在数量上居第四位仅占11.2%,但在典型字母词中平均词频排第一。以上三种缩略类字母词合计占典型字母词词种超过三分之二(为69.2%),而合计词次更是占典型字母词词次超过六分之五(为86.7%),平均词频5.1次,远超其他类型的字母词。可见电视新闻中使用的数量和频次最多的字母词是缩略语。

表6 典型字母词的分布

虽然缩略机构名在典型字母词中平均词频最高,平均每个词出现6.5次,但是对缩略机构名的数据分析(见表7)显示这类词的高频其实是一种假象,是因抽样中的偶然性造成的。因为在19个缩略机构名的123次使用中,仅G20和BTV两个词就占了96次,且BTV全部出自《北京新闻》,其他17个词的平均词频仅为1.6次,所以89.5%的缩略机构名字母词都是低频词。

表7 缩略机构名字母词词频排序

排序替代类字母词(如景区的分级、建筑物的编号、股票类型、血型、服装的大小号、打印纸的类型等等)绝对数量在典型字母词中居第二位,但使用的频次却很低,仅平均1.8次,远低于典型字母词的平均词频率4。后面按词种和词次依次为量词、带汉字字母词(字母非缩略:QQ群,U行,V形,“AB角工作制”中的AB角)、特殊字母词(“3+X”中的X,“N次”中的N,LOGO)、化学符号,但除量词之外其他类别的字母词数量都很少。

与典型字母词相比(表5),非典型字母词的词种虽然只少19%,但出现的词次却少了58.2%,说明非典型字母词虽然总体数量不少,但使用频次很低,平均词频只有1.6次。在专有名词、型号、交通(车次路线)、车牌号四类非典型字母词中(见表8),专有名词的平均词频最高,也仅为2.4。在 17个专有名词中有6个属于国人自创或改造的字母词(e租宝,QQ,TFBOYS,WM众创智慧谷,V蓝·北京)或国人使用的外语原词(Twins),其余全部为外来专有名词(A cappella,AECOM,ApplePay,BIGBANG,C罗,Google,Hello Kitty,Sabin株,KKS传媒公司,MONO文化集团,TOP500)。

表8 非典型字母词的分布

2.科技领域是生产字母词的主力

由于普通缩略词是样本字母词中的主角,词种和词次均排第一,所以需要重点分析。对76条普通缩略字母词分布领域(见表9)的考察显示,科技类占60.5%,其中多数来自高新技术领域,经贸类占27.6%,交通和体育与休闲领域的占11.8%。抽样语料搜集的过程显示,综合类新闻中政治、经贸类的新闻比例最高,科技类新闻比例较小,而恰恰是这部份比例较小的科技类新闻对字母词引进和使用的贡献率最大,而且越是高新技术领域,字母词使用的越多。由此可见,伴随着科技的不断进步和发展,字母词的使用也会生生不息。

表9 普通缩略字母词的分布领域

科技类普通缩略字母词的特点导致了它们在媒体中被大量使用的状况,而且这种状况估计很难改变。首先,很多科技缩略字母词的中文术语很长,例如AIS(船舶自动识别系统)、CBTC(基于通信的列车控制)、CT(计算机断层扫描)、ETC(电子不停车收费)、FAST(500米口径球面射电望远镜)、GNC(航天器制导导航与控制系统)、GMP(药品生产质量管理规范)、HPV(人类乳头状瘤病毒)、IPV(灭活脊髓灰质炎病毒疫苗)等,转化为汉语都在6字以上,音节数都是缩略字母词的两倍以上,从语言使用的经济性上来看,使用缩略字母词是必然的;其次,普通缩略字母词使用频率也比较高,本次调查样本中每个普通缩略字母词平均出现5.2次。在时间或版面控制要求极高的媒体新闻领域,反复使用缩略语是必要的策略,所以科技类缩略字母词在新闻播报中大量使用的状况很难改变。

在抽样语料中排名前十位的高频字母词中(表10),11个词中(两个词词频并列第十)仅2个缩略机构名(BTV和G20),其余全部为普通缩略。按领域来看,除了BTV可以划归休闲类之外,科技类(PM2.5、APP、3D、Wi-Fi、4G)和经贸类(G20、GDP、PPP、CBD、CPI)的字母词各5个,科技类高频字母词多是各地普通百姓日常生活中十分常用的,经贸类高频字母词则是政府层面使用较多的或是地域性的高频词(如CBD)。

表10 排名前10位的高频字母词

3.不同媒体的字母词使用存在一定差异

从图1所显示的统计结果来看,不同电视媒体综合类新闻的字母词使用状况差异是比较清楚的,但地域性差异不明显,如北京台与中央台在同北京,但字母词使用却差别明显。

图1 样本字母词使用的媒体间差异

在词种方面,《山东新闻联播》使用的字母词种数最多(109种),比词种使用最少的《安徽新闻联播》(46种)和《云南新闻联播》(47种)多一倍多。但这种数量上的优势主要是由于专有名词、型号、车次路线、车牌号这些非典型字母词使用得最多。典型字母词使用种数最多的是《北京新闻》(71种),也比字母词种数使用最少的《安徽新闻联播》(33种)和《云南新闻联播》(36种)多一倍。

表11 样本字母词使用频率的媒体间差异

在词次和平均词频(表11)方面,《北京新闻》也是使用字母词次数最多的(共307次,平均每词3.4次),而且主要是典型字母词使用频繁(274次,平均每词3.9次)。使用字母词次数最少的是《安徽新闻联播》(86次),而且它的典型字母词使用次数和频率也最低(共70次,平均每词2.1次)。

因此,综合考虑词种、词次、平均词频的总体状况,以及典型字母词这一重要指标的状况,在这批电视新闻样本中,《北京新闻》是字母词使用最多的,《安徽新闻联播》是最少的,中间依次为山东台《山东新闻联播》、中央1台《新闻联播》、云南台《云南新闻联播》。这仅仅是基于这批样本统计结果得到的排序,如果变换这五家媒体抽样的日期,或许会得到不同的统计结果和排序。

抽样媒体字母词使用的多少只是这批样本之间的相对情况,不能被放大解读;不能仅凭一档节目的抽样结果就以篇概全地说哪个台所有节目整体上字母词使用得多或少。因为在180多万字的总体抽样语料中,字母词种数仅占总词种数的0.63%,词次仅占语料总词次数0.1%,所以总体而言,字母词在电视新闻中的使用极少。

(三) 抽样电视新闻字母词使用规范程度比较高

调查结果显示,抽样电视新闻字母词使用规范程度较高。抽样得到的典型字母词中,很多缩略字母词存在一词多义情况,表3中的BT、FC、THG因其一词多义而导致电脑分类误判,表7、表9中圆括号内的标注是一些多义缩略字母词在抽样语料中使用的意义。可见,缩略字母词的一词多义状况使规范地使用十分必要,否则受众难免一头雾水。

在对软件提取的字母词核查的过程中,我们注意到缩略语类字母词的使用方式主要有以下几种:(1)直接规范,包括使用“汉语+缩略语”的规范形式播报,或使用中文字幕为字母词标注等;(2)间接规范,使用说明性的语体方式编辑新闻内容在一定程度上普及了字母词知识;(3)语境暗示,在没有特别说明的情况下,字母词出现的语境对消除歧义作用也很大;(4)直接使用,虽然电视新闻直接使用字母词的情况也很普遍,但多数是人们知晓度比较高的、与日常生活关系密切的常用词(如APP、ETC、GPS、PM2.5、Wi-Fi、4G等)或高频词(如CEO、DNA、G20、LED、3D等),或字母词用于新闻标题字幕,配以中文播报,需要借助词典或网络搜索确定字母词意义的情况比较少。

媒体主动规范字母词使用的行为明确,但规范标准和措施松紧不一。例如,表12中的新闻片段节选自同一家媒体,有的新闻当中使用“汉语+缩略语”的播报形式,甚至连采访对象使用的字母词都配以中文字幕,规范得十分周到,有的新闻当中则直接使用外来词。另外,有些字母词在媒体口语中使用的必要性并不是很强,如Google(谷歌)等有固定的简单音译形式的词和LOGO(标志,标识)、R&D(研发)等有简单意译形式的词,所以规范还是有提升空间的。

另外,从不同调查的历时比较来看,抽样媒体的字母词使用频率比以往有所下降。段业辉、刘树晟(2014)对2013年4月1-15日《新闻联播》进行的比较宽泛的字母词使用(将网址、邮箱都算作字母词)统计为:词种23,词次109,平均词频为4.7次,平均出现频率为0.242次/分钟。本次调查中,《新闻联播》被归入非字母词的只有一条出现了一次的网址,如果按照段业辉、刘树晟的标准计算这次的《新闻联播》字母词使用状况为:词种63,词次161,平均词频为2.6次,平均出现频率为0.103次/分钟。从有可比性的平均词频和平均出现频率来看,《新闻联播》2016年比2013字母词使用的平均词频和出现频率都明显下降了,可以被解读为使用的规范程度提高了。

表12 电视新闻中的字母词使用方式举例

六、结论

此次电视新闻节目字母词使用状况调查,从2016年1-12月综合性新闻中均衡地抽取了五家电视媒体各52期节目,在总计183.9万字的语料中,字母词共284种,占全部语料总词种数的0.63%,字母词共出现863次,占语料总词次数0.1%,每个字母词平均出现3次。此次调查结果的字母词使用水平大大低于《中国语言生活报告2016》对2015年报纸、广播电视、网络新闻字母词使用状况的调查结果:字母词种数占总词种数2.6%,字母词出现次数占总词次数0.22%。可见综合类电视新闻中字母词使用是足够“保守”的。

此次调查结果显示,包含3种缩略词、排序替代、量词、特殊字母词、带汉字字母词(字母非缩略)、化学符号的典型字母词是新闻当中的字母词主体,而缩略类字母词在使用中占绝对优势。普通缩略词的词种和词次在各类字母词中排第一位,其中源于科技领域的缩略词最多。科技领域缩略字母词大行其道的局面估计很难打破,这既有词语本身的经济性内因,也有电视新闻节目的限时性外因。

五家抽样媒体的字母词使用呈现一定的相对差异,但地域性差异不显著,在综合类电视新闻总体字母词使用极低的大背景下,这种基于样本的差异不宜被放大解读或曲解。抽样媒体字母词使用规范程度比较高,媒体使用直接或间接的方式规范字母词的使用,而且历时考察也显示字母词使用频率有所下降,可见语言规范政策和措施起到了一定的作用。

学界对字母词研究的分类体系和标准并不十分统一,比如对于英文原词与字母词之间界限的判定就会因人而异,对于本次调查,就会涉及到若干个全英文的机构名和人名是应该判定为英文还是字母词,相应的统计结果方面存在争议在所难免,不过有争议的字母词数量很少,不足以影响到调查的主要结果和结论,调查达到了预定的研究目的。

七、字母词的使用与规范余论

此次电视新闻字母词调查的一点意外收获是通过媒体观察到了百姓日常的字母词使用,这让我们多少有了一点社会语言学研究过程中随机录语料进行田野调查的感受。

口头播报的新闻语料不同于日常口语语料,因为口头播报的新闻语料实际上是口语化的书面语,它是介于口语与书面语之间的中介形式,既有书面语规范的语法表达形式,又有口头交际中相对通俗易懂的词汇。抽样获取的采访对象字母词使用语料虽然不多,但因其高度的随机性而显得极有代表性。由于北京电视台的字母词使用词次最高,且主要使用的是典型字母词,我们从中筛选出了以下被采访对象使用字母词的语料。

(1)……LED的显示验证验票,老弱病残孕的专题候车区,以及这个热水的供应,都比我们的正常的候车区呢没有什么差别……(《北京新闻》2016.01.05)

(2)比如说《末代皇帝》包括《乱》4K这次的修复版,我觉得都应该是很热门的作品……(《北京新闻》2016.03.29)

(3)IPTV不仅仅是TV,实际上我们打造的是一个家庭多媒体互动平台……(《北京新闻》2016.05.17)

(4)……这些公司都会向我们咨询,咨询我们的动漫IP,传播中国的动漫文化。(《北京新闻》2016.05.31)

(5)……我们在软件方面的话,已经达到了国际IES的一个最新的标准认证。(《北京新闻》2016.06.07)

(6)像我们这种疾病,肯定门诊老得去那做CT啊,做核磁,然后有可能会做化疗和放疗……(《北京新闻》2016.12.13)

这些未经任何规范化加工的字母词使用,显示了日常口语中字母词使用的原生态,虽然(1)和(6)中使用的字母词LED、CT是百姓日常生活中经常接触到的事物,但和(2)—(5)当中专业人士使用的IPTV、IP、4K、IES一样都属于科技词汇,是专业性比较强的概念;表12中的LP(Limited Partnership)虽然是经贸类词汇,但也是专业领域的概念。从社会语言学角度来看,这些实例说明虽然日常口语整体的正式程度(Formality)很低,但是字母词的使用更多是与专业语域(Language domain)相关的,而非与基于正式程度的语体(Language register)相关。也就是说口语中使用的多数字母词与书面语当中的专业词汇没有太大区别,只是书面语在呈现方式上更有灵活性优势,可以使用注释或括号等说明性手段;而口语中只有汉外语码混合(Code mixing),陌生的字母词会造成交际困难,额外的说明无疑会增加交际成本,所以口语中大量使用和传播的高频字母词多是知晓度比较高的词。

因此,口语字母词使用的特点与饱受诟病的网络字母词使用特点是截然不同的。社交网络当中使用的字母词虽然也以缩略为主,但却与专业语域关联不大,更多是语体上的非正式、俚俗化表达,如“asap”(as soon as possible)、“lol”(laughing out loud)、“B4”(before)、BB(宝贝)、MM(美美/眉)等。对于便于使用规范形式的书面语,字母词的使用可以严加约束;对于口语可以尊重语言自身的使用规律,不适合口头交际的字母词在交际中会自行淘汰;对于网络交际中使用的字母词,应该重点防止低俗词语流入书面语。

语言规范政策的制定往往滞后于语言生活,经常是问题出现了再去定政策;而新闻是要保持信息前沿性的,必然会大量地接触到新字母词,不断应对新的语言问题。从语言服务的角度来说,新闻既要新又要通俗易懂,还要担起语言示范的责任,所以新闻媒体有必要规范地使用字母词。字母词规范方略要充分考虑新闻媒体大量接收新词的特殊性,对字母词的规范需要刚柔并济,既要考虑政策的可操作性,也要有针对性;使规范政策保持一定的张力,防止标准僵化单一,能够兼顾书面媒体、有声媒体、社交网络媒体字母词使用的不同特点和交际需要。

注释:

① Bernard Spolsky.Sociolinguistics.Oxford University Press,1998:66.

② 张彤:《语言交融及其影响因素研究》,中国传媒大学出版社2016年版,第133页。

③ 孙汉军:《俄语外来词研究》,《外语与外语教学》,2002年第11期。

④ 转引自胡飞萍:《浅谈法语中的英语借词》,《剑南文学(经典阅读)》,2014年第1期。

⑤ 转引自史有为:《汉语外来词》,商务印书馆2003年版,第97页注2。

⑥ 何涛:《德语中外来词的演变与规范》,《首都师范大学学报(哲学社会科学版)》,1998年第2期。

⑦ 吴侃:《日语词汇研究》,上海外语教育出版社2005年版,第3-4页。

⑧ 陈佳璇、胡范铸:《我国大众传媒中字母词使用状况的调查与分析》,《修辞学习》,2003年第4期。

⑨ 皇甫素飞:《从〈文汇报〉看汉字字母词的历史演变》,《修辞学习》,2004年第5期。

⑩ 郑泽之、张普:《汉语真实文本字母词语考察》,《语言科学》,2005年第6期。

猜你喜欢

缩略词频语料
基于归一化点向互信息的低资源平行语料过滤方法*
基于词频比的改进Jaccard系数文本相似度计算
大海失踪者
“人艰不拆”、“累觉不爱”等网络四字成语与文化
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
词频,一部隐秘的历史
《苗防备览》中的湘西语料
国内外语用学实证研究比较:语料类型与收集方法
这些词语你看明白了多少
汉语音节累积词频对同音字听觉词汇表征的激活作用*