汉语时间词“年”、“月”、“天”的搭配行为研究*
2015-08-17华南师范大学方清明
华南师范大学 方清明
汉语时间词“年”、“月”、“天”的搭配行为研究*
华南师范大学 方清明
本文利用语料库方法考察时间词“年、月、天”的搭配行为。它们与整数、半数、约数、位数的搭配颇为复杂,需要条分缕析。传统研究仅以若干句法标准考察特定高频词语是否具有同质性的做法,有待进一步探讨和检验。“年”的搭配力远远高于“月、天”,“年”至少有9个义项是“月、天”所没有的,其超高频率和用法的多样性充分说明“年”具有突出的例外性和特殊性。“月”的特殊之处在于无标记序数用法与需要前加量词“个”才能表达基数用法。“有一天、第二天”等含有“天”的多词单位具有语用语篇功能。本文认为多个相关的高频词之间,往往只具有部分的同质性,很难有完全的同质性可言。
时间词、年、月、天、日、语料库、搭配
1. 引言
汉语时间词“年、月、日”已经得到学界比较深入的研究。《现代汉语语法讲话》(丁声树等 1961)指出“年、天”为准量词,“月”为普通名词。陆俭明(1987)首次较为系统地对比了三者的差异,认为“年、日”是时量词,“月”则是名词。
陆丙甫、屈正林(2005)则持不同意见,他们关注“年、月、日”的同类性,认为作为序量词的“年、日”和“月”之间并没有本质的差别。以往的语法分析把“月”看作是“年、月、日”这个连续统中的例外;而根据他们的描写,在“世纪”到“秒”这个连续统中,例外的其实是“年”。陆和屈还进一步从认知角度解释了“大单位容易兼有名词形式,小单位容易兼有基量词形式”的倾向性。
邓思颖(2012)对陆丙甫、屈正林(2005)的观点提出了质疑,如:1)为什么“年”是例外?如果“年”是例外,为什么仍然说“年、月、日”之间“并没有本质的差别”?2)邓认为“毫秒”和粤语的“字(五分钟)”有名词的用法,因此否认了“单位大小与词类之间存有必然的认知关系”的说法。
邓思颖明确支持陆俭明(1987)的观点,并进一步论证汉语时间词的不对称性,如例(1-4)。邓先生认为“年、周、天、分钟、秒”应该分析为量词(基量词),而“月、星期、钟头”则属于名词。量词和名词的差异是语法上的差异,跟认知无关。另外,张霄军(2010)、裴雨来(2011)等也有相关论述。
(1)年年、*月月、天天(重叠测试)
(2)一年年、*一月月、一天天(重叠测试)
(3)一年一年、*一月一月、一天一天(重叠测试)
(4)多少年、*多少月、多少天(疑问代词测试)
综上,上述成果无疑加深了人们对“年、月、天/日”性质的认识;但是客观来说,前贤研究多囿于若干句法标准来探讨时间词的同质性问题,其局限性是显而易见的。第一,上述研究都尚未考虑频率问题,但事实上,时间词的高频搭配对语法规律的呈现有着重要影响,非常值得关注。第二,尚未从搭配角度全面揭示“年、月、天/日”用法的丰富性。第三,尚未对含“年、月、天”多词单位的语用和语篇功能进行考察。
“众所周知,运用语料库对语言现象进行定量定性的实证研究,已经成为近年来语言学发展的一个重要趋势。汉语学界真正把大规模语料库和软件技术相结合进行相关研究的案例并不多见”(方清明 2014)。鉴于学界目前缺乏对时间词搭配现象的系统研究,本文试图跳出句法词类视角,利用“国家语委现代汉语标注语料库”(以下简称“国家语委语料库”)和AntConc3.2.4w1技术相结合的方法对时间词“年、月、天”2进行分析。
2. 数量与“年、月、天”的搭配
数量与“年、月、天”组配时,呈现出非常复杂的关系。下面从整数、半数、位数、约数四个方面进行描写。
2.1 整数与“年、月、天”的搭配
2.1.1 基数、序数与“年、月、天”的搭配
整数可分为基数和序数两大类。其中:
基数、序数与“年”搭配有三种表达方式,如例(5-7)。
(5)一年、两年、三年、100年(基数用法)
(6)第一年、第二年、第100年(有标记“第”的序数用法)
(7)1949年、2000年、2014年(纪年时,为序数用法)
基数、序数与“月”搭配有两种表达方式,如例(8-10)。
(8)一个月、两个月、三个月(基数用法)
(9)第一个月、第二个月、第三个月(有标记“第”的序数用法)
(10)一月、二月、三月、十二月(无标记序数表达,范围限于“1-12”)
基数、序数与“天”搭配有两种表达方式,如例(11-12)。
(11)一天、两天、三天(基数用法)
(12)第一天、第二天、第三天(有标记“第”的序数用法)
以上用例至少能说明以下三点:第一,进行基数表达时,“年、天”与“月”不同,“月”需要前加量词“个”。第二,进行序数表达时,“年、天”与“月”也不同,“年、天”需要加标记“第”,而“月”可加可不加,无标记用法范围限于前加数词“1-12”。第三,“年”表示纪年时,“年”也是序数表达。
2.1.2 整数越大,越倾向于与“年”搭配
“年”与整数搭配具有较高的适配性。从理论上说,从一到无穷大的整数都可以与“年”搭配,如1年、2年、100年、10,000年、1亿年。
“月”与整数搭配则较为受限,一般以“1-12”为常规,13以上就有条件,因为“13-23个月”可以说成“一年多”,“25-35个月”可以说成“两年多”。理论上来说,只要超出12个月,都可以用“年”来折算。“天”与数量搭配也有此类限制,如“32-59天”可以说成“一个多月”,“400天”可以说成“一年多”。从折算的优选性来看,“年”是最具优势的时间单位。其原因大致是:第一,人类思维、自然现象和社会现象,其本质是模糊的,不是精确的。从计量时间方面来说,需要模糊计量的情况往往比较多。例如可以说“我在广州生活了八年”,一般不会说“我在广州生活了96个月”或者“我在广州生活了2,920天”。第二,作为时间方面的大单位和基本单位,当数量越大,折合为“年”的可能性也就越大,因为这是最便捷的。这就像人们到银行取一万元钱,人们得到100张100元的可能性是最大的,除特别要求外,银行一般不会给1,000张10元的。
2.2 半数与“年、月、天”的搭配
“半”与“年、月、天”的搭配,丁声树等(1961:177-178)、陆俭明(1987)已经有所论及。不过我们发现,随着数量的增大,“年、月、天”与“半”搭配的可接受度越来越低,如例(13-16)。
(13)半年、一年半、两年半……?十一年半、?十二年半、*一百年半3
(14)半个月、一个半月、两个半月……?十一个半月、?十二个半月、*一百个半月
(15)半天、一个半天、两个半天……?十个半天、*一百个半天
(16)半天、一天半、两天半……?十一天半、?十二天半、*一百天半
上述用例表明,随着数量的增大,“半”的使用越来越受限,如“一百年半、一百个月半、一百天半、一百个半天”在现实语言里为超低频现象(方清明 2012a),可接受度非常低。这也与时间表达的模糊性有关,例如大数量加“年”多为模糊量,而“半年”却是精确量,因此二者搭配时较难被接受。另外,前贤多指出“一天半、两天半、三天半”这类用法,但是现实语言里还有“一个半天、两个半天、三个半天”这样的表达,例如“我这个学期上课比较轻松,每周只要上两个半天就可以了”,这个例子里的“半天”整体上具有名词性。
2.3 位数与“年、月、天”的搭配
朱德熙(1982:45)把“一、二、三……九”称之为系数词,把“百、千、万、亿”称之为位数词,“十”既可以是系数词也可以是位数词,而系位构造是由系数词和位数词两部分组成的复合数词。“年、月、天”与系位构造搭配时,所受到的限制不尽相同。例如:
(17)十年、十个月、十天 (17’)十年、十个月、十天
(18)百年、*百个月、百日 (18’)一百年、?一百个月、一百天
(19)千年、*千个月、千日 (19’)一千年、?一千个月、?一千天
(20)万年、*万个月、??万日 (20’)一万年、?一万个月、?一万天
(21)亿年、*亿个月、???亿天 (21’)一亿年、?一亿个月、?一亿天
例(17-21)为位数词与“年、月、天/日”的搭配,例(17’-21’)为系位构造与“年、月、天/日”的搭配。上述用例说明,“年”可以与位数词直接搭配,也可以与系位构造搭配,其搭配力最强;“天/日”搭配力居中;“月”不能与位数词直接搭配。统计发现,“一千日、一万日、一亿天”、“一亿个月”等都没有用例出现,可见这类搭配可接受度非常低。即系位构造数量越大,也越不适合与“月、天”搭配。
2.4 约数与“年、月、天”的搭配
2.4.1 约数“多”与“年、月、天”的搭配
丁声树等(1961:177-178)详细地指出,“比三年、三天多点儿,‘多’字加在‘年’或‘天’的后面。多于三个月,‘多’字加在‘月’前面”。我们观察语料发现,情况远比这复杂,请看例(22-23)。“十”是个分水岭,当数字小于十,“多”位于“年、天”之后,当数字大于十,特别是出现“百、千、万、亿”时,“多”位于“年、天”之前。当数字正好是“十”时,“多”与“年、天”搭配可前可后,但意思有所不同,如“十多年”是大于十年小于二十年的意思,而“十年多”是大于十年小于十一年的意思。
(22)三年多、十年多、*二十年多、*三十年多、*一百年多
(22’)*三多年、十多年、二十多年、三十多年、一百多年
(23)一天多、十天多、*二十天多、*三十天多、*一百天多
(23’)*一多天、十多天、二十多天、三十多天、一百多天
另外,我们通过检索“国家语委语料库”发现“多年”二字单位为1,576例,而“年多”二字单位为315例。“多天”二字单位为110例,而“天多”二字单位为13例,这从整体上说明,“多”位于“年、天”之前的频率更高。“多日”已经固化成词。
“一百多年”能说,而“一百年多”不能说,这是为什么?可能的原因是,第一,从语义上来看,“一百多年”是指101年到199年这样的约量时间;而“一百年多”里的“多”的语义无法落实,如果“多”是“1-12个月”的意思,那么这个相对的小量与表示大量的“一百年”极不匹配。如果是“1-99年”的意思,则与“一百多”语义重复。因此“一百年多”在语义上不具有合法性。第二,从韵律来看,“一百多年”属于“2+2”自然音步模式,而“一百年多”则是“2+1+1”音步模式,这类模式造成韵律不和谐,因此很难被接受。
2.4.2 其他约数与“年、月、天”的搭配
“X年来”是非常高频的多词单位4,共计出现1,464例。“X年来”的实例里有“一年来、两年来”等具体表达,但是出现较多的是“十多年来、多年来”等约量时间表达,这类表达方式以“年”的搭配能力最强,请看例(23-26)。
(23)十多年来、多年来、近年来、几年来、近百年来
(24)*十多个月来、*多月来、*近月来、*几月来、*近百月来
(25)十多天来、*多天来、*近天来、几天来、*近百天来
(26)十多日来、多日来、近日来、几日来、*近百日来
胡玲(2007)指出“X以来”以表示长时居多,在一个很长的时间段中,过于精确的起点显得没有必要。“X以来”具有方向性,由过去时间指向说话人所在的时间,这种方向性具有一种动态效果。拿“几年”与“几年来”相比,“几年”是静态的,是时间流程上任意截取的一个时间段;“几年来”是时间流程上相对于定的一个时间段,起点是几年前,终点是说话时,有一个动态的过程。据统计,虽然“十多日来、多日来、近日来、几日来”有用例出现,但是频率都不高,倒是另外一个多词单位“连日来”比较高频。
3. 从频率和搭配看“年、月、天”的共性与个性
“频率”可分为实例频率(token frequency)和类型频率(type frequency)(Bauer 2001;王洪君、富丽 2005;Thompson 2007),一般来说,实例频率要远远高于类型频率。
3.1 “年、月、天”在类型频率搭配方面的共性
三者都表时间,其左搭配以数量成分最为高频,这是“年、月、天”之间的共性所在。下面罗列三者都能搭配的类型以展示它们的共性,如例(27)所示。
(27)次年、次月、次日|当年、当月、当天|几年、几月、几天|每年、每月、每天|哪年、哪月、哪天|那年、那月、那天|年报、月报、日报|年产、月产、日产|年历、月历、日历|年薪、月薪、日薪|全年、全月、全天|同年、同月、同日|元年、元月、元日|这年、这月、这日|整年、整月、整天|逐年、逐月、逐日|年收入、月收入、日收入
如果有人把“年、月、天”三者看作同类词的话,那么这种语言直觉应该与例(27)里三者在类型搭配方面所体现出来的共性密切相关。需要指出的是,尽管例(27)类型频率一样,但是实例频率依然有所差异,如“每年<1,113>、每月<237>、每天<6,289>”,人们日常生活中使用“每天”的概率要高很多。
3.2 关于“年”搭配的个性分析
陆丙甫、屈正林(2005)认为在从“世纪”到“秒”这个连续统中,例外的是“年”;不再按传统观点把“月”看作“年、月、日”这个连续统中的例外。邓思颖(2012)以“年、天”与“月”的一系列句法不对称性否定了“年”的例外性。本文与上述分析视角都有所不同,我们认为从频率和搭配角度来看,“年”无疑具有例外性或者特殊性。
“年”的频率远远高于“月”和“天”。依据“国家语委语料库”的统计,它们的实例频率分别为“年<22,029>”、“月<6,336>”、“天<6,401>”。“年”的超高频暗示该词含有“月”和“天”所不具备的额外功能。“年”的高频组合是揭示其用法的重要线索。
第一,“年”具有纪年作用,表达某个年份,如“2014年”、“2020年”等。这一点,前文已述。
第二,“年”可以表示一生中按年龄划分的不同阶段,如“早年、童年、幼年、少年、青少年、青年、壮年、中青年、中年、中老年、老年、晚年”等。
第三,“年”可以表达年龄或岁数的大小,如“年少、年幼、年轻、年青、年老、年迈、年纪大、年龄小”等。
第四,“年”可以对人生某个十年进行称谓,如“而立之年、不惑之年、耄耋之年”等。
第五,“年”与春节、年货有关,如“过大年、过年、过新年、年初一、年除夕、年糕、年关、年画、年货、年节、年三十、年味、年夜饭、年意、新年”等。
第六,“年”与十二生肖有关,如“鼠年、牛年……狗年、猪年”。其中特别值得注意的是,“猴年马月”已经固化,它属于“似非而是”的表达。按常理应该表达为“猴年马年”,但是由于避免同音,加之“X年X月”的构式压制作用,人们最终采用了“猴年马月”这样的表达。如果看其内部构成成分的话,“马月”似乎并不合法,它不是对“月”的某种划分或命名。“形态词”是指构词成分本身不是词(Packard 2001:11-12;方清明 2015a: 39)。“马月”的性质类似于形态词。
第七,作为时间单位,“年、月”本身可以作为词素对“年”或者“月”进行内部划分,并且方式多种多样,如例(28)。“天”往往较为单一,似乎只有“早晨、上午、中午、下午、黎明、傍晚”等划分,但这些都不含有“天”这个词素。
(28)年头、月头、*天头|年初、月初、*天初|年中、月中、*天中年底、月底、*天底|年末、月末、*天末|年尾、月尾、*天尾年终、月终、*天终
第八,用于与“学校”有关的语域,表示“年级”,如“一年级、二年级、低年级、高年级、学年”等。
第九,“年”所反映的其他事情,如“编年、丰收年、更年期、荒年、纪年、年成、年代、年会、年检、年鉴、年景、年轮、年限、年岁、年华”等等。以上关于“年”的用法可以形成表1:
表1. 关于“年”的9个义项与用法
表1里,“年”的9个义项基本都是“月、天”所不具备的。“年”具有义项丰富、搭配能力强大的个性,因此完全可以认为“年”具有例外性和特殊性。
3.3 “年度”词汇化的个案分析
如前文所述,“年”参与“构造已有词语的组合能力”(王洪君、富丽 2005)非常强大。不仅如此,以“年”为成分的单位还具有固化成词的潜能,下面以“年度”为例进行探讨。
吕叔湘(1999:604)指出“一度”表示一次或一阵,常和“一年”连用,组成“一年一度”修饰名词,作定语。我们检索“国家语委语料库”,发现共有“年度”218例,其中绝大部分用例被标注为量词,但这并不符合语言事实。从词性上来看,“年度”应属于名词,主要充当定语,如“年度人物、年度计划、年度建设、年度预算”等,也可以充当中心语受其他成分修饰,如“本年度、上年度、下年度、该年度、按年度、各年度”等。
更值得注意的是,“年度”是在当代固化成词的。检索“北京大学现代汉语语料库”发现,新中国成立前的语料基本不见该词,新中国成立到改革开放期间有零星使用,在改革开放以后,在如当代报刊、网络语料、人民日报等语料中却出现了19,748例。高频效应导致“年度”越来越固化,最后完成词汇化。
“年度”来自“一年一度、两年一度”等表达的缩略。缩略的动因主要有以下几个方面:第一,“一度”具有黏着性质,“‘一度’修饰名词作定语在现代汉语中是很受限制的,一般只能出现在与前面的时段词语对举的句子中”(于立昌、吴福祥 2011)。第二,界面差异,“一年一度”多用于句法层面的描述,如“一年一度的体检又开始了”,而“年度体检”则属于粘合结构或概念化的名名复合词层面。第三,韵律促动,如“2013年一年一度杰出人物颁奖典礼现在开始”里划线部分显得较为繁杂,不经济,因此有“2013年年度”的潜在表达,但是由于汉语的“同音噬词”规则,最终产生“2013年度”的说法。“2013年度”类表达产生之后,由于“年”与“度”句法位置相邻且高频连用,二者语义互相浸染,其内部结构发生了重新分析,结构边界得到了重新调整,最终“年度”凝固成词。“2013年度”从读音上来切分应该是[2013[年度]],属于“2+2+2”或“4+2”音步模式。如果是[[2013年]度],则属于“[4+1]+1”模式,这种音步模式不合法,非常别扭。音节韵律方面的要求直接导致了“年度”的固化与词汇化。
3.4 关于“月、天”搭配的个性分析
3.4.1 关于“月”构成的多词单位
通过语料库考察发现,“月”最大的特点是:1)“1-12”与“月”直接组合表示序数;2)表示基数时,“月”之前要加“个”。关于这两点,前文已述。另外,有少数以“月”为单位所反映的事情,如“正月、满月、月子、月经、个把月、半月谈、蜜月、岁月”等等。要注意的是,新近的语料显示,“月度”也有成词趋势,但是本文所检索的语料库里未发现用例。
在口语中,一些带有指称性的表达5,如“这月、上月、下月、那月、哪月”里,有的以不出现“个”为常。依据“国家语委语料库”的统计,如“上月<48>”、“上个月<24>”;“下月<27>”、“下个月<10>”;“哪月<3>”、“哪个月<1>”。举具体用例来说,我们感觉“下月十五号”比“下个月十五号”要简洁经济。另外“三月半、七月半、八月半、九月半”等表示节日的短语,“半”可以位于“月”之后。以月份对特殊事件进行命名,如“十月革命、五月巡游”等。
3.4.2 由“天”构成的多词单位
“有一天”多词单位非常高频,相关数据如“有一年<33>”、“有一个月<9>”、“有一天<453>”。
“有一天”常用作句首前位成分(句首之前的成分)(方清明 2012b),其本身不能独立成句,具有篇章方面的启下性。其主要任务不在于担负线性句法结构中的基本角色,而在于具有语篇开启与触发功能。“有一天”主要为篇章叙述提供一个模糊的参考时间,其后经常出现停顿标记,如例(29-30)。“有一天”后面的逗号不仅起停顿作用,而且创立了话语边界。逗号可以凸显句首前位成分,起到标示语篇手段的作用。
(29)有一天,张学良从南京回到西安,一下飞机就直达军训团去点名,发现不少人回了家。
(30)有一天,张明山看见街上耍猴戏,他很爱那活猴,同时他发觉真猴子不该是白颜色的,为了更像真的,他当晚觑着父亲入睡时就把泥猴子都涂上灰黄色。
“有一天”的时间意义往往比较弱,主要是充当说话者回忆过去某个事件时的宽泛标记,具有明显的过去时标记功能。有时候,它可以被替换为“有一次、有一回”等形式,如例(31)里的“有一天”换作“有一次”,其功能基本相当。上述例(29-30)也可如此分析。
(31)有一天做实验,孙韶渝偶然发现一种可能达到上述要求的体系,从而打开了一个新的境界。
我们通过双库检索,与其他两个参照项“第一天”和“第三天”相比,“第二天”频率异常偏高。具体如表2:
表2. “第二天”的异常高频表现
从逻辑方面来看,序数词“第一、第二、第三、第四……”之间的地位应该是平等的。从人类认知主观性角度来看,语言认知赋予“第一、第二、第三”这三个序数更多的机会和重要性,其中“第一”应该具有更高的认知凸显性。方清明(2014)对“世界第一<97>、世界第二<29>、世界第三<21>”等极性意义多词单位的考察就是一个证明。但是在“第一天、第二天、第三天”这个序列中,最高频的不是“第一天”,而是“第二天”,数据见表2。
“第二天”的异常高频该如何解释呢?存在即合理,“第二天”看似违背逻辑和认知规律,其实恰好暗示“第二天”有着“第一天”或“第三天”所不具备的额外功能。“高频复现的多词单位不一定显示很强的意义关系,却极有可能会导致该词在功能上的扩张”(Mahlberg 2005)。观察语料索引行发现,“第二天”可以表示时间顺序,如例(32);但很多时候含有“第二天”的结构主要是充当连接词功能,起到语篇连贯作用,而非单纯的时间序数用法,例(33)里“第二天”与“今天”相呼应,即“第二天”是指“今天”之后的一天。例(34-35)里的“第二天”都是用来连接两个先后相关的事件。例(36)里“第二天”的时间意义最弱,前面未出现相应的时间词与之呼应,它表达“后来”的意思,其连接意义已经较为显豁。
(32)其中的一只公鸡正在想:“第一天早晨有米吃,第二天早晨有米吃,……第九十九天早晨有米吃,所以今天,第一百天的早晨,一定有米吃”。
(33)我觉得做艺人有一点不好,就是不管你今天心情多么不好,第二天你该以灿烂的笑容面对大家的,还是得这么做。
(34)我走了整整一夜,第二天清晨才回到我的租住地。
(35)我好不容易才把他扶上出租车,回到家,他就一头栽进卫生间里狂吐起来。第二天他醒来,才把事情告诉我。我只好和声细语地安慰他。
(36)他曾经厚着脸皮约我去一家咖啡馆喝咖啡,我立即拒绝了。他不死心,第二天又来约我吃饭,被我再一次拒绝后,他终于死了心。
再系统观察例(32-36),我们不难发现“第二天”非常符合“联系项居中原则”(刘丹青 2003:68-73),即连词“第二天”用在两个被联系事件之间,起到关联前后事件的作用。“第二天”之前都有边界标记,如句号、逗号等等。这种边界的创立,凸显了前事件与后事件的相对独立性,它们需要通过“第二天”这类时间标记来粘合和关联。正因为“第二天”符合“联系项居中原则”,经常起到语篇关联的作用,具有类似时间连词的功能,因此其频率比“第一天”高也就不足为奇了。
另外,我们检索“半天<425>”发现,“半天”很少为实指用法,多为说话人主观认为时间长的意思。“等你半天了”不是真的等了6个小时或12个小时,而是等你很久的意思。“半天”的主观长时用法体现了语义晦涩的一面,不具有切分性(张霄军 2010)。其他具体实例还有“半天才到、半天才来、沉吟了半天、大半天、好半天、叫了半天、看了半天、老半天、愣了半天、问了半天、想了半天、找了半天、折腾了半天”等。
4. 余论
基于语料库的定量定性研究能对语言现象作出更为全面的描述与分析,为传统研究提供必要补充和拓展,同时也在“很大程度上弥补了传统研究因语言材料不够充分而多依赖主观自省的不足,从而使传统的直觉经验方法转向基于实验和统计的方法”(潘璠 2012:30)。本文重视真实语料,并借助语料库和软件考察时间词“年、月、天”的搭配现象,发现它们与整数、半数、约数、位数搭配时,情况颇为复杂。传统研究仅以若干条句法标准考察特定词语是否具有同质性的做法,有待深入探讨和进一步检验。同质性分析不利于计算机对词性的加工处理,也不利于教学把握,而基于频率与搭配对“年、月、天”各自之间的异质性加以分析,做到了细化处理,既有利于计算机自动分词,也有利于对外汉语教学处理。
从频率和搭配的视角来看,“年”最为特殊,其搭配力大大高于“月、天”。如整数越大,越倾向于与“年”搭配;“年”既可以与位数词直接搭配,又可以与系位构造搭配。系位构造的数量越大,越不适合与“月、天”搭配。另外,“年”至少有9个义项是“月、天”所没有的。“年”的超高频率性和用法多样性充分说明“年”具有突出的例外性和特殊性。
“月”的特殊之处在于无标记序数用法与前加量词“个”才能表达基数用法,“月”不能与位数词直接搭配。“有一天、第二天”等含有“天”的多词单位具有语用语篇功能。总之,多个相关的高频词之间,往往只具有部分的同质性,很难有完全的同质性可言。
语料库语言学的任务是“从海量的数据中挖掘出隐藏在其中的有规律性的东西,把海量的、离散的数据变为精炼的、系统化的知识”(冯志伟 2010)。其他时间名词也可利用本文的方法进行逐一分析。这里不妨再以时间词“最后”为例进行说明。“最后”表示“在时间上或次序上在所有别的之后”(《现代汉语词典》2005:1823),因此在话语里,“最后”也多出现在其他话语之后。我们在语料库里发现“,+最后”形式达到769例,占总数的26.32%。这一数据说明“最后”的语义与总体的语篇结构具有象似性。例(37)里,“鉴真”是先花11年时间,然后才“最后”成功。
(37)鉴真为了赴日,自公元七四三年春开始,前后六次东渡,历时十一年之久,最后才得到成功。
我们以“最后”为节点词,以“一”为右搭配词,跨距为10R(R为英文Right的缩写)进行检索发现,“最后……一”搭配为486例,占总数的16.63%。“最后……一”搭配是具有浮现特征的半固定短语(semi-fixed phrase)。“最后……一”高频搭配,凸显了“最后”的某种属性,即“最后”不仅“在时间上或次序上在所有别的之后”,而且它在量性特征上属于少量,这一潜在语义特征与“一”的小量性具有语义上的相宜性。如例(38)里,“最后一次机会”凸显的是机会很少,只有一次了。我们进行了跨库验证,在“北京大学现代汉语语料库”里发现“最后一<15,355>”,约占“最后”总用例61,529的25%。
(38)她也明明知道对于她这是最后一次机会,因为明年她就超过高考规定年龄了,那样,几年寒窗苦读的心血将付之东流。
人们习惯说“我给你最后一次机会”,但一般不说“我给你最后两次机会”,更不会说“我给你最后三次机会”。因为“一次机会”才是最后的,“两次机会”里还有先后之分,不是严格意义上的最后。再如,我们经常能够听到“最后,我来说一句”,但是很少听到“最后,我来说两句”,更不会有“最后我来说三句”的表达。上述分析都说明,“最后……一”高频搭配具有“时间少、量性小”的特殊的语义、语用功能。这种用法的倾向性是在大量索引行例句的定量统计基础上,作出的定性分析。
总之,语料库语言学既是一种工具,也是一种范式,必定会“为语言学研究提供了新的途径、带来新的理念、新的方法,这方面的研究也必然使人们加深对语言本质的理解”(杨惠中 2010)。
注释
1. 关于语料库和AntConc3.2.4w软件的介绍请参看方清明(2014,2015b)。
2. “天”和“日”既有相同点,也有不同点。比如“三日就能完成这项工作”也能说成“三天就能完成这项工作”;但有时候又不相同,如“十月一日是国庆节”不能说成“十月一天是国庆节”。另外,“日”和“号”有时是同义的,如“十月一日”和“十月一号”。考虑到行文方便,本文优选“天”,仅在必要时选用“日”。对二者差异方面不作细致探讨,引文照旧。
3. 本文使用“*”星号表示不能说,“?”表示可接受度有问题。语料库语言学不仅关心能不能说,更关心多大概率能说。
4. 多词单位是指两个或多个词语高频复现的序列,详细介绍请参看方清明(2014a)。
5. 陆俭明(2013)论证了“这三个苹果”为有定指称,而非真正的数量表达,可参看。
Bauer, L. 2001. Morphological Productivity [M]. Cambridge: CUP.
Mahlberg, M. 2005. English General Nouns: A Corpus Theoretical Approach [M]. Amsterdam:John Benjamins.
Packard, J. 2001. The Morphology of Chinese: A Linguistic and Cognitive Approach [M].Cambridge: CUP.
Thompson, S. 2007. Three frequency effects in syntax [A]. In J. Bybee (ed.). Frequency of Use and the Organization of Language [C]. Oxford: OUP.
邓思颖,2012,再说“年、月、日”[J],《语言教学与研究》(2):39-43。
丁声树等,1961,《现代汉语语法讲话》[M]。北京:商务印书馆。
方清明,2012a,现代汉语副词连用频率考察 [J],《汉语学报》(3):87-94。
方清明,2012b,论现代汉语“XP的是,Y”有标格式 [J],《语言教学与研究》(1):44-51。
方清明,2014,汉语抽象名词的语料库研究 [J],《世界汉语教学》(4):532-544。
方清明,2015a,《现代汉语名名复合词的认知语义研究》[M]。北京:科学出版社。
方清明,2015b,《现汉》抽象名词语义韵的定量、定性研究——基于语料库和Antcon3.2.4w技术 [J],《辞书研究》(4):17-23。
冯志伟,2010,双语语料库的建设与用途 [J],《现代外语》(4):420-421。
胡 玲,2007,“X以来,Y”句的成句条件 [J],《汉语学习》(4):87-92。
刘丹青,2003,《语序类型学与介词理论》 [M]。北京:商务印书馆。
陆丙甫、屈正林,2005,时间表达的语法差异及其认知解释——从“年、月、日”的同类性谈起 [J],《世界汉语教学》(2):12-21。
陆俭明,1987,说“年、月、日”[J],《世界汉语教学》创刊号:35-36。
陆俭明,2001,现代汉语时量词说略 [A],载《语言学论丛》(第二十三辑)[C]。北京:商务印书馆。1-35。
陆俭明,2013,有关汉语数量表达的几个问题 [J],《澳门语言学刊》(2):4-11。
吕叔湘,1999,《现代汉语八百词》[M]。北京:商务印书馆。
裴雨来,2011,再说“年、月、日”的词类 [J],《语文学刊》(4):54-55。
王洪君、富 丽,2005,试论现代汉语的类词缀 [J],《语言科学》(5):3-17。
杨惠中,2010,语料库语言学的应用研究与贡献 [J],《现代外语》(4):421-422。
于立昌、吴福祥,2011,时间副词“一度”的语义演变 [J],《古汉语研究》(4):27-30。
张霄军,2010,“两个半月”和“两个半天”——面向词法自动分析的涉数时间语素说略[J],《语言教学与研究》(3):84-90。
中国社会科学院语言研究所词典编辑室,2005,《现代汉语词典》(第5版)[Z]。北京:商务印书馆。
周小兵,1995,谈汉语时间词 [J],《语言教学与研究》(3):85-93。
朱德熙,1982,《语法讲义》[M]。北京:商务印书馆。
通讯地址:510631 广东省广州市华南师范大学国际文化学院
* 本文是国家社科基金青年项目“基于语料库与AntConc3.2.4w技术的汉语抽象名词搭配研究”(14CYY033)的阶段性成果,并得到教育部人文社科青年基金项目(13YJC740018)、暨南大学华文教育研究院2013创新平台研究重大项目(CXPTZD201315)和华南师范大学(2012)青年教师科研培育基金项目的资助。文责自负。