语言研究的实证性倾向
2016-09-15陆叶
陆叶
(中国传媒大学文学院,北京 100000)
语言研究的实证性倾向
陆叶
(中国传媒大学文学院,北京 100000)
研究方法可以说是语言学研究最重要的要素之一,也是语言学学科建立和发展必不可少的支撑。语言学发展至今,研究方法呈现动态的发展的趋势,随着与其他学科的交叉融合,定量的、实证性的研究方法越来越多地被运用到语言研究中。语言研究逐渐呈现实证性的倾向。
语言发展;研究方法;实证性
一、语言观的发展
语言学家从不同视角对语言进行观察和研究,对语言的认识也各不相同,形成了不同的语言观。根据语言观的不同,在具体研究语言时往往采用不同的研究方法并根据研究对象形成新的理论,进而形成各种语言学流派。现代语言学之父索绪尔的语言观对现当代的语言研究产生了深远的影响。他提出语言是一种表达观念的符号系统以及语言一系列的二元对立。从此,语言研究变成了真正现代科学意义上的语言学。后来发展起来的现代语言学不同流派展开了对语言结构、功能、运用及演变等诸多方面的描述和探讨,试图揭示语言的规律。
从历时角度看,语言学研究是一个历时的动态的研究范畴,语言研究方法也具有动态发展的特点。当代语言学研究呈现跨学科、多元化的倾向。语言学与其他学科交叉产生的分支学科中研究方法则更加多样化。数学、自然科学和系统科学等学科定量的、实证性的方法被广泛借鉴运用在语言研究中。科学的方法和系统的研究也使语言学被公认为是人文科学中最接近自然科学的人文社会学科。而近年借助计算机和定量统计方法进行语言研究也丰富了传统的语言观:语言不仅是人类最重要的思维和交际工具、一种音义结合的符号系统,是人类积累信息的储存库,也是信息的加工原料,在当代语言还是人类和计算机共同的表达知识、传递信息、实施控制的符号系统。
二、语言研究的科学意识
运用科学方法的汉语研究起步较晚,从1898年马建忠先生的《马氏文通》才开始进入理性主义的研究。20世纪中叶西方结构主义描写语言学、转换生成语法和系统功能语法等研究理论和方法被引入汉语语法研究中来。迄今为止,汉语研究还是以借鉴西方语法研究理论为主要倾向。面对这种现状,陆俭明先生提出汉语语言研究要树立三种意识:多元意识、理论意识和假设意识。许多科学研究的重要理论的产生都离不开科学的假设。
三、研究方法的实证性倾向
西方科学的哲学基础是逻辑实证主义,因此有“科学即实证”的说法,而逻辑实证主义也是定量研究的哲学基础。虽然系统、比较、描写、归纳、内省以及各种语言学派的理论方法等都是语言学研究中常用的研究方法,但语料库法和实验法更能为研究者提供客观性的数据。因此,对当今的语言学研究者来说掌握科学的、前沿的研究方法显得尤为重要。
(一)语料库方法。
互联网时代,海量信息扑面而来,承载信息的大量语言材料和现象令语言研究者应接不暇,语料库成为语言研究者的田野调查的沃土,为研究者实证取例和分析提供方法、材料和数据。语料库方法成为语言实证性研究的重要手段之一,影响了当代语言学研究倾向,使得定量定性相结合、尤其是计量的研究方法成为主流的研究方法。
语料库语言学采用的是以语料统计为基础的方法,即基于概率的方法。通过对大量语言数据的定量化统计分析,得出语言成分分布和语言成分之间关系等的概率,以数据的形式展现语言的规律。语料库的方法实际是一种以定性研究为基础的定量方法,进行定量研究还涉及数据的后续处理,包括分类和比较等。当代语言研究中不仅是语音、文字、词汇、语义、语法、语篇,在方言和古代汉语的音韵学方面定量的方法也逐渐受到重视,而且语料库方法对语言的应用研究也有一定的辅助作用。比如,在词典编纂时词与非词的确定方面,通过语料库的方法考察词语的使用和分布,可以为研究者提供客观的可参考的数据。下面举具体实例简要说明。
汉语表序数“第一”义的“首”常以“首+量词”出现在书面语中,“首+量词”是词还是短语在学界一直有很大争议。因为汉语中数词和量词通常都不单独使用,数词和量词组合后在句子中充当句法成分,作定语或补语、状语等。对于“数词+量词”黄伯荣等称之为数量短语,胡裕树、袁毓林等称为数量词。词典编纂时如何处理也是一个问题。《现代汉语词典》的编纂规范之一是以能单用的词为基本立目单位。不同版本《现汉》中“首+量词”的收录情况如下:《现代汉语词典(修订本)》(1996)和《现代汉语词典(增补本)》(2000)只收录了“首届”;《现代汉语词典第6版》收录了“首次、首度、首届、首例和首位”并做了词性标注,其中“首次、首度、首届”标注为数量词,“首例和首位”标注为名词。由此可见,个别“首+量词”在词典中已经占据了一席之地,具有了词的身份。“首”具有附着性,与量词组合时只位于量词前,可以和很多量词组合,《现汉第6版》仅收录五例,在语言实际使用中“首+量词”的情况是怎样的呢?
我们用定量统计的方法在中国传媒大学媒体语言语料库(语料规模34039个文本,包含241316530字符)中对数词“首”和汉语主要常用量词的搭配使用情况进行检索,结果如下:
表1 表序数的“首”与量词的共现情况
根据检索结果,从实际文本分布和使用频率来看,“首批、首个、首场、首轮、首例、首家、首位”等词也应考虑收入词典中。然而由于词典不能无限增容,因此在收录词目时必须界定一个标准。我们认为可以根据词目在实际使用中的分布和使用频率来决定,分布和使用频率达到一定标准的词可以收录为词典词,这样既可以为辅助词典编纂提供实证材料,也可以做到客观反映语言的使用情况。另外,该定量考察结果也可以为语言自动检测系统提供一定参考。由于汉语量词是个相对封闭的类,因此根据上面的分布和使用频率,面向语言监测的分词系统标注时,“首”字后面如果出现汉语固有量词时,可以视为一个词标注为数量词。
(二)实验室方法。
上面提到,科学具有客观性、可验证性和系统性的特征,科学研究的实证过程与分析论证必须透明,其他研究者才能从系统或逻辑上判断其是否正确。现代自然科学研究方法中最核心、基本的方法便是“实验室方法”。在语言学的一些分支学科如心理语言学、认知语言学等学科中实验法已成为基本方法之一。金立鑫提出将“实验室方法”用于语言学研究,并给出了语言学的实验室方法的完整表述。通过实验法对语言进行形式化的研究,而形式化研究也有自己具体的方法——形式化方法(formal methods),它原指在逻辑科学中分析、研究思维形式结构的方法,在语言学研究中就是分析、研究语言形式结构的方法。目前结构主义语言学、转换生成语法、形式语义学等学派都采用了形式化的研究方法。通过实验的方法对语言进行形式化的研究,使语言研究具有实证性和可验证性,进而摆脱文学欣赏式的主观研究。
四、结语
近年随着计算机技术的普及和发展,人们使用的大量信息以语言为载体通过电子文本和文件的方式大量存储,我们已经进入 了一个大数据的时代。杨惠中先生有这样的解读“所谓大数据时代,实际上就是用语料库语言学的方法处理海量语言信息……”。对于语言研究来说,借助计算机通过定量统计等方法来自动发现语言学知识将极大地提高研究的效率、扩大研究的规模。定量统计和实验等实证方法可以为语言理论研究和应用研究提供客观、科学的数据,确保研究的科学性和实证性,实证方法也是语言研究提高科学性、可靠性的需要。
[1]中国社会科学院语言研究所.现代 汉语词典第6版[M].北京:商务印书馆,2012
[2]费尔迪南·德·索绪尔著,高明凯译.普通语言学教程[M].北京:商务印书馆,2010
[3]马建忠.马氏文通[M].北京:商务印书馆,2010
[4]杨慧中.语料库语言学与中国外语教学[ J].现代外语,2010
[5]金立鑫.将“实验室方法”用于语言学研究[J].中国社会科学报,2014
[6]黄昌宁.语料库语言学[M].北京:商务印书馆,2002
C03
A
1671-864X(2016)08-0132-02