APP下载

现代语言类型学跨语研究的视角与综合实现路径

2022-12-13王小穹

语文学刊 2022年5期
关键词:类型学语序共性

○ 王小穹

(重庆理工大学 外国语学院,重庆 400054)

一、引 言

最早有关语言类型学的研究可以追溯到18至19世纪的德国学者施莱格尔(Schlegel)兄弟,他们发现不同语言中形态丰富的词缀语素除了差异,还有着很大程度的共性。根据构词特点和词形变化的有无,施莱格尔兄弟以及后来的德国历史语言学家施莱希尔(August Schleicher, 1821-1868)把世界语言分为屈折语、黏着语和孤立语,这三种类型加上德国语言学家洪堡特(Wilhelm von Humboldt, 1767-1835)在北美等地发现的由多个语素编插黏合而成的编插语(或称复综语),一共是四种。早期语言类型学对世界语言的分类是从词的外形和结构出发的,实际上是一种形态学(Morphology),故被类型学界称为“形态类型学”。传统语言类型学同于历史语言学,主要从语言内部来描述语言之间的源流关系,不太考虑语言接触等语言外的社会因素,其描写性的历时研究无法解答无源流关系的语言为何存在相关性和相似性的疑惑。

现代语言类型学继承了传统语言类型学的研究对象——人类语言的类型,但在研究视角上有了全新的变革,既不像传统语言类型学那样仅仅对语言进行形态上的分类,也不只以形态为唯一依据来确定语言在发生学上的亲属关系,而是关注不同语言之间或同一个语言内部的不同结构之间的相关性,通过跨语言的调查和对比寻找语言共性。因此,基于非发生学关系的语言接触和语言演变的跨语言比较研究,成为现代语言类型学研究的重点。现代语言类型学与传统语言类型学的显著区别是,关注发生学所不能解释的现象,运用跨语比较的共时研究视角和跨学科的综合研究手段来实现其解释世界语言相关性的研究追求。

二、现代语言类型学的跨语研究视角

传统语言类型学根据语音特征和语法结构的相似性对世界语言进行分类并确定亲属关系的研究范式在面对“语言联盟”现象时不起作用。语言联盟是处于连续的地理区域但彼此没有发生学关系的不同语言由于在语音特征和语法结构上的相似性而形成的同盟,这些语言之间没有发生学上的源流关系,但却因为地理位置毗邻相连和语言接触导致了不同语言的相似趋同,并进而形成了新的语言类型。现代语言类型学扩展了传统语言类型学的研究对象,关注任何环境和任何因素作用下的语言相似性问题,致力于传统语言类型学不能解释的现象,其研究视角主要着眼于语言相关性和语言共性研究。

(一)相关性研究

相关性指的是语言成分之间的约束关系或条件关系,对前置词和动词前置语言使用关系的考察就是相关性研究。例如,语言学家们首先要根据基本语序规则来调查世界上的语言,考察前置词或后置词的隐现情况。世界语言的六种基本语序按行为动作(V)与行为对象(O)的前后位置可分为两大类型:动词在行为对象之前的语言分别是SVO、VSO、VOS,我们称为“动词前置语言”;动词在行为对象之后的SOV、OSV、OVS为“动词后置语言”。动词前置语言占人类语言的75%以上,而动词后置语言大约仅为1%左右,这两大类型与前置词、后置词有四种理论组合:(1)动词前置语言与前置词;(2)动词前置语言与后置词;(3)动词居中或动词后置语言与前置词;(4)动词后置语言与后置词。人类语言根据这四种组合被分成了四类。除了第二种情况,其他三种情况在人类语言中都有不同程度的存在[1]5。例如:

(1)Tzotzil索西语(动词前置语与前置词)

ti t'ul-e

CMP-TER-carry away woman

the rabbit-CLT

“The rabbit carried away the woman.”

withTER-husband

“with her husband”

(2)Yoruba约鲁巴语(动词居中语与前置词)

a.bàbá ra bàtà

father bought shoes

“Father bought shoes.”

b.ní ojà

at market

“at the market”

man PST dog beat

“The man beat the dog.”

b.pur kam

field in

“in the field”

接着,语言类型学家们对所作出的分类进行归纳,提出一个普遍性的观点,即,动词前置语言大多使用前置词。而这个结论反过来又需要语言类型学家们对动词前置与前置词为什么存在这种潜在的关系做出解释,相关性研究就是对语言成分之间的潜在关系进行解释。

上述相关性研究着眼于通过寻找语言成分之间的约束关系或条件关系,以发现某种语言的结构规律。相关性还有一个广为接受的含义,即:不同语言在表达某一概念时具有某种结构上或语义上的相关性,传统语言类型学和现代语言类型学都重视这个层面的相关性研究。世界上的语言几乎都有询问地点或方所的疑问词,尽管不同语言的疑问词的语音形式不同,但在概念表达和语义引申上由于相似而具有相关性。下面以波兰语gdzie、英语where和汉语“哪里”为例,分析方所疑问词在不同语言中语义扩展的一致性。

(4)Gdziejest Stare Misato?

whereFOCit is old city

“Where is the Old City?”

“老城在哪里?”

(5)Gdziezwykle odpoczywasz?

whereFOCusually you rest

“Where do you usually have rest?”

“你通常在哪儿休息?”

whereFOCyou will be live

“Where will you live?”

“你将住在哪儿?”

and whereFOChe would sleep

“And where would he sleep?”

“他将在哪儿睡觉?”

and from whereFOCthis high

humidity

“And where does this high humidity come from?”

“这种强烈的湿度是从哪里来的呢?”

from whereFOChe came

“Where did he come from?”

“他来自什么地方?”

and from whereFOChe knew

CONJ will fit on her finger

“And how did he know it will fit her finger?”

“他是怎么知道这适合她手指的?”

gdzie jest klucz.

from whereFOCyou you know

where it is key

“How did you know where the key was?”

“你是怎么知道钥匙的位置的?”

w tobie tyle agresji?

by the way this from whereFOC

in you so much aggression

“By the way why are so much aggression in you?”

“话说你为什么那么好斗呢?”

(13)-Jak jest po rumuńsku

how it is in Romanian

waiting

from where I I have know how

it is waiting

“-How is ‘waiting’ in Romanian?-How should I know how to say ‘wait’ in Romanian!”

“-罗马尼亚语的‘等待’怎么说?-我哪里知道罗马尼亚语的‘等待’怎么说!”

(二)共性研究

共性是和类型相对的概念,类型是依据共性建立起来的较为特殊的集合体,而在集合体/类型之间表现出来的却是个体差异。语言个性和差异并不是语言研究的终极目标,语言学追求的终极目标是语言共性,即寻求语言和语言之间的差异本质上是由哪些极其有限的共性因素造成的。深入研究语言共性,需要依赖语言类型的工作。语言类型学家们首先需要通过分类来揭示语言共性,他们观察不同语言类型的形式和规则,以发现哪些类型能在我们的语言中更有普遍性,哪些类型不能被验证,哪些类型只能被部分验证。SOV、SVO这两种优势语言类型揭示了语言共性和语言类型的密切关系,如果不对六种可能的基本语序类型进行调查,就无法发现这些语言结构的倾向性。也就是说,分类工作是阐释人类语言的重要前提,只研究一种或少数几种语言而得出语言倾向性的论断是靠不住的。语言类型学基于语言内部结构倾向性的语言共性研究,需要调查数据的支撑而具有统计学的属性。

同时,语言类型学根据逻辑学上的蕴含共性进一步揭示了语言共性与语言类型的共生交互关系。例如,动词前置语序蕴含了前置词的出现,逻辑学上用“p→q”或者“p⊃q”来表达,这种蕴含关系反映了事物与事物之间的制约关系和条件关系。在形式逻辑中,p是q的充分条件,“如果p则q”逻辑模式存在四种可能性:

(1)p为真,q为真:如果是动词居前语言,那么有前置词的使用;

(2)p为真,q为假:如果是动词居前语言,那么没有前置词的使用;

(3)p为假,q为真:如果不是动词居前语言,那么也会有前置词的使用;

(4)p为假,q为假:如果不是动词居前语言,那么也就没有前置词的使用。

第(2)种可能性(p→-q)在现实语言中并不存在,我们可以排除这种逻辑可能性。同时,语言类型学不关心第(3)、第(4)这两种条件为假时的命题真假,它更多关注条件为真时人类语言的共性,即p→q。要真实客观地阐述语言共性,就要确定这四种逻辑可能性是否存在于我们现实的语言中,而这些都需要基于语言类型学家们对人类语言的分类以及前置词、后置词分布情况的研究。

语言共性与语言类型的交互影响还强调基于类型学分类的共性表达。类型学意义上的分类,通常要求语言数据应来自丰富的语种。语种大样本能够减少把非共性特征视为共性特征的风险。数量不多、众所周知的语言也许并不能真正代表人类语言的结构特征。如,关系从句使用关系代词的现象在印欧语言中很普遍。Comrie指出,关系代词在跨语言比较研究中其实是一个少见的类型[2]149。因此,仅基于印欧语系的某些语言就得出关系从句具有共性的结论是让人怀疑的。

考察不同语言在语序上是否存在共同点是语言共性研究的重点所在。名词层面的语序,主要有:形容词与核心名词的语序(AN/NA)、指示词与核心名词的语序(DemN/NDem)、领属词与核心名词的语序(GN/NG)、数词与核心名词的语序(NumN/NNum)。在实际语料中,名词常常带有几个修饰语,而充当修饰语的代词、指别词、数词、形容词、名词等多项定语也需要遵循一定的规则排序。汉语、土家语和苗语分属汉藏语系下的汉语族、藏缅语族和苗瑶语族,彼此之间有共性也有差异。其共性是这三种语言都有修饰语在核心名词前面和后面的情况。尽管现代汉语的修饰语几乎都在核心名词的前面,但修饰语在核心名词后面的构词特点仍然保留在一些名词性词汇中,如“马匹”“纸张”“船只”等。下面以滇东北苗语[3]和渝东南秀山、酉阳土家族苗族自治县的土家语[4]88为例,说明苗语、土家语的修饰语与核心名词的语序(见表1)。

表1 苗语、土家语的修饰语与核心名词的语序

修饰语和核心名词的语序有三种情形:一是中心语在后,这是苗语、土家语和汉语的名词性结构的语序共性;第二种情形是中心语在前,这类名词性结构在苗语和土家语都普遍存在,这是苗语和土家语的语序共性;第三种情形是中心语居中,这只存在于苗语中,这是苗语有别于土家语、汉语的语序差异。语序差异反映了语言的多样性,语言类型学家关注的是从多样性的语言中寻求语序共性规律。

三、现代语言类型学的综合实现路径

现代语言类型学探求世界语言的共性,尽量多地考察不同语言并进行跨语比较,这个过程所包括的搜集、统计、比较和归纳等环节决定了现代语言类型学的研究路径一定不是单一的,而是一个交叉了多种实现手段的综合集成路径。其中,田野调查、语义地图和多维尺度构成了现代语言类型学实现路径的关键。

(一)田野调查的执行程序

语言样本是语言类型研究的基础,确凿可信的语言样本大多是通过跨语言的田野调查得到的。语言样本的搜集整理工作是语言类型学研究的起点,因此,田野调查从来都是跨语言比较研究不可缺少的手段,是语言类型学一切研究方法的基础。田野调查包括语料搜集、语料调查的内容以及语料分析技术等工作。

首先,做好语料搜集工作。语料搜集的方法主要有引导式提问、观察和非文字刺激。

引导式提问是田野调查最基本的方法。针对一门从未被系统地深入地记录和研究过的语言,在做一个从单词、句子到长篇语料的初步描写时,往往采用引导式提问的方法。这种方法受调查者控制,以翻译词汇表、语法句或由调查者主导的采访活动为主,是一种被设计、被布局的不自然或者半自然的沟通活动。核心词是各民族语中最基本最核心的词汇,没有借词成分,排除了借词的干扰。调查者通常使用斯瓦迪士核心词列表,用引导式提问对不同语言的词汇及语音作比较研究。但对一些语种复杂地区的语言研究,比如藏缅语族语言,调查者会使用大一些的调查词汇表,例如,《藏缅语语音和词汇》[5]和《藏缅语族语言词汇》[6]。

使用引导式提问的好处在于:调查者能引导调查朝预测方向推进,并通过提问获得研究所需的负面证据并产生大量结构。弊端是:以引导式提问来翻译词汇表,只能记录那些被调查的语言与媒介语言都共同具有的概念,引导式提问还容易受媒介语的影响,通常有误解的风险,而且用直接提问方式搜集的词汇,名词偏多,动词和其他词类偏少,独特的抽象的语言现象很少。另外,要做到有效的引导式提问,还需要田野调查者在如何构建上下文、如何提问以及如何解释答案等方面对所调查的语言与调查方法有较全面的了解。

观察,是调查者在搜集语料时为补充引导式提问的不足而采用的辅助方法。该方法是调查者不介入语言活动,作为旁观者观察被调查者的语言在真实自然状态下的沟通活动,调查者通过观察有上下文信息的自然语料,发现新的结构。不过,观察是在随意场景下发生的,语料零散,不提供负面证据,最后实际可用的例句少,所调查的结构在不同类型的文本有不同的出现频率,存在不便于统计的缺点。

非文字刺激,是在缺少引导式调查技巧或缺少田野调查经验和时间的情况下较为理想的方法。调查者在调查具体事物时,为减少媒介语的影响,采用非文字刺激的手段来补充媒介语没有而调查语言存在的语言现象。非文字刺激的手段包括图片、绘画、视频、表演等形式。使用该方法搜集语料的好处是:(1)避免了媒介语的影响;(2)用图片、视频等非语言方式给被调查者提供了他要表达的明确内容,因此可以把误解的风险最小化;(3)可以让被调查者很自然地产出大量结构,包括使用率很低的词语;(4)通过对图片等非文字形式的调整,调查者可以对语料进一步探测,得到理想的数据;(5)可以针对不同的说话人采用同样的非文字刺激,通过比较得到一个更为客观准确的结果。德国马克斯-普朗克学会心理语言学院开发的“演化人类学:田野语言学的类型学工具”和“心理语言学:L & C田野手册与刺激素材”为非文字刺激的田野调查提供了不少很有参考价值的图片、视频资料。

其次,确定田野调查的具体内容。田野调查的两大内容是语音调查和形态句法调查,其对应的研究领域分别是田野语音学和形态句法学,主要工作内容是使用某个现有的词汇表录音、记音、归纳音系,以及选取长篇语料语段的例句、提取词语并进行语法标注。

语音调查方面,包括辅音的记录和描写、元音的记录和描写、声调的记录和描写,以及音位归纳(见图1)。

图1 语音调查的内容

形态句法方面,形态涉及语素、词的内部结构和构造规则,具体内容包括制定TMAQ问卷,确立时/情态/体等语法范畴并进行语法标注。句法方面,包括语素构成词,以及词和短语组合成句子的结构规则和变化规则,涉及名词性、动词性的各类短语结构、词或词类之间的联系、句子组织方式,以及句子组成部分与小句联系方式等(见图2)。

图2 形态句法调查的内容

语法标注是形态句法研究的核心。目前类型学界基本上依据莱比锡标注系统(the Leipzig Glossing Rules)采用三行标注的范例形式标注对象语言。第一行是对象语言的国际音标记音,第二行采用行间标注的形式进行逐词标注,第三行是句子的相应翻译。其中,第二行标注使读者能够追踪到原始文本和翻译文本之间的关系,明确地展示被描述语言的结构,方便语料的归类、储存和分析,因此最为重要。在标注对象、形式和体例上,莱比锡系统都做了一系列明确的规定,例如,具有语法意义的屈折词缀才需要标注,被标注词与标注词之间要垂直对应,例句行和标注行之间要以词为单位上下靠左对齐,语素之间对应,用短横“-”隔开,语法标签采用小字号大写字母的缩写形式和采用下标形式标注语法意。同时,莱比锡标注系统也考虑到了不同语言在语法范畴上存在差异,所以特别指出,范畴标签不限于它列出的标签形式,标签的缩写形式可以和它附录中列出的有所不同。

最后,要采用合适的语料分析工具。获得田野调查的原始语料后,就要选择合适的分析工具进行语料分析研究。语料分析就是语料标注,即对原始文本逐字(词)的解释、翻译和说明。一般来说,语料标注包括:(1)采用国际音标或国际通行的转写系统进行(同步)注音转写;(2)对译/直译;(3)自由翻译;(4)内容说明、意译注释等。目前执行语料分析的技术工具主要有Praat、Flex和Elan这三个软件。这三个软件都可用于语料标注,各有针对性的功能。

从表2可知,Praat是做语音分析的软件,无法做文本、语法分析,所以不太适合做语料标注。Flex处理文本语料的功能十分齐全,具有输入词汇信息、编纂词典、文本分析以及通过标注文本实现各种查询和统计分析的强大功能。Elan是记音的有力工具,能标注音频、视频等媒体文件,通过选择标注段,可实现对媒体文件任何时段的浏览和播放。

表2 语料分析的工具及其功能

Flex或FLEx全称是Fieldworks Language Explore,是由美国国际语言暑期学院(Summer Institute of Linguistics, SIL)开发的一款软件,专门用于田野调查时的文本分析、语料标注以及词典编纂。由于Flex没有与音频/视频文件发生直接关系,但Flex功能又很齐全,南开大学外籍专家齐卡佳创新性地把Elan和Flex结合起来使用,其具体流程是:(1)Elan语音转写,用Elan软件以国际音标或国际通行的记音转写系统标注媒体语料的第一层;(2)Flex文本分析,把Elan的标注文件导入到Flex,利用Flex进行逐词标注、添加相应翻译和注释;(3)Elan进一步标注,把标注完的Flex文件导入到Elan,完成媒体语料的标注。

(二)语义地图的多维构建

语义地图基于认知理论相似性原则之一的联系项原则,最早由Anderson提出。其主要理念是,如果某个语法形式对应多重功能或意义,而且这种现象在不同语言里也一再出现,那么这个语法形式与概念的关联一定不是偶然的,应该是普遍且系统的[7]。语言类型学家们认为,联系项原则可能反映了人类语言的共性,被用来解释在一对多的形式中所发现的某些共性,即通过构建彼此勾连的语义网络来展示多功能形式在语义远近上的相关程度和蕴含关系。因此,语义地图是一种分析多功能语法形式与语法意义关联模式的方法,它既可以分析语言内部的语义与形式的对应关系,也可以用来分析不同语言之间在形式与语义上的差异和共性。

Croft首次提出“语义地图连续性假说”,将有关联的语义表征在一个连续的区域(即概念空间)[8]。在这个概念空间上,有些语言的形式与概念之间的关系是相同的,也有一些语言的形式与概念之间的关系与其他语言不太一样,有些区域交叉而有些又是重叠的,这种用类似地图的直观方式,能表现不同语言之间的共性和差异。语义关联,是构建语义地图最基本的原则,因此Croft将语义的连续性作为验证语义推导所必须满足的前提假设。

Croft用语义地图展示了某些语言的语法化过程,并提出语义地图能表达蕴含、等级等关联性的思想[9]。Haspelmath介绍了语义地图的绘制方法[10],自此语义地图成为语言类型学家描写、分析语料的重要技术手段,以及用来阐述语言形式与意义功能的关系的重要工具[11]263。Haspelmath构拟了一个与格介词的语义地图[10]213:

图3 与格介词的语义地图

在这个语义地图中,英语与格介词“to”所表达的概念空间是“目的—方向—接受者—经验者”,法语介词“à”所表达的概念空间是“方向—接受者—经验者”,这两个概念空间都是连续的,符合语义地图连续性假说,说明语义推导是没有问题的。根据语义地图连续性假设,如果英语“to”有表达“目的”和“接受者”的功能,那一定就会有表达“方向”的功能,或者如果英语“to”或法语“à”有表达“方向”和“经验者”的功能,那一定就会有表达“接受者”的功能。通过语义地图,语义之间的关联和不同语言语义功能之间的蕴含关系就能很直观地表达出来。

(三)多维尺度的数据分析

语义地图能直观呈现语义的关联性,但是这个方法无法表现各个语义项目之间的关联强度、频率,更无法准确反映各节点之间的空间距离以及支持节点距离背后的理论意义。于是,类型学家们开始尝试用多维尺度分析法(Multidimensional Scaling, MDS)来取代传统的语义地图分析法。MDS借鉴统计学处理数据的方法,从描述统计和推断统计等两个层次对数据进行分析。MDS通常借助SPSS统计分析软件。用SPSS构图之前,需要弄清数据类型,不同类型的数据,处理方法不同。MDS的数据通常是分类数据,对分类数据做出分类整理后,统计分析软件会呈现分类数据所涉及的频数、频率、比例等统计量,能呈现数据的集中趋势、离散程度和分布形状等数据分布特征。MDS分析语言数据,运用统计学功能对样本进行总体推断、参数估计和假设检验,通过多因素方差分析、相关与回归分析、聚类和因子分析等手段来分析变量之间是否存在相关性、相关强度,以及变量之间是否存在互相影响。

世界上的语言都有疑问词、疑问语义的组配现象,这是共性,但不同语言疑问语义的表现形式和组配方式又是不一样的,这是差异。基于统计学方法的语言样本整理和分析,不仅适用于语言之间的比较研究,也适用于某种语言的变量之间的影响分析。例如,我们研究汉语双重疑问词的语义组配及对疑问语义的影响,首先,要确定汉语疑问词的类别和数量。我们用函数式Y=f(x1,…xm, z1,…zn)描述疑问词与疑问语义的相关关系,疑问代词(x1,…xm)和疑问副词(z1,…zn)同为输入变量,是影响疑问语义(Y,输出变量)的属性变量。其次,建立SPSS数据集。将疑问代词定义为影响疑问语义的第一个属性变量,给变量赋值“谁=1”“什么=2”“哪里=3”“怎么=4”“多少=5”(x1,x2,x3,x4,x5),将疑问副词定义为疑问语义的第二个属性变量,给变量赋值“询问类=1”“测度类=2”“反诘类=3”(z1,z2,z3),编制疑问副词与疑问代词的交叉列联表,将疑问词组配数据输入到SPSS的数据视图中。最后,利用降维方法,将变量与变量之间的联系同时反映在一张二维或三维的对应分布图(散点图)上,对应分布图使联系密切的类别点较为集中,使联系疏远的类别点较为分散,通过观察对应分布图去直观把握不同变量类别的相似性和选择倾向性。

四、结 语

现代语言类型学基于传统语言类型学,其研究对象不限于有源流关系的亲属语言,还包括没有发生学关系的非亲属语言。现代语言类型学的主要任务是寻找世界语言所具有的共性规律,研究追求是解释性的共时研究而非传统语言类型学的描写性历时研究。以跨语比较考察不同语言之间的相关性和共性是现代语言类型学的主要研究视角。田野调查的执行内容、语义地图的多维构建以及多维尺度的数据分析等综合路径反映了现代语言类型学研究的科学内涵。

猜你喜欢

类型学语序共性
以考古类型学视角观察南宋、金境内出土瓷器的互动关系
共性
论音乐考古学研究中类型学方法的应用
“数控一代”示范工程引领和推动共性使能技术在中小企业推广应用
汉韩“在”字句的语序类型及习得研究
汉英倍数表达形式比较及其类型学考察
雷锋精神与辽宁精神的共性研究
类型学视角下的维吾尔语情态表达