学术英语语块发展研究动态路径：复杂系统建模∗

2019-07-20段士平

外语学刊 2019年1期

段士平

（中原工学院，郑州 450007）

提要：复杂动态系统最初应用于自然科学领域，它由于关注语言发展的非线性和动态交互性特征而成为近年二语习得领域的研究热点。本文梳理学术语块和基于复杂动态系统的二语习得研究现状后发现：学术语块发展呈现出非线性、U 型波动发展态势，但国内采用动态研究方法极其匮乏，急需推广建模方法；然后论证基于复杂系统建模方法的理论基础，并阐述学术语块发展建模研究方法的步骤。最后，本文认为，基于复杂系统的建模研究有助于推动语言学研究向复杂性科学转向，作为全新的科学观和方法论，能够为语块研究提供新的研究范式，为语言学的跨学科研究在方法论上提供证据。

1 引言

复杂动态系统（Complex Dynamic System，简称CDS）是近年来应用语言学跨学科研究的主题（Larsen-Freeman，Cameron 2008）。作为一种新的理论视角和研究范式，CDS 超越线性因果关系，倡导以系统的复杂性和变异性为研究核心，采用整体论范式考察双向因果关系（van Greet 2003：640，de Bot et al.2007：7）。CDS 广泛应用于自然科学领域，近年来国内外学者将其应用于语言学领域，研究影响语言能力发展的众多维度之间的复杂关系。

学界对学术语块的普遍性和重要性已经达成共识，研究对象和范围日趋全面完整，研究视角从宏观走向具体。国内外相关研究发现学术语块发展出现“高原现象”，呈现出非线性、U 型波动发展态势（段士平 2007：27，屈典宁 2016）。但是单一视角的静态研究无法给予充分阐释，面临研究范式接口问题，而跨学科创新研究和人本研究能够解决此类问题。CDS 作为一种有价值的跨学科主题，是指导应用语言学实证研究的一般性原则，当前相关研究已大量涌现，可为学术语块研究提供理论框架和研究范式。

本文从CDS 出发，采用电脑建模的方法，对电脑模拟结果和真实数据进行比较，动态跟踪考察影响语块能力发展多因素的复杂交互作用，揭示它们之间支持和竞争的关系，构建基于CDS 语块能力发展模型，将有助于探索新型有效、适用于我国学术英语语块能力发展的课堂教学模式。

2 学术语块发展研究现状

2.1 学术语块发展研究稀缺的不足

学术语块指学术英语语篇中高频出现、作为整体储存和提取的多词单位，包括短语、搭配、固定结构、类联接和程式语等，是构建学术语篇标识性特征的重要手段，是区分专家与新手的重要标志（Wray 2002，魏兴等2017）。国外相关研究侧重于不同学科领域的学术语块差异并创建语块表，强调学术语块的教与学的研究。而国内研究视角较为单一，主要围绕学习者与本族者学术语块使用差异展开，有关如何消除两者之间差异、恰当有效地帮助学习者发展语块能力的研究较少。

国外研究主要考察3 个方面：（1）不同学科之间学术语块使用与分布上的差异性，侧重于提取特定学科的特色语块，探讨学术语块的分布频率、结构形式及功能方面的语域特征和学科差异（Biber et al.1999，Hyland 2008：4-21）。而国内这方面的研究相对匮乏。（2）常用学术语块表的整理和创建（Simpson-Vlach，Ellis 2010：487）。而国内该方面的研究近乎为零。（3）学术语块的教学应用（Li，Schmitt 2009：85）。上述研究表明，语块应作为学术英语的教学重点，且教学上应确保语块的可教性。

国内研究侧重中国学习者和本族语学者在学术写作中语块使用的比较研究：研究对象以元话语为主，包括立场标记语、身份语块（徐昉2012：51）。语篇内部结构研究日益具体、细化，尤其针对论文组成部分，如摘要语步语块、引言语块。上述研究大多基于短语学理论，采用语料库对比的实证研究方法，揭示学习者较本族语者在学术语块使用方面的不足，发现学习者学术语篇存在过多或过少使用学术语块的现象，缺乏学术语块语用意识，不能区分其语用功能，也不能恰当地表达语篇立场以增强说服力。由此可见，学术语块是二语或外语学习的难点，仅靠隐性输入，学习者很难注意并习得语块。学习者如何有效习得学术语块，国内相关研究甚少。

2.2 学术语块的复杂性和非线性特征

语块是一个形式、意义和功能结合的复杂语言系统，语块习得具有非线性和动态交互性（Ellis et al 2008：375）。首先，语块复杂性体现在两个方面：一是语块系统是由结构、韵律、语义等诸多子系统组成，子系统之间相互联系、彼此交互；二是语块意义建构具有复杂性。基于使用的语言观认为，语块意义建构重点在于其使用过程（Tomasello 2010），重复使用的频率是触发组块的首要条件。其次，语块习得呈非线性，具有动态交互性。国内外研究发现，二语语块习得也是一个复杂的动态过程，其运作受语块本体成分、认知与情境语境等子系统的交互影响，其发展轨迹是非线性的（ Larsen-Freeman，Cameron 2008；蒋苏琴2016）。Ellis 等认为语言水平、语块频率与互信息值交互影响，学习者语言水平决定语块学习的影响因素（Ellis et al.2008：375-396）。Webb 等呼吁语块学习应考虑语块的语义透明度（Webb et al.2013：91）。Peters 发现，母语一致性和短语搭配类型结构也是影响语块学习负荷的重要因素（Peters 2016：113-138）。而国内采用动态研究方法，有针对性地揭示语块发展复杂性和非线性的深入研究较为少见。仅有郑咏滟和王海华等的研究有所涉及，但是均以词汇产出为研究对象（郑咏滟2015：276-288，王海华等 2015：67-80）。

3 基于CDS的建模研究现状

3.1 二语习得领域内的CDS研究状况

CDS 在语言学领域备受关注，但研究深度和广度有限。1997年Larsen-Freeman 提出将 CDS应用于二语习得领域，经过十多年发展，研究成果丰厚且具有启发意义。2008年她提出“二语发展”（Second Language Development）的表述更能体现语言学习过程的特点，2014年在《语言教学》（Language Teaching）上发文详细阐述由“二语习得”（SLA）变成“二语发展”（SLD）的12 个理由。可见，CDS 理论框架不断完善，实证研究进一步深入。检索中国知网发现，2008-2015年期间，国内语言学学科领域内有关复杂动态系统理论研究的论文共计121 篇，且逐年增加，2012年为分界线：此前有关复杂或动态系统理论研究的论文不足十篇，2012年后该方面的文章逐步增多，2015年数量翻倍上涨，多达41 篇，研究视角逐步拓展。但绝大部分研究属于CDS 理论引介和研究视角的思辨性理论阐释（李兰霞 2011：409）。相关实证研究数量较少，仅有4 篇（郑咏滟 2015 等）。实证研究中定性研究较多，定量研究较少，关注二语语块发展机制的研究更是少见。

3.2 二语习得领域内的CDS研究方法

国外研究（Larsen-Freeman，Cameron 2008）认为适用于动态系统的研究方法多种多样，包括定性和定量方法、纵向历时研究、与语料库结合、与语篇分析结合研究、电脑建模等。van Geert 和Verspoor 等也提出电脑建模适用于动态系统的研究（van Geert 2008：179，Verspoor et al.2011：143）。采用建模方式模拟真实语言环境，通过改变参数，观察结果，模拟变化条件来探索语言系统内部变量之间的关系，推断各个变量如何在时间推移中交互作用，这既是对传统研究方法的颠覆，也是一种很好的补充（王士元2006：17，李兰霞2011：417）。但是囿于跨学科技术所限，至今为止，国内外相关研究鲜见基于CDS 的二语发展建模研究。国外已有研究多采用CDS 特有的、van Geert 和 van Dijk（2002：340）首创的移动极小—极大值图表法来观测复杂的数据变化（Spoelman，Verspoor 2010：532；Polat，Kim 2014：184）。CDS研究又引入再抽样技术和蒙特卡罗模拟等数据分析方法，用以弥补CDS 实证研究样本数据较小、缺乏统计意义的不足。国内类似研究仅有郑咏滟一例（郑咏滟 2015：280）。其它两项基于 CDS 的实证研究均与语料库结合，采用定性定量相结合的研究方法。但每种方法均有其局限性和缺陷，基于CDS 的研究方法尚需调整。由此可见，二语发展领域内CDS 的研究方法较为单一，需采用建模方法补充传统研究方法的不足，突破数据分析方法的局限性。

4 基于CDS建模方法的理论基础

基于CDS 的二语习得研究发现：二语语块发展系统呈非线性；影响其发展的多因素（即变量）之间属于动态交互、完全联结的关系。因此，运用复杂动态系统理论预测语块发展的共同规律对二语发展研究至关重要。但是检验二语语块发展的非线性特征和动态规律存在以下困难：（1）如何从众多变量中确定有价值的变量，它们之间存在何种耦合关系；（2）如何科学合理地预测个体二语的非线性发展结果。

由于二语语块发展系统是“部分信息已知，部分信息未知”的“少数据”“贫信息”不确定性系统，因此，运用灰色系统理论开展建模研究是解决上述挑战的有效工具（刘思峰等2014：13）。灰色系统预测方法通过原始数据的处理和灰色模型的建立，挖掘系统演化规律，科学地定量预测系统的未来状态。换言之，运用灰色系统预测方法对灰色系统内部各个因素之间的不确定关系，及在一定范围内变化的、与时间有关的灰色过程做出科学推测。选择哪一种灰色预测模型，首先需要针对具体问题进行充分的定性分析，然后经过多种检验才能确定该模型是否合理、有效（同上：237）。

本文以学术英语语块能力发展为研究对象，以复杂动态系统为研究视角，从影响语块能力发展多因素出发，考察其发展的非线性和复杂交互性。具体而言，就是把影响语块能力发展的多因素分为3 个维度多个因素，采用历时设计，运用灰色系统建模方法建立语块能力发展模型和交互动态模型，电脑模拟、动态考察影响因素之间的交互作用及发展态势，描述学术语块发展的非线性特征，并跟踪研究修正和推广语块能力发展模型。

5 基于CDS学术语块发展建模研究方法

基于复杂动态系统理论，本文尝试解决以下问题：在学术语块能力发展过程中，语块的结构类型、语义透明度、母语一致性、韵律特征、频率以及学习者的英语水平等因素之间是否存在交互关系；如果存在，是竞争关系还是支持关系。

按照“建模—求解—验证—电脑模拟—模型优化”的步骤，建立学术英语语块能力发展模型。在电脑建模之前，首先梳理文献确定影响语块发展的多因素变量或生长点；然后跟踪提取学术语块，采集相关数据。将电脑模拟数据和实验数据进行视觉化比较，考察语块能力发展复杂系统的交互模式和发展模式。基于CDS 建模方法如下：

（1）模型建立：针对上述问题，观察现有数据的状态和可变性的发展趋势，对这些数据定性分析，利用反演理论，建立关联生长点的非线性动态交互混沌模型，即微分方程模型或差分方程模型。例如，我们分析不同时刻学习者掌握的语块数量，记t 时刻的语块频数为yt，t +1 时刻的语块数量为yt+1。因为学习者此时刻掌握的语块数量依赖于上一个时刻的语块掌握量，然后根据这些调查的数据建立观察者的语块发展模型yt+1=f（yt），这是一个差分方程，它可以是线性的，也可以是非线性的。以前研究者建立过简单的线性模型，认为语块一直呈递增趋势，近年来这种发展模式受到质疑，于是人们建立非线性发展模型，较简单的模型就是Logistic 模型 yt+1=r∗yt∗（1-yt），Logistic 模型最初是研究人口发展模型提出的。近年来英语学习能力研究者借助这些模型建立的模型Lt+Δt=Lt +Lt∗r∗Δt∗（1-Lt／Kt）是一个一维模型（ Dromi 1986：220-245）。大量研究表明，某时刻语块量掌握的多少不仅仅与前一个时刻掌握的语块数量有关，还与语块的语义透明度有着某种内在的联系，于是，我们运用Verspoor 等的模型，建立语块数量与语义透明度的耦合模型，如下所示（Verspoor et al.2011：158）：

这些参数与变量的意义参见文献，此处不再详述。通过上述模型的示例分析，作者拟将大量的调查数据作为研究基础，建立系统预测模型，因为对于含有多个相互关联因素和多个自主控制变量的复杂系统，任何单个模型均不能反映系统的发展变化，须考虑建立系统模型，才能对语块能力的发展进行客观反映、有效预测（刘思峰等2014：253）。

（2）模型求解：非线性混沌模型的精确解很难求得，首先运用相应数学方法对差分方程给定初值利用迭代求解，然后运用相关软件和计算机技术形象化展示，检验关联生长因子之间可能存在的不同耦合关系：支持关系、竞争关系或前提关系，确定有价值的互动变量和模型发展总体趋势。

（3）模型验证：运用统计学的相关方法对模型参数进行灵敏度分析、误差分析和稳定性分析，验证模型的可信度与适用性，确定该模型是否真实、有意义，是否具有可推广价值。如果误差较大，可考虑修改参数或者增加变量等。

（4）电脑模拟：基于多 Agent 的复杂系统建模仿真方法是目前研究复杂系统重要甚至是唯一手段，是复杂系统研究领域的热点问题，利用Swarm平台对语块能力发展复杂系统进行多Agent 整体建模仿真。在美国不少专家开展相关的研究，且成立专门的计算语言实验室或语言模拟实验室。如芝加哥大学的Jason Riggle 及其团队的研究领域包括：基于Agent 建模的语言学习和语言变化研究，基于Agent 建模的语言演变研究，以及基于Agent建模的多语和多方言习得研究等。

（5）模型优化：对上述模型推广应用，开展教学实践，跟踪分析刻画学生语块能力发展趋势，讨论前述建模结果的意义。同时，限制参数范围、考虑噪声因素等，使其模拟数据与测量数据达到拟合最优化，据此修正模型。

6 结束语

复杂动态系统理论的语言观作为新的科学观和方法论也为语块研究提供全新的研究范式，有助于推动语言学研究向复杂性科学转向，采用整体论阐释语言发展机制，为跨学科互补和整合研究提供理论基石，深化对语言研究理论目标的认识，全面系统深入揭示语块发展的复杂交互性和非线性特征。

建模是一种自下而上的研究方法，基于CDS建模历时研究语块能力发展，通过比较模拟结果和真实数据，能够突破还原论线性研究方法的藩篱，凸显语块发展不同因素之间的联动发展关系，有效地分析和揭示他们之间的交互模式和非线性发展模式。创建语块能力发展复杂系统模型有助于弥补静态研究缺陷，突出动态考察特点，是对传统研究方法的有效补充，为语言学的跨学科研究在方法论上提供证据。