基于态度意义的语篇组织文本可视化*
2017-12-07刘玉洁罗道玉
岳 颖 刘玉洁 罗道玉
(北京师范大学, 北京 100875;中共克拉玛依市委党校,克拉玛依 834000)
基于态度意义的语篇组织文本可视化*
岳 颖 刘玉洁 罗道玉
(北京师范大学, 北京 100875;中共克拉玛依市委党校,克拉玛依 834000)
语篇既是以词汇、语法为物质基础进行编码后的产品,也是意义展开和累积的持续过程。语篇的动态组织性常不为人所知,这是由于语言的书写体系掩盖语言系统的潜势,即选择性。本研究将语篇分析与计算机技术结合,尝试将评价系统中态度意义的语篇组织进行可视化设计与图形实现,旨在表征其连续性、动态性与整体性特征。首先,运用UAM CorpusTool软件对语篇进行态度成分的标注;其次,使用微软语言工具C#开发可视化软件处理标注好的文件;最后,生成流图,从而验证语篇组织可视化的可行性。
态度意义;评价系统;语篇组织;文本可视化
1 引言
可视化(visualization)是一种视觉呈现信息的技术,运用计算机程序将数据信息转换为图形或图像,直观表征信息之间的关系。文本可视化(text visualization)在数据可视化的基础上增加文本分析的内容,属于计算机图形学的前沿技术,能够展示隐含于文本中、容易被忽略的信息,还能够对大量文本信息进行概括从而有效定位核心内容,已经成为许多学科的辅助研究工具。
在系统功能语言学领域,目前已开发研制出一些用于语篇标注和语篇生成的软件,例如Systemics,WAG及UAM CorpusTool等,涉及可视化功能,但可视化程度都不高。以UAM CorpusTool为例,该软件被广泛应用于评价语言分析,能够对文本和图像进行整体或切分段标注,也能在一定程度上将文本流视觉化。但该软件的可视化功能表达信息非常有限,其形象化也不尽如人意。本研究尝试开发把UAM CorpusTool的标注结果导入并生成态度意义语篇分布图形的可视化程序,即能够与UAM CorpusTool对接的可视化程序。尝试将评价系统中态度意义的语篇组织进行可视化设计与图形实现,旨在表征其连续性、动态性与整体性特征。
2 文本可视化概述
2.1 普通视角的文本可视化
文本可视化可分为基于词汇、基于篇章内容、基于时间序列及基于主题领域4种类型。基于词汇的文本可视化针对文本中某一类特定词汇,计算机软件以关键词和关键词之间的聚合关系为条件搜索目标词汇。有些软件还可以追踪查询条件集合在文本中的发生频率和分布频率。基于篇章内容的文本可视化根据文本中的语义关系或词频模式提取主题内容。基于时间序列的文本可视化对一定时间跨度内的文本进行动态分析,能够识别文本内容的变化趋势。基于主题领域的文本可视化主要分析大规模文本之间主题领域相似或相异的趋势(赵琦等 2008:25-29)。
以基于主题领域的文本可视化为例,Galaxy是由美国西北太平洋国家实验室开发的二维可视化工具,以星云团呈现文本主题的聚集或离散特征;Theme View 则运用三维空间中的山峰与山谷呈现主题之间的关系,主题内容相近的文本聚集为山峰,山峰的高点代表文本数量多,低点代表数量少,两座山峰距离越近说明内容越相似。
2.2 语篇分析视角的文本可视化
目前,在有限的语篇分析可视化研究中,3种技术手段较为常用(Zappavigna 2011:215-226)。文本弧(text arcs)(图1)表征重复模式,弧形的两端区域覆盖相似或相同特征,应用于文本、代码、DNA及音乐等领域,其优势是将时间变量作为可控因素,不论数据具有多大长度和数量,都可以在一个页面内进行表征。对于语篇分析来说,文本弧可用于展示重复出现的语篇模式从而进行语类对比。流图(stream graph)(图2)属于堆积图,将不同变量以不同颜色的河流表示,流向以时间为横坐标,纵向排列的是以堆叠方式分布的变量。流图最初用于展现一段时间之内的电影票房,在语篇分析方面可用于提取语料库或语篇的主题词汇、呈现Twitter词汇的变化趋势等。动画网络(animated network)是三维动态图③,将文本视为具有自我调节功能的复杂系统,旨在模拟出信息之间的互动关系以及这些关系赖以发生的语境。该图模拟词汇相邻关系,以词汇为节点,用线连接相邻词汇,每发现相关词汇相邻一次,两个词之间的连线即缩短一些,它们在图上的距离就更近一些,为研究语篇内部的词汇关系提供便利。
以上文本可视化技术的适用对象不同,设计方案也不同,但观其本质都是使用者与技术手段以及文本之间互动的结果,目的都是为了减轻人们的认知负担。
图1 儿歌Hickory Dickory Dock的弧形图(Byron 2007,转自Zappavigna 2011:218)
图2 Twitter用户的话题流(Clark 2008,转自 Zappavigna 2011:222)
3 语篇组织研究概述
语篇组织(texture)是近年来语言学领域的一个热点课题,研究者的视野从词组、小句或小句复合体等结构性语法现象转向关注跨越小句的、指向语义关系的语篇现象。
3.1 语篇语义视角的语篇组织研究
在功能语言学理论框架内,语篇属于意义单位,是“任何口头或书面的、任何长度的、具有整体性的片段”(Halliday, Hasan 1976:1-2)。语篇组织是语篇区别于非语篇的重要特征,是使句子与上下文语境一致的语言机制(Halliday, Hasan 1976:1-2;Eggins 2004:24)。语篇组织研究旨在探索在形式上彼此分离的词汇或语法成分、句子、段落、多模态图文等单位如何组织、联接形成连贯的语篇,即意义在语篇中连续或变化的过程。
语篇组织的早期研究多围绕非结构性衔接展开,聚焦于如何通过照应、连接、替代、省略和词汇衔接5种方式从周围语篇中寻找线索从而解释句子中的词汇或语法项目。Hasan(1984:181-219)着眼于衔接与连贯之间的关系,提出“衔接和谐”理论。Halliday和Hasan(1985:70)扩大衔接的内涵,将结构性衔接手段也纳入其中。在后期研究中,衔接被视为具有语义结构的语篇系统。Martin(1992:31-379)将经典理论中的语篇组织资源发展为4个语篇语义系统,包括基于经验功能的概念系统(ideation)、基于逻辑功能的连接系统(conjunction)、基于语篇功能的识别系统(Identification)和基于人际功能的协商系统(negotia-tion)。Martin和Rose(2003:22-58, 175-201)增加评价(appraisal)与格律(periodicity)两个系统,前者是基于人际功能范畴的词汇系统,后者是基于语篇功能中的主位结构与信息结构。由此可知,语篇组织的基础是语义关系,其体现形式是语篇内的词汇与语法模式。早期研究关注跨越语法结构的衔接现象,后期研究转向更加抽象的语义层面。语篇组织可看成语境层、语义层和词汇语法层共同作用的结果。
3.2 评价系统的语篇组织研究
评价是功能语言学中表达人际意义的系统之一,分为态度、介入和级差3个子系统。针对评价语篇组织,国外学者主要聚焦语义韵律(prosody)的传递。Lemke(1998:8)提出评价衔接(evaluative cohesion),指语篇中一些离散的评价成分能够在相同的语义维度中得以统一从而与语篇的整体评价基调一致,是一种评价传播(evaluative propagation)现象。Martin和White(2005:19-20)将评价的韵律结构具体化为3种体现方式:渗透型结构(saturation)指评价成分分布于语篇的任意位置,因此语义韵是随机的;加强型结构(intensification)指评价成分随着语篇的展开重复出现,因此语义韵逐渐增强;主导型结构(domination)指有些评价成分支配并影响相邻语篇。Hood(2004:144)基于学术语篇评价意义的研究发展了主导型语义结构。她发现,有经验的作者往往使用显性态度标记语作为语义辐射的源头,在语篇中建立起语义韵辖域(prosodic domain),态度的消极与积极取向、铭刻式与引发式体现形式在辖域内是一致的,语义韵的改变往往标志着语篇进入新的阶段。Hood(2009:220)将学术语篇中的评价与语篇格律结合,发现超主位和超新信息中的评价意义具有前瞻和回溯功能。此外,评价韵律结构模式在语篇层具有适用性,态度可视为一种衔接手段,而且语篇中态度韵包括3种传播方式,即波浪韵(wave)、发散韵(dispersion)和梯度韵(scalar)。
国内学者对于评价语篇组织的研究倾向于建构综合模式。彭宣维(Peng 2009:98)认为评价系统的语篇组织(appraisal textuality)是一个3层级结构模式,按照由上至下的顺序,层级一是评价网格(fabric),由前景化的分项评价链条交互构成;层级二是基于叙述者视角、指向语篇宏观层面的整体评价趋势;层级三是作者视角的底层评价动机。孙铭悦、张德禄(2015:30)提出一个跨界面的评价语篇组织分析框架,从层次来看包括语境层、语义层和词汇语法层,从维度来看涉及宏观语类结构成分与微观措辞成分,还有一个修辞策略层作为中介层,其重点是评价与语篇元功能资源相结合的语篇组织机制。
综上所述,评价系统的语篇组织研究关注意义在语篇中展开的过程及其整体性。语义韵研究主要聚焦于语篇内部评价资源的分布,考察意义随语篇展开的累积方式;综合模式研究则结合篇内与篇外因素考察意义与语篇建构之间的关系,更加强调语境的作用。
4 态度意义语篇组织的可视化设计与实现
4.1 语篇组织可视化的意义
从理论角度看,语篇组织属于语义结构,位于比词汇语法更抽象的语篇语义层面。由于评价成分不受限于小句结构,评价系统的韵律特征涉及语篇层面的分析,贯穿语篇始末,分布在不同位置,随语篇动态展开。“可能是因为书写体系的演变大大掩盖韵律结构”(Martin, White 2005:19),我们很难通过书面语篇的形式表现人际韵律。“理论上来说系统功能语法形式化程度相对较低,而更多地强调语言的功能和语义层面。”(严恒斌 2011:32)这些因素既是语篇组织可视化的难点,同时也成为研究的突破点与动力。
从应用角度看,评价词汇在语篇中的离散性以及意义与措辞之间的错位现象使普通读者很难从整体视角与语义层面理解语篇的评价意义,即使对于语篇分析人员来说辨识语篇组织也有难度。因此,如果能开发可视化程序直观展示隐藏在文本背后的语义关系,将有助于深层次理解文本。此外,评价语篇分析的一个新趋势是基于大型语料库的应用型研究(郇昌鹏 2013:374)。目前,语料库的量化分析主要集中在频率统计,而可视化能够运用统计结果呈现语言特征使用的效果,从而进一步提高语料库的应用价值,可以说是基于数据的质性研究工具。
4.2 设计原理与绘图工具
可视化总体设计拟在一个二维图形界面上展现语篇中态度词汇的种类、分布以及频率。图形采用流图为蓝本,坐标系横轴表示语篇阶段,即语篇展开的过程;纵轴表示不同态度在语篇不同位置出现的次数,因有差别强奸此流的宽度代表态度发生的频率;上下坐标分别表示态度意义的极性(积极与消极);坐标系内黑、白、灰3种颜色代表不同的态度类别。
为了给图形处理提供支持,在具体实施时采用微软公司的第4代开发语言Visual Studio 2015集成开发环境中的C#.在数据处理方面,采用XML技术对UAM CorpusTool标注完成的数据进行解析,并采用哈希表(Hashtable)和链表(ArrayList)等数据结构进行存储和处理。在图形展现方面,采用GDI+(Graphics Device Interface Plus,增强的图形设备接口)技术进行开发,确保在不同展示设备上的通用性。GDI+为开发人员提供统一的、与各类外部显示设备(例如显示器、打印机等)进行交互的基础绘图方法。以绘制一条线段为例,线段本质上是从一个开始位置(X0,Y0)到一个结束位置(Xn,Yn)的一系列像素点的集合。开发人员通过调用GDI+的drawLine方法,由GDI+在视频内存中绘制一条从点A到点B的直线,GDI+读取点A和点B的位置,然后把它们转换成一个像素序列并且指令外部显示设备显示该像素序列。开发人员使用统一的绘图代码即可实现各类设备的差异化展示。
4.3 图形实现步骤与解析
4.31 态度标注
笔者首先使用UAM CorpusTool软件对示例语篇进行态度类别的标注,标注体系使用《汉英对应评价意义语料库》采用的方法(Cf.图1,彭宣维等 2012:4),借助数字表征评价系统,1-26代表不同的评价类别。由于本研究只针对态度意义,标注的数字范围为1-12。例如,图3中give my vote to 标注后在特征栏显示为“情感”类别中的“愉悦”子类别,数字标号为2,+表示积极取向。两位标注人员均熟悉评价系统并具有丰富标注经验,在分别标注后针对少数分歧进行讨论达成一致。接着,在UAM CorpusTool的安装目录中找到标注结果文件(appraisal.xml)(图4),其中详细记录每一个标注项在语篇中的位置及评价属性,这是后续工作的重要基础。接下来的处理过程都由笔者团队自行开发的UAM Tools工具完成。
图3 态度标注示例
图4 标注结果示例
4.32 数据归类整理
运用UAM Tools对标注后的数据进行整理,步骤如下:
(1)解析标注结果文件。借助XML处理软件,过滤标注结果的辅助信息,去除失效标注,并提取核心内容(图5)。例如,在《橘颂》中,第一个标注词语Golden在后台的存储格式为:
图5 appraisal.xml文件核心内容
(2)文本预处理。过滤掉一些与可视化无关的信息,如作者或段落之间的空行等。
(3)定位标注项在语篇中的位置。找到一个标注项在语篇中开始与结束的位置并将其归属到某个具体的语篇阶段。例如,“start=‘115’end=‘130’”表示give my vote to的第一个字母在语篇第115个字符处,最后一个字母在语篇第130个字符处,这个表达式的长度为15个字符。
(4)统计各个语篇阶段中不同态度类别出现的次数。通过以上步骤能够获得图形化展示需要的3个要素,即语篇阶段、态度的特征值以及频率。相关算法摘要如下:
①初始化段落列表;
②分段落循环处理(记录每一个态度的属性:段落、特征值;添加到段落列表);
③分段落循环处理(同一段落同一特征值计数);
④算法结束。
4.33 可视化呈现
运用以上步骤获得数据后即可进行可视化呈现。首先,进行画图前的准备工作,包括初始化Graphics类实例与创建窗体等工作,用StreamRea-der(数据流读取方法)按行读入数据;其次,逐行对已读入数据进行解析处理,得到坐标点的值;再次,对数据点进行叠加运算,计算出纵坐标点,将坐标点连线并逐个封闭曲线填色;最后,通过外设显示出来。图6与图7分别为语篇《橘颂》(GoldenFruit)与《射手》(AShooter)的可视化图形。
相关算法如下:
①定义平面坐标系;
②按行循环(数据拆分,类型转换,得到横、纵坐标;将数据对添加到泛型数据结构);
③格式化数据源后绘制数据线;
④相邻数据线围成闭合区域,闭合区域填色;
⑤算法结束。
图6 《橘颂》态度意义语篇组织流图
图7 《射手》态度意义语篇组织流图
4.34 图形解析
根据Martin和White (2005:42),态度系统包括情感(affect)、判断(judgment)与鉴赏(appreciation)。其中,情感用于表达感情与情绪,又可细化为意愿①(1) 、愉悦(2)、满意(3)以及安全(4);判断用于评价人的品质与行为,可细化为态势(5)、能力(6)、可靠(7)、真诚(8)以及恰当(9);鉴赏是评估事物与现象美学价值的资源,具体包括反应(10)、构成(11)以及估值(12)。每一种态度意义均有积极与消极取向。
本研究选取英国散文《橘颂》与《射手》作为语料。《橘颂》表达作者对于橘子的喜爱赞美之情,鉴赏在该语篇态度意义中占据主导,情感与判断运用较少(表1)。《射手》生动刻画出一个律师射手的虚荣心,判断为该语篇的主导态度,情感次之,鉴赏运用最少(表2)。
表1 《橘颂》中态度成分的统计数据
表2 《射手》中态度成分的统计数据
如图6所示,横轴刻度表示语篇自然段落。横轴之上代表积极鉴赏的黑色流区域贯穿语篇全过程,表现为连续状态,说明积极鉴赏成分运用于每一个语篇阶段。横轴之下消极鉴赏表现为断续状态,说明其成分只用于某些语篇阶段。积极鉴赏的高频率出现在语篇的第1、第2及第9自然段。以第9自然段为例,流的最高点对应纵轴上的刻度10,最低点对应刻度3,意味着积极鉴赏成分的频率为7次。消极鉴赏的高频率出现在第8与第9自然段,频率分别为5次和4次。该语篇中,情感使用频率较低,在图形中体现为灰色狭窄区域;判断最少,体现为零星白色区域。
结合文本可知,态度频率及分布与语篇阶段的主题内容相关,体现作者的写作意图。在语篇的起始与结尾阶段,作者借助于积极鉴赏直接称赞橘子的“美德”,其高频率在图形中凸显为流的宽度,构成语篇态度意义的主导基调。消极鉴赏主要用于评价其它水果从而与橘子形成对比,从第4自然段开始出现,在语篇结尾处最为密集。“对别的水果,采用的是攻其一点不及其余的方法,抓住其弊端,加以贬损,以此来突出橘子之美德,对于橘子,则一味讲好话。”(黄源深 2007:224)
根据图7可知②,白色流区域代表的判断使用频率最高。积极判断从开篇即出现,在第3自然段密集出现7次,这源于作者从语篇一开始就着笔刻画律师射手重视其射手名誉的行为举止。叙事情节在第3自然段达到高潮,射手出于虚荣心,在打中99只鹧鸪后谎称自己打中第100只并且吹嘘自己的“非凡成就”。这里需要指出,作者运用许多积极判断成分建构语篇的嘲讽基调。故事的高潮还体现在积极情感与消极鉴赏的运用,在图形中体现为第3自然段横轴上下流的起伏。随着语篇进入尾声,射手的真面目逐渐明了,语篇基调从积极判断变为消极判断。“文章的层次非常清楚,作者一步一步地向读者展示可恶的虚荣心可以诱使人干出怎样卑俗的事情。”(黄源深 2007:57) 在这一语篇中,情感的展开过程与判断保持一致,语篇前半部分以积极情感为主导,后半部分转入消极情感;鉴赏使用较少,图形中体现为狭窄区域。
对比图6与图7发现,可视化图形上的差异反映出语篇内容的不同。《橘颂》意在颂物,鉴赏运用最多, 作者对橘子的偏爱在图形中表现为积极鉴赏的连续状态。《射手》意在绘人,判断运用较多,作者层层铺垫、以嘲讽的语气向读者展示射手的虚荣心,积极判断与消极判断均表现为断续状态。通常情况下,语篇中的人际意义时强时弱,时而明晰,时而隐晦,跨越词组或小句,分布于整个语篇,其效应是累积性的。Halliday(1979:66-67)将这种如同音乐中韵律一般的结构称为韵律结构。不同于语篇的纯文本模态和单纯基于频次的数据统计,可视化图形作为质性工具能够模拟出评价意义的韵律模式。
5 结束语
语言与图形属于符号资源,都具有丰富的表意功能,但二者抽象与具象程度不同,将语言使用视觉化更利于直观、概括地呈现文本不能体现的信息。本研究基于态度体现成分,自行开发可视化软件UAM Tools,与已有标注软件UAM Corpus Tool对接并整合数据,将态度意义的语篇分布模式以图形方式直观呈现出来,不但有效展示态度意义的动态与韵律特征,也验证将语篇过程可视化的可行性。宏观意义上,希望研究为数字时代背景下语篇分析辅助工具的开发带来新思路。
本研究仅是一个初步尝试,有其局限性。该软件不能体现态度的明晰程度,比较适用于篇幅较短的语篇。此外,评价意义十分复杂,图形展示应该与文本分析相互配合。在提升空间方面,可以考虑开发自成体系的多功能软件,既具有作为可视化最初环节的标注功能,也具有作为最终环节的图形转换功能。如果一个软件能纳入上述不同环节,那么其应用价值将大大提升。要实现这一点,需要建设具有跨学科分工的团队。
注释
①括号内的数字标号是各类态度在标注体系中的标号。
②《射手》原文中并没有段落,为了制图,笔者根据语篇内容进行段落划分。
③由于图像印刷效果不佳,敬请读者参阅原著。
郇昌鹏. 评价系统研究的新趋势:第一届评价系统研讨会综述[J]. 当代语言学, 2013(3).
黄源深. 英国散文选读[C]. 上海:上海外语教育出版社, 2007.
彭宣维 杨晓军 何中清. 汉英对应评价意义语料库[J]. 外语电化教学, 2012(5).
孙铭悦 张德禄. 评价系统组篇机制研究[J]. 现代外语, 2015(1).
严恒斌 Webster, J. 功能及语篇结构的标注和可视化:基于协作性云计算平台的实现[J]. 北京科技大学学报(社会科学版), 2011(4).
赵 琦 张智雄 孙 坦. 文本可视化及其主要技术方法研究[J]. 现代图书情报技术, 2008(8).
Eggins, S.AnIntroductiontoSystemicFunctionalLinguistics[M]. New York: Continuum, 2004.
Halliday, M.A.K. Modes of Meaning and Modes of Expression: Types of Grammatical Structure, and Their Determination by Different Semantic Functions[A]. In:Allerton, D.J., Carney, E., Holdcroft, D.(Eds.),FunctionandContextinLinguisticAnalysis:EssaysOfferedtoWilliamHaas[C]. Cambridge: Cambridge University Press, 1979.
Halliday, M.A.K., Hasan, R.CohesioninEnglish[M]. London: Longman, 1976.
Halliday, M.A.K., Hasan, R.Language,ContextandText:AspectsofLanguageinaSocial-semioticPerspective[M]. Geelong: Deakin University Press, 1985.
Hasan, R. Coherence and Cohesive Harmony[A]. In:Flood, J.(Ed.),UnderstandingReadingComprehension:Cognition,LanguageandtheStructureofProse[C]. Newark: International Reading Association, 1984.
Hood, S. Appraising Research: Taking a Stance in Academic Writing[D]. Sydney University of Technology, 2004.
Hood, S. Texturing Interpersonal Meaning in Academic Argument: Pulses and Prosodies of Value[A]. In:Forey, G., Thopmpson, G.(Eds.),TextTypeandTexture[C]. London: Equinox, 2009.
Lemke, J.L. Resources for Attitudinal Meaning: Evaluative Orientations in Text Semantics[J].FunctionsofLanguage, 1998(1).
Martin, J.R.EnglishText:SystemandStructure[M]. Amsterdam: John Benjamins Publishing Company, 1992.
Martin, J.R., Rose, D.WorkingwithDiscourse:MeaningBeyondtheClause[M]. London: Continuum, 2003.
Martin, J.R., White, P.R.R.TheLanguageofEvaluation:AppraisalinEnglish[M]. London: Continuum, 2005.
Peng, X.-W. Appraisal Textuality in Discourse: A Case Observation from the Motivation Perspective[A]. In:Huang, G.-W.(Ed.),StudiesinFunctionalLinguisticsandDiscourseAnalysis[C]. Beijing: Higher Education Press, 2009.
Zappavigna, M. Visualizing Logogenesis: Preserving the Dynamics of Meaning[A]. In: Dreyfus, S., Hood, S., Stenglin, M.(Eds.),SemioticMargins:MeaninginMultimodalities[C]. London: Continuum, 2011.
定稿日期:2016-12-12 【责任编辑孙 颖】
VisualizationoftheTextureofAttitude
Yue Ying Liu Yu-jie Luo Dao-yu
(Beijing Normal University, Beijing 100875, China; Party School of CPC Karamay Municipal Committee, Karamay 834000, China)
attitude; appraisal; texture; text visualization
*本文系2015年度中央高校基本科研业务费专项资金项目“学术语篇人际意义的建构”(SKZZY2015062)和教育部留学基金委青年骨干教师出国研修项目(201506045061)的阶段性成果。感谢广东外语外贸大学彭宣维教授对本研究的启发。
H0-05
A
1000-0100(2017)02-0038-7
10.16263/j.cnki.23-1071/h.2017.02.006
Text is viewed not only as a product encoded with lexis and grammar but also as an ongoing process in which meanings unfold and pile up. The dynamic feature of text, however, is largely unnoticed, due to the fact that system potentials (linguistic choices) are obscured by the mechanisms of written text. Aiming to manifest the dynamic, continuous and wholistic features of attitude, this study attempts to visualize the texture of attitudinal meanings through a disciplinary collaboration between discourse analysis and computer technology. The study applies UAM CorpusTool for text annotation and Microsoft C# for visualization software programming. It proves that stream graph is a practical tool to display texture.