基于复杂网络视角的《现代汉语词典》与《国语辞典》常用动词释义元语言研究
2016-07-09徐德宽何保荣邱立坤
徐德宽 何保荣 邱立坤
摘 要:词典释义元语言作为一种特殊语言形式,具有重要的研究价值。本文以HSK汉语水平考试大纲中的动词为母本,选取《现代汉语词典》(第六版)和《国语辞典》(修订版)中共有的608个词条,以其在各自词典中的释义作为语料,构建字同现网络,以复杂网络的视角对其进行了多方位的研究,解释了其在小世界性、无标度性、居间中心性、层次性和匹配度等方面的特点,揭示了词典释义元语言字同现网络独特的复杂网络性质,拓宽了语言网络研究的领域和范围。
关键词:动词;释义元语言;字同现网络;复杂网络
中图分类号:H0-0 文献标识码:A 文章编号:1003-6822(2016)02-0002-12
1. 引言
网络在自然界和人类社会中普遍存在,自然界中的天然星系、神经网、食物链网络,人类社会中的社交网络、疾病传播网络以及人类创造的通信网络、交通网络等都属于复杂网络。作为一门新兴科学,复杂网络是对普遍存在的网络现象及其复杂性进行解释的一门学科。
近年来,复杂网络研究日益成为学界研究的热点,语言网络研究的成果更是不断涌现,比如,词同现网络、依存句法网络、词汇联想网络和辞典网络等(Jin and Liu, 2014; Li and Zhou, 2007; Sheng and Li, 2009; Solé, 2001; Solé et al, 2010; 林枫 等,2012; 韩普 等,2014)。其中,对于汉语语言网络的研究也不乏其例,如An empirical study of Chinese language networks一文以实验的方法说明了语言网络的小世界效应、无标度网络结构、异配性等特点,得出汉语言网络与其他复杂网络在其发展进程中可能具有共同特点的观点 (Zhou et al, 2008);(Cong and Liu, 2014)。梁伟等的Modeling the Chinese language as an evolving network 则提出了一个发展中的语言网络模型,并通过模拟共生网络发现了在旧词中高频出现的词语在构建新词时经常被重新启用的现象(Liang et al, 2014)。同现网络研究是语言网络研究的重要构成部分,许多学者对其进行过深入研究(韩普、王东波、路高飞、苏新宁,2014;梁伟 等,2012;刘知远 等,2008)。
“元语言”这一概念来自哲学。词典学中,元语言是指用来解释词典所收词语的定义语言,有学者称之为“释义元语言”(苏新春,2006)。词典学注重实践,收词释义是词典的基本内容,因此,以解释词语为己任的元语言研究就成了一个重要方面。
词典释义元语言作为一种特殊语言形式,具有独特的研究价值(李葆嘉,2002)。许多学者对汉语词典释义元语言进行了孜孜不倦的研究,得出了重要的成果(安华林,2009; 苏新春,2006)。但这些研究大都是基于直觉和定性研究得出的结果,但对于词典释义元语言的定量对比研究却鲜有人涉及。本文以HSK汉语水平考试大纲中的动词为母本,选取《现代汉语词典》(第六版)(以下简称《现汉》)和《国语辞典》(修订版)(以下简称《国辞》)中共有的608个词条,以其在两部词典中的释义作为语料(参见刘珺、徐德宽等,2014),构建了字同现网络,力求对两部词典的释义用词在小世界效应、无标度特征、层次性、居间中心性和匹配度等方面的进行量化的对比,以便更为精确而深入地探求汉语释义元语言的底层特征及其本质。
2. 字同现网络
字同现网络是一种基于大规模语料库的语言网络。本质上,它可以揭示人类语言的某些特性,是近年来语言研究中的一个非常重要的、新的方向。
字同现网络的构建:语料中所包含的每一个字对应着字同现网络中的一个节点,若两个字之间在n阶马尔科夫链①的条件下存在同现关系,则认为这两个节点之间存在一个连接。(Solé, 2001)本文所构建的词典释义元语言字同现网络为1阶有向同现网络,即把词典释义中紧密相邻的两个字符连接起来,构成一个网络。
例如,《现汉》对于“爱”“喜欢”和“爱好”三个词条的释义为:
爱:对人或事物有好感或感兴趣。
喜欢:对某种事物具有浓厚的兴趣。
爱好:喜欢。
《国辞》对于“愛”“喜歡”和“愛好”三个词条的释义为:
愛:喜好、親慕。
喜歡:喜愛。
愛好:喜好。
图1、图2(见下页)是分别是《现汉》和《国辞》对上述三个词条的释义所构建的字同现网络示意图。
图1中,首先以“对”为一个节点,由该节点发出的两条边连接了它的两个邻居节点“人”和“某”,其中,由“某”发出的一条边又连接了节点“种”,“种”又连接了“事”,按照箭头方向依此类推,即形成这样一条字符链:“对→某→种→事→物→具→有→浓→厚→的→兴→趣”。相应地,由“人”这个节点发出的边连接了“或”这个节点,以此类推形成了字符链“对→人→或→事→物→具→有→浓→厚→的→兴→趣”。另外,“喜→欢”单独形成了一条字符链。
图2则是以“喜”为一个节点,由它发出两条边连接了“愛”和“好”这两个节点,另外,“好”这一节点通过标点“、”(本文中的标点符号也被包括在同现网络中)依此连接起“親”和“慕”两个节点。
字同现网络中,度(degree)是指与某个节点连接的其他节点的数目,连接某个节点的边的数目就表示该节点的度。一般而言,一个节点的度越大则表示该节点在某种程度上越重要。比如,与“某”这个节点连接的有两条边,那么它的度就是2。本文字同现网络采用的是有向图,有向图指节点的度是有向的,包括出度(out-degree)和入度(in-degree)。比如,连接“某”这个节点的边是由其发出的一条边和指向它的一条边组成,前者我们称之为出度,后者则称之为入度。图中,箭头所指的方向限制了节点之间连接的顺序,使其构成了一个有向网络(directed network)。
3.网络的性质
在同现网络中,小世界效应、无标度特征、层次性、居间中心性和匹配度等是其几个主要的特性(Liu et al, 2008; Newman, 2003; Solé, 2001; Yu et al, 2011),因此,本文将从这几个方面对《现汉》和《国辞》释义元语言字同现网络进行计量研究,并分析出两者的特征和差异。
3.1 小世界效应
何为“小世界效应”?简单来讲就是网络中的任意某个节点仅通过为数不多的几步就可以达到网络中的其他任何一个节点(郭世泽,2012)。有的网络具有很大的尺寸,但是网络中任意两个节点之间的距离相对较小。此外,这种网络还有着较高的集聚系数。著名的“六度分离理论”就是很好的解释。“六度分离”源于20世纪60年代美国哈佛大学心理学家米尔格拉姆(Milgram)的实验假设:在大多数人中,任意两个素不相识的人通过朋友(或朋友的朋友),平均最多通过六个人就可以彼此认识(瓦茨,2011)。
1998年美国科学家瓦茨和斯特罗加茨在《自然》杂志上发表了“‘小世界网络的群体动力行为”一文,推广了“六度分离”假设,提出了小世界网络模型(Strogatz, 1998; Watts and Strogatz, 1998)。
网络的小世界性与其平均最短路径长度d和较大的网络聚类系数C有关。若i和j表示网络中的两个节点,将dmin(i,j)定义为网络中i和j两个节点的最短路径,则节点i与其他所有词的平均最短路径为:
那么,网络的平均路径长度为:
另一个与网络的小世界效应密切相关的变量是聚合系数C,网络的聚合系数指网络中某个节点的任意两个邻居节点互为邻居节点的概率。网络聚合系数的公式为:
设网络的平均度为k,那么该网络的聚合系数为Crandom≈k/n,,平均路径长度为drandom≈lnn/lnk。如果网络的平均路径长度d≈drandom,,聚合系数C>>Crandom,,则该网络具有小世界效应。
3.2 无标度特征
在有些网络中,存在极少数节点(关键节点),这些节点与数量众多的其他节点相链接;而其他的大部分节点只与少量节点链接。由于包含这类关键节点的网络的度无明显特征长度,所以被称为无标度网络。无标度网络由大量低度节点和少量高度节点构成,具有“增长”和“优选”两个特征:增长是指复杂网络是开放的系统,随着新的单元的不断加入,节点总数也在不断上升;优选则是指一个节点连接新节点的概率主要依赖于节点已有的度,且优先和度数比较大的节点连接。
无标度特性是指度为k的节点在网络中出现的概率P(k)要满足幂律分布(长尾分布)P(k)~k。该公式表明,度k的值越高,度为k的节点的数量(P(k))就会越少,节点出现的次数(P(k))与该节点的度的幂(k)成反比关系(负号表示反比例)。
3.3 层次模块性
模块(module)是指一组连接在一起的、具有相对独立功能的节点,许多网络中的模块是按等级组织起来的,这样就形成了一个等级网络(hierarchical network)。网络的层次性一般通过平均度k 与网络聚合系数C(k)这两个参数来观察。许多网络的平均度-聚合系数(k-C(k))的分布图呈幂律分布:C(k)~k ,且≈1。该公式说明,一个网络的平均度k值越小,则该网络越具有较高的聚合系数,属于高度连接的模块;平均度k值越高,则该网络越具有较低的聚合系数,属于低度连接的模块。一般而言,度较高的节点具有较低的聚集系数,其作用是将不同的模块连接起来。在层次模块性网络中,许多内部联系密切的小规模节点组之间松散关联,这些联系松散的小模块又构成了规模更大的模块。
3.4 居间中心性
居间中心性又叫“中介度”,指网络中某个节点连接其他(任意两个)节点时的最短路径的条数,其他任意两个节点要产生联系,必须经过该节点的连接。居间中心性体现了某些节点在网络连接中的重要作用。我们定义节点v的居间中心值为g(v),Gv(i, j)表示节点Si、Sj之间通过节点v的最短路径的条数,G(i, j)表示节点之间所有的最短路径条数,即G(i,j)=。那么gv (i, j)=Gv (i, j)/G(i, j)可以表示节点v在节点i和j的联系中的重要性。
3.5 匹配度
匹配度是指网络中各节点在度连接方面的相似性,即是否高连接度的节点与高连接度的节点相连。网络中,如果高连接度的节点倾向于同高连接度的节点相连,则该网络具有同配性;反之,高连接度的节点倾向于同低连接度的节点相连,则该网络具有异配性。网络的匹配度可通过匹配系数Γ来测量:
若Γ>0,网络同配;若Γ<0,则网络异配。
4. 《现汉》与《国辞》字同现网络的对比
本文以HSK汉语水平考试大纲中的动词为母本,选取《现汉》和《国辞》中共有的608个词条,将其在各自词典中的释义作为构建网络的基础语料。我们用自编程序提取2元字串,构建了字同现网络,然后用Cytoscape 2.83②、Network X③和Pajek 4④等开源的复杂网络处理软件计算了网络基本参数,并用Origin 9.1科学计算与制图软件对数据进行了拟合,得出了《现汉》和《国辞》常用动词释义元语言字同现网络的基本数据(表1)。
4.1 网络基本数据对比
从表1可以看出,《现汉》网络的节点总数为1201,而《国辞》的节点总数为1246。即《现汉》中释义元语言所使用的字种总量为1201个,《国辞》则为1246个。《现汉》网络的总字频为9142,《国辞》的总字频为6083。
两者的节点总数较其总字频的数量小很多。释义元语言的功能是完成对其他词语的描述和说明,因此,其数量必须限定在一定数量范围之内。有限量是元语言形成的一个外部特征,同事又是其内在素质要求的体现。只有“有限”才能具有“元”语言的资格,才能更好地体现其表意功能(苏新春,2006)。而用有限量的词语来描写大数量的语义,无疑大大提高了词语的使用频率。《国辞》的总字频比《现汉》少很多。我们知道,《现汉》使用简体字,而《国辞》使用繁体字(正体字)。繁体字中异体字较多,在汉字的规范化和简化过程当中,部分异体字被取消使用,许多繁体字被合并成了一个简体字。基于这一原因,《现汉》释义元语言所使用的字种的总量比《国辞》要少是有据可循的,体现在释义元语言网络上,就是《现汉》的释义元语言网络比《国辞》的节点要少。这说明在释义上《国辞》比《现汉》要简明,而《现汉》比《国辞》更为详尽。
《现汉》网络的边数为5120,而《国辞》的边数为3868。字同现网在某种程度上可以看作是一种表层组合关系网络,《现汉》的边数比《国辞》多,则说明《现汉》释义元语言里的组合关系的类型比《国辞》的多。
《现汉》网络的平均度为8.159867,而《国辞》的平均度为5.94061。如上所述,一个字的度能够反映该字的组合能力,《现汉》的平均度比《国辞》大,说明《现汉》释义元语言用字的平均的组合能力比《国辞》要强。这其实是上述三种效应综合作用的结果:《现汉》网络的节点数比《国辞》少,而总字频和边数都比《国辞》多,三个方面综合作用下,形成了《现汉》释义元语言网络的平均度要大于《国辞》。这说明在《现汉》释义元语言里,字的组合能力要比《国辞》的组合能力强。
通过以上分析,我们可以推测,《现汉》释义元语言与《国辞》相比,组合类型更为丰富,释义方式更为多样化,释义用语也更为详尽。而《国辞》的释义元语言则更为简洁、凝练。
4.2 网络性质对比
4.2.1 小世界效应
将两个网络的平均路径长度和聚合系数与随机网络相比较,我们发现,《现汉》和《国辞》释义元语言字同现网络的平均路径长度分别为3.034652和3.162426,聚合系数分别为0.178438和0.179535;而相对应的随机网络的平均路径长度分别为3.377866和4.000251,聚合系数分别为0.0068和0.004772。对于两个网络,均有d≈drandom,C>>Crandom,符合复杂网络小世界效应的一般条件:d≈drandom,C>>Crandom。因此,两部词典的动词释义元语言字同现网络均具有小世界效应。对于《现汉》来讲,其(d/drandom)/( C/Crandom)的值为0.034236396,而《国辞》的值为0.021012825。该比值越小,表示小世界效应越大。可以认为,《国辞》的小世界效应比《现汉》大,其释义元语言更为凝练。
词典学要求在语义解释过程中,应尽量使用简单的意思,对于具有复杂语义的词则要努力给出一个简单易懂的释义。因此,词典释义应该用简洁、精炼的语言对词语进行解释。而这种小世界性恰恰保证了词典释义过程中一个字能够以较短的路径与另一个字相关联,从而避免释义元语言之间距离过大造成的释义拖沓、繁杂。相较《现汉》,《国辞》释义元语言网络的小世界性更强,主要原因在于《国辞》在收词、释义上使用了更多文言词语。
4.2.2 无标度特征
图5—图8分别为《现汉》和《国辞》两部词典释义元语言字同现网络的所有度累积分布曲线图和分段的所有度累积分布曲线图。其中,横坐标k表示节点的度:;纵坐标Pc(k)表示节点的累积频率。通过观察,我们不难发现两部词典释义元语言字同现网络的度的分布曲线都大致遵循幂律分布。
但对这些累积分布曲线图进行更细致的观察后,我们发现,两部词典释义元语言字同现网络的度的分布并非一条直线,而是呈现出斜率不同的两个线段。为了方便观察,我们将两部词典释义元语言所有度累积分布曲线的分段情况用不同的线型(点线与直线)进行标示(图7、图8),图中,所有度的累积分布曲线明显地被分成了两个不同斜率的线段(箭头指向处)。在字同现网络中,度被分为两段不同斜率的线段的现象,就暗示了释义语言中核心字的存在。任何话语的表达过程中,都会反复使用某些字,这些有限的、被重复运用的字就构成了人类语言中的核心字典。其中,位于第一段的字的度较低,这类字是释义时使用的特殊的字,这类字由于使用有限,所以与其他字产生连接的肯能性较小,其度相对也要小很多。而处在第二段度较大的字,其连接性较强,因此被反复使用,就构成了所谓的核心字典。
自然语义元语言论的“还原释义法”目的是用最基本、最简单的词语解释复杂的语义现象,即用简单的词语表征、解释复杂的语义。该方法的目标是把语义分析的解释用语还原为一组数量最小、解释力最强且适用性最为广泛的词语。因此,正如日常语言的运用,词典释义元语言时,为了使使用者能够以最为省力的方法读懂字词的释义,往往采用一些解释力很强,连接性很高,但语义相对简单的字。但为了使释义完整、准确,某些低连接度的字的采用也是不可或缺的。
4.2.3 层次性
图9、图10分别为《现汉》和《国辞》两部词典释义元语言字同现网络的总度-聚合系数图。横坐标k表示两个网络的总度;纵坐标C表示两个网络的聚合系数。分析结果显示,两部词典释义元语言字同现网络总度-聚合系拟合指数γ分别为-1.22322和-0.88527,且两者都大致遵循幂律分布。两图中,总度-聚合系数的拟合曲线呈明显下降趋势,表明该网络中不仅存在着很多度虽小但聚合系数较高的节点,也存在很多度很高而聚合系数比较低的节点。这说明在词典释义元语言中不仅存在具有高连接性的模块,也存在连接性较低的模块。因此,两部词典的释义用字具有层次性。
在词典释义过程中,许多相似或相关词语的释义常常使用相同的元语言来进行描写,但不同词语之间所使用的元语言则有较大差别。不同类别的元语言形成了不同规模的组块,组块内部联系密切,组块与组块之间则关系疏松。因此,释义元语言网络就呈现出一定的模块性和层次性。
4.2.4 居间中心性
《现汉》和《国辞》释义元语言字同现网络的度—居间中心性关系图和居间中心性累积分布图如图11-图14所示。图11-图12中,横坐标k表示两个网络的度;纵坐标g表示连个网络的居间中心性。由图可知,两个网络中度和居间中心性有着较强的正相关关系,即度越高,居间中心性也随之增大。图13-图14中,横坐标g是两个网络的居间中心值:纵坐标Pc(g)是两个网络的累积居间中心值。由图可知,两个网络的居间中心性累积分布曲线呈明显的两段分布。表1数据显示,两个网络的居间中心性指数η分别为-0.16613/-1.00218和-0.21052/-1.26147,虽然《现汉》的释义元语言字同现网络的居间中心性指数要大于《国辞》的居间中心性指数,但两者的指数相对都较低,两个网络中起到连接作用的关键字较少。
词典释义元语言重在对词义进行描写,多采用具有实际意义的实词,要求元语言具有精炼、概括的特点。汉语中,具有高度链接作用的词主要是一些功能词,比如连词、助词等虚词。这些功能词没有实际意义,因此词典释义时使用较少。
4.2.5 匹配度
图15—图16分别为《现汉》和《国辞》释义元语言字同现网络的字频-总度关系图。其中,横坐标表示两部词典释义元语言时所运用的字的频率f;纵坐标则表示两个网络的总的度数k。计算表明,释义元语言网络的字频-总度关系呈幂律分布的关系:
即f~
其中,总度—字频的拟合指数ξ≈1(《现汉》、《国辞》分别为1.0824和1.04158)。通过观察释义元语言网络字频-总度的相关图表,我们不难发现该同现网络的度与字频的正相关关系,即字频越高,度也随之增大。虽然两个网络的系数差别不大,但相较而言,《现汉》的拟合指数略高于《国辞》,这说明《现汉》释义元语言中,字频较高的字的度也高,即频率较高的字,与其他字相联系的可能性也较大。这可能与《现汉》释义更为多样化有关系。
根据表1中的数据,《现汉》和《国辞》释义元语言字同现网络的匹配度系数Γ分别为-0.20425和-0.13003,Γ<0。这说明两个网络均具有异配性,即网络中高连接度的节点更倾向于与低连接度的节点相连。在语言网络中,高连接度、高频率的节点一般为功能词,比如“的”、“和”、“在”等。高连接性的节点与低连接性的节点相连接也符合语言的特点和要求:节点度比较高、含义比较虚的功能字作为连接成分或粘附成分,大都附加在节点度比较低、含义比较实在的字词周围,符合语言的句法、语义和表达规律。释义元语言的主要功能是满足社会交际需要对该语言的词语进行一般性的陈述、描绘和再现,应服务于语言社会的普通成员。因此,释义元语言虽然比较特殊,但仍需遵循语言表达的这一总的规律和要求。
相比较而言,《现汉》匹配度系数的绝对值高于《国辞》,说明《现汉》中度数高的字更倾向于与度数低的字相连接。原因可能在于《现汉》中常用虚字的种类较多,频率较大,从而使得度数高的字与一般度数的字连接的概率较大。
5. 结论
本文从复杂网络的视角对《现汉》和《国辞》常用动词的释义元语言字同现网络的特征进行了研究,分析了两个网络的小世界效应、无标度特征、层次性和居间中心性及匹配度等特性,并从网络基本参数和基本性质方面对两部词典常用动词释义元语言进行了对比,得出以下结论:
第一,《现汉》网络与《国辞》网络相较而言,其总字频、总边数、平均度都大于《国辞》,表明《现汉》在释义上比《国辞》要更精细、详尽,释义元语言的组合关系更为复杂。
第二,在小世界性上,两部词典均符合复杂网络小世界效应的一般条件,均具有小世界性。但《国辞》释义元语言更加凝练,其小世界性更强。
第三,两部词典释义元语言网络的度都遵循幂律分布,因此都具有无标度性;但两个网络度的分布的折线型也暗示了词典释义元语言的核心字的存在。两部词典的释义元语言不仅存在高连接的模块,也存在低连接的模块,表现出了一定的层次性。
第四,在居间中心性上,《现汉》和《国辞》两个网络的居间中心性指数都比较低,说明两个网络中起到连接作用的关键字较少,这与词典释义元语言的精炼特点不无关系。
第五,匹配度上,两个网络的匹配度系数都小于零,表明两个网络均具有异配性,高连接度的节点更倾向于与低连接度的节点相连。词典释义元语言虽较为特殊,但仍遵循汉语语言的表达规律,即节点度较高、含义较虚的功能字有着很强的连接能力,比如“的”“和”“在”等。
本文把复杂网络方法引入到汉语释义元语言研究中,将以往基于感性认识和定性描述研究提升到了精确的定量的层次,使元语言研究朝着科学化的方向迈进。本文的研究也为词典对比研究提供了一个新的角度,使得词典对比在一个客观的可比较的框架内进行。同时,本文将元语言这种特殊的语言形式作为研究的对象,也拓宽了语言网络的研究视野,这对复杂网络研究的拓展和深化有一定的推动作用。但是由于所用语料规模较小及研究水平的限制,本文也存在一些不足和缺陷。希望在以后的工作中,能扩大语料库的规模和范围并对其进行更为全面和深入的研究。
参 考 文 献
Jin Cong, Liu Haitao. Approaching Human Language with Complex Networks [J]. Physics of Life Reviews, 2014, (4): 598-618.
Li Jianyu, Zhou Jie. Chinese Character Structure Analysis Based On Complex Networks [J]. Physica A: Statistical Mechanics and its Applications, 2007: 629-638.
Liang Wei, Shi Yuming, Huang Qiuling. Modeling the Chinese Language as an Evolving Network [J]. Physica A: Statistical Mechanics and its Applications, 2014 : 268-276.
Liu Zhi Yuan, Zheng Ya Bin, Sun Mao Song. Complex Network Properties of Chinese Syntactic Dependency Network [J]. Complex Systems & Complexity Science, 2008.
Newman, M. E. J. The Structure and Function of Complex Networks [J]. SIAM Review, 2003: 167-256.
Sheng Long, Li Chunguang. English and Chinese Languages as Weighted Complex Networks [J]. Physica A: Statistical Mechanics and its Applications, 2009,(12): 2561-2570.
Solé Ramon Ferrer I. Cancho. The Small World of Human Language [J]. Proceedings of the Royal Society of London. Series B: Biological Sciences, 2001,(1482): 2261-2265.
Solé, R. V., Corominas-Murtra Bernat, Valverde Sergi, Steels Luc. Language Networks: Their Structure, Function, and Evolution [J]. Complexity: NA-NA, 2010.
Strogatz, D. J. & S. H. Watts. Collective Dynamics of“Small-World”Networks [J]. Nature, 1998, (6684): 440-442.
Watts D. J., Strogatz S. H. Collective Dynamics of Small-World [Z].1998.
Yu Shuiyuan, Liu Haitao, Xu Chunshan. Statistical Properties of Chinese Phonemic Networks [J]. Physica A: Statistical Mechanics and its Applications, 2011,(7): 1370-1380.
Zhou Shuigeng, Hu Guobiao, Zhang Zhongzhi, Guan Jihong. An Empirical Study of Chinese Language Networks [Z]. 2008.
安华林.汉语释义元语言理论与应用研究[M]. 上海:学林出版社,2009.
郭世泽.复杂网络基础理论 [M]. 北京:科学出版社,2012.
韩 普、王东波、路高飞、苏新宁.语言网络研究进展[J]. 中文信息学报2014,(1): 9-18.
李葆嘉.汉语元语言系统研究的理论建构及应用价值[J]. 南京师大学报(社会科学版),2002,(4).
梁 伟、史玉明、谢智刚、王艳丽.不同时期汉语散文的字同现网络之研究[J]. 中国科学:信息科学,2012,(7): 831-842.
林 枫、刘 云、江钟立.汉字网络的历时性模式探析[J]. 复杂系统与复杂性科学,2012,(3): 50-61.
刘 珺、徐德宽、马梦佳、陈淑梅.现代汉语常用动词释义对比研究——以《现代汉语词典》(第六版)和《重編國語辭典修訂本》为例[J]. 中文信息学报,2014,(1) .
刘知远、郑亚斌、孙茂松.汉语依存句法网络的复杂网络性质[J]. 复杂系统与复杂性科学,2008,(2): 37-45.
苏新春.汉语释义元语言研究[M]. 上海:上海教育出版社,2006.
瓦 茨.六度分隔[M]. 北京:中国人民大学出版社,2011.
Abstract: As a unique language form, the meta-language of dictionary interpretation is of great importance. In this paper, we select 608 entries included both in the modern Chinese Dictionary (the six edition) and Mandarin Dictionary (the revised edition) on the basis of the verbs in the syllabus of Chinese Proficiency Test (HSK) and then built a character co-occurrence network with the interpretations of these verbs in each dictionary. We have taken an all-round research from the perspective of complex network and studied such characteristics as small-worldness, scale-free, betweenness centrality, hierarchy and assortiveness. The unique nature of the character co-occurrence network of meta-language of dictionary interpretation has been revealed and the scope of research on language network has been broadened.
Key words: verb; meta-language of interpretation; character co-occurrence network; complex network
作者简介:徐德宽,男,博士,鲁东大学文学院教授、硕士生导师。主要从事语言网络、汉语国际教育和计算语言学等领域的研究;
何保荣,女,鲁东大学文学院硕士研究生。主要从事语言学及应用语言学研究;
邱立坤,男,博士,鲁东大学文学院副教授、硕士生导师。主要从事计算语言学研究。
通讯地址:山东省烟台市芝罘区红旗中路186#,鲁东大学文学院,邮编264025
E-mail:xudekuan@tom.com
(责任编辑:周统权)