APP下载

基于Pajek的《说文解字》部首关系可视化与计量性探索

2023-05-30王奕人张缘缘

参花·青春文学 2023年5期
关键词:说文解字网络分析部首

王奕人 张缘缘

一、引言

《说文解字》是我国历史上第一部系统分析汉字字形和字源的汉语字典,也是我国第一部文字学专书。但由于汉字部首数量多、关系杂,纯人工统计整理汉字部首间的关系非常困难,所以到目前为止都没有形成一个全面系统的部首间关系整体框架。因此,本研究在数字化时代大背景下,基于Pajek社会网络分析技术,从可视化和计量性两个方面对汉字部首关系进行深入研究,旨在探索社会网络分析技术与传统文字学科结合的最优模式,挖掘新兴信息科学技术在传统人文学科中的应用价值与学术价值。

二、相关研究现状

数字人文是将计算机网络技术与传统人文学科结合起来,进行交叉研究而形成的新兴跨领域学科。在数字化时代的大背景下,社会网络分析技术与传统人文学科结合的研究领域有着广阔的应用空间。比较具有代表性的是南京师范大学陈小荷和许超(2014)等人以网络科学为视角研究《左传》的文章,其构建了春秋时期人物关系网络,以此来探查《左传》中反映的春秋社会历史;赵薇(2018)运用社会网络分析技术对小说《大波》“三部曲”中的人物关系和社会网络进行了可使用性分析等。

本研究以许慎的《说文解字》540部汉字部首为研究对象,在此领域中的研究成果数不胜数,历代学者从不同角度对其进行了深入的研究。经查阅文献资料,可大致将以往对《说文解字》的研究概括为两方面内容:一方面,是对部首分类方面的研究,另一方面,是以某部为切入点的部首字形义方面的研究。前者在部首分类方面进行了着重考察研究,后者针对具体的某一个部首进行深入全面研究,包括发展历史、研究现状、研究思想与方法等。

前人对《说文解字》的研究涉及方方面面,取得的成果也十分显著。但目前学界还没有学者对汉字部首间的关系进行可视化和计量性研究,不能很好地满足部首关系研究、汉字研究等方面的学术需求。不仅如此,由于社会网络分析技术与传统人文学科结合的应用在国内起步较晚,仍在探索和发展阶段,对于人文性更强的项目研究还处于相对起步阶段,尚未形成系统的研究方法理论。综上所述,本研究借助Pajek社会网络分析技术,旨在为传统人文学科知识的呈现与传播提供新的方法与形态。面对目前传统人文学科所面临的挑战,借助新兴数字化技术,从不同角度对传统人文学科进行再挖掘和进一步整合,使传统人文学科伴随着科技的发展而更加完善。

三、《说文解字》部首关系的可视化研究

(一)网络文件

在Pajek社会网络分析技术中,一张图和附加在图的点线之上的信息可以构成一个网络。利用Pajek研究《说文解字》部首关系时,可以借顶点表示部首,连线表示部首间关系,并改变颜色加以区分,通过新建网络文件,把540个部首之间错综复杂的关系以网络图的形式进行可视化展示,更加清晰直观,为部首关系的全面研究提供了便利。通过系统地收集和整理资料,本文将《说文解字》部首间的关系分为五类。

1.意义相近

意义相近指在形符互换的异体字中,充当形符的两个或多个部首承担角度和内容相同或相近的表义功能。

例如《说文解字》中提到:“茑,寄生也。从艸,鸟声。《诗》曰:‘茑与女萝。樢,茑或从木。”“茑”与“樢”即为一组形符互换的异体字,“茑”的形符为“艸”,“樢”的形符为“木”,而“艸”与“木”的本义又同属植物,属性相近,故判断艸部和木部的关系为意义相近。

2.意义相关

意义相关指在形符互换的异体字中,充当形符的两个或多个部首承担角度和内容相关的表义功能。

例如《说文解字》:“祝,祭主赞词者。从示,从人、口。”而《集韵》中又提到“祝,或从食”,这说明“祝”还有一个异体字,即把示部替换为食部。“祝”的形符示部表示“祝”的意义与祭祀有关,而异体字的形符食部则表示祭祀之礼起源于饮食。虽然示部和食部在这组异体字中可以互换,但二者承担的表义功能并不完全相同,只是在内容上有一定的相关性,故判断示部和食部的关系为意义相关。

3.同源分化

同源分化指取形对象相同,但由于字形分化,演变为了不同部首的分化现象。

例如很多部首在造字之初都选取人的图形,但取形的角度则不尽相同。人部、尸部是依据人的侧面图形而造,其中,人部源于人的侧面站立之形,尸部在《说文解字》中的释义为“尸,陈也。象卧之形”。说明尸部源于人的侧面屈卧之形。大部、子部是依据人的正面图形而造,其中,大部源于成人的正面图形,子部源于幼儿的正面图形,《汉语大字典》中也提到子部的金文“象小儿头上有发及两胫之形”。故判断这些取人之形造字的部首之间存在同源分化的关系。

4.异体部首

异体部首指部首及其异体字分别作部首,并且各有其从属字。

根据朱强的《<说文解字>异体部首探析》一文,可以了解到《说文解字》的540部中共有五组异体部首,出现这种情况是由于五个异体字单独立部,并没有像通常情况那样归入与其对应的五个正体部首中。例如《说文解字》中明确提出了“亣,籀文大,改古文”,认为“大”是古文,“亣”是对应的籀文。然而,亣部并没有合并进大部,而是单独立部,有自己的从属字,并且二者的从属字在结构上呈现出了不同的特点。故判断大部和亣部之间存在异体部首的关系。

5.讹变

讹变指在汉字的演变和使用过程中,由于使用者出现失误,导致汉字形体的突变。

汉字的讹变在其漫长的演变过程中并不少见,但部首的讹变则没有那么丰富。《说文解字》540部中较为典型的讹变出现在月部和肉部之间。观察“月”和“肉”的字形演变可以发现,二者甲骨文和西周金文的字形都有着非常明显的区别,但从战国时期开始,字形趋于相同,到了篆文,已经十分接近,很难区分,人们在写作时将二者混淆也是情理之中。

(二)分区文件

分区文件主要用于保存网络顶点的分类或聚类信息,使每个顶点都能被确切地划分到某个分区类别中。在研究汉字部首关系时,可以利用分区文件的特点對540个部首进行意义和功能方面的分类,从而更有针对性地进行讨论。

关于部首的意义分区文件,邹晓丽的《基础汉字形义释源》将540部分为七个意义类别,分别是:以人体为内容的部首、以器用为内容的部首、以动物为内容的部首、以植物为内容的部首、以自然界为内容的部首、以数字为内容的部首和以干支字为内容的部首。用不同颜色的顶点表示归属于不同意义类别的部首,并给予它们不同的分类号,最终呈现在网络图上会更加清晰直观,也方便研究者分析相同和不同意义类别部首的分布情況。

部首的功能分区文件参考了王晴的《<说文解字>五百四十部首研究》对部首进行的分类,根据部首从属字的数量及其造字能力,分为高能部首、中能部首、低能部首和无能部首,并同意义分区文件一样,用不同颜色的顶点和不同的分类号加以区分。

(三)矢量文件

矢量文件负责保存顶点的连续特征,可以为网络中的每一个顶点赋予一个实数值,并最终反映在顶点面积的大小上。在研究《说文解字》部首关系时,矢量文件的应用主要体现在计量化研究中。

四、《说文解字》部首关系的计量化研究

(一)计量化方法

如何对《说文解字》540部进行计量化分析,也是一个非常重要的问题。根据上述的可视化操作,这样部首之间的关系通过网络图能够直观地展示出来,然而网络图同样需要数据支撑,这样部首间关系才会更加明确。对此,可以选择两种计量化方法进行研究。

点度,即一个顶点所拥有的连线数量。一个顶点所拥有的连线越多,它的点度越大,在能化排列时更靠近部首网络的中心,在部首网络关系图中占据更重要的位置,在矢量文件中,该顶点的面积也相对较大。点度较小的部首在能化排列时则较为边缘化,它所对应的顶点也较小。一般高点度顶点也更容易出现在网络中的高密度区。

斯皮尔曼等级相关系数用于分析顶点某种特征的秩次与顶点另一种特征秩次是否相符。在统计学中,两种现象的关系往往用相关系数来衡量。相关系数的取值范围为-1到1。相关系数为正,意味着一种特征的高得分与另一种特征的高得分相关;相关系数为负,意味着一种特征的高得分与另一种特征的低得分相关。如果相关系数的绝对值小于0.05,意味着不相关,绝对值为0.05-0.25为弱相关,绝对值为0.25-0.60为中度相关,绝对值为0.60-1.00为强相关。

(二)实验和分析

为了验证上述的计量化方法,本文选取《说文解字》540部中与口部相关的28个部首进行可视化展现,并对此进行点度和斯皮尔曼相关系数的计量化分析。

1.点度

计算点度需要用到分区矢量文件。需要先得到与口部有关部首的点度分区文件(Net>Partitions>Degree>All),执行此指令后,便可以得到点度分区文件。接着,需要得到矢量文件(Partition>Make vector),最后进行可视化展现。

根据分区矢量网络图可知:口部的连线数量为12,即口部的点度为12。口部在网络图中占据中心位置,且口部对应顶点的面积也最大,根据可视化分析,同样可以知道亣部在部首网络图中与其他部首的连线数量为1,即亣部的点度为1,亣部在部首网络图中也就处于边缘位置,所对应顶点的面积也最小。

2.斯皮尔曼等级相关系数

为了验证部首点度和其功能的相关性,本文运用Pajek软件进行了斯皮尔曼等级相关系数的计算。

计算斯皮尔曼等级相关系数需要用到的是两个分区文件,即点度分区文件和功能分区文件。前文均有提及,此处就不过多赘述。

下面将对其操作步骤进行简述:在分区列表框的第一栏和第二栏中分别选择点度分区文件(由Net>Partitions>Degree>All指令生成)和功能分区文件,二者先后顺序并不重要。在指定两个分区文件后,执行Partitions>Info>Spearman Rank指令便可计算斯皮尔曼等级相关系数。

根据上述操作所得出的数据进行分析:斯皮尔曼等级相关系数所得出的结果约为0.15,也就是说,以口部为中心的部首网络图的点度和以口部为中心的部首的功能的相关系数为0.15。根据上述相关系数的取值范围可知,斯皮尔曼等级相关系数位于0.05-0.25之间时,表明两种关系呈现弱相关,即部首在网络图中的点度与其功能呈现弱相关。

五、结语

本文分析了《说文解字》540部部分部首之间的关系,并将Pajek社会网络分析技术融入其中,通过可视化和计量化方法,旨在更加准确地展示汉字部首间关系。实验证明,本文所提出的将社会网络分析技术与传统语言学结合研究的方法是切实可行的。本文选取的方法,除了用于研究汉字部首关系外,还可以为辞书编纂、对外汉语教学、古代汉语教学等领域提供参考。由于知识结构的限制,本文只对目前的研究结果进行阐述,不敢随意妄下定论。但这也说明社会网络分析技术与传统语言学结合的研究是大有可为的。工作目前偏向技术性尝试,今后仍有许多工作需要完善。

参考文献:

[1][荷兰]沃特·德·诺伊,[斯洛文尼亚]安德烈·姆尔瓦,[斯洛文尼亚]弗拉迪米尔·巴塔盖尔吉,著.蜘蛛:社会网络分析技术[M].林枫,译.北京:世界图书出版公司,2012.

[2]邹晓丽.基础汉字形义释源——《说文》部首今读本义[M].北京:中华书局,2007.

[3]王玉新.汉字部首认知研究[M].济南:山东大学出版社,2009.

[4]王晴.《说文解字》五百四十部首研究[D].江西师范大学,2009.

★基金项目:本文系西南民族大学省级大学生创新训练项目“《说文解字》部首关系的可视化与计量性研究”(项目编号:S202210656147)的阶段性成果。

(作者简介:王奕人,女,本科在读,西南民族大学中国语言文学学院,研究方向:汉语国际教育;张缘缘,女,本科在读,西南民族大学中国语言文学学院,研究方向:汉语国际教育;<通讯作者:李涵宇>)

(责任编辑 王瑞锋)

猜你喜欢

说文解字网络分析部首
基于ISM模型的EPC项目风险网络分析
弄清偏旁与部首
铁路有线调度通信的网络分析
系在绳上的“冬”
“六书”在小学识字教学中的应用
《说文解字》中的反形字分析
体验知识的形成、产生和发展
2016年社交网络分析
大班幼儿同伴交往的社会网络分析