APP下载

中文文学作品中的社会网络抽取与研究

2017-11-14刘朕君

神州·时代艺术 2017年10期
关键词:文学作品节点文本

刘朕君

(北京师范大学-香港浸会大学联合国际学院,广东 珠海 519000)

中文文学作品中的社会网络抽取与研究

刘朕君

(北京师范大学-香港浸会大学联合国际学院,广东 珠海 519000)

文学一直以来都是人类思想的主要载体,文学作品由一个个文字组成,通过分析这些文字在作品中的意义,可以理解作品中的人物形象,明确文本的思想观念表达。现阶段,随着电子信息技术的发展,对文学作品的社会网络抽取已经成为了新的研究热点。文章主要研究中文文学作品中的社会网络抽取与研究。

中文文学;社会网络抽取;语言

在人类历史的长河中,人类的精神文明通过文学得以传承,我国作为一个传承几千年的古老大国,具有着丰富的文学底蕴。随着信息技术的发展,大量的文学作品被电子化。如果从这些作品中抽取出有价值的资料,利用自然语言处理以及计算机技术,是否能够对作品中的社会现实信息进行再现与还原,这一问题值得深思。

1 社会网络抽取概说

在信息化不断深入的今天,计算机网络已经深入的影响到了人们生活的方方面面。在文学作品领域,电子信息化的文学早已成为了人们文化生活的常态。从最基础的电子图书,到作品翻译,相关信息检索,数据结构分析等,目前的信息水平,已经具备了智能处理分析文学作品的基本条件。自然语言处理是现阶段进行文学作品处理的主要手段,其分析过程主要包括三个方面:①语言研究,例如对文学作品中的文章。词汇使用状态进行分析;②篇章分析,即对文本篇章中语言、结构、理论的分析;③综合分析,这一技术还只是一种概念分析方法,目前还处于研究阶段。

社会网络是行动节点与行动节点之间构成的互相连接关系。网络中的接点可以是单独的个体,也可以是共同的集合体。从理论方面来理解,社会网络可以是亲缘网络、神经网络、信息网络、拓扑结构等等,其中最常见的要数社交网络。社会网络抽取分析,就是通过矩阵以及图对社会网络结构进行分析。这一理论最早起源于上世纪30年代,是一种人类学以及心理学的概念,经过长时间的实践发展,它才最终成为了一种跨学科的分析研究方法。

现阶段,已经有一部分语言学专家、文学理论专家利用非计算模型对文学作品的结构进行展示。例如:社会关系图、文本映射图等。通过对文学招聘中的社会网络进行抽取并分析,能够帮助人们更好的对作品的人物、背景、环境进行分析。例如,在英国有一项研究,将作品中的人物对话进行标记,并将这些标记进行按角色分配,以此组织作品中人物的社会量化指标,形成社会网络,以此为基础对作品中的社会网络进行研究。这是一种对作品中社会人物进行抽取的研究方法,其对现阶段的文学作品社会网络抽取与研究具有非常重要的参考以及指导意义。

2 中文文学作品中的社会网络建立与研究

2.1 社会网络建立

从具象的角度理解,社会网络是一种多节点组成的网络结构图,为了对文学作品中的社会网络进行抽取并分析,必须要从作品中抽取一定的有价值片段,生成节点,以此来构建社会网络结构。对于文本中的文字、主题、或片段,可以进行分区处理,将每一个区域看做是一个独立的个体。以《三国演义》为例,这是一部章回体的小说著作。因此,在进行社会网络抽取的过程中,可以将同一章节中的共现情况作为人物之间的关系纽带。在人物识别方面,可以利用web与统计方法建立人物列表。首先,可以利用文字处理技术,对作品中的词性成分进行分析,一次来对文本中的人文进行确定。例如,《三国演义》中共出现1191人。这种对小说中人物角色进行抽取的方式虽然比较直观,但准确度相对较低。像《三国演义》《水浒传》这一类的长篇小说,涉及大量的绰号、别名、字,以及省略称呼的情况,这是在进行人物抽取过程中比较困难的部分。对此,可以采用多层次筛选的方式进行选取,先筛选名词,再筛选角色,最后筛选语法语义。在抽取了作品人文之后,再利用章回矩阵,可以初步建立一定的社会网络,以此作为分析的基础。

2.2 社会网络研究

(1)频数分析。文学作品一般都是由人物、环境、时间、事件等因素构成,而人物是作品的核心,因此,在进行作品的社会网络分析时可以将人物的出现频数作为分析的指标。例如,在小说《西游记》中,可以对其在的人文频次进行分析。通过对人物频次的分析,能够研究所分析人物在作品中的性格、特质,以及人文本身所代表的思想观念。

(2)中心分析。对于网络中心的分析,也就是对网络中各节点在文本中心的程度。通过中心分析,可以客观的得出在社会网络中,该节点与主角的社会关系,以此探究作品中的重要角色。一般来说,在文本中出现的频次越高,其中心程度也就越高。这些角色往往是作品的核心,是作品分析的重点。例如:《西游记》中出现频次最高的是唐僧、孙悟空、猪八戒、沙僧,这也就凸显了这几个角色的中心程度。像龙王、二郎神这一类的角色出现的频次低,说明其是文本中的边缘角色,主要对作品内容起到辅助的作用。

(3)子群分析。子群即社会网络中存在的强烈、稳定、直接的关系节点的集合。在进行社会网络分析的过程中,分析子群,就是对统一子群集体之间关系特点的分析。例如:在《三国演义》中,就可以分为六个主要的子群,其中通过分析每个子群之间的领导者,可以分析出作品中人物的对文本表达思想的重要意义。

3 结束语

随着文学作品的信息化,对文学作品的智能化分析已经成为了一种必然的研究趋势。通过对文学作品中社会网络的抽取以及研究,能够实现对文本人物、结构、思想、理论等多方面的解读。虽然,我国现阶段的研究还处于不成熟的发展阶段,但是,随着科技的进步,社会网络分析,必然会成为一种文学研究方向。

[1]赵京胜,张丽,朱巧明,等.中文文学作品中的社会网络抽取与分析[J].中文信息学报,2017,31(2):99-106+116.

[2]肖永贺,谢亚军.中文文学作品中人物命名的文化内涵解读[N].内蒙古农业大学学报(社会科学版 ),2016,(6):386-387.

作 者:

刘朕君(1996-),男,山东济南人,本科在读,研究方向:汉语言文学。

I2

A

1009-5071(2017)10-0096-02

猜你喜欢

文学作品节点文本
当文学作品扎堆影视化
文本联读学概括 细致观察促写作
分区域的树型多链的无线传感器网络路由算法
基于移动汇聚节点和分簇的改进节能路由算法
基于点权的混合K-shell关键节点识别方法
挖掘文本资源 有效落实语言实践
搭文本之桥 铺生活之路 引习作之流
文本与电影的照应阅读——以《〈草房子〉文本与影片的对比阅读》教学为例
第二届“ 名作杯”全国大学生文学作品大赛征稿启事
文学作品与数学