数据人文视角下川端康成文学作品中女性形象分析
2021-06-15陶建明
摘 要:本文以川端康成代表性作品《雪国》为例,对原著文本进行统一整合,以HTML标记方式,将文本中的章,节及段落内容进行细致划分后,采用文本分析软件KH Coder对标记后的整篇文本文档进行相关系列数据挖掘。在挖掘出的相关文本数据的基础上,计算出高频词汇,再以共起网络效果图的形式,展现出彼此相互之间的对应关系以及各自所对应的文本内容,进而对文本中的女性形象进行数据化实证分析。
关键词:雪国;数据挖掘;女性形象
作者简介:陶建明(1992-),男,汉族,湖北武汉人,文学硕士,武汉文理学院助教,研究方向:日本文学、日语教育、社会语言学。
[中图分类号]:I106 [文献标识码]:A
[文章编号]:1002-2139(2021)-08--02
1.研究背景
文学作品是时代社会发展的产物。通过对不同国家文学作品中的细节,语言,人物形象进行研究解读,能够在一定程度上,窥探出不同国家在具体时代的社会历史特征。在对日本文学的研究中,新感觉派代表作家川端康成的文学作品,因文笔新颖,人物形象刻画细致,具有较高的美学艺术价值,因此一直备受国内外研究学者的青睐。而川端康成的文学作品中,由于存在大量关于女性角色的刻画描写,因此针对作品中女性形象的分析也是历来研究的焦点之一。然而众多先行研究多倾向于主观判断,研究成果缺乏相关理论数据支撑。
近年来,数字人文研究方法在文学研究领域取得不断发展和创新,基于数据人文视角,本文以川端康成的代表作品《雪国》为例,利用文本分析软件KH Coder,对标记后的整篇文本文档进行相关系列数据挖掘,通过文本中的高频词汇,建立起共起网络效果图,以此为基础整合相关数据,进一步探究《雪国》文学作品文本中出现的女性形象。
2.文本整理与分析
2.1 文本预前处理
将日语原版《雪国》作品文档,输入整理成txt文本文档形式,以HTML方式将整篇文本文档划分为俩章,分别以
上下形式进行标记,各章细分小节数以形式进行区分标记,以便文本分析软件KH Coder的顺利操作使用,及后续文本数据的相关分析和处理。
2.2文本导入与分析
将预前处理好的《雪国》文本文档导入软件KH Coder,对整篇文本中的高频词汇进行数据化抽取,在导出的文本Excel中,人物名词岛村,驹子和叶子的出现次数分别以322次,214次,78次位居前列。抛出文本内容的影响,仅从这组数据观察,便可断定这三人在文本内容中的主人公地位。而驹子和叶子这两位女性形象的高频出现,同样为本文研究的开展,进一步提供了理论数据支撑。
为进一步探究文本内容要素的相关性,深入挖掘驹子和叶子这两位女性形象相关数据信息,结合以上数据,以文本段落为计算单位,其中在语言的取舍上,最小段落单位为1,最少词频出现次数为20,利用KH Coder,对整篇文本文档中抽取出的高频词汇,进行共起网络可视化分析,中心媒介网络共起效果图如下图1所示。结合图1右边的Centrality参考值(中心度越高,颜色越深)以及Frequency参考值(出现频率越高,圆圈面积越大)。
综合比对后,可以再次很明显发现岛村,驹子以及叶子这三位人物形象,在整篇文本内容网络共起效果图中的中心地位,进一步对图1中的结论进行了证明。同时,在图1中驹子和岛村在整篇文本中的出现频率数值虽然不同,但是从效果图的颜色进行判断,其呈现出和岛村十分接近的颜色,而相较于岛村和驹子,叶子在整篇共起网络效果图中,颜色呈深蓝色,在整篇文本内容中中心度最高。由此可见对两位女性形象进行深入挖掘的必要性和可行性。基于以上发现,继续深挖相关内容和数据,对图1中驹子和叶子周围出现的相关联高频词汇进行观察和分析,与叶子关联度最高的高频词汇分别为“声”“美しい”“胸”“目”“顔”“家”等,而与驹子关联度最高的高频词汇分别为“手”“自分”“思う”“言う”“顔”等词。然而图1呈现出的共起网络效果图,在对应高频词汇的数据分析上,难以精准判断,因此利用KH Coder的关键词索引功能,输入关键词叶子和驹子后,以叶子为例,抽出结果如下图2所示,。
根据图2,呈现出的相关数据,可以对照图1得出的相关结果,进行佐证以及进一步细化说明。图2中,关于叶子的高频词汇,除了可以精确到文本文段中抽出的关键词前后具体位置之外,还可以继续进行数据统计补充说明,其中的高頻词汇按照分数高低, 可依次排列为“顔”(2.200)“声”(1.450)“美しい”(1.333)“目”(1.083)“胸”(1.000)“家”(0.833),除此之外还有如“腓”(1.000)“胯”(0.917)等相关高频词汇的补充。参考图2,同样关于驹子的高频词汇,依旧可以精确到所抽出的关键词前后具体位置,根据分数高低,依次进行排序“言う”(5.333)“顔”(3.083)“自分”(2.000)“手”(1.450)“思う”(0.850),除此之外在抽取的图片中还出现了“目”(1.533)“姿”(1.500)“肩”(1.500)“髪”(1.000)等词,并且附上了有关个人性格的表达性词汇,如“愛情”(1.000)“笑う”(1.450)等。结合文本中对应的内容,通过这些数据对比,足以佐证叶子是一个极具女性之美的人物形象,是日本现实社会中忠实家庭婚姻的典型传统女性形象的代表。而与之相对应的驹子,结合对应的文本内容,其除了具备像叶子那种日本女性之美外,还是一个性格活泼,善于健谈的女性形象。但是反观图1中,出现的“自分”“思う”以及后续有关驹子的抽取图片中“爱情”等高频词汇,可以看出文本呈现出的驹子,又不同于叶子那种典型传统日本女性形象,是一个拥有女性独立意识,敢于追求属于自己爱情的典型女权主义女性社会形象。
3.结语
基于数字人文视角,本文采用KH Coder文本计量分析软件,对川端康成文学代表作品《雪国》文本进行数据挖掘,通过高频词汇的统计和网络共起效果图,确定文本中的主要代表人物后,对文本中的驹子和叶子俩位女性人物形象,进行进一步的数据挖掘与分析。采用关键词信息抽取功能,将俩者分别作为中心词进行数据提取,补充与分析。结果表明文本中呈现出的俩位女性形象既有共性即女性外在躯体之美外,又存在彼此的个性之美。其中叶子是典型的具有日本家庭传统女性之美的人物形象,而相比之下的驹子却有着不同于叶子的形象特征,结合相关数据支撑,文本中刻画是一个性格活泼乐观,拥有女性独立意识,在现实生活中不拘泥于社会婚姻制度,敢于追求自身爱情的典型女权主义女性社会形象。除此之外,根据中心媒介共起网络效果图中提供的相关信息,并结合Centrality参考值,可以很客观发现“叶子”在整篇文本中的中心度值位居首位,这一新发现为后续对“叶子”这个女性人物形象的进一步深入挖掘分析,提供了理论数据支撑。
本文采用数据人文研究方法,對日本文学作品《雪国》进行了大胆尝试与分析,通过KH Coder制作出相关图文和数据,对以往先行研究中的结论进行了验证,丰富并初步取得了一定的进展,然而对叶子这一女性形象的研究仍有进一步挖掘和分析的空间,相关图文信息由于版面受限不能一一展示,后续仍需要进一步丰富和完善。文章中诸多不足之处,还请多多指正。
参考文献:
[1]梅沢亜由美.川端康成『雪国』 : その世界と視点人物についての考察[J].日本文学誌要 (46), p50-61, 1992.
[2]樋口耕一.『社会調査のための計量????分析-内容分析の継承と発展を目指して』[M]?????出版,2014.
[3]松井幸子.田村俊子『木乃伊の口紅』の女[J].日本語と???????第12号,2012.
[4]刘克华;白露.论村田沙耶香《方舟》中的性别意识[J].当代外国文学,2018.
[5]李圣杰.反乌托邦视阈下的《蔷薇香》[J].日本学刊,2019.
[6]李先瑞.论日本女性主义文学文本中女性形象的嬗变[J].日语教育与日本学研究,2015.
[7]谭晶华.川端康成文学的艺术性·社会性研究[D]. 上海外国语大学 2009.
[8]项蕾; 许婷; 谭天; 雷宁; 蔡翔宇.数字与文学的对话——“数字人文规范对传统文学研究方法的挑战”研讨会纪要[J].中国现代文学研究丛刊,2020.