基于CiteSpaceⅢ的国内濒危语言研究动态可视化分析
2020-05-26王聪聪刘希瑞
王聪聪刘希瑞
(河南工业大学外语学院,河南郑州450001)
语言是沟通交流的工具,作为一种文化载体,是世界灿烂文化的重要组成部分,在彰显民族特色的同时,更体现了民族凝聚力与民族认同感。然而随着全球经济一体化程度的加深,语言同化现象明显,越来越多的使用基数较小的语言被遗弃,濒危语言的概念也由此产生。20世纪60年代,国际语言学界开始关注濒危语言的问题,至今,濒危语言问题及关于濒危语言问题的新兴研究领域受到国际社会和学术界的重视,成为人文社会科学界持续升温的热点领域[1]。戴庆厦教授认为,所谓濒危语言,实际上就是指在交际过程中使用功能或活性趋于衰退并面临消亡的语言[2]。目前,世界上约97%的人口使用着仅4%的语种,即绝大多数不同的语言仅为人口极少的民族在使用[3]。而中国作为世界上少有的多民族国家,语言濒危现象严重,中国有120多种少数民族语言,其中有20多种语言的使用人口不足一千,这20多种语言基本上处于濒临消亡的边缘。即使使用人口超过一千的语言,也并不说明它们有较强的生命力[4]。
在此背景下,研究和保护濒危语言受到学术界的关注与重视,相关的研究文献也层出不穷,因此有必要对该领域的总体研究状况进行梳理与分析。本文基于前人的研究成果,运用CiteSpaceⅢ文献计量可视化软件,对近年来国内关于濒危语言研究的文献进行了整理与总结,以图谱的形式将该领域目前的研究状况客观呈现,把握该领域的研究热点、研究趋势、主要研究机构及未来研究前沿,为广大学者提供一定的研究启示。
1 研究方法与数据来源
科学知识图谱的概念源于2003年美国国家科学院组织的一次研讨会,随着信息可视化技术的发展,绘制科学知识图谱的各种工具也应运而生[5]。CiteSpaceⅢ作为知识可视化软件,绘制的知识图谱能够将一个知识领域来龙去脉的演进历程集中展现在一幅引文网络图谱上,并把作为知识基础的引文节点文献和共引聚类所表征的研究前沿自动标识出来[6]。本文数据来源于中国学术期刊(网络版);检索日期为2018年9月10日;检索年限为2000—2018年;来源类别设置为全部期刊,不设年限;以“濒危语言”“语言濒危”为主题词进行高级检索,共检索到文献528篇,经过人工数据清理,去除图书出版信息、会议通知等不相关条目,最终得到有效文献493篇。
2 数据分析与讨论
2.1 发文量分析
对濒危语言相关文献的发文量进行展列,便于对濒危语言的研究状况进行历时分析。图1显示了2000—2018年有关濒危语言研究的发文量。如图1所示,国内对该领域的研究整体呈上升趋势;2000—2006年每年发文量均不超过10篇;2006—2007年为发文高峰期,但两年后热潮便已褪去,但后期未出现负增长。
总体看来,首先,国内有关濒危语言的研究起步较晚。研究数据搜集未设置起始年限,但检索到的最早数据是2000年。其次,国内关于濒危语言的研究缺乏稳定性。图1中显示的发文量未呈现持续上涨或是保持稳定,而是起落不断。这在一定程度上反映出,濒危语言的研究与保护还未引起国内学者的足够重视,濒危语言研究的重要性在国内的传播度和接受度还不够广泛。再次,近年来国内关于濒危语言的研究热潮较为高涨。2015年关于濒危语言研究的发文量达到最高值,虽后期发文量有所下降但一直保持较高水平。这与社会大环境的改变和人们文化保护意识的增强不无关系,人们越来越意识到少数民族语言对中华文化的重要性。
图1 国内濒危语言研究结果成果年际分布
2.2 濒危语言研究的热点与前沿分析
关键词是文章核心内容的浓缩,如果某一关键词在该领域的研究文献中重复出现,就可以被视为研究热点,再将关键词与文献发表的时间相联系,就能发现某个领域在特定时期的研究热点[7]。借助信息可视化软件CiteSpaceⅢ,绘制濒危语言研究领域的关键词共现知识图谱,科学地对该领域的研究热点及研究热点的变化进行捕捉,并对研究前沿进行提取和分析,可为该领域的新兴工作者提供研究的指向标,帮助其把握学科发展主线,减少学科研究边缘化现象。同时,对研究前沿的识别与追踪能够为研究者提供学科研究的最新演化动态,预测研究领域的发展,识别需要进一步探索的问题[8]。
CiteSpaceⅢ根据关键词出现的频次对关键词进行选择性显示。在软件的“Node types”(节点类型)功能键下选择“keyword”(关键词),频次设置为5,共展示出40个关键词,得出图2。首先,不同的圆形节点代表不同的关键词,其形状大小反映了关键词出现的频次,节点越大表示关键词出现的频率越高,反之亦然。其次,节点之间的连线表示关键词之间的共现关系,连线越细、越稀疏,说明两个关键词出现在同一篇文章中的次数越少,反之则越多。通过该关键词共现图谱,其间的隐含数据意义变得一目了然。
图2展示了2000—2018年国内濒危语言研究中出现5次以上的40个关键词。节点较大、连线密集的关键词有 “濒危语言”“语言濒危”“语言保护”“少数民族”等。这些关键词在不同文献中出现的频率较高,与其他关键词同时出现的频次较多,成为该领域的研究热点。从高频关键词的内容可看出濒危语言研究以少数民族语言为主要研究对象,以濒危语言保护与维护语言多样性为研究重点。关键词“非物质文化遗产”则说明人们对濒危语言研究与保护价值的肯定。同时,“土家语”“满语”与“赫哲语”这些少数民族语言的种类作为高频关键词出现在图谱中,这与相关机构与学者论文分析的选择有关。原因可从以下四方面考虑:①这类语言濒危程度最严峻,趋于灭绝,被研究保护的需求最紧急;②语言原本适用范围广泛,如今收缩明显,研究空间较大,研究价值较高;③语言使用区域地理条件优越,方便学者进行研究考察;④语言特点鲜明,民族性强,研究价值高。但中国作为一个拥有多民族语言的国家,仅有三种少数民族语言的研究频次居高也反映出一些问题:①对濒危语言的研究覆盖面不够广泛,保护与开发相对欠缺;②对真正濒危的语言的关注力度尚不足,多数濒危程度更为严重的语言仍挣扎在灭绝边缘;③国内濒危语言研究人员短缺,不足以支撑大范围的语言调查。同时,仅有40个关键词的频次在5次以上,说明大量关键词只是昙花一现,仅被讨论了一两次便消失无影。其原因除了国内对濒危语言的研究力度不够之外,研究内容也不够规范,在跨学科研究势头强劲的情况下,有些与濒危语言研究价值不大的领域也被牵扯,在濒危语言的高价值领域还未充分开发的情况下,这些边缘化研究不大可取。
在CiteSpace的计量分析中,一般以中心性(Centrality)作为节点在网络图谱中连接作用大小的度量,中心性大的节点文献往往被视为该领域知识发展过程中的关键文献[9]。依据关键词出现的频次与中心性两个指标对图2进行二次加工,得出含有中心性指数的表1。
图2 国内濒危语言研究关键词共现图
国内濒危语言研究关键词共现图为学界了解濒危语言研究现状提供了视觉上的直观感受,表1的量化表格则为学界了解濒危语言研究现状提供了数据的精确性,利于深入挖掘数据间的隐含信息。从表1列出的关键词排序看,位于首位的“濒危语言”出现频次远远大于第二位的“语言濒危”,但随后的“语言保护”与“少数民族”等关键词出现的频次相差不大。这反应出国内濒危语言的研究很大程度上是孤立的,与相关保护措施等的结合研究较少,与语言活力或者语言生态研究等的联系也并不紧密。这在保护濒危语言的紧急大环境下是不可取的。濒危语言研究应与实际应用相结合,来源于实践最终回归于实践是该领域的生命力与研究动力。如果将濒危语言研究仅作为单纯的学术研究,那么将丧失该领域研究的重要意义。同时,低频关键词占据比例较大,频次位于前40位的关键词中,低于10的占50%,低于20的占78%,即热点词汇的频次低。这与图2研究所得结论相符:国内关于濒危语言的相关研究欠缺,对濒危语言的关注与保护刻不容缓。
表1 国内濒危语言研究关键词
对濒危语言研究前沿的分析一定程度上可通过关键词激增图展现,以图2数据为来源使用CiteSpaceⅢ生成濒危语言研究的关键词激增图。该图包含关键词内容、激增力度和激增的起止年限,并按照激增力度的大小进行排序。激增力度代表该关键词在某个年限内的热点增长率,相对应的深色格段表示关键词发生激增的时段。通过图3可以获取不同时间段内濒危语言研究热点的变化以及研究前沿的内容。如发生激增时间最早的关键词是“仙仁土家语”,时间为2002—2004年。而发生激增时间最晚的关键词是“语言学”(2015年)、“保护对策”(2015—2016年)与“语言竞争”(2015—2016年)。这些关键词代表近几年濒危语言的研究前沿,并且反映出濒危语言研究不再孤立地研究濒危语言本身,而开始与语言学紧密联系,并与保护措施相结合。
2.3 濒危语言研究的主要作者与机构分布
对主要作者与机构进行可视化图谱分析能够更好地了解濒危语言研究领域的机构分布特征、人文结构特征;能够呈现该研究的普及度与关注度;能够通过主要作者与机构之间的合作状况反映出研究方法上可能存在的问题。
图3 国内濒危语言研究关键词激增图
打开“Node types”功能键,选定“author”(作者)与“institution”(机构),导入数据后进行聚类分析,将阈值设置为2后得出图4。图4中不同节点代表不同的研究机构与作者;字体大小凸显的是该研究领域内机构或作者的贡献大小,字体越大说明该机构或作者对该研究领域的贡献越大,反之贡献越小;节点之间的连线反应的是机构之间、作者之间及机构与作者之间的合作关系。由图4可知,目前国内对濒危语言的研究形成了四个主要科研阵地:中国社会科学院民族学与人类学研究所;中央民族大学;暨南大学;黑龙江大学。而部分机构如云南师范大学、大连民族学院、广西师范大学等,则依附于以上四个科研阵地。
通过对研究机构的分析发现,这些研究机构在专业程度与地理位置方面都表现出绝对的优势。对位居第一的中国社会科学院民族学与人类学研究所来说,濒危语言研究是其专业性最强的研究方向。而其他几所大学和机构的地理优势似乎是推动其研究濒危语言的主要因素。如广西民族大学,坐落于中国广西壮族自治区,少数民族聚集之地,得天独厚的地理条件为濒危语言研究提供了极其便利的条件。而对代表作者戴庆夏、范俊军、瞿继勇、徐世璇等所在机构进行研究后发现,在濒危语言研究领域,主要作者与重点机构之间联系紧密。这点也可从图4中各个节点间形成的紧凑的网络布局与不同节点间紧密的联系看出。该种布局同时也说明研究者与研究机构之间协作交流能力较强,但也反映了该研究方向在全国范围的普及度不够高,仅仅局限于专业性较强的几所机构与作者之间,大部分学者对濒危语言的研究价值还不认可,或对中国少数民族语言濒危的程度还没有足够的危机感。
图4 国内濒危语言研究主要机构与作者共现图
3 结束语
本文运用CiteSpaceⅢ软件对中国学术期刊(网络版)近20年收录的濒危语言研究文献数据进行了分析,绘制了相关知识图表,对濒危语言研究的整体发展脉络的梳理在一定程度上廓清了该领域的知识结构。①中国国内濒危语言研究起步较晚,虽整体呈上升趋势,但发展并不平稳。相关学者需唤起更多领域保护濒危语言的意识,同时政府也应给予更大力度的支持,更好地推动我国濒危语言研究的发展。②国内研究机构与研究者数量总体偏少。虽然研究机构与作者之间联系较为紧密,形成了四个主要科研阵地,但各个研究机构之间分布较散,资源共享程度较低,没有形成紧密的关系网,不利于研究的深层次开展。③研究热点变化较快,一定程度上体现了研究视角的多元化趋势。濒危语言研究不可能是孤立的,仅停留在“濒危语言”本身是不可取的,濒危语言研究要与时代变化相结合,具体问题具体分析。在语言多样化环境日益恶劣的情况下,应从各方面加强对濒危语言的研究。语言的消亡贯穿于历史长河中,从语言内涵的文化意义来看,放弃一种语言的同时也就丢失了蕴含在这种语言中的独特文化,任何语言的消失都是人类文明的损失[10]。人类的历史经验早已证明,世界只有语言多样,文化多元,不同语言和文化间的交流畅通,才谈得上世界的稳定与和平[11]。基于此,本文旨在梳理濒危语言研究领域的发展脉络与现状,多维度地展现该领域的研究状况,为更多对濒危语言研究感兴趣的学者提供研究便利与启示,并且唤起更多学者对该领域的关注。本研究也尚有不足之处,如:
未与同期国际濒危语言发展状况进行同步对比分析,数据来源仅为中国学术期刊(网络版)等,日后力图尽力弥补,更好更科学地服务于中国濒危语言研究。