基于语料库的语言哲学文献计量分析
2014-09-18李涛,周平
李 涛,周 平
(1.上海交通大学 外国语学院,上海 200240;2.安徽财经大学 外国语学院,安徽 蚌埠 233030)
一、引言
国内语言哲学研究,特别是在外语界,近十年来发展态势迅猛,业已成为外语学界新的科研增长点。“我们以为,21世纪第一个10年,西语哲在中国的传播与研究的重大进展的一个显著标志是:外语界学者异军突起。”[1]就目前而言,部分学者对语言哲学研究做了大致梳理,并详细论述了语言哲学潜在的研究课题[1]。也有一些学者对部分外语学科做了文献计量学分析,其中涉及语言哲学。[2]但先前文献计量研究年代久远,缺少对语言哲学研究的关注,且仍缺少对近10年来国内语言哲学研究现状分析。再者,目前对科学文献的研究大多依赖于手工统计或使用文献可视化图谱软件CiteSpace等[3-6],但鲜有研究尝试利用语料库研究方法开展文献计量分析。而语料库作为大量电子文本的集合,其研究方法的优势在于将研究建立在数理统计和定量分析基础上,且支持重复性验证研究,使得相关研究更具科学性,研究结论更加可靠[7]。
本文基于文献计量学研究框架,结合语料库数据统计,以近10年国内外语界知名期刊为研究对象,开展国内语言哲学的文献计量研究。旨在通过梳理我国外语界近十年来语言哲学研究脉络,在文献计量学框架下综观外语类核心期刊语言哲学研究论文刊发现状、相关核心研究学者、核心研究机构、研究关键词,为语言哲学研究者以及期刊编辑发行部门,提供我国近十年来语言哲学研究全景,为进一步推进语言哲学研究提供参考。
二、研究设计
1.研究问题
本研究具体回答如下三个问题:
(1)近十年来国内语言哲学论文发表现状如何?有哪些期刊青睐语言哲学研究论文?
(2)近十年来国内语言哲学研究专家主要有哪些?主要研究机构有哪些?其地域分布状况如何?
(3)近十年来国内语言哲学研究关键词有哪些?有没有研究趋势的变化?
2.数据采集
考虑到数据样本较大,我们以2012年(第六版)北大中文核心期刊目录为基础,选取其中9本期刊。这9本期刊分别是:《外语教学与研究》《外国语》《外语界》《现代外语》《外语与外语教学》《外语学刊》《外语教学》《解放军外国语学院学报》(以下简称《洛外学报》)和《外国语文》。前8本是依照核心期刊目录顺序选取前8位期刊,选取《外国语文》是考虑到期刊主办院校为我国语言哲学研究重要基地。
语料采集标准为:1)对相关语言哲学经典理论、命题的思考、解析、评述,如语言哲学认识论、罗素的摹状词理论,以及哈贝马斯、索绪尔、维特根斯坦、克里普克等人的语言理论,等等;2)从哲学理论的角度对语言的讨论,包括对意义、语言结构、言语交际、语言知识等的哲学思考;3)对意义本质、意义理论的综述、批评性文章,包括各种意义观的介绍比较、意义的生成;4)对语言的本质、普遍规律的分析、研究和理论综述类文章,如语言的符号性、语言的体验性、言语交际的意向性、从逻辑学等角度展开的分析等等;5)并排除了借助实验、语料库等手段进行实证性研究类的文章,以及篇章语言学、语义学、语用学、认知语言学、心理语言学、社会语言学、系统功能语言学等立论于各个语言学分支学科的学科理论分析以及实证性文章;排除文学、翻译学类文章。
基于以上标准,在CNKI数据库中对这9本核心期刊,从2003至2012年做穷尽性检索,采集所有语言哲学研究论文,共计451篇。
3.数据处理及分析
所采集数据全部电子化处理,截取所有论文的题目、作者、机构、摘要、关键词,每个文件单独建立相应文本,所有文本保存编码为unicode的.txt格式,创建近十年国内外语类核心期刊语言哲学学术文献语料库(以下简称语哲语料库),库容达58.664千词。并以期刊、年限为参数建立相应子库,为开展后继研究打下基础。
由于英汉语之间的差异,即与英语不同,汉语词与词之间没有空格,为使得语料处理软件Word⁃Smith(6.0)识别汉语语词,我们采用张华平博士开发的ICTCLAS定制版本对汉语文本进行分词并保存。结合Excel和语料库检索软件WordSmith(6.0),提取相关数据进行统计分析,并对定量分析结果做出解释。
三、研究结果与讨论
依据文献计量学研究框架,我们拟从刊载论文、刊文期刊、来源作者、来源机构、研究关键词几个方面分别进行讨论。
1.刊载论文分析
由于我们在做语哲语料库时,每篇论文占取一个.txt文档,通过Excel中的sum函数,得出年度刊文总量,详细见图1:
图1 年刊载语言哲学论文总量趋势图
总体而言,图1显示高质量语言哲学研究性论文稳中有升,尽管有些年度出现起伏,但没有改变由少变多的总体趋势。这一方面说明国内语言哲学研究质量上升;另一方面也表明核心类期刊趋于接受语言哲学研究性论文。
从图1中,还可以看出2008年至2009年间出现了一个陡增趋势。我们认为2008年是中国外语界语言哲学研究界的一个重要年份,2008年1月11日于广东外语外贸大学国际会议厅,成立了中西语言哲学研究会。研究会的成立极大地鼓舞了国内语言哲学研究者,《外语学刊》甚至推出了“庆祝中西语言哲学研究会成立专栏”,我们认为这可以部分解释此期间外语界语言哲学研究论文极速增长。
但也可以看到20004年至2005年间有个下降趋势,2009年至2010年又出现一个陡降趋势。我们考虑这可能与外语界重要期刊《外语与外语教学》的变动不无关系,其前任主编张后尘先生在2004年改任《中国外语》主编,张先生对语言哲学研究论文多有青睐。“《中国外语》的主编张后尘以敏锐的眼光、前瞻意识与少有的创新精神使这个刊物在创刊之后不久就立即抓住了传播西语哲这个亮点”[8],而2010年《外语与外语教学》改版,由一年12期改为6期,刊文总量大大减少,相应语言哲学研究的刊文也有所下降。
此外,2010-2012年期间,期刊刊发论文呈不断增长趋势。这从侧面表现出外语界语言哲学研究队伍不断扩大,语言哲学研究逐步深化。
2.刊文期刊分析
各期刊刊文总量并不一致,部分期刊更加青睐于刊发语言哲学研究论文,我们针对各期刊,对其10年间所刊发论文总量做出分析。详细数据见图2:
图2 各期刊刊发语言哲学研究论文总量
从图2中可以看出,刊文绝对数量最多的期刊为《外语学刊》,10年间共刊发语言哲学研究论文226篇,占总刊文总量的50%。其次为《外国语文》和《外语与外语教学》,分别为60篇和36篇。而《外语界》最少,10年间仅出现1篇。检索细读该篇论文,我们发现其主题是关于语言意识的性质与特征以及语言意识研究对于语言习得的意义。这表明《外语界》所刊发论文主要研究对象并非语言哲学,符合其办刊宗旨。
考虑到所收录期刊年刊发期刊数量存在差别,有单月刊、双月刊、季刊,我们还考察了期刊发文篇数与年度比率、期刊发文篇数与期数比率,详细见图3、图4:
图3 各期刊刊发语言哲学研究论文篇数与年度比率
图4 各期刊刊发语言哲学研究论文篇数与期数比率
从图3、图4可以看出《外语学刊》作为语言哲学研究“重要基地”名符其实,无论是刊文篇数/年比率还是刊文篇数/期数比率均稳居榜首,远远超出其他期刊,在推动我国语言哲学研究方面功不可没。考虑到办刊宗旨不同,我们预期《外国语》刊发相关语言哲学研究论文可能较少,但出乎意料的是,该刊年均刊发论文3.3篇,仅次于《外语学刊》《外国语文》和《外语与外语教学》,且刊文篇数/期数比率与《现代外语》并列第三。由于每年发行期数不同,按照刊文篇数/期数比率,从高至低依次为:1.《外语学刊》2.《外国语文》3.《现代外语》《外国语》4.《外语教学》5.《外语教学与研究》6.《外语与外语教学》7.《洛外学报》8.《外语界》。
从另一方面,也可以看出尽管刊发论文近十年来总量稳步增长,但总体而言,语言哲学相对于其他学科,外语类核心期刊刊文仍然不多。除了《外语学刊》、《外国语文》之外,其他期刊每期不及1篇。这也表明国内外语学界对语言哲学作为“语言研究的营养钵”仍认识不足,语言哲学研究者仍需不懈努力。此外,语言哲学研究学界亟待建立专门研究期刊,为推动语言哲学在国内的发展提供讨论平台。
3.来源作者分析
一个作者发表论文的多少在一定程度上反映了其科研状况,因此对语言哲学论文发表的作者进行计量统计,可以观察到这一领域的核心研究者。我们使用WordSmith(6.0)语料库软件包,以“作者”为检索项,通过关键词右一词项进行从高到低排序,得到发文总量的作者排序名单,如图5所示:
图5 基于发文总量的核心作者
图5 显示,前15位作者作品总数为92篇,占刊发论文总数的20%;前30位作者论文刊发总数为130篇,占刊发论文总数的29%。其中发表5篇(含5篇)论文以上的作者有8位,分别是:王寅、刘利民、徐盛桓、李鸿儒、叶起昌、钱冠连、冯光武、王爱华,共刊发论文64篇,占刊发论文总数的14%。对一个学科的了解,需要了解该研究领域核心成员的著作。对于初涉语言哲学研究者,可以依据图5所示语言哲学领域核心研究者著作进行选择性研读。
4.来源机构分析
来源机构刊文总量也是该机构某一领域科研团队力量的体现。考虑到语哲语料库中包含有“【机构】”一项内容,我们使用WordSmith(6.0)语料库软件包,以“机构”为检索项,并通过搭配排序,得到大体上的研究机构名单,如图6所示:
图6 显示,语言哲学研究机构主要集中在黑龙江省、老四川地区、广东省、北京市和上海市。基于以上结果,我们在语哲语料库中对各搭配词进行详细检索,以刊登论文篇数计算(包含非第一作者),从多到少依次排列前10位的研究机构为:黑龙江大学(43篇)、广东外语外贸大学(26篇)、四川外语学院(21篇)、首都师范大学(15篇);河南大学(13篇);解放军外国语学院(13篇)、华东师范大学(10篇);西南大学(包括原西南师范大学)(10篇)、清华大学(9篇)、暨南大学(8篇);四川大学(8篇)、北京外国语大学(7篇)、上海交通大学(6篇);中山大学(6篇)。
可以看出,研究机构区域分布不够均衡,特别是中西部地区(原四川、河南省除外)缺少核心研究成员,而此类地区相对于东部及沿海经济发达省份,在资金支持上相对薄弱。但语言哲学研究特点相较于实证研究而言,不需要过多得依赖于昂贵的仪器、工具、技术手段,更适合该类地区研究人员进行探讨和研究。因此,中西部地区需要继续深入拓展在语言哲学领域的研究。
5.关键词分析
关键词词表能够反映某一领域的研究热点,为此我们使用语料库软件包WordSmith(6.0)制作了语哲语料库关键词表。我们首先建了一份停用词表(stoplist),包括“作者”、“机构”、“摘要”、“关键词”、“本文”、“的”、“了”、“与”等,以避免非语言哲学领域关键词的生成。然后,以库容百万词的现代汉语书面语通用型平衡语料库——兰卡斯特现代汉语语料库2.0版为参照语料库,分别生成相应词表并制作语哲语料库关键词表,并依据关键性(keyness)的数值大小依次从大到小进行排列的,具体词表见图7:
图7 语哲语料库关键词表
图7显示,前5位的研究关键词为语言、哲学、语言学、意义、理论。这5个关键词基本从宏观上厘定了语言哲学的研究领域,即具有哲学性质、关注语言及意义的理论建构,同时“语言哲学和语言学的关系格外紧密”[9]18。前30位的关键词还有认知、语用、分析、语境、逻辑、符号、语义、概念、思维、体验、本体论、世界、含义、话语、命题、隐喻等,认知、体验、思维等关键词的高频使用反映出当前认知科学迅猛发展在语言哲学领域带来对体验观的新一轮研究热潮,语言哲学经典论题如逻辑、符号、本体论、命题等在中国语言哲学界依然占据着重要的地位。此外,值得一提的是,维特根斯坦和索绪尔也是近十年来语言哲学研究领域所关注的两个重要代表人物,成为了研究关键词。可以看出,语言哲学研究对象仍然主要集中在语言、语义、语境、逻辑、思维、世界、维特根斯坦等经典论题之上,进而从经典论题入手开展“节外生新枝”的拓展性研究。
四、结论
本文在文献计量学研究框架下,基于语言哲学学术文献语料库并辅以数据统计,开展了近十年外语界核心期刊所刊发语言哲学研究的文献计量研究。研究结果显示:1)外语学界高质量论文数量总体趋势上扬,稳中有进。2)除《外语学刊》、《外国语文》外,外语类核心期刊刊发语言哲学论文总量普遍较少,有待建立更多的语言哲学讨论平台。3)国内语言哲学核心研究团体及机构逐步建立,但区域分布不够均衡。4)语言哲学关键词
主要集中于语言、语义、语境、逻辑、思维、世界、维特根斯坦等经典论题。这为语言哲学研究者以及期刊编辑发行部门了解国内语言哲学研究现状并进一步推进语言哲学研究提供了参考。
致谢:感谢上海交通大学外国语学院语言哲学方向硕士研究生朱晓真在语料库建设方面的帮助。
[1]钱冠连.西语哲在外语界的传播与未来的发展[J].外语学刊,2008(2):1-16.
[2]温晋方.外语界科研概况的文献计量学研究[J].外语学刊,2002(4):107-111.
[3]Chen,C.M.CiteSpace II:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Lit⁃erature[J].Journal of the American Society for Informa⁃tion Science and Technology,2005(3).
[4]陈汉轮.数字出版研究论文的文献计量与分析[J].科技与出版,2013(5):92-96.
[5]李镜镜,张志强.国内电子书研究的文献计量分析[J].出版科学,2013(4):85-90.
[6]杨彭.2008-2012年我国数字图书馆领域的文献计量分析[J]. 图书与情报,2013(5):72-77.
[7]李涛,徐芳.莎士比亚戏剧汉译译者研究综观[J].山东外语教学,2013(6):100-105.
[8]钱冠连.论语言哲学的基本元素《语言哲学精典原著系列》总序[J]. 外国语文,2010(6):40-44.
[9]陈嘉映.语言哲学[M].北京:北京大学出版社,2003:18.