APP下载

大数据中的中国文化名人名著:500年国际知名度分析

2016-09-01张亮亮李双龙吴楷文

学术论坛 2016年6期
关键词:文化名人大数据

张亮亮,张 洪,李双龙,吴楷文

大数据中的中国文化名人名著:500年国际知名度分析

张亮亮,张洪,李双龙,吴楷文

[摘要]文章基于谷歌图书的百万书籍大数据,以中国文化名人名著近500年来英语书籍中呈现的词频来分析其国际知名度的变迁及其特性。研究发现,孔子、孟子、朱熹、李白、杜甫、鲁迅、梁启超、康有为、王维和墨子为中国文化名人国际知名度前十名;《论语》《周易》《诗经》《史记》《道德经》《礼记》《水浒》《春秋》《尚书》和《楚辞》为中国文化名著国际知名度前十名,且中国文化名人名著的国际知名度具有内在相关性。我们发现,国际知名度的变化和政治事件、“中学西渐”密切相关,具有跨文化传播流派连带性,并且与国际知名度的朝代分布和国力、文化多元繁荣度密切相关。

[关键词]大数据;国际知名度;文化名人;文化名著

一、导 言

文化是一定的历史阶段、地域环境、人类种群的一种生存状态、生活习惯、思维方式的反映。在文化的诸多内涵要素中,名人名著是一国文化传承的重要载体,作为文化传承的时间载体,中国文化名人名著的国际知名度不仅体现了其本身在国际层面的知晓度,也体现了中国文化在国际层面的关注度。更重要的是,它是衡量整个中华文化国际知名度和国际影响力的一个重要组成部分。因此,研究中国文化名人名著的国际知名度,是国家层面提升我国文化国际知名度和影响力的应有之义。不过,由于数据和测量的局限,学界迄今尚未对这一领域有过系统探索。

现有文献中文化名人知名度仅局限于文化名人效应研究,多被量化为名人级差,分为世界、国际、国家、省市、地县五级,与文化价值、经济旅游发展等相结合[1][2],且相关研究均局限在某个时代或地域文化名人,缺乏对自古以来全国文化名人群体的鸟瞰。现有文献也极度缺乏对文化名著知名度的研究,基本文献局限于名著的解读,并与素质教育、名著影视改编等相结合[3]。总体上,现存文献对文化名人名著国际知名度的研究,既缺乏历史时间维度上的回顾,也没有系统分析和测量。

“大数据”尤其是数字化书籍语料库的应时出现,为开展社会科学研究提供了空前的机遇[4][5]。目前,谷歌图书(Google Books)语料库能提供公元1500年以来7种语言800多万种数字化书籍的全文词频检索[6][7]。通过分析关键词在语料库中词频的变化,我们可以呈现关键词在人类文化发展史中有趣的现象和趋势。因此,本文基于谷歌图书1500年以来的英语书籍语料库,以中国文化名人名著的英文名称为关键词,以这些关键词在语料库中每年出现的频率高低为指标,在纵向跨度500年、横向跨度达千亿词汇的文化大数据中,精准描绘文化名人名著词频的变迁及特征,填补这一研究领域的空白。

二、数据、概念和策略

(一)数据

我们以谷歌图书语料库为中国文化名人名著国际知名度测量的数据库,考虑到2000年之后的书籍仍然在数字化过程中,为减少样本偏误,本文分析设定的历史上限定为1500年,历史下限为2000年。

英语是近百年来全球使用最广和最重要的通用语言之一,而积累数世纪的浩瀚书籍是数百年里国际社会知识、观念和经验的重要载体[8]。因此,我们认为,在一个具有足够规模、跨度和代表性的英语书籍语料库中,文化名人名著在某一时间跨度内出现的次数可以代表其在该时段内的国际知名度。

(二)概念

文化名人主要是指在文化领域特别突出的人物。本文以《中国百位文化名人传记》为主,选取上百位文化名人进行分析,原因如下:一是具有权威性,《中国百位文化名人传记》是由中国作家协会具体实施的国家级文化重大工程;二是人物记载全,该传记力图囊括中国文化史上所有重要的文化名人。

考虑到每年书籍中的词汇量不尽相同,我们用该文化名人词频除以当年的词汇总量以获得数据的时间可比性。具体该比例计算公式为:其中,Rit为文化名人在公元t年的词频比例,也即知名度,Cit表示文化名人i在公元t年的出现次数,Ct为公元t年中出版书籍的全部词汇量。

文化名著主要指具有较高艺术价值和知名度的文字作品。本文主要以文化大家推荐的文化名著为检索关键词,例如:1920年,胡适拟写含有31种古籍《中学国故丛书》目录;1923年,梁启超编撰《国学入门书要目及其读法》;1924年,章太炎发表的《中学国文书目》;1930年,钱穆开列的《文史书目举要》;1982年,蔡尚思在《中国文化基础书目》的基础上提出最能代表中国文化的40种书。因为这些名家推荐的书目具有权威性和重合性,所以本文从这些推荐书目中选取文化名著进行分析。

同理,考虑到每年书籍中的词汇量不尽相同,我们用该文化名著词频除以当年的词汇总量以获得数据的时间可比性。具体该比例计算公式为:Qit=C′it

C′t其中,Qit为文化名著i在公元t年的词频比例,也即知名度。C′it表示文化名著人i在公元t年的出现次数,C′t为公元t年中出版书籍的全部词汇量。

(三)策略

在检索关键词的过程中,我们注意到:绝大多数名人名著的英语名称近500年来发生了变化,例如孔子在英语中既可以被称Confucius,也可用汉语拼音Kongzi表示。因此,要计算孔子的词频必须让两者相加。同时,不少文化名著还不止一个别名,如《西游记》现称为Xiyouji,而国外称之为Journey to the West/Monkey/The Adventures of Monkey等。在数据统计过程中,我们均设置了单词字母大小写的非严格区分。例如,Kongzi和KONGZI都可以被统计进来。因此,我们仔细考证了文化名人名著全部可能的英文名称,并对各自检索结果进行加总以获得最为精确的文化名人名著检索数据①需要文化名人名著检索名单的读者可向作者索取。。

三、500年来中国文化名人名著的国际知名度

(一)500年来中国文化名人的国际知名度分析

我们首先对文化名人的国际知名度指标进行分段分析(均截至2000年),计算出平均知名度。我们发现,在1500-1700年间的英语书籍大数据中,仅孔子有所记载,其他文化名人提及极少。因此,我们分别对近300年、200年、150年、100年、50年和20年的时间序列进行单独分析,并将有关时段的文化名人进行了计算和排名。考虑到文章篇幅,表1给出了前30强的文化名人榜单②需要其他文化名人国际知名度排名的读者可向作者索取。。从表中可见,这6个不同历史跨度的文化名人的平均知名度排序总体上稳定:500年来平均知名度前30集中在35位文化名人;前20集中在24位文化名人;前10集中在15位文化名人。总体上,孔子、孟子、李白、杜甫、朱熹、鲁迅、梁启超稳居前10名,他们在任何一个历史阶段的平均排名都非常靠前(康有为5次进入前10;王维四次进入前10;墨子三次进入前10;孙子两次进入前10;老子、庄子、韩非、郭沫若1次进入前10)。换句话说,中国文化名人的国际知名度本身是一个较为稳定的指标:尽管近500年来江山代有人才出,但最知名的文化名人基本上是稳定的。

表1 中国文化名人近300年来各历史阶段国际知名度前30强

除了观察平均值之外,我们还有必要对总体演变情况进行分析。我们在图1中用时间序列曲线来展示500年来进入国际知名度前30的文化名人词频变化。近500年来,孔子一直遥遥领先,1500-1700年间,仅有孔子在英语书籍中被长期提及。1700-1800年间,除了孔子外,仅有孟子、墨子被少次提及。1800-1900年间,在英语书籍中提及相对较多的依次为孔子、孟子、朱熹、墨子、李白、杜甫、管仲、班固。1900年以后,除孔子外的中国文化名人才被普遍提及。毫无疑问,孔子是中国最为知名的文化名人,而其他文化名人与之相差甚远。

此外,1700年后中国文化名人在英语书籍中开始普遍被提及且波动增长,以前10名为例进行分析。如图2,杜甫、朱熹、鲁迅词频曲线波动巨大:杜甫在1925年左右急速上升,1925-1930年间达到第一个峰值,1950年左右达到第二个峰值,之后回落但位于高梯度层次平稳波动。朱熹1835年出现,1915年开始大幅上升,在1925和1935年左右出现两个峰值后大幅下降,于1940年后大幅上升,在1960年达历史最高点后再次回落。鲁迅在1970年以后大幅上升,于1985年左右达到最高值,之后小幅回落并位于高梯度层次平稳波动。墨子、李白、梁启超、康有为的词频曲线波动平缓:墨子于1745年和1880年左右达到两个峰值,在1920年后小幅上涨,1960年达到历史最高之后回落并位于高梯度层次平稳波动;李白在1915年后平稳增长,于1940年后达到最高值,之后较为平稳地下降波动;梁启超、康有为均于1890年后出现,在1905左右小幅上升,在1935-1940年间上涨,康有为于1955年左右达到峰值后平稳回落,梁启超在1960-1980年间达到三个相似峰值之后平稳回落。

值得注意的是,屈原的国际知名度排名并不高,只在近20年里进入中国文化名人国际知名度的前25名。1935年之后,屈原才在英语书籍中出现,词频变化曲线也相对比较平稳,仅在1985年左右和1993年左右出现两个小高峰。其他文化名人虽然也有不同程度的发展和波动,但大致都处于较低梯次范围内。

图1 中国文化名人国际知名度前30强(基于书籍大数据)

图2 中国文化名人国际知名度前10强(除孔子、孟子外)

(二)500年来中国文化名著的国际知名度分析

我们首先对我国文化名著的国际知名度指标进行分段分析(均截至2000年),计算出平均知名度。我们发现,1500-1700年间,仅《礼记》有所记载,而其他名著提及极少。因此,我们分别对近300年、200年、150年、100年、50年和20年的时间序列进行单独分析,并将有关时段的文化名著进行了计算和排名。考虑到文章篇幅,表2给出了文化名著国际知名度排名前30强的榜单①需要其他文化名著国际知名度排名的读者可向作者索取。。从表中可见,这6个不同历史跨度的文化名著的平均知名度排序总体上稳定:6个不同时期的平均知名度前30集中在31部文化名著;前20集中在22部文化名著;前10集中在12部文化名著。总体上,500年以来,《论语》《周易》《诗经》《史记》《道德经》《礼记》《水浒》《春秋》《楚辞》稳居中国文化名著国际知名度前10名,这些名著在任何一个历史阶段的平均排名都非常靠前(《尚书》三次进入前10;《红楼梦》两次进入前10;《战国策》一次进入前10)。换句话说,中国文化名著的国际知名度本身是一个较为稳定的指标:虽然近500年中国经典名著层出不穷,但最知名的文化名著基本上稳定。

除了观察平均值之外,我们还有必要对中国文化名著国际知名度的总体演变情况进行分析。我们在图2中用时间序列曲线来展示500年来进入国际知名度前30的文化名著词频变化。在近500年的英语书籍中,《论语》长期以来独占鳌头;1500-1700年间,仅有《礼记》在英语书籍中被长期提及;1700-1800年间,除了《礼记》外,《徐霞客》《楚辞》《论语》《史记》《三国演义》等逐渐被提及;1800-1900年间,在英语书籍中提及相对较多的为《论语》《尚书》《礼记》《诗经》《春秋》;1900年以后,中国文化名著才被普遍提及。毫无疑问,《论语》是中国最为知名的文化名著,而其他文化名著与之相比存在较大差距。

此外,1700年后,由《楚辞》《史记》开始,中国文化名著在英语书籍中开始被提及并且波动上升,以前10名为例:根据图4,《楚辞》的国际知名度发展比较平稳,没有明显较大的跌宕起伏;《诗经》在1920年后急速上升,1933年左右达到第一个峰值,之后略有回落并以较稳定的速度波动变化下降;《史记》《春秋》在1960年左右出现了历史最高峰值,此后《春秋》一直起伏较大呈现了明显的波动和梯次,而《史记》之后出现了大幅回落,在1985年后再次上升并一直在较高梯次范围波动;而《论语》《周易》《道德经》《诗经》有着类似的波动起伏,只是波动程度不同,例如,《论语》《诗经》的国际知名度自1900年以后一路曲折攀升,均在1930-1940年、1960年和2000年左右达到峰值。其他文化名著虽然也有不同程度的发展和波动,但大致都处于较低梯次范围内。

表2 中国文化名著近300年来各历史阶段国际知名度前30强

值得关注的是,《水浒》是中国四大名著中唯一稳定在前十名的文化名著,这和赛珍珠有很大的关系,《水浒传》迄今最有影响力的译本是1933年赛珍珠版的《四海之内皆兄弟》(All Men Are Brothers)。这是《水浒传》的第一个英译本,曾登上美国权威的“每月图书俱乐部”的排行榜(叶旭军,2008)。《红楼梦》的国际知名度不如《水浒》,仅在近50年进入前10名,主要是因为《红楼梦》的跨文化翻译困难,英文翻译难以体现红楼梦的韵味,

不同文化背景和语言习惯易造成翻译失真[9]。

图3 中国文化名著国际知名度前30强(基于书籍大数据)

图4 中国文化名著国际知名度前10强(除《论语》)

(三)近500年来中国文化名人与文化名著的国际知名度变化相关联

从表1和表2我们可以发现,有些文化名著或是出于文化名人之手或是由他们编制或是与其学说相关。例如,孔子稳居文化名人国际知名度的第1位,而《论语》则稳居文化名著国际知名度的第1位;老子的国际知名度排在前14位,记录老子的学说《道德经》则排在3-6名;司马迁近20年进入国际知名度前20名,其著作《史记》稳居3~4名;顾炎武在近50年进入前30名,其著作《日知录》稳居28名。

其中,最为典型的就是孔子与《论语》:孔子与《论语》分别稳居文化名人名著的第一位,且儒家经典“五经”(《周易》《礼记》《尚书》《诗经》《春秋》)均排在前10名。我们从图1、2中发现:1860-1980年间,孔子与《论语》的词频曲线波动的幅度相似,且在6次相近的时间里(1865-1870年、1909年、1927年、1940-1945年、1950-1960年、1970-1975年)出现峰值。例如,1950-1960年、1970-1975年正值新中国建立新外交之际,孔子思想是新中国和平外交政策的重要来源,孔论述了道义、礼制与国家权力之间的关系,催生了和平共处五项原则、求同存异的外交方针的外交理想。周恩来曾多次直接引用《论语》,其中被反复引用的就是“和为贵”“和而不同”“己所不欲,勿施于人”等[10]。对照图1和图2,我们还可以发现,两者存在一个重要的谷值,即1919年新文化运动之际,“打倒孔家店”是公认的五四新文化运动的纲领性口号,除了《论语》,儒家经典《诗经》《春秋》《周易》等也在1919年左右出现谷值[11]。由此可见,文化名人孔子与《论语》及儒家经典等文化名著的国际知名度变化密切相关。换句话说,近500年来中国文化名人与文化名著的国际知名度变化相关联。

四、中国文化名人名著国际知名度的特征

(一)国际知名度的变化和政治事件密切相关

仔细观察文化名人名著的词频曲线可以发现:无论是在曲线的高处还是低处,总有不时的尖锐起伏和波动。而这些波峰与波谷的出现往往与中国历史上政治事件密切相关。

从图2中我们可以发现,鲁迅词频在1970年左右急速上升,到1980年左右达到峰值,而这与中美建交具有密切联系。鲁迅从中国走向世界离不开中外学者对其作品的翻译与研究,中美建交后,特别是80年代以来,随着经济发展,多元文化融合,促使鲁迅小说翻译走上复苏繁荣期(蔡瑞珍,2015)。具体而言,鲁迅的很多作品都是由美国高等学校出版。例如:1981年,美国印第安纳大学出版了杨宪益和戴乃迭合译的《鲁迅小说全集》;1995年,哥伦比亚大学出版《哥伦比亚中国现代文学读本》,其中“小说”部分有《〈呐喊〉自序》《狂人日记》《孔乙己》;1996年,美国斯坦福大学出版丹顿主编的《现代中国文学思想读本》,鲁迅的《摩罗诗力说》《论照相之类》《〈呐喊〉自序》《文艺与政治的歧途》《论第三种人》入选[12]。

从图3中,我们可以发现,《论语》国际知名度近300年来出现了数次峰值,我们分析其显著的三次峰值:第一次高峰处于1865-1870年间,两次鸦片战争导致的侵华各国对中国的关注,太平天国运动也使得西方世界更加关注中国文化,从而了解《论语》。第二次高峰处于1875-1880年间,中国民族资产阶级的产生和洋务运动的兴起使得西方世界更加关注中国的发展,对于孔孟和儒家经典也有更深入的了解。第三次高峰在20世纪30年代,正是日军侵华战争爆发时期。由这三次高峰可以看出,世界各国侵略中国时,也相应更多地了解中国文化,了解孔子与《论语》。此外,《论语》在1980-2000年间稳步上升,一直到2000年左右达到历史最高点,这与改革开放中国走向世界有着很大的关系。

改革开放30年来,随着国力的增强,中国日益以一种开放、自信和宽容的姿态融入国际社会,中华文化也逐渐挺起胸膛,最明显的例子就是孔子学院遍布世界。孔子学院是推广汉语和传播中国文化与国学的教育和文化交流机构,其为世界各地的汉语学习者提供规范、权威的汉语教学。孔子学院是连接中国与其他文化沟通交流的桥梁,促进华夏文化的跨文化传播[13]。随着中国日益融入世界和中国文化的传播,中国文化名人名著在英语书籍中被提及频次也逐渐稳步提升。

(二)国际知名度的变化与“中学西渐”密切相关

中国文化名人名著国际知名度的变化不仅与历史政治事件相关,还与“中学西渐”相关联。从图1中我们可以看到,孔子自1575年有记录以来,其国际知名度出现了数次峰值,我们分析其显著的三次峰值:第一次高峰处于1575-1585年间,此间,意大利人利玛窦(Matteo Ricci)来到中国,他注释“四书”并写作《出访中国记》,欧洲人第一次从此书中知道孔子和儒家经典。第二次高峰处于1650-1660年间,意大利人卫匡国(Martino Martini)著述《中国历史》并将中国文化思想灌输欧洲[14]。第三次高峰即历史最高点处于1735-1740年间,法国人冯秉正(Joseph-Francois-Marie-Anne de Moy-riac de Mailla)的《中国通史》问世,其在序言中介绍了孔子。由此可知,当时书籍出版非常昂贵且数量少,但凡提及就会显得比例很高,这表明孔子在那个时代已被外国人所熟知。由此可见,“中学西渐”背景下每逢关于中国的外文书籍出版,孔子是不可跨越的文化符号。

朱熹也在“中学西渐”的背景下受到西方的日益关注。我们可以从图1中看到,朱熹词频在1920年左右、1935年左右达到两个相似的峰值,此间,《哈佛亚洲通讯》发表霍金(William E.Hocking)的《朱熹的知识论》,这是西方最早研究朱熹的论文。1940年起,朱熹词频急速上升,于1960年左右达到历史最高值:1946年,加大伯克利分校出版宓亨利(H.F.MacNair)主编的《中国》,其中一章是朱熹思想的介绍;1960年,陈荣捷与狄百瑞(Wm. Theodore de Bary)合编《中国传统诸源》并撰写朱子一章;1967年,谢康伦(Conrad Max Schirokauer)撰写《大英百科全书:朱子传》,同年《近思录》的翻译得以出版,典籍的翻译加速朱子学在西方的传播。1982年,美国学术团体举办首界“国际朱熹会议”,“国际朱熹会议”的召开是国际朱子学研究兴旺的标志,它成为推广朱熹的国际影响、加强朱熹研究的国际性合作的重要平台[15]。由此可见,“中学西渐”背景下每逢关于新儒学和宋明理学等的外文书籍出版或者相关会议的召开,朱熹是不可跨越的文化名人。

(三)国际知名度变化具有跨文化传播流派连带性

中国文人自古有流派之分,而流派命名方式主要是以代表作家、题材、风格和理论等命名[16]。弄清流派与作家、风格、理论等关系,有助于我们理解国际知名度变化的跨文化传播的流派连带性。

根据名人流派和身份,我们把前30强大致作如下流派分类:儒家(孔子、孟子、荀子)、墨家(墨子)、道家(老子、庄子)、法家(韩非、管仲)、兵家(孙子)、“大李杜”(李白、杜甫)、“唐宋八大家”(韩愈、苏轼)、“理学”(朱熹)、“心学”(王阳明)、维新派(康有为、梁启超、严复)等。我们可以从图1中发现,儒家孔子与孟子曲线波动有着惊人的相似性:自1860年以后两者曲线的波峰与波谷基本吻合,曲线变化幅度基本一致。道家老子和庄子在1980年之前一直在低梯次内平稳波动,1980年后大幅上升并于2000年左右达到历史最高点,且在近20年里同时进入前10名。“维新派”严复、康有为、梁启超曲线波动基本一致,三人均于1890年后出现,在1905左右小幅上升,在1935-1945年间大幅上涨,达到相似峰值之后以相似的幅度回落。

根据名著流派和题材,我们把前30强大致作如下分类:儒家经典(《论语》《诗经》《尚书》《礼记》《周易》《春秋》);道家经典(《道德经》);四大名著(《水浒》《西游记》《红楼梦》《三年国演义》)等。我们可以从图2中发现,《论语》与《诗经》在1920-1970年间的曲线波动幅度相同:1920-1930直线上升,1929-1932达到峰值,1942-1949年间两者均出现两个齐平的峰值,1960年两者再次达到峰值。1860-1980年间,《论语》与《尚书》曲线波伏一致,均在1875年、1930年、1960年左右出现相似的峰值。《论语》与《周易》在1965-2000年曲线波动幅度基本一致,即儒家文化名著的国际知名度的变化具有相似性。我们还可以发现,四大名著《水浒传》《西游记》《红楼梦》《三年国演义》均在1790-1970年间平稳波动,1970年之后大幅上升,只是《水浒》的增长幅度远远大于其他三部。

由此推断,当英语书籍中提到儒家时,必然将孔孟放在一起;提到道家,必然将老庄联系在一起;谈到“维新变法”,必然会将康有为、梁启超师徒放在一起;提到《论语》,也将会谈到“四书五经”;说到《水浒》,也将提到中国四大名著的其他三部等。由此可知,跨文化传播必然是以点带面地渐次进行,即中国文化名人名著的国际知名度变化具有跨文化传播的流派连带性。

(四)国际知名度的朝代分布与国力、文化多元繁荣度密切相关

中国文化名人名著的国际知名度不仅具有跨文化传播的流派连带性,而且其朝代分布还与一个国家的国力和文化多元繁荣度密切相关。为了更好地分析国际知名度的朝代分布与国力、文化多元繁荣度的关系,我们将前30强(民国以前)按朝代进行基本的归类,结果见表3。

表3 中国文化名人名著朝代分布

文化名人名著的国际知名度和文化多元繁荣程度有关。从表3中,我们可以发现,春秋战国时期文化名人名著的数量最多乃至超过汉唐盛世:春秋战国时期共有10位文化名人、9部文化名著进入前30强。而汉代有3位文化名人、6部文化名著,唐代有7位文化名人、2部文化名著进入前30强。结合表1,我们还可以发现,其中孔子、孟子、老子、庄子、墨子,《周易》《论语》《道德经》《尚书》《诗经》《春秋》进入前10名。春秋战国时期,传统社会秩序受到冲击,文人志士游说讲学、著书立说,产生了各种思想流派,出现了中国历史上文化多元繁荣高峰。由此可知,春秋战国时期文化名人名著与多元文化繁荣密切相关。从表3中,我们还可以发现,明代国际知名文化名人名著的数量超过清代,这也和文化多元繁荣密切相关。明朝文学活动极为活跃,小说、戏曲等蓬勃发展,最显著的例子就是四大名著有三部(《水浒》《西游记》《三国演义》)写于这一时期。

文化名人名著的国际知名度和国力相关。从表3中,我们可以发现,汉唐时期的名人名著明显多于宋代,这与汉唐时期的国力密切相关。前30强中,有3位名人、6部名著属于汉代。汉代的国力之盛、疆域之广,以及西汉丝绸之路的开通对汉代的文化交流有着积极的影响,使得史学、汉赋等得以向欧非大陆传播。由此,汉代史学家、文学家、史学著作、文学著作为西方世界所熟知。前30强中,有7位名人、2部文化名著属于唐代。唐朝在“丝绸之路”陆路的基础上新辟至朝鲜、日本、西亚、欧洲的海路。更为重要的是,唐朝统治者采取吸收外来文化的政策,至力于将中国文化传播到世界各地。此间,儒学文化得以整理,道教文化得以发展,佛教得以传播,文学艺术百花齐放。此外,唐代繁荣的文化对日本产生了强烈的吸引力,日本派遣留学生和遣唐使学习唐朝文化。对日文化输出,使得唐代以及唐代以前的文化名人名著进一步获得了间接传播的国际窗口。例如,日本儒学是在中国儒学的基础上发展而来的,日本儒学以中国儒学为范本,开办汉学学校,教授明经(《礼记》《左传》《周易》《尚书》)纪传(《史记》《文选》)、明法、音、书、算等[17]。

当然,文化名人名著的国际知名度不仅仅取决于国力。例如,元代是历史上首次征服全中国地区的征服王朝,国力昌盛,但是元朝的文化成果不多,没有名人名著进入国际知名度前30强。

五、结 语

文化名人名著国际知名度的排名,折射出太多值得深思的问题,但无论如何,经过500年的文化演绎,这些文化名人名著已是后世不可多得的文化精神财富。本文利用大数据的方法,对我国文化名人名著近500年来的国际知名度进行了描述分析,弥补国内外对中国文化名人名著的国际知名度研究的空白。研究发现,孔子是中国在全球最为知名的文化名人;《论语》是中国最为知名的文化名著,且中国文化名人和文化名著的国际知名度具有内在相关性。

从方法和数据的角度看,本研究表明:第一,从现有的大数据中提取出相关的变量用以描述或分析,是当前利用大数据进行社会科学定量分析的可行途径。第二,词频统计方法是对非结构化的、非为研究定制的文本大数据进行分析的有力武器,其在社会科学领域的用途还将得到进一步拓展。

需要指出的是,由于谷歌数字化图书的版权问题,目前谷歌只能对外提供词频,而无法实现具体书籍和词汇的匹配。比如,一种极端的可能是,一本曹雪芹专著大量出现曹雪芹的名字,而施耐庵虽然没有专著,但却在数十本书中出现,显然两者的词频不太好直接比较。此外,本研究也存在诸多不足:第一,用词频代表文化名人名著国际知名度的尝试需要在今后的研究中得到进一步验证,以确保这是合理、综合、科学、可信的测度;第二,对文化大数据进行检索的精度仍然有进一步提升空间;第三,限于时间,我们梳理出的一些现象和规律,有可能只是挂一漏万,甚至以偏概全。在今后的研究中,我们会加强对上述问题的研究和解决。

[参考文献]

[1]章采烈.论历史名人级差及其效应——中国名人名胜资源的旅游价值[J].旅游学刊,1994,(4).

[2]郑惠生.大学生离经典名著有多远——大学生课外阅读调查研究之三[J].内蒙古师范大学学报:教育科学版,2005,(9).

[3]何希凡.电影对文学名著改编的困境与出路——影视文化的发展与中国现当代文学的接受研究之二[J].四川师范学院学报:哲学社会科学版,2003,(4).

[4]陈云松.大数据中的百年社会学——基于百万书籍的文化影响力研究[J].社会学研究,2015,(1).

[5]陈云松,吴青熹,黄超.大数据何以重构社会科学[J].新疆师范大学学报:哲学社会科学版,2015,(3).

[6]Michel J B,Shen Y K,Aiden A P,et al.Quantitative analysis of culture using millions of digitized books[J]. science,2011,(6014).

[7]Lin Y,Michel J B,Aiden E L,et al.Syntactic annotations for the google books ngram corpus[C]//Proceedings of the ACL2012systemdemonstrations.Associationfor Computational Linguistics,2012.

[8]陈云松,吴青熹,张翼.近三百年中国城市的国际知名度——基于大数据的描述与回归[J].社会,2015,(5).

[9]赵建忠.《红楼梦》在国外传播的跨文化翻译问题[J].天津外国语大学学报,2000,(3).

[10]刘芳,张勇.探析孔子思想对中国外交的影响[J].延边党校学报,2007,(1).

[11]林存光.五四新文化运动与孔子观念的根本转折[J].孔子研究,2004,(3).

[12]蔡瑞珍.文学场中鲁迅小说在美国的译介与研究[J].中国翻译,2015,(2).

[13]陈培爱,沈蓓蓓.跨文化传播视域下的孔子学院功能研究[J].新闻春秋,2013,(4).

[14]高连奎.中国大形势[M].北京:电子工业出版社,2011.

[15]卢睿蓉.美国朱子学研究发展之管窥[J].现代哲学,2011,(4).

[16]陈文新.论中国文学史上的九种流派命名方式[J].武汉大学学报:人文科学版,2007,(4).

[17]王勇.遣唐使时代的“书籍之路”[J].甘肃社会科学,2008,(1).

[责任编辑:戴庆瑄]

[作者简介]张亮亮,南京大学社会学系研究生;张洪,南京大学心理学系副教授,香港中文大学博士,江苏南京 210046;李双龙,西南财经大学社会工作发展研究中心副教授,日本九州大学博士,四川成都611130;吴楷文,南京大学社会学系研究生,江苏南京210046

[中图分类号]G05

[文献标识码]A

[文章编号]1004-4434(2016)06-0097-09

[基金项目]江苏高校哲学社会科学研究重点项目“中国传统文化的全球知名度”(2015ZDIXM001);江苏省社会科学基金重点项目“大数据视野中的江苏文脉研究”(15ZHA001)

猜你喜欢

文化名人大数据
韩国汉诗中的齐鲁文化名人形象研究
文化名人与淮扬菜
文化名人
———刘训毅
广播文化节目的“慢”与“深”——以《温州当代文化名人名家》为例
连连看
广西历史文化名人郑小谷
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索