APP下载

中国数字人文:发展现状、核心问题与多维价值

2024-05-29徐永明张世海

数字出版研究 2024年2期
关键词:数字人文

徐永明 张世海

编者按:

经过广泛调研和深入研讨,从本期起,“深度访谈”栏目采取了一些优化做法,在“深度”二字上进一步着力。我们的目标是将此栏目打造成一个兼具学理性、通俗性、可读性与纪录性的对话式学术表达载体,挖掘现象本质,探求思想前沿,同时为中国数字出版事业发展历程留存和积累信实的、有现场感的宝贵资料。

近些年,数字人文的发展已经在历史、古代文学、出版、文旅等领域产生广泛影响。不久前,本刊编辑部邀请黄淮学院张世海教授深度访谈了对数字人文有深刻独到理解、在该领域耕耘多年的教育部长江学者徐永明教授,以下为访谈实录。

摘 要:数字人文的理念和技术引入中国以来,对传统人文学科产生了深远影响。国内多个团队在数据库建设领域开展的独立的、具有竞争性的研究和开发有利于数字人文的整体繁荣和多种互补性系列产品的发展,但是在基础和通用性数据库建设方面还存在力量过度分散、重复建设和资源浪费等问题。数字人文事业具有重大的战略价值和广阔的商业前景,事关我国优秀传统文化的创造性转化和创新性发展,需要建构一个统一的框架体系完成基础性数据库建设,支持数字人文学科教育,鼓励学术共同体和产业界开展多种形式的合作。《数字出版研究》专访浙江大学文学院教授、教育部长江学者徐永明,探讨中国数字人文领域的发展现状、核心问题与多维价值。

关键词:数字人文;学术共同体;支持体系;多维价值

DOI: 10.3969/j.issn.2097-1869.2024.02.002 文献标识码:A

著录格式:徐永明,张世海.中国数字人文:发展现状、核心问题与多维价值:浙江大学文学院徐永明教授访谈实录[J].数字出版研究,2024,3(2):10-17.

访谈人物简介:

访谈对象:徐永明,浙江大学文学院教授、博士生导师,教育部“长江学者”特聘教授。浙江大学文学院数字人文研究中心主任,“学术地图发布平台”和“智慧古籍平台”负责人。

访谈人:张世海,中国社会科学院博士,黄淮学院文化传媒学院教授。

访谈时间:2024年3月14日上午

访谈地点:浙江大学文学院会议室

问:张世海

答:徐永明

1 哈佛大学的数字人文与中美合作

问:徐老师,非常感谢您接受我们的专访,首先祝贺您因数字人文领域的成就被评为长江学者。从接触数字人文到决心全力投入这个领域,哈佛大学的访学经历起到关键作用。您与哈佛大学数字人文的代表性人物包弼德教授是旧识,他是如何开展数字人文研究的?

答:包弼德教授对数字人文的意义理解很深刻,他有人文学科的研究背景,又有技术方面的知识积累,熟悉数据库,很多核心理念如数据库的组织框架、呈现形式等都是他本人的想法。他负责的“中国历代人物传记资料库”(China Biographical Database,CBDB)在学术界影响非常大,这是一个结构化的数据库,不仅能在地图上定位人物的籍贯,而且能展示人物的社会网络关系。

美国的学术支持体系比较发达,特别是像哈佛大学这种名校,校内的、社会上的和政府方面的各种基金很容易申请。他组建了一个技术团队,专门服务于他的理念。比方说,他想做中国历史地理信息、了解中国古代地名和行政区域的变化情况,就与复旦大学历史地理研究中心合作,建设中国古代的历史地理信息数据库(CHGIS)。

中国高校在人文学科投入的资金往往比较有限,文科老师的科研经费难以支撑与计算机老师的长期合作。计算机专业的老师如果有涉及文科的项目,虽然文科老师可以过去帮忙,但他们的出发点有很大的不同,因此项目缺少可持续性。

问:哈佛大学为什么会对中国的古籍感兴趣?

答:应该是基于学术性研究目的,他们好奇中国的历史和文化,想获得这方面的知识。他们的理念是全球性的,中国只是其中一部分。譬如,哈佛大学的历史地理信息数据库,除中国外,还有世界各大洲、各个国家和地区的历史地理信息库。涉及各个国家应用性的数据地图,最后都发布在WorldMap①平台上。(①WorldMap网站是哈佛大学基于地理信息系统(GIS)技术建立的人文地理信息数据库可视化查询平台。)

问:他们的用户主要是华人研究者吗?

答:对。但是国外做汉学研究的人也都在用,他们都反映哈佛的数据库很好,确实能提高研究效率。我自己做浙江文献总目,也受益于哈佛的CBDB数据库。比如把带有籍贯的作者解析出来,与数据库的文献进行匹配,就能很容易找出浙江籍作者的文献。

问:包弼德教授的原名是Peter K.Bol,他向爱新觉罗·毓鋆先生學习四书五经时,毓鋆先生给他取了“包弼德”这个名字。他给您留下什么印象呢?

答:他现在应该70多岁了,但是他的思维还非常活跃,不管是什么时候给他发邮件,他很快就会回复。他给我的印象就是那种很纯粹的人,对中国文化非常感兴趣,不管是在管理者还是普通学者的位置上,他的思想几乎全部都在学术上。

问:燕京学者筛选非常严格,你们过去自己基本上不需要花什么钱了吧?

答:是的,要经过层层选拔,然后再面试。我们那个时候一个月给3 000多美元,现在差不多6 000美元了吧。他们根据物价来确定资助金额,确保学者能安心做研究,包括家属的机票、保险等也都给解决。哈佛燕京学社的创始人查尔斯·马丁·霍尔(Charles Martin Hall)在民国时期是做铝业生意的,他对中国有好感,就在遗嘱里要求设立基金资助中国文化研究。

问:那段学习时间对您学术视野的拓展及后来学术方向的选择应该产生了很大的影响,这一点可能也决定了您对数字人文的理解,您做数字人文的方法跟国内其他学者不一样。

答:燕京学者都要在那里讨论、听报告,他们既请哈佛大学的学者,也请全球各地的学者过去讲学,确实对我影响很大。我刚开始不大了解数字人文,后来逐渐认识到它的价值,就决定深入研究。我意识到要研究数字人文,数字技术和人文两个方面都要懂才好。我花了很多的时间学习数字人文的技术,但还只是学了些皮毛。不过,我能把自己的需求较准确地传达给计算机专业的老师和技术人员,因此沟通成本比较低。

问:您的学术地图发布平台是以什么形式与哈佛合作的?

答:在提出合作后,对方建议就用他们WorldMap平台的框架,我们利用这样的系统发布数据,就好像我们从国外买了一个瓶子,但瓶子里的水是我们自己的。

问:您这边应该也涉及一些费用吧?

答:需要。我们改造系统时曾向他们咨询,他们主要收取咨询费,大概花了50万元人民币。改造好后基本就没有再花钱了,这是一个复杂的平台,如果我们自己重新做至少要花80万元人民币。

问:这种合作会不会有信息安全或知识产权方面的问题?

答:古代的地理信息文献资料都是公开的,他们还有很多数据库是利用中国公开出版的年鉴资料建立的。比如WorldMap会随时更新上传中国的信息,这些信息也都是能从公开途径找到的,他们会跟踪采集人口、空气质量、高铁、地铁、公路、天然气管道、电厂等方面的数据,再放到平台中。他们对中国的研究非常深入,是立体和全方位的,比如包括明代的驿站路线图、卫所分布图、清代1820年的寺庙分布图等等。

问:中美两国的人文交流是两个不同的文化体系,如果彼此在文化层面能互相理解和欣赏,其他领域的交流就有了共识基础。近几年两国关系的变化对人文交流影响大吗?您应该有切身感受。

答:我感觉比其他领域影响小一点,但也是有影响的。包弼德教授主要做中国历史文化研究,他很希望与我们合作,我们每年都派学生出国交流,从2006年以来已经有15个博士进入哈佛学习了,今年又有2个古代文学专业的博士去交流。我觉得中美的人文交流应该会一直持续下去的。

问:学生去交流的流程大概是怎样的,期间要做什么?

答:学生出发前,哈佛大学相关部门会提前发来邀请函,学生再申请国家留学基金,交流期间主要就是帮他们审核数据、校对或者做数据。

问:双方也是互惠的,学生的学术视野会更加广阔,他们回国后也会成为中国数字人文领域研究的重要力量。

答:是啊,学生在哈佛交流1年左右,可以选听哈佛大学的课程、使用学校图书馆、在实验室里使用学校的数据库。1年下来,他们的数字人文理念和技能都会得到提升。目前在全国的古代文学领域研究机构中,我们(浙江大学)这里去哈佛的最多,每年都有,今年去的2个学生中有1个是我的学生。

2 数字人文与传统人文研究

问:利用数字人文技术做古代历史或文学研究,至少在文献资料查询方面就方便多了。2020年王兆鹏、邵大为在《中国社会科学》杂志发表了一篇《数字人文在古代文学研究中的初步实践及学术意义》,提出当全面引入数字人文的技术和方法后,未来中国文学史的形态将彻底改变。

答:是这样的,以前用传统方式阅读文献或工具书,很难进行多条件搜索,比如若想了解明代的状元和进士情况,后面即便有索引,其功能也非常有限。而数据库就不同了,按照条件搜索其在哪个时间段、在何处任职、担任的是何种职衔就方便多了。

再比如利用数据库对《全元诗》作者的分布情况进行计量统计,速度快且准确度高。我们发现诗人集中在苏州、安徽宣城(那时称宛陵)、钱塘。《全元诗》的主编杨镰先生也注意到了这个问题,但他没有专门统计,也没有用定位的方式进行可视化呈现。我们把人物籍贯的经纬度写出来再利用软件制作,通过圆圈大小就可以直观展示区域集中密度。

问:您以前跟着徐朔方老师接受的是传统的人文训练方法,比如精读文本、查找纸质文献、做手抄笔记,和现在做数字人文相比,传统方法还有什么优势?学生读纸质的、不加现代标点的繁体竖排文献,是不是更能增进他们对古代文化的亲切感,更容易进入古代的情境?

答:我以前在浙江图书馆古籍部负责善本,徐朔方先生经常来查资料,他都采用手抄的方式,效率较低。但传统的方法肯定也要继承和发扬,细读、考据文本的方法等都是必备的能力,然后再使用计算机进行辅助。但未来若古典文献全部数字化,情况可能会发生变化。北京大学的廖可斌教授曾说:“现在的文献学已经成了年轻人的学问。”言下之意,在数字化的文献载体里,年轻人查资料的速度可能比老辈学者快,他们用的是秒查、地毯式搜索的方法,而老辈学者往往是记笔记。我已把浙江省、江苏省等各省的地方志都完成了识别,把“地方志丛刊”和“中国地方志集成”都做完后,大部分地方志就都可以被检索,我的机器一天24小时都开着。以前做古典文学研究有三个基本功——义理、考据、辞章,我觉得现在还要再加一个“算力”。

问:包伟民先生在《史学月刊》上发表的文章从史学角度提出数字人文对历史研究帮助有限,像CBDB这样的数据库也有缺陷,比如将复杂、立体的描述性历史文本转化成平面数据可能会抹杀各种文本之间的差异性,真正利用数据库做出的有影响的學术成果数量有限。您怎么看这个观点?

答:包伟民教授对数字人文的理解可能更传统,与包弼德教授的理念不同。包伟民教授其实很重视数字化数据库,《四库全书》数据库出来后,他是最早买的那批人,他后来还买了中国基本古籍库,这在全国范围几乎都是最早的。

问:哈佛可以说是西方文明和文化的高地之一,您怎么看西方的人文和文明?

答:文化和文明一定是多元的,你中有我、我中有你。我平时接触很多国外研究汉学的专家,没有觉得存在文化差异和价值观冲突,他们很认同中国的传统文化。斯坦福大学教授艾朗诺(Ronald Egan)是从哈佛大学东亚语言与文化系毕业的,主要研究唐、宋时期的文学和美学。他的举止投足显得彬彬有礼,就像一位传统的中国谦谦君子。

问:还有一个实际问题,如果用纸质材料阅读那些古典文献材料,对视力的伤害可能会小一些。数字化以后要用电子设备才能阅读,对视力会不会伤害更大?有一些学者曾经因为阅读太多的电子材料而使视力受到损害。您怎么看这个问题?

答:就我个人的经验,其实纸质的古籍更伤眼睛,尤其那些繁体、竖排的古文献,又没有标点,眼睛得死死盯着。在我们的平台上阅读古籍会感觉更舒服,有标点,字体大小和屏幕亮度都可以调节,其实对视力伤害更小。但我们现在还有瓶颈,光学字符识别(Optical Character Recognition,OCR)在识别行书、草书和手写字方面还是有所欠缺,听说日本的新技术在识别手写字方面已经实现了突破,但我目前还没看到演示。

3 当下国内的数字人文教育

问:很多做人文研究的学者对数字技术天生感到陌生和排拒,我觉得您应该有数学和技术天赋,您父母是技术出身吗?

答:我老家在浙江遂昌,我父亲以前在乡里的机械修配厂工作。他很聪明,天生就对各种机器感兴趣,动手能力很强,会自己改装各种机器。我记得他曾经做过电动捕鱼器、裁缝拷边机、木车床等等,也许我在一定程度上受到了他的影响。

问:哈佛大学的霍华德·加德纳(Howard Gardner)教授提出过“多元智能论”,他认为有人天生擅长语言文学,有人擅长音乐,还有人擅长数理逻辑。您是怎么把这个领域的文科硕士和博士身上的数理潜能挖掘出来的?

答:我们还是立足古代文学学科教学中一些实用的方法,比如学术地图的制作、数据库功能的使用、查找数据的方法等,主要目的是让学生快速查找资料并进行一些可视化的分析。这些方法年轻学生能学会,但是像python这类工具的学习难度就比较大了。

我们的学科终归还是古代文学,原浙江大学校长吴朝晖教授倡导跨学科和大数据研究,学校成立了10个大数据团队,我们是大数据和学术地图创新团队,也是当时人文学科里唯一的创新团队。后来我们增加了交叉学科博士招生名额,学生可以来自工科或其他学科。因为名额有限,各导师之间的竞争很激烈,我这么多年就只申请了一个。

问:这个交叉学科的学生本科和硕士毕业于哪所学校?是什么专业?

答:他是个男生,本科和硕士都毕业于温州大学。本科专业是英语,硕士专业是古代文学,具体研究方向是南戏。他就喜欢计算机,他在博士期间把硕士论文扩展成书并出版了,还获得了国家级奖学金。他跟我读博期间去哈佛学习了一年,毕业后去了浙江工商大学。在就业方面,我的学生还是比较受欢迎的,因为很多高校想要跨学科的博士。

问:你们交叉学科平时怎么开展教学?

答:学校专门成立了一个交叉学科团队,我的学生要到计算机学院学习C++语言。

问:交叉学科学校一年批几个名额?

答:具体多少不清楚,但是很少。

问:为什么不扩大规模呢?

答:我也不清楚,我也觉得应该扩大规模。这个交叉学科是在博士层面,现在中国各学校的博士招生名额比较少,要从总名额中挤出交叉学科的名额。

问:在招那个学生之前,是否要考察计算机水平?

答:我当时没有选择余地,但这个学生的计算机水平还是非常不错的,他的博士论文写的是元末明初的文人互动研究,涉及很多地理信息,少量地方志用了数字人文的方法。

问:浙大古代文学专业的学生在收集和运用数据方面的能力如何?

答:研究生会好一些,但本科生还意识不到可以把古代文学的专业学习与计算机结合起来。我曾向学校教务处申请给本科生开设数字人文课,但教务处希望这门课先在学院层面开设,成熟后再在学校层面开设。在文学类院系中,做数字人文研究的还是少数,大部分人对这个专业还不了解。2023年,教育部设置了数字人文专业的本科,估计这个专业以后会越来越好。

4 数字人文共同体的交流与合作

问:有没有可能将浙大、北大、复旦、人大、武大等文科名校联合起来,共同起草一个古籍数字化的方案,联合全国高校的力量把基础性的古籍数字化工作做扎实?

答:现在力量还比较分散,很难形成一个全国统一的规划方案,清华大学曾经提交过一个关于古籍数字化、智能化的提案,不知道目前是什么进展。政府有关部门也曾发布过古籍数字化的项目申请,但这种模式大多數是传统的数据库和搜索引擎、全文检索,不算是真正的数字人文,数字人文必须有结构化的数据,能自动生成各种新的知识组合。

问:国内做古籍数字化处理的团队很多,比如王兆鹏老师的团队,你们私下交流过吗?有没有过合作?如果你们在某些方面能形成共识、进行合作,影响可能是非常大的。

答:有交流,我们都是古代文学背景出身,但是各自的平台不一样。王兆鹏老师的平台是做唐宋(时期数据)的,他自己做数据、自己发布。我的平台是发布平台,用户注册后经过培训都可以发布内容,当然这也可能导致内容质量良莠不齐,但在数据库中发现问题后可以改正并不断完善。

问:您的平台是兼容开放的,王老师的平台是更加封闭独立的系统。能否就由您来领头,将全国的相关资源尽量整合在一个平台上?既方便读者,也能集中力量使内容更精粹。

答:(笑)那是不可能的,这些资源都有自己的知识产权,不可能都放在一个平台上,也没有必要都放在一个平台上,平台之间的多样化竞争也有好处。

问:以您了解的情况,国内还有哪些团队数字人文做得比较好?

答:大家各有特色。王兆鹏老师做得很好;清华大学的刘石现在做《数字人文》期刊,但目前还没有平台;北大信息管理系的王军和字节跳动合作,用机器识别古籍,如果这些古籍再经人工校对就好了。

问:您的系统规模最大时有多少人?

答:我们有两个微信群,一个是本科生的,一个是硕士和博士生的,两个群加起来有1 000多人。

问:我感觉你们把技术与人文结合得非常紧密,你们还和外面专业的公司合作吗?

答:我现在跟一家公司签订了合同,对方协助开发机器智能问答系统,我们要给机器“投喂”大量数据进行训练,然后通过人工辅助进行引导来回答用户提问。以后还要让这个系统更加智能化,增加语音功能。最新发布的Sora能生成图片和视频,对我们研究和传播古代文学非常有用,比如让Sora生成昆曲演唱方法的演示视频、让《聊斋志异》里的小狐狸跟人互动等等。

问:这听起来太有意思了,如果数字人文真的能达到这种程度,中国古代文化的研究和传播或许将发生一场革命。你们用获得的经费能开发出什么样的系统呢?

答:目前我国有9家基座大语言模型获得了国家颁发的执照,浙大的大语言模型叫“观止”,我们在“观止”的基座上开发二次加工平台,“投喂”数据,让大语言模型理解。待微调平台上线后就可以训练宋濂、刘基、王阳明等人物的数据。

问:今后如何继续扩大横向经费的来源?按照目前的运作模式和对未来的设想,现在的经费来源似乎很难实现目标。

答:待我们的大语言模型微调平台建成后就可以做个样品出来,会有广泛的应用前景。比如可以训练关于西湖文化的机器智能问答,与西湖相关的任何问题都可以在平台中询问。只要有数据可“投喂”,机器就能自动生成。其他的横向课题项目,包括与博物馆、纪念馆、各种文旅活动相关的,我们都能介入,也在慢慢争取。

问:您用的OCR来自龙泉寺,是贤超法师的团队开发的。贤超硕士毕业于北京大学物理学院,我之前在复旦大学团委的账号“复旦青年”上了解到,他近些年一直致力于佛教典籍的数字化,他的团队还开发了一个机器僧“贤二”。有没有比他们做得更好的产品,比如识别率更高的?为什么选择龙泉寺的产品呢?

答:贤超法师精通计算机,这个系统是他自己开发的,主要用于识别佛教典籍。“书同文”做得也很好,但是价格比较高。

5 数字人文的支持体系

问:您曾说过,如果把各种版本都算上,所有的中国古籍中还有约5/6没有扫描,要把这些全部扫描完成大概需要60多亿元。这并不算是一个天文数字,但您认为没有扫描完成的原因是什么呢?

答:现在我国与古籍有关的政府部门都存在经费不足的问题。并且,如果要真正实施国家文化数字化战略,要对各省、市、县委宣传部的地方文献数字化工作进行考核,工作量自然就上去了。把这些材料进行OCR处理后,还会存在约10%的错误率,也需要依靠众包系统和人工校对解决。

问:浙江省经济发达,也许未来会有相关经费支持。

答:到目前为止,我的两个平台都没有拿过浙江省的经费。开发后的数据具有难以估量的社会价值和商业价值,比如关于古代名人的智能问答,无论在文旅、中小学教育还是大众传播方向都有很大潜力。

问:您有没有考虑按照纯粹的商业模式去做,比如吸引风投?

答:我们成立了一家杭州云四库科技有限公司,浙大的规定是,这种公司如果要进行商业操作,学校占30%的股份,执行团队占70%。投资人对这种人文学科的业务没有把握,不敢投。国外有资本公益基金,但国内很少,所以有时不得不自己“造血”来建设可持续的平台和数据。

问:您的实验室在哪里,访谈结束后可以看看吗?

答:我还没有独立的实验室,办公室太小了,里面有好几台服务器24小时工作,因为有大量古籍要识别。我还有几十TB的古籍内容要转换成数字化的文本,这样才能快速编辑和查询,增加其附加值。浙江省要建文科实验室,如果我能推出去,多得到一点经费,就可以建立更多数据。

问:您现在运营的费用从哪里来?

答:主要来自纵向课题和横向课题的经费,也有捐助的经费。之前我认识的一位研究OCR的老师将我引荐给了一位阿里巴巴公司的工程师,他以个人名义向浙大教育基金会捐助了100万元人民币,指定用于数字人文。他现在离开阿里,自己开了一家公司。

问:这在文科领域应该算是一笔巨款了。

答:是的,不过已经基本用完了。平台建设太“烧”钱了,两台GPU服务器每月大约要花6 000多元人民币,此外还有其他服务器,每年仅服务器方面就要支出十几万元人民币。以后设备还会进一步升级,文科经费根本“吃不消”。

问:中国很多企业家都热衷于文教事业,像曹德旺、雷军等。如果找一些浙江本地的富豪来投资,不知有没有可行性?是不是想得太浪漫了些?

答:现在还没人投资,也许将来有远见的企业家会投资。我们研究古代文学和古典文献的人,把那些古籍当宝贝一样津津乐道,但其他领域的人未必理解。再说,如果天天到处找钱,我也耗不起时间。

6 数字人文的多维价值

问:刚才说的古籍扫描问题,经典的文献可能都已经被扫描过并被数字化处理了,那剩下没有被扫描的5/6价值大不大呢?

答:价值是要先将其数字化以后再慢慢发掘的,有了新材料,学术研究就有了更多可能性和新的增长点,很多学术研究成果就会随之出现,从而丰富人们对中国文化和历史的认知。将各种数据库建立起来后,就可以陆续开发智能问答服务、发展文化旅游业,如果再加入AI等新技术,了解古代文化、阅读古籍就会更容易、更便捷了。

问:浙大的评价考核体系对文科教师采用的是什么标准?您花这么多精力做数字人文,没有这方面的压力吗?

答:我了解自己目前研究内容的价值,所以我不去计较这些。我也要发文章,但现在顾不上,目前对我来说最重要的还是建平台、建数据,我不是写不出文章,而是我更希望将时间用来做数据。智慧古籍平台还要改造,我明天约阿里巴巴的人来谈未来工作的开展和实施计划,还有很多技术细节要处理,比如有些平台要求进行格式转换或者版式内容切割等,这些数据需要借助python来处理。不过我现在还有几部书稿,任务和待遇都会兑现的。

问:我了解到您经常前往全国各高校做讲座,一方面能让你和同行切磋专业,另一方面也能传播你的数字人文理念和方法。

答:我每年要去很多所高校做讲座,还要举办暑期社会实践,每次报名者能有700~800人,包括来自线上和线下渠道的。学生在未来的学习和科研中都能用到从我这里学到的技能。

问:就全国范围来说,浙江省的整体文化素质和文明水平如何?

答:从我研究大数据的角度来看,在《全宋诗》《全宋文》中,浙江籍的作者人数都排第一。浙江省很重视大数据,制定了很多大数据计划,但目前还没有与文化大数据相关的计划。

问:根据您之前做的古籍数字化转化工作,您觉得传统文化中有哪些元素特别值得弘扬吸收?

答:太多了。比如《人民日報》近期推送的《送东阳马生序》就是很好的励志教育文章。宋濂的求学条件那么艰苦,求学态度那么谦恭,我们应该学习他的求学精神。还有王阳明,他在龙场驿虽然言语不通,生活也不习惯,但他一直保持乐观的态度,最后他在思想和事功上都取得了很大成就。

問:除了个人修养之外,在社会建构和社会理想方面,我们能从古代文化中学到什么?

答:这个问题太大,三言两语说不清楚。一个东西的价值包括很多方面,包括认识价值、功利价值、审美价值。我们用数字人文的方法重新建构古代的世界,也是想让现代人更好地了解过去,如果对自己的历史都不了解,也就无法知晓今后的路该怎么走。

问:经过今天的访谈,才知道您要操心这么多事情。您怎么看待自己现在工作的意义?

答:现在只能“咬牙往前拱”了,我认为我研究的内容有很大的商业前景,不过钱不是我追求的目标。中国文化大数据肯定要有人做,如果我们不做而让国外的人去做了,那么话语权和数据库就都在国外了。其实我现在做的很多事情都是在给后人铺路,未来再用新技术去了解古代文化可能会变得更容易。

7 谈谈结束后的参观

12点15分,徐永明教授在办公室展示他的智慧古籍平台和学术地图发布平台。他说,在运营过程中,他自己就能解决智慧古籍平台的很多技术细节问题,实在无法解决的就找计算机专业的老师来帮忙。学术地图发布平台上已经有2 000多幅地图,他给我们演示了如何在平台上查看苏东坡一生的行迹。

12点31分,大家离开人文学院大楼时查看进出登记表,从2024年3月7日至3月14日,他最早离开的一次是在3月8日凌晨1点38分,最晚离开的一次是在3月10日凌晨3点29分。徐永明教授说自己喜欢在夜里工作,因为效率更高,他上午7:30—8:00起床,天天如此,一天休息5个小时就够了。

他引以为豪的是,很多知名专家都帮助他在智慧古籍平台上校对过数据,中国韵文学会会长钟振振教授就是其中之一。他说每年给本科生上课时,都有学生表示高中时就用过学术地图发布平台,学生们非常喜欢;浙江省建设文学馆和“唐诗之路”时,他的两个数据库都提供了很多有价值的信息。每当听到这些反馈,他就觉得以往的辛苦都是值得的。

午饭后,他热情地邀请访谈人去浙江大学新落成的图书馆和其中的古籍馆参观,一见到古籍他就立即变得兴奋起来,不管和他聊什么话题,不超过10分钟,总会转到数字人文和文化大数据的话题上。新图书馆中西合璧,美轮美奂,徐老师笑着说“如果学校和社会再支持我把文化大数据建起来就更好了,我是有野心的”,大家都大笑起来。

Digital Humanities in China: Development Status, Core Issues and Multidimensional Values—An Exclusive Interview with Professor Xu Yongming from Digital Publishing Research

XU Yongming1, ZHANG Shihai2

1. School of Literature, Zhejiang University, 310058, Hangzhou, China; 2. School of Culture and Media, Huanghuai University, 463000, Zhumadian, China

Abstract: Since the introduction of the concept and technology of digital humanities into China, they have had a profound impact on traditional humanities. Independent and competitive research and development by several teams in the field of database construction in China is conducive to the overall prosperity of digital humanities and the development of a variety of complementary series of products. However, there are still problems such as excessive dispersion of efforts, repetitive construction and waste of resources in the basic and universal database construction. The cause of digital humanities has great strategic value and broad business prospects, which is related to the evolution and growth of fine traditional Chinese culture in new and creative ways. It is necessary to construct a unified framework system to complete basic database construction, support digital humanities education, and encourage academic communities and the industry to carry out various forms of cooperation. Digital Publishing Research interviewed Professor Xu Yongming, a professor at the School of Literature of Zhejiang University and a Yangtze River Scholar, to discuss the current development status, core issues and multidimensional values of digital humanities in China.

Keywords: Digital humanities; Academic community; Support system; Multidimensional value

猜你喜欢

数字人文
图书馆未来的技术应用与发展
数据驱动下的高校图书馆数字人文服务研究
汉传佛教文化遗产数字化建设现状调查与特征分析
数字人文2011—2016年研究综述
数字人文时代公共图书馆经典阅读推广研究
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文