APP下载

面向领域需求的数字人文研究
——以方志物产知识库为中心

2022-08-15吕金伟

中国科技史杂志 2022年2期
关键词:物产方志知识库

吕金伟 包 平

(南京农业大学数字人文研究中心,南京 210095)

伴随着大数据时代的到来,数字技术对学术研究的影响日益增大,科技史研究亦不例外。近年来,科技史领域的数字人文研究逐渐兴起,以基础设施建设为例,北京科技大学设计研发的“中国古代金属技术数据库”、中国中医科学院主持开发的“中国历代医家传记知识库”等数据库已经先后投入使用。

在农史领域,数字技术的运用为农史研究注入了一些新的元素。2005年,南京农业大学中华农业文明研究院推出了国内第一个农业科技遗产信息平台[1],初步具备了文献检索、图文对照、资源获取等功能。随着数字技术的进一步发展,数字人文背景下的农史研究方兴未艾。比如,在基础设施建设层面,方志物产知识库就致力于构建一个面向领域需求的数字人文研究平台,既顺应当前数据库建设从文本电子化向数字化、知识化迈进的发展趋势,又能推动农业史等研究乃至科技史研究方法(工具)的不断创新。

何为方志物产知识库?它是指以地方志中记载的物产资料(简称“方志物产”,主要包括动物、植物、货物)为素材,运用数字技术对其进行处理,构建起来的具有多种功能的物产知识库。物产作为地方志记载的内容之一,历史由来已久。早在地方志的雏形《尚书·禹贡》《山海经》等书中就有关于物产的记载,明代地方志中设置物产门类成为一种定例,清代以来地方志中记载的物产资料蔚为大观,内容十分丰富[2]。方志物产是农业史等研究的基本史料[3],具有相当重要的价值。因此,围绕着方志物产展开数字化、知识化的探索工作,有助于推动农业史等研究的继续发展。

作为一项数字人文基础设施,方志物产知识库的构建以满足领域专家需求为目标。为了达到这一目标,首先要对领域专家的需求展开调查;然后运用数字技术满足领域专家的相关需求;进而深入分析方志物产知识库对领域研究的积极意义,展望数字人文对科技史研究的促进作用。循此思路,本文略抒己见,不当之处,祈请方家指正。

1 领域专家对方志物产知识库的需求分析

开展面向领域需求的数字人文研究的前提在于,要弄清楚研究者的需求之所在。一般而言,学界对数据库的需求主要表现在形式需求、内容需求、服务需求、技术需求4个方面,分别对应数据库在结构形式、开放内容、服务方式、技术支持上的功能。

为了更清楚地了解领域专家对方志物产知识库的需求,2019年9月至2020年1月,我们在南京、广州、苏州等地先后组织了三次有针对性的问卷调查。在调查问卷的设计理念上,突出方志物产知识库与传统数据库之间的区别,以及领域专家对方志物产知识库所提供功能的需求。比如,与传统数据库相比,方志物产知识库可以提供知识组织、知识发现、聚合分析、GIS可视化、众包编辑、数据关联等功能,但这些功能能否得到领域专家的认可、能否满足其需求仍需进行调研。因此,问卷调查旨在弄清楚他们的需求,为进一步通过方志物产知识库来满足他们的需求寻找依据。调查问卷的设计内容主要包括个人信息、知识库形式、知识库内容、知识库服务、知识库共建共享、知识库使用;答题形式分为问答、单项选择、多项选择。调查对象主要来自西北农林科技大学、华南农业大学、上海交通大学、东南大学、江苏科技大学、苏州农业职业技术学院、南京农业大学等单位,调研方法为随机抽样。在调查问卷的发放上,分为纸质问卷调查与在线问卷调查两种形式,共计发放问卷120份,收回113份,有效率达94%以上。对收回的113份有效问卷,使用Excel与SPSS软件进行统计分析,相关结果如下。

1.1 个人信息

关于个人信息,调查问卷设计了性别、年龄、学历、从业年限、职称、岗位、专业和研究领域8个方面的内容。在性别上,男性65人、女性48人,分别约占57.52%、42.48%。在年龄分布上,由于调查对象主要为高校的研究生、教师,年龄均在20岁以上,故年龄段20岁以下者暂无数据。21—30岁者41人,约占36.28%;31—40岁者23人,约占20.35%;41—50岁者15人,约占13.27%;51—60岁者17人,约占15.04%;61岁及以上者3人,约占2.65%;年龄不详者14人。表明20—30岁之间的研究者(主要包括硕士研究生、博士研究生、青年研究者)对方志物产知识库的需求较大,31—40岁、41—50岁、51—60岁三个年龄段研究者的需求相对较小,61岁及以上年龄段研究者的需求最小(图1)。

图1 调查人员年龄分布

在学历上,本科15人,硕士43人,博士51人,其他4人(图2),可见硕士及以上学历者对方志物产知识库的需求较大。在从业年限上,从事农业史等相关研究5年及以下者19人,6—10年者8人,11—20年者13人,21—30年者14人,不详者59人,此项内容的调查结果可能无法反映真实的情况。

图2 调查人员学历分布

在职称上,中级以下者50人、中级15人、副高22人、正高26人,表明职称为中级及以下者对方志物产知识库的需求较大。在岗位上,专职科研类22人、教学科研类36人、管理服务类17人、其他31人、不详7人,其中,与科研相关者共有58人,约占51.33%(图3),反映出科研工作者对方志物产知识库的需求较大。

在专业与研究领域上,问卷未设置具体的选项,由调查人员根据自身实际情况填写,共有33个专业或研究领域,其中,涉农专业12人、与计算机相关专业2人、与史学相关专业6人,科学技术史最多,达52人,表明科技史研究者尤其是农业史研究者对方志物产知识库的需求较大。

1.2 知识库形式

在知识库形式层面,调查问卷设计了5个方面的内容。在需求程度上,迫切需要者38人、需要者58人、一般需要者14人、有无都可以者3人、完全不需要者无,表明大多数调查人员需要一个便捷、实用的方志物产知识库来解决专业问题。在资料获取方式上,问卷设置4个选项,调查人员可以多选或单选,其中,通过搜索引擎者最多,达63人,通过馆藏方志原始文本者59人、方志专题数据库者50人、相关数据库者20人(图4),可见,通过搜索引擎、数据库获取方志物产资料者较通过馆藏方志原始文本者多,符合当前信息化背景下调查人员的现状。

图4 调查人员获取方志物产资料的方式

在进入途径上,问卷设置8个选项,调查人员可以多选或单选。其中,“方志物产知识库主页”“图书馆或信息中心的网页链接”“从搜索引擎的检索结果链接”“行业、学会或者其他网页链接”是使用人数较多的四种途径,分别有84人、71人、46人、33人;而“论坛、研讨会、专业培训推荐”“新闻、微信信息链接”“专家、同事推荐”“其他”4个途径相对较少,分别有27人、17人、16人、3人。大致来看,希望通过专题网页、网页链接、信息链接等信息化途径进入方志物产知识库者较多,与当前信息时代的特征相符。

在呈现形式上,问卷设置6个选项,调查人员可以多选或单选。其中,方志物产知识库网页的需求者最多,达89人;方志物产知识库APP的需求者次之,有60人;微信小程序的需求者又次之,有38人;而其他电脑客户端软件、互动机器人、其他的需求者相对较少,分别为8人、6人、2人。在展示界面上,问卷设置8个选项,调查人员可以多选或单选,统计结果表明,调查人员对界面检索易于操作、简洁美观、页面和功能介绍清晰以及呈现检索、浏览、下载历史的需求相对较大(表1)。

表1 方志物产知识库展示界面的需求

1.3 知识库内容

关于知识库内容,调查问卷设计了5个方面的内容。在功能上,问卷设置10个选项,调查人员可以多选或单选,相关统计结果见图5,其中,知识检索的需求最大,是当前方志物产知识库构建过程中需要着力的重要方向之一,智能史料考证、文本分析、历史时空可视化展示、研究数据存储与管理的需求也比较大。

图5 调查人员对方志物产知识库功能的需求

在知识检索上,调查人员对全面、方便、准确的需求最大,达92人,约占81.42%,对图文对照、专业考证、字体纠正的需求也比较大,分别约占61.95%、57.52%、26.55%,另有3人希望能够提供相关背景介绍。在内容分析上,知识图谱的认可度最高,达87人,约占76.99%,可视化展示、词频统计、社会网络分析的认可度相对较高,分别有63人、57人、51人,另有3人希望能够提供词汇解释(图6)。

图6 调查人员对方志物产知识库内容分析的需求

在专题服务上,调查人员对资料汇总的需求最大,达93人,约占82.3%,对图件资料、研究报告、专业系统展示的需求相对较大,分别有62人、60人、44人,另有3人希望能够提供涉及专题的其他资源链接。在内容与其呈现方式上,问卷设置问答题,由调查人员自行作答,他们的关注点集中在物产同物异名与同名异物、品种产量、时空分布、推广路径、消长变迁等上,并希望能够实现图文对照、可视化呈现、智能化考证、与相关数据库关联等功能。

1.4 知识库服务

在知识库服务层面,知识库提供服务的重要程度以及资源的开放程度备受关注。在服务的重要程度上,问卷设置7个选项,调查人员的需求态度按照五级进行设计。统计结果显示,多渠道检索功能的重要程度最高,提供信息分析与展示功能次之(表2)。

表2 方志物产知识库提供服务的重要程度

续表2

在资源的开放程度上,问卷设置4个选项,调查人员的需求态度按照四级进行设计,相关统计结果见表3,其中,调查人员对完全开放的需求最大,为未来方志物产知识库的开放程度提供了参考。

表3 方志物产知识库提供资源的开放程度

1.5 知识库共建共享

关于知识库共建共享,调查问卷设计了资料来源、原因分析、面临困境、解决途径4个方面的内容。在资料来源上,问卷设置8个选项,调查人员的提交意愿按三级进行设计,其中,论文、著作、方志物产原始资料共建共享的意愿较高,而不愿意资料共建共享的调查人员整体相对较少(表4)。

表4 方志物产知识库共建共享的资料来源

续表4

在原因分析上,问卷设置5个选项,调查人员可以多选或单选,其中,选择“完善方志物产资料和研究”者最多,约占78.76%,选择“促进个人成果的共享和传播”者、“方便他人利用,增强成果的显示度”者、“认同并且实践开放共享的方式”者依次减少,分别约占63.72%、49.56%、45.13%,另有约3.54%的人选择“其他”。

在面临困境上,问卷设置7个选项,调查人员可以多选或单选,其中,“对方志物产知识库不了解”“提交过程复杂,增加工作量”“访问权限有限制,不便使用”“担心信息安全和数据备份等问题”是调查人员面临较多的四种困难,出于“担心出版社/单位不允许”“资料或科研成果属于保密范围”的考虑则相对较少,表明增强研究者对方志物产知识库的了解是未来的一项重要工作。

在解决途径上,问卷设置4个选项,调查人员对其重要程度的衡量按五级进行设计。从表5可以看出,加大宣传力度被认为是最有效的解决途径之一。

表5 方志物产知识库共建共享的解决途径

1.6 知识库使用

在知识库使用层面上,调查问卷设计了4个方面的内容。在预期效果上,问卷设置6个选项,调查人员的预期按五级进行设计,相关统计结果见表6。

表6 方志物产知识库的预期效果

续表6

在提升使用的途径上,调查人员对“采用便捷、实用、开放的系统平台”“提高数据被多种检索工具检索的开放性”“丰富资源内容,增加特色信息收藏”的需求较高,对“加大宣传力度,增强使用意识推广”“获得版权许可和政策保障的支持”“争取科研评价体系的认同”“拓展成果利用统计、评价服务功能”的需求也比较高。

在知识付费与否上,23.01%的调查人员希望免费,42.25%的调查人员倾向于按年计费、11.50%的调查人员期望按工作量计费、8.85%的调查人员认为在有帮助的前提下可以收费、6.19%的调查人员赞同按件计费,反映出付费与否与调查人员的需求是否得到满足有关。

在知识库构建过程中可能遇到的困难上,调查人员对“相关学术资料与成果的收缴问题”“方志物产知识库的平台搭建”“后期可持续性的维护和使用”的担忧较多,对“方志物产知识库相关法律问题(版权、著作权等)”“经费、人员和技术支撑”“资源的组织和展示方式”的担忧相对较少。

2 基于领域需求的方志物产知识库构建

能否满足领域专家的需求是衡量方志物产知识库有效与否的重要标准之一。因此,在方志物产知识库的构建过程中,我们坚持以领域专家的需求为导向,主要进行了以下四个方面的工作探索。

其一,在基本形式上,构建开放的方志物产知识库这一数字人文研究平台。在此之前,围绕着方志物产资料展开的工作大致可以分为两个阶段:第一阶段是方志物产资料的搜集与整理阶段,这项工作始于20世纪50至60年代,以南京农学院万国鼎先生组织查抄方志中物产史料并编成431册《方志物产》手抄本为代表;第二阶段是方志物产资料的文本电子化阶段,该工作始于21世纪初,在南京农业大学王思明教授的主持下完成了《方志物产》纸质文本到电子文本的转变。与馆藏文献《方志物产》手抄本相比,《方志物产》电子文本在资料的查询与获取方面迈进了一大步。当前,方志物产知识库的构建可以称作第三阶段的工作,其目标是要将《方志物产》电子文本与《方志物产》未曾收录的地方志中的物产资料全部囊括进来,研发出一个存储方志物产资料最为详尽的知识库。结合前文的调查问卷分析来看,方志物产知识库基本可以满足研究者在数据库形式层面的需求:首先,以往研究者查询方志物产资料或通过馆藏方志原始文本,或利用如文渊阁四库全书全文检索数据库、中国基本古籍库这样的综合性古籍数据库,前者查询与获取资料均不方便,后者虽然较之前者便捷,但是获取资料的效率不高且需要进一步分类整理。在方志物产知识库中,类似的难题得到了解决,未来研究者只需输入一个关键词,就可以实现同类资料的打包下载。其次,在开发过程中,方志物产知识库主页暂名为中华方志物语,突出“中国”“地方志”“物产”三大核心要素,研究者除从主页进入以外,也可以通过中华农业文明网、南京农业大学图书馆网站等网页的相关链接进入。同时,为了顺应移动互联网的发展潮流,团队成员还将开发能够在手机、平板电脑上使用的方志物产知识库APP以及微信小程序,满足研究者随时随地使用的需求。再次,为了满足研究者对展示界面的需求,团队成员将在借鉴中国历史地理信息系统(CHGIS)、中国历代人物传记资料库(CBDB)、中国地方历史文献数据库等已有数据库的基础上,在知识库页面设置简洁、清晰、美观的检索模块,呈现历史记录,为研究者查询、获取方志物产资料提供便利。

其二,在开放内容上,致力于提供可以关联的物产知识数据集。根据前文的调查问卷分析可知,在知识库内容方面,研究者对检索内容的丰富性、准确性以及知识图谱的需求较大。为此,我们研发出了可以关联的物产知识数据集,它不再是简单的文字、图表、数据,而是包括物产-别名、物产-人物、物产-时间、物产-地点、物产-事件、物产-引书、物产-功效等内容在内的知识集合,是可以根据需求排列组合的知识单元。以薯蓣为例来看,嘉庆十五年《扬州府志》记载:“薯蓣俗名山药案薯蓣一作藷藇俗呼为山药见罗愿尔雅翼”,这是纸质文本、中国基本古籍库所能提供的文本内容,与之不同,方志物产知识库提供的可以关联的物产知识数据集主要内容包括时间——嘉庆十五年(1810)、地点——扬州、物产薯蓣、藷藇与山药的别名、相关考证成果集合、罗愿其人其事、《尔雅翼》其书。值得注意的是,可以关联的物产知识数据集能够满足研究者的上述需求,原因在于:首先,录入知识库的方志物产基本上囊括现今所存地方志中物产记载的全部内容,作为专业的方志物产数据库来说,内容十分丰富,而且,每一条数据在录入过程中都要经过自核、互核、人工标注、自动标注、计算机比对、智能化考证等环节,确保其准确性,在此基础上形成的可以关联的物产知识数据集可以为研究者提供全面、准确的资料;其次,可以关联的物产知识数据集是形成方志物产知识图谱的前提,研究者通过方志物产知识库获取前者,对同类资料按照一定的原则进行编排,利用可视化技术进行处理,能够得到后者。可见,方志物产知识库能够基本满足研究者对内容层面的需求。

其三,在服务方式上,以知识检索、知识分析、知识呈现为核心,尽量满足研究者对方志物产知识库服务层面的需求。首先,在知识检索层面,方志物产知识库不仅能够提供同一库内的关键词检索、主题检索、著者检索、题名检索、分类检索,而且由于数据关联技术的运用,还可以实现跨库检索。比如,《方志物产》手抄本一般只抄录了方志的时间、地点,其他信息包括纂修者、版本、流传、是否亡佚、馆藏地等基本缺失,为了帮助研究者深入探讨相关问题,方志物产知识库可以与其他已建成的数据库进行关联,指明继续查找文献的方向[4]。其次,在知识分析层面,同物异名、同名异物的考证工作在方志物产知识库的构建过程中备受重视,团队成员力图通过建立智能考证体系为研究者提供真实可信的方志物产资料。比如,关于嘉靖十七年《福宁州志》卷3、嘉靖二十四年《新宁县志》卷5所载金瓜是否为南瓜的别名,相关学者的讨论尚未达成相对一致的意见[5,6],面对类似的问题,方志物产知识库引入文献智能对比技术,通过对比物产不同记载中的内容、行文、结构、语气、上下文语境等,计算出不同记载之间的相似度阈值,判断是否为同一物产,然后将相关考证结果录入知识库,供研究者选用。最后,在知识呈现方面,利用GIS技术展示物产的时空分布、种类规模、传播路线、消长变迁。以白梨引种为例,方志物产知识库在全面搜集白梨引种记载的基础上,按照时间顺序之先后推断白梨引种的路径,然后以中国历史地图集中1820年疆域政区全图为底图,绘制白梨引种迁移图[7],为研究者更为清楚地了解相关问题提供便利。

其四,在运用技术层面,与典藏检索型数据库、量化分析型数据库相比,方志物产知识库这一数字人文研究平台更加复杂、多样,而运用这些技术的目的则在于满足研究者的需求。比如,关于共建共享,调查问卷结果显示,多数研究者均有这方面的需求,在他们看来,方志物产知识库不仅是地方志中记载的物产资料的存储平台,而且是相关论文、著作、演示文档、音频、视频、调研报告、专利、实验数据等资料的共享空间,通过方志物产知识库,他们既可以高效地完成原始史料的检索、获取,又能够便捷地浏览、下载其他人共享的相关资料,一举两得。不过,在共建共享环节,研究者也会遇到各种各样的问题,根据调查问卷结果可知,对知识库是否了解、提交过程是否复杂、访问是否受限是他们考虑较多的三个问题,因此,为了更好地解决他们所面临的这些问题,方志物产知识库的构建过程中将引入共建共享技术,满足研究者的上述需求。又如,关于内容分析,调查问卷结果显示,部分研究者对社会网络分析有一定的需求,他们希望通过方志物产知识库了解物产与物产之间、物产与其他要素之间的关系,因此,在充分考虑这一需求的基础上,团队成员将在知识库的构建过程中引入社会网络分析技术,并以之作为内容分析的特色之一。可以说,在方志物产知识库的构建过程中,我们将秉持“了解领域专家需求→利用数字技术解决相关难题→满足领域专家需求”的理念展开工作,使数字技术真正成为研究者手中的利器,帮助他们解决遇到的相关问题。

3 方志物产知识库对农业史研究的学术意义

方志物产知识库这一数字人文研究平台的构建不仅可以解决农业史研究中出现的一些具体问题,而且有助于农业史研究方法、工具的革新,以及农业史研究范式的转换。具体而言,方志物产知识库对农业史研究的学术意义主要有四:

第一,有利于研究者对获取的方志物产资料按照需求自行组合,展开研究。与以纸质文本为载体的地方志中记载的物产资料、以电子文本为载体的数据库中存储的物产资料相比,方志物产知识库中存储的物产资料是一种经过多层级标注的知识,诸如物产名称([WC])、来源志书([LY])、时间([SJ])、区域([QY])、属之分类([FL])、人名([RM])、地名([DM])、引书([YS])、别名([BM])等内容均按照统一的规范进行标注,研究者提取这些物产资料以后,可以根据自己的需求归类、排列、整理,展开不同主题的研究。比如,烟草作为明清以来传入中国的美洲经济作物,地方志对之多有记载,研究者将从方志物产知识库中提取的烟草资料编排在一起,可以探讨烟草与淡巴菰、淡肉果、相思草、芬草、金丝烟、返魂烟之间的关系,分析它们是否为烟草的别名、成为烟草别名的原因、每一烟草别名存在的时空范围、烟草别名的文化内涵等。又如,嘉庆二十年《萧县志》“蚬”条记载:“本草纲目处处有之小如蚌黑色又其类大小厚薄不一”,《本草纲目》中的内容常被地方志中的医药物产所援引,研究者可以将从方志物产知识库中提取的以《本草纲目》为引书的医药物产资料编排在一起,按照时间、地点、物产、属等分类组合,探讨地方志医药物产援引《本草纲目》的类型、动因、内容。再如,地方志中涉及物产的栽培技术较少,若研究者想要深入了解相关知识,方志物产知识库提供的可以关联的物产知识数据集能够清楚地指明查找的方向、路径,实现知识库内外不同资源的有效联结,这样一来,原本围绕着文献记载而展开的论述将得到程度不一的丰富,学术争议也有望得到解决。可见,方志物产知识库可以提高研究者获取方志物产资料的工作效率,改进研究者阅读、分类、整合方志物产资料的工作方式,开阔研究者分析方志物产资料的视野。

第二,推动单一的物产史研究向整体的物产史研究转变。所谓单一的物产史研究,是指以某一种物产为研究对象进行的论述,比如关于稻、麦、粟、玉米、番薯、马铃薯、辣椒、南瓜、西瓜、番茄、大豆、花生、烟草、陆地棉、橡胶、猪、牛、羊、小黄鱼、墨鱼、象、虎、狼等的专题研究。所谓整体的物产史研究,是指以某一类物产或大多数物产为研究对象展开的分析,比如关于粮食作物、蔬菜作物、经济作物、药用作物等的分类研究,或者关于某一时期大多数物产的综合研究。一般而言,单一的物产史研究是开展整体的物产史研究的基础,建立在前者基础之上的后者才更扎实、更可信。目前,单一的物产史研究已经取得了比较丰硕的成果,初步具备了推进整体的物产史研究的条件,不过,仍然存在着一些不足之处:一方面,以作物史为代表的植物史研究远较动物史、矿物史、货物史研究为多,动物史、矿物史、货物史研究有待丰富;另一方面,单一的物产史研究往往只能反映某一种物产消长变迁的历史,而难以揭示多种物产融合、竞争的复杂态势。方志物产知识库的构建有助于上述问题的解决。首先,与作物史资料相比,涉及动物史、矿物史、货物史的资料相对较少且零散,利用传统方法搜集难度较大,然而,方志物产知识库可以十分便捷地为研究者提供这些资料,同时指明数据关联的方向,为动物史、矿物史、货物史研究奠定坚实的史料基础。其次,方志物产知识库存储着多种物产的知识,有助于揭示不同物产之间融合、竞争的复杂态势。比如,明代以来玉米传入我国,因其具有耐旱耐瘠的特性,环境适应性较强,迅速在我国山区推广开来,与番薯、马铃薯一起融入我国原有的以水稻、小麦为主的粮食作物结构之中。但是,随着山区玉米种植规模的扩大,森林资源遭到破坏,动物遭到捕杀与驱赶,玉米与部分植物、动物之间也存在着一定的竞争关系。类似的情况,在方志物产知识库中,通过设置相关检索条件,可以获取相关资料,并实现可视化呈现。

第三,促进局部的物产史研究迈向全局的物产史研究。所谓局部的物产史研究,是指以某一地区的物产为研究对象进行的探讨,比如关于某一行政区划单元的物产、某一自然地理单元的物产等的专题研究。所谓全局的物产史研究,是指以更大的行政区划单元或自然地理单元甚至全国的物产为研究对象展开的阐述。大致来说,局部的物产史研究虽然有利于弄清楚某一地区的物产状况,却容易忽视物产在这一地区以外的状况,形成一种无意识的碎片化。与之相比,全局的物产史研究具有诸多优势:首先,以时间为线索来看,全局的物产史研究可以展现物产结构变迁的阶段特征,比如,选取1368年前后、1644年前后、1840年前后、1949年前后为四个时段节点,通过方志物产知识库获取相应的物产资料,进行对比分析,可以大致勾勒出宋代以来物产结构变迁的整体图景。其次,以空间为线索来看,全局的物产史研究可以反映全国范围内物产结构的地域特征,比如,选取江苏、湖北、云南分别代表东部、中部、西部,利用方志物产知识库提取三个地区的物产资料,然后对三个地区的粮食作物结构进行对比,能够知晓谷类作物、薯类作物、食用豆类作物所占比重的地域差异,并进一步分析其动因、影响。再次,将时间、空间两条线索叠加起来观察,全局的物产史研究可以更为详细、全面地揭示宋代以来物产消长的时间进程与空间分布的复杂状况,比如,美洲作物传入以后,不同作物在引种、推广、本土化过程中存在着时间上、空间上的差异,这些内容汇集起来可以折射出明清以来美洲作物与原有作物融合、竞争的双向(甚至是多向)图景。如此海量的物产数据呈现功能,是纸质文本、传统电子文本难以实现的,而方志物产知识库存储的绝大部分物产数据具有明确的时间、地点信息,可为这种宏大叙事提供支撑。

第四,引领大数据时代农业史研究新趋势。21世纪初,有学者在回顾20世纪中国农业史研究的不足之处时写道:“农业史研究大多仍局限于一般历史学和文献学方法的应用,农业经济史的研究偶尔也应用了一些经济学的理论和方法,其他学科的理论方法则很少利用。”[8]经过近二十年的努力,上述面貌已有初步的改观。当前,大数据时代背景下数字人文的迅速发展,为农业史研究带来了新的机遇与挑战。方志物产知识库的出现正是顺应这一时代背景下学术潮流的结果,有助于农业史研究中数字人文理念的传播与方法的践行。首先,推动农业史研究中以数字人文为代表的交叉学科理念的传播。史学研究的创新一般包括新史料、新方法、新观点三个方面,方志物产知识库这一数字人文研究平台的研发将为农史研究提供一系列新方法,而新方法的运用又有助于新观点的提炼与论证。从这个意义上来说,方志物产知识库可以为数字人文在农业史领域的探索工作提供示范。其次,促进农业史研究主体由个人向个人、团队并存转变。以往的农业史研究主要由单个研究者独立进行,在大数据时代背景下,研究者熟知多个学科的理论与方法虽然十分必要,却困难重重,这种由学科壁垒、知识结构差异造成的天然鸿沟短时间内难以弥合,因此,较为有效的办法便是围绕着某一主题组成研究团队,团队成员彼此之间扬长避短且互相学习,既发挥他们在各自擅长领域内的优势,又不断弥补他们在其他领域的知识短板。方志物产知识库的构建就与农学、历史学、科技史、图书情报学、计算机等相关领域学者的通力合作密不可分。再次,实现“数据驱动”与“问题驱动”的有机结合。所谓数据驱动,是指通过数字人文技术搜集、整理、分析数据,挖掘数据中潜藏的知识。所谓问题驱动,是指以问题意识为导向,通过研究数据,合理解答问题。作为一种新的研究方法,数字人文的蓬勃发展并非一帆风顺,甚至遭到了质疑,有学者曾一针见血地指出,“发展数字人文的过程中,很多人的研究迷失在数字人文新概念、新方法的海洋”,“如果在研究过程中没有强烈的问题意识,再好的工具也仅仅是算法而已”[9]。换言之,如果数字人文仅能带来“数据驱动”,而无法实现“问题驱动”,其所得出的论断往往难以超越传统农史研究的认知框架,甚至有以枯燥的数据与图表取代生动的历史叙事之危险。有鉴于此,为了实现“问题驱动”,了解、满足研究者的需求(包括其部分问题意识)始终贯穿于方志物产知识库的构建过程中,而且,在方志物产知识库的深度利用上,也将回归到农业史等领域研究的学术语境之中,具体问题具体分析。

4 结语

在当前数字人文实践活动中,开展面向领域专家需求的数字人文研究是重要途径之一。方志物产知识库的构建及深度利用正是在这一理念指引下展开的,将对大数据时代科技史研究的创新与发展产生十分深远的积极影响。首先,为知识再生产探索新的途径。在数据化过程中,方志物产知识数据集类似于碎片化的知识单元,领域专家按照各自的需求对这些知识单元进行排列组合,有利于挖掘、发现新的隐藏知识,产生新的认知。其次,为科技史研究引入新的方法(工具)。方志物产知识库运用的量化分析、社会网络分析、GIS可视化呈现等新方法,有助于科技史研究方法的创新,是科技史研究创新的重要路径。再次,为科技史领域的数字人文基础设施建设提供示范。基于古籍智能整理、命名实体识别、集外字处理、智能考证、知识图谱、知识应用等方面的工作,方志物产知识库构建过程中形成的一系列标准与规范,对未来科技史领域的其他数字人文基础设施建设具有一定的参考价值。总之,以数字人文的迅速发展为契机,研发更多的开放的科技史数据库(或知识库),并逐渐实现彼此之间的关联,在此基础上,推出一批具有重要价值的学术论著,有助于推动数字人文背景下的农业史研究乃至科技史研究的继续发展。

致 谢团队成员在调查问卷的设计、发放以及数据回收、统计过程中曾给予诸多帮助,谨致谢忱!

猜你喜欢

物产方志知识库
Effects of O2 addition on the plasma uniformity and reactivity of Ar DBD excited by ns pulsed and AC power supplies
汉语近义词辨析知识库构建研究
Development of a battery-operated floatingelectrode dielectric barrier discharge plasma device and its characteristics
The investigation of OH radicals produced in a DC glow discharge by laser-induced fluorescence spectrometry
Activated persulfate by DBD plasma and activated carbon for the degradation of acid orange II
实践活动—教学设计案列
东北地域物产及其词语缘由
机构知识库建设的动力研究
风险警示:香溢融通、物产中拓、申达股份
我国联合虚拟参考咨询系统知识库现状研究*
——基于与QuestionPoint的对比