APP下载

基于TPI的黄炎培研究专题数据库的建设实践

2023-11-06茅晓薇杨静丽杨雨慧

电脑知识与技术 2023年27期
关键词:黄炎培检索数据库

茅晓薇,杨静丽,杨雨慧

(南京工业职业技术大学,江苏 南京 210023)

我国近现代教育家黄炎培先生是职业教育的集大成者,其职业教育思想对我国职业教育改革有着重大的现实意义。南京工业职业技术大学作为黄炎培先生亲自创办的学校和中国现代职业教育事业的继承者,在职业教育进入提质培优、增值赋能的新阶段,学校依托现有特色资源,构建一个集学术研究、社会服务、专业资源服务于一体的黄炎培研究专题数据库,不仅能服务于学校教学科研,而且能实现资源共享,推动黄炎培研究多元化、系统化格局的形成,使黄炎培职业教育思想焕发新的时代价值。

1 数据库的建设背景与目标

黄炎培先生是我国职业教育的先驱,他于1917年在上海发起成立了中华职业教育社,以倡导、研究和推行职业教育,随后又创办了《教育与职业》杂志,次年创办中华职业学校(即南京工业职业技术大学前身)[1]。他在长期的职业教育理论探索和职业教育实践中,形成了比较完整的中国现代职业教育思想理论体系,并对当时及以后的职业教育产生了巨大的推动作用[2]。

国内学者对黄炎培的研究由来已久,但是有关文献分布广泛且分散,尚没有专门的文献信息中心,在此背景下,南京工业职业技术大学建立一个完备的黄炎培研究专题数据库,可以妥善保存黄炎培文化遗产,更好地弘扬、传承和发展黄炎培职业教育思想。通过建设具有学科特色的“黄炎培研究专题数据库”,利用现代信息技术手段对分散的、零乱的、多种类的有关黄炎培研究的文献资源进行全方位、深层次的挖掘、采集、整理、加工、整合和展示,使黄炎培研究文献资源完整化、数字化和网络化,实现对黄炎培研究文献资源的存储、检索和传播,形成黄炎培研究文献资源的服务平台,面向国内外用户、学者和研究人员,提供特色服务,实现资源共享。

2 数据库的建设基础

2.1 学校专题展览馆和研究中心为数据库建设提供了前期基础与数据资料

学校于2004 年成立了黄炎培职业教育思想展览馆和黄炎培职业教育思想研究中心,在黄炎培职业教育思想的研究、宣传、传承与创新方面做出了诸多探索与实践,收集了珍贵的史料图片、文字及实物,编印出版了系列研究资料,建成了黄炎培职业教育思想文库专题网站等,为数据库的建设奠定了前期基础,提供了大量数据资料。

2.2 省哲社重点研究基地为数据库的建设提供了人员和经费保障

学校黄炎培职业教育思想研究中心2018 年获批江苏高校哲学社会科学重点研究基地,得到了多方经费支持并建成了一支具有深厚理论功底、学科互补、研究与教学融通的职教文化研究与创新队伍,为数据库的建设提供了充足的经费及人员保障。

2.3 校内外的黄炎培研究团队及专家学者为数据库建设提供了理论指导

2020年,中华职业教育社黄炎培职业教育思想研究院成立并在学校设立秘书处开展工作,研究院所组建的专兼职研究团队以及相关专家学者,为数据库的建设提供了内容收集、框架设计、专题栏目分类等多方面的理论指导。

2.4 《江苏高职教育》“黄炎培职教思想”专栏为数据库培育了稳定的读者和用户

2018 年底,学校学报更名为《江苏高职教育》,从服务一方院校转变为服务江苏乃至全国职业教育,期刊设有“黄炎培职教思想研究”专栏,刊登了众多研究黄炎培及职业教育的专家和学者的优质文章,为数据库培育了稳定的读者用户群。

2.5 专业的软件系统为数据库建设提供了技术保障

学校购买了清华同方TPI专业数据库制作管理系统作为数据库创建、发布和管理的平台,它是基于非结构化文档管理开发的智能内容管理系统,以KBASE全文检索数据库为核心,采用B/S 形式进行网站的发布,C/S形式进行数据加工,能够同时管理文字、图片、音频等不同格式的多媒体信息,实现资源整合,为数据库建设提供了完备的技术保障。

3 数据库建设的主要实践

黄炎培研究专题数据库需要将分散无序、形式各异的文献信息资源进行采集、整理、加工、集成、整合,形成统一的信息服务体系后通过门户系统展现,供用户使用。建库平台TPI 系统的核心是KBASE 检索服务器,它能实现信息的组织、存储与检索,内容管理器(CMC)实现数据仓库创建与内容管理,元数据加工工具(TCMM)实现元数据在线标引对原始文献资料的数字化结构化,内容发布(TPIWeb)实现内容的发布与资源展示利用服务。数据库主要的建设过程如下所述。

3.1 数据收集与数字化处理

建设团队依托先进的数字化技术、网络化信息手段和检索方法等,全面、广泛地收集了各类黄炎培研究资料(包括文字、声音、图像等信息),从时间上收集了包括自晚清以来各历史阶段有关黄炎培的所有资料;从介质上收集了包括纸质的和电子的有关黄炎培的所有文献;从内容上收集了包括黄炎培著作、日记等资料,有关黄炎培研究、黄炎培职业教育思想影响等所有文献;从文献类型上收集了包括图书、期刊论文、学位论文、报纸论文、会议论文、视频、图片、相关网页等所有文献[3],具体资源内容可见表1。

表1 资源内容一览表

对于收集到的所有资源,经过遴选后,团队在建库前期进行了大量的数字化处理工作,把各种类型的数字对象加工成规范、有序的资源,具体流程见图1。一是对现有的电子资源进行加工、标引后上传到资源中心;二是对所收集到的纸质资源进行数字化处理,利用建库平台TPI 的电子图书制作专用工具,通过书页扫描、扫描图像处理、OCR识别处理、校对、标引、编辑目录等工序后上传到资源中心;三是对收集到的网络资源通过信息采集、资源转换后上传至资源中心。所有资源将通过建库平台TPI进行发布。

图1 数字化流程图

3.2 数据库设计

根据收集到的资源数据类型,在遵循CALIS特色数据库建设技术规范的前提下,团队结合数据库的实际使用需求,利用建库平台TPI 的内容管理与发布工具(CMC)实现了图书、报纸、期刊论文、博士论文、硕士论文、国际会议论文、国内会议论文、视频、图片等子数据库的搭建,设置了子库的名称、字段信息、位置、权限等,子库的数据结构表为:XXX_CLS 数据分类导航目录表、XXX_CLS_NODE 分类导航树结构表、XXX_DATABASE_DESCRIPT 数据库的描述表、XXX_FIELD数据库的字段表、XXX_METADATA数据库中表数据表、XXX_METADATA_ FILE 文件存储路径表、XXX_METADATA_FILE_IMAGE 数据库中缩略图表、XXX_METADATA_RELATION 数据库相关表。这些子库是构成黄炎培研究专题数据库的核心。

3.3 数据转换

数据转换主要包括数据导入、数据导出和数据库间的数据导入,建库平台TPI 的数据转换工具(Data-Tran)支持多种类型的转换模板,如:CNMARK、ODBC、Excel、DC、ACCESS、XML、TPI、CALIS、自定义文本等多种格式。在数据库设计并创建完成后,团队利用该工具进行元数据与目标子库的字段映射,将数据导入各子库中;还可利用该工具可以把数据库中每个子库中的数据导出到本地,同时平台支持数据库间的数据导入,包括导出文本文件、Microsoft Excel 文件、Microsoft Access数据库、MARC文件等。

3.4 数据库发布

数据导入之后,团队利用建库平台TPI 的后台管理功能来实现数据库的发布,首先配置子库的检索、概览、细览、排序、分组字段等内容,实现子库的页面初始化;然后再进行提交字段、修改字段的配置,实现子库数据的初始化;最后对跨库进行配置,实现统一检索全文的功能。同时平台支持Internet内容信息发布的流程化管理,采用动态页面生成技术,无须编程即可自动发布,提供了多种发布风格[4],支持多导航和多个数据库的无缝链接。

3.5 资源展示与检索

数据库最终是以网页的方式呈现,并为用户提供浏览、检索和下载服务,因此黄炎培研究专题数据库在前期构建时即采用了个性化页面设计,网站的设计上内容丰富、布局合理、美观且具特色。为了全面展示黄炎培相关研究成果、打造具有特色的研究平台,团队设计建立了分类导航体系,以生平简介、个人著作、珍贵图片、影像资料、研究动态、传承发展、热词分析等为主要导航架构,方便快速定位到所需查找的内容模块,具体设计可见数据库首页导航展示图(如图2所示)。

图2 黄炎培研究专题数据库首页导航展示图

1)生平简介模块。该模块重点展示了黄炎培的生平及其职业教育思想概述,从1878年至1965年,以时间为主线,详细介绍了黄炎培先生的职业教育生平。

2)个人著作模块。该模块展示了黄炎培个人所著《中国教育史要》《学校教育采用实用主义之商榷》《内外时报中华职业教育社宣言书》等作品,以及许汉三编写的《黄炎培年谱》等。

3)珍贵图片模块。该模块重点展示了黄炎培工作、生活中的珍贵照片,包括其与家人朋友的合影、多次考察教育、进行职业教育办学、重要场合主持工作等场景图片。

4)影像资料模块。该模块展示了黄炎培相关影像资料,包括《大师》中国教育家(黄炎培)、电视剧《黄炎培》等视频。

5)研究动态模块。该模块不仅详细展示了与黄炎培职业教育思想相关的最新研究成果,同时围绕黄炎培教育思想体系的教育救国思想、实用主义教育观、大职业教育主义、职业道德教育观、职业指导等五个方面展示了与之相关的研究成果,主要选取了CNKI 中国知网总库收录的中外文期刊、博硕学位论文、会议、报纸等相关成果[5]。

6)传承发展模块。该模块展示了黄炎培职业教育思想传承发展的最新动态,利用互联网资源抓取工具进行相关数据的抓取,并实现数据的智能标引,主要包括国家、省市、中华职业教育社与各省社以及学校的相关新闻动态。

7)热词分析功能。主要为用户呈现具体的可视化分析结果,热词分析为与黄炎培研究相关的、反映当下职业教育研究热点的关键词展示,例如黄炎培、教育、职业、职教、职业道德、周期率等,可为用户进行关键文献及相关文献推送,并提供延伸阅读。

团队充分考虑了各层次用户的使用习惯及需求,建立了简洁方便的检索界面,数据库的检索工具不仅提供单库检索、跨库检索和分布式检索等多种检索方式,还提供二次检索、高级检索等,并能按照更新日期和相关度等方式进行排序。

3.6 数据库的使用与维护

黄炎培研究专题数据库已初步建成并投入使用,目前运行良好,总数据近四千条,以时代为线索,将著作、论文、图片、视频等,借助于数字化平台,有组织地分类、编排在一起。具有独立的域名(http://hypresearch.niit.edu.cn/),提供Web 形式的开放式检索,可基于题名、作者、关键词、全文等多种检索途径及多个字段的组合检索方式,检索功能强大。对于信息资源提供概览显示、全文显示、打印等输出方式,供广大职业教育者、学者和研究团队学习使用。

专题数据库的建设是一项长期且艰巨的工作,需要持之以恒地对数据库不断进行充实、调整、更新、维护和完善,使其真正成为为广大用户和研究学者提供全面、方便、快捷、高效的文献信息资源检索的平台。

4 结语

在黄炎培研究专题数据库的后续建设过程中,要始终坚持特色,突出特色,高度重视知识产权问题并严格遵循相关法律法规,加强对数据库的宣传,注重数据备份与数据安全,及时收集用户使用的反馈信息,对平台不断加以改进和完善,同时可建立面向黄炎培研究团队的知识管理和协同平台,提供云服务,以用于团队成员之间的网络协同、知识共享、知识沉淀和知识创新,努力将数据库建设得更加实用与专业。

猜你喜欢

黄炎培检索数据库
2019年第4-6期便捷检索目录
专利检索中“语义”的表现
浅析黄炎培对职业教育过程的思辨
1949年以来黄炎培研究综述
第四届黄炎培职业教育奖颁奖大会在京隆重举行
国际标准检索
国际标准检索