APP下载

近代教育类期刊分类体系探索
——以《全国报刊索引民国时期期刊全文数据库》为例

2018-09-19沈立力

图书馆理论与实践 2018年8期
关键词:类目聚类期刊

沈立力

(上海图书馆)

中国近代史上,由出版社、学校、教育团体和个人创办的教育类期刊数量巨大,其中《全国报刊索引数据库》收录的教育类期刊就达2,700余种。这些期刊讨论了近代教育的种种问题,传播了西方先进的教育理念和方法,记录了当时中国教育改革的进程,[1]对近代教育类期刊的知识挖掘具有重要的历史意义和理论价值。笔者以《全国报刊索引民国时期期刊全文数据库》(以下简称《民国期刊数据库》)为例,对近代教育类期刊体系的设置进行研究,旨在深入挖掘上海图书馆馆藏近代教育类期刊的资源特色,探索开展专题知识资源开发与创新的可能性。

1 国内近代期刊知识组织方法的比较与现状

1.1 主题法与分类法的比较

目前,学界整理和汇编文献的主要方法有分类法和主题法。分类法按照文献内容特征的相互关系加以组织。如,《杜威十进制图书分类法》《中国图书馆图书分类法》(以下简称《中图法》)都是典型的层级制分类法组织方式。对于近代期刊的知识组织,层级制分类法的优点在于其类目设置使分类体系更加完备、知识结构更加完整、对文献的覆盖面相对较大、能够全面呈现专题内容、充分揭示资源全貌并为用户提供更系统、更便捷的聚类和文献导航功能,同时可以弥补关键词检索的不足。缺点在于不能完全揭示近代期刊的时代特色、体裁特征,缺少独特性与时代性的体现。

主题法以文献论述的对象,以事物、问题和现象等作为主题词,直接以表达文献主题的词语作为检索标识。主题法与分类法的不同在于其不受学科体系的限制,可以直接从主题对象的角度进行文献资料的揭示。[2]主题法的优点在于可进行人物、事件、地点、体裁、学科等多维度的揭示,此外,还可依据社会热点增加新的主题标签。虽然主题法对文献的覆盖面小于分类法,但在该专题文献领域内,便于用户对其感兴趣的问题进行检索查询。[3]如,国家图书馆的《东京审判资源库》就是以历史事件为主题聚类形成的近代文献信息资源专题库,所涉及的文献内容更专业、更具体。当然,主题法的知识组织方式也有一定的局限性,其知识组织方式未成体系化,对深层次内容的揭示不如分类法完备。

1.2 国内近代报刊教育类目设置现状

目前,国内的商业机构和图情机构对近代文献都进行了一定程度的数字化加工,但是深度挖掘和语义层面的知识服务都还处于起步阶段。知识组织的方式较为单一,类目设置分为层级制和平铺式两种。

以国内收录范围较广、知名度较高的三大近代报刊数据库为例,其中,睿则恩、孔夫子旧书网采用的都是层级制分类体系,细分至二级。睿则恩将教育作为二级类目下设于人文与社会类目下;孔夫子在教育类目下设6个二级类目。大学数字图书馆国际合作计划 (China Academic Digital Associative Library,CADAL)采用的是平铺式分类体系,共设立类目70个,其中涉及教育的类目有3个。

2 近代教育类期刊分类体系构建特点和方法

目前,近代教育类期刊分类体系构建是在全国报刊索引晚清、民国时期期刊全文数据库个人服务平台58个平铺式类目分类体系的基础上,[4]针对教育类目的进一步探索,以期为后期近代期刊内容层面的知识组织奠定基础。依据已有的期刊分类,《全国报刊索引数据库》共收录教育类期刊2,700余种,占数据库总量的13.5%(数据库总量为20,654种)。体系构建依托《中图法》G4-G7教育类,汲取主题法的优点,深入研究当时的历史背景和近代教育类期刊内涵特征,结合自身资源特色,构建层级式的近代教育类期刊分类体系。该体系可依据数据库资源加工情况,对二级类目进行细分,并设立三级类目。

2.1 彰显时代特征

中国近代教育期刊有其鲜明的时代特色和历史背景,是近代教育发展历程的真实写照。在分类体系设立时,首先应该将这些特征归纳提取,设立类目。

(1)近代教育期刊区域分布广而不均,地方教育类期刊占比较大。有学者指出,教育期刊密集区域为上海、北京、江苏、四川等地区,形成此分布的原因是因为“它们是中国近代政治和文化中心”,[5]从侧面反映了当时历史环境下,各地教育办学的水平以及各地政府对教育的重视程度。对地方教育期刊进行知识组织有利于对特定省份、特定地区的教育期刊内容进一步梳理和挖掘。因此,拟立地方教育为二级类目,同时以省份、地方为热点关键词对刊名字段进行关键词检索,统计得出《民国期刊数据库》中收录地方教育类期刊最多省份依次为上海、北京、江苏、四川 (见表 1)。

表 1 区域分布热点关键词统计

(2)特殊社会群体的教育问题备受关注。在中国近代史上,一些特殊的群体发挥着重要作用,影响着历史前进的方向,他们的教育问题在近代教育期刊中也占有一席之地。① 以妇女教育类期刊为例,这类期刊的创办为中国近代妇女的解放和思想启蒙奠定了基础,既倡导女学又尊重女权。[6]因此,将妇女教育单独立类充分体现了当时这一特殊社会群体的历史地位和贡献。② 华侨也是近代史上不可忽视的一个社会群体。华侨教育伴随着中国人迁移海外发展,最后又发展至国内,在中国近代教育史上画下了浓墨重彩的一笔,[7]清末的《东方杂志》《教育杂志》等对华侨办学的情况都有所报道。[8]这些华侨教育类期刊的发行机构有华侨学校、工会、个人,出版地分布菲律宾、香港、上海等地,内容大多涉及侨民教育问题、办刊机构现状、时评论说等。因此,在类目建设中可将华侨教育单独立类。③ 民国时期伴随着农业的发展和社会的进步,农民这一社会群体的教育问题也是各大教育期刊论述的重点之一,农民教育被赋予促进农村社区和农业社会现代化转变的重要意义。[9]农村教育类期刊的内容往往侧重于普及农业常识、介绍乡村教育的理论,并以普及农村教育、提高农民文化素质为宗旨,文字往往通俗易懂,是研究近代中国农村教育制度变迁的有力史料。这些特殊社会群体是中国近代历史发展的重要组成部分,因此,笔者将妇女教育、华侨教育、农村教育分别立类,并用相关热点关键词在刊名字段进行检索(见表2)。考虑到这三个类目下数据量在所有教育类期刊中占比较低,因此聚类后将各类教育立为二级类目,下辖三级类目妇女教育、华侨教育、农村教育。

表 2 特殊群体教育热点关键词统计

(3)近代教育期刊中有很大一部分论述教育理论体系的期刊,其特点是理论性强、有一定学术价值。有学者指出,民国以后,教育期刊向教育理论体系和各类教育两个方向分化。[5]因此,分类体系构建时将教育理论体系单独立类,教育理论体系类刊物包含教育行政、教育理论、教育法令等内容。这些总论教育理论体系的期刊在《民国期刊数据库》中占比较高,笔者以教育理论、教育学等热点关键词在期刊介绍字段进行检索,统计得出此类期刊占所有教育类期刊的22.43%(见表3)。此外,近代教育刊物中还包含少量论述教育心理学、教师与学生关系的文章,都一并归入教育理论体系中。因此,将其聚类后构建二级类目教育理论。

表 3 教育教学热点关键词统计

(4)国外先进教育理念介绍在近代期刊中占有一席之地。笔者在梳理《民国期刊数据库》后发现,诸如《基本教育》《实验教育》等期刊中都有对国外教育方法、教育经验的介绍,或是对国外教育家有关现代教育理念的译述。由此,将世界教育单列成二级类目,以突出西学东渐背景下,西方先进教育理念、学术思想对中国近代教育的重大影响。

2.2 揭示近代期刊体裁特征

近代教育期刊办刊机构多样,政府、学校、出版机构和个人都创办过大量期刊,[10]《民国期刊数据库》收录的期刊中尤以官报、校刊最为突出。无论是在近代教育期刊的初兴时期,还是在其发展兴旺期间,官办教育期刊的数量一直处于领先地位。清末,各地方劝学所兴办官方教育期刊,由此官报的概念形成。到了民国初期,在沿袭清末官报的基础上,为宣传教育政策、传达教育法规,各级官方教育机构大量创办发行教育期刊。

此外,小学、中学、大学纷纷创办校报、校刊以及校友会刊物,内容包括校训、课程设置、学生习作、学术探讨等,全方位、多角度描绘了中国近代史上各级院校的办学状况、学生风貌、学术动态以及教学方法,是研究近代教育办学情况的一手资料。

综上,笔者拟将教育官报、公报、校报、校刊、校友会刊物设为类目,同时,以教育官报、校刊、校报等热点关键词对刊名、期刊介绍字段进行检索,筛选出的关键词较为集中(见表4),所涉及的期刊在数据库中占比较高,也进一步印证了这些拟设类目的时代性、典型性。通过后期聚类,设立二级类目校刊官报,并将校报校刊、官报公报分别立类为三级类目。

表 4 期刊体裁热点关键词统计

2.3 结合自身资源特色

近代教育类期刊分类体系建立的初衷是为了对《民国期刊数据库》进行更好的内容挖掘和知识组织,体系的建立在考虑时代性和体裁特点的同时更需立足资源本身。因此,笔者在研究《民国期刊数据库》教育类期刊的主要内容和期刊简介后,剔除已经进行类目建设的热点关键词,筛选出以下集中度较高、有一定代表性的关键词,并对这些关键词进行聚类和汇总(见表5),对初等教育、中等教育、高等教育、社会教育立类,这四个二级类目下辖的期刊数据量占所有数据量的79%。因此,设置这四个类目能够最大程度地揭示现有馆藏特色资源,提高数据使用率。

表 5 特色资源热点关键词统计

2.4 依托《中国图书馆分类法》辅以主题聚类理论

经过上文多角度分析和对自身资源的研究,选取多个热点关键词,辅以主题聚类理论,对其中某些关键词进行聚类。之后,借鉴《中图法》(第五版)中G4-G7教育类的体系结构,秉持立足理论、结合实际、服务应用的原则,最终建立近代教育类期刊三级层级制体系(见下图)。其中,一级类目1个,二级类目9个,三级类目7个。

图 近代教育分类体系

需要指出的是,近代教育类期刊有较强的综合性,除了论述以上类目所涉及的内容外,还常常设置文艺、小说、图画等形式多样的专栏,以活泼多样的形式传播最新的教育理念,展示各级各类办学主体的现状。因此,在之后对篇名数据的标引分类过程中需要对这些专栏的内容进行分析研究,将其剥离出教育类目,划入其他合适的类目中。

3 近代教育类期刊知识组织的思考和展望

3.1 多学科视角下的内容深度挖掘

学者们从不同视角对近代教育期刊进行研究,取得了一定成绩,但这些研究也存在一定局限性。首先,研究角度较为单一,缺少交叉学科视角的探索。目前对近代教育期刊的研究大多集中在教育学或历史学领域,而图书馆界的关注点又大多集中在近代期刊的数字化和浅度加工,即客观字段著录和知识组织,对深度加工,即内容的挖掘还处于起步阶段。随着用户知识需求的日益提高,简单的浏览、检索、聚类服务已经难以满足用户的需求。因此,为了满足用户更深层次的需求,在处理该类资源时,需结合教育学、历史学、图书馆学等学科的专业视角,并借鉴传播学、社会学等最新的研究成果,从内容着手,进行面向语义层面的深度知识组织和挖掘。

3.2 增加人物、时间、地点的多维度研究

目前,对近代教育类期刊的研究大多是以刊为单位,并且主要研究对象多为《教育杂志》《中华教育界》等发行期长、影响力大的期刊,而对期刊中编辑单位或个人、出版地、创刊年月、期刊沿革等元数据字段的研究和知识组织关注较少。以编辑单位或个人字段为例,期刊主编对期刊的创办、办刊宗旨、舆论导向等起着决定性作用,如,陆费逵之于《教育杂志》、陈鹤琴之于《幼稚教育》等。[11]因此,将这些字段的数据进行梳理,有利于后期从人物、时间、地点等多维度进行聚类,使元数据字段可以更灵活地扩展,有利于进行内容层面的知识组织,更有利于丰富近代教育史的研究范畴。

3.3 加强近代教育类期刊广告、图片的加工和知识组织

《全国报刊索引数据库》已经完成了部分中国近代中英文报纸广告、图片的加工工作,并进行了一定程度的知识组织,如,《新闻报》《时报》《字林西报》《沪报》等。但对于近代教育类期刊中的广告和图片,并未进行深入的研究和加工。近代教育类期刊,特别是教育类期刊往往刊载一定数量的广告,并在文中配有大量图片。教育类期刊中的广告和图片与《时报》等政治综合类报纸或《上海繁华》等娱乐小报不同,较少刊登烟草、化妆品、医疗保健等商业类广告,而多为文化教育、启事公告等。对这些广告、图片进行进一步的加工有利于更深层次地挖掘近代教育发展的细节脉络,是对相关文献研究的补充,是对近代教育期刊知识组织全景式的展现,同时也是对近代教育市场化、现代化的揭示。

3.4 重视近代教育期刊专题库建设

近代教育类期刊分类体系建设最直接的应用场景就是为专题库服务。近代教育期刊专题库的建设本质上是以教育这一主题类目下某二级类目或主题进行聚类和文献资料的再整合,是深度挖掘文献内容的过程,也是对一些利用率低的文献资料的二度开发的过程。专题库的建设既能满足学者对特定课题的研究需求,也能吸引特定用户对数据库的利用。

猜你喜欢

类目聚类期刊
期刊更名启事
期刊简介
本期练习题类目参考答案及提示
期刊问答
CLC与LCC类目同现映射方法研究
——以图情领域为例*
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
《中图法》(5版)“K历史、地理”大类的修订
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法