APP下载

上海图书馆会议文献建设与服务

2021-07-10沈立力

图书馆研究 2021年3期
关键词:上海图书馆学术会议加工

沈立力

(上海图书馆,上海 200031)

1 引言

2018年12月第一届全国灰色文献年会的召开引起了图书馆业界对灰色文献新的重视,随着图书馆数字化和数据化的不断推进,对灰色文献的收集、整理、研究和服务都有了新的认知和要求[1]10。GeryNet对灰色文献有明确定义:“灰色文献是由各级政府、学术机构、企业等产出的不受商业出版机构控制的文献资料,其形式可以是印刷版本也可以是电子格式,受版权保护,具有收藏和保存价值。”[2]灰色文献作为一种介于白色文献和黑色文献之间的特殊性质的文献,具有时效性强、内容丰富、学科分布广泛、形式多样、获取采访困难等特点[3-4]。而会议文献的管理、组织与服务则是灰色文献建设中非常有代表性的一种类型。

上海图书馆作为综合性研究公共图书馆,一直致力于开展灰色文献的馆藏资源建设和服务。馆藏灰色文献包含各种类型和各种体裁,包括学术会议文献、馆藏标准数据文献、馆藏家谱文献等。灰色文献资源的采集和建设按照馆所分工分属不同部门,因此本文将以2007年到2018年采集的学术会议文献为主要对象,分析上海图书馆“全国报刊索引中国学术会议在线服务平台”对上海图书馆在网络环境下对会议文献进行知识组织和知识服务的新尝试,以及面向个人用户的社会服务的新探索。

2 上海图书馆会议文献采集

上海图书馆学术会议文献建设最早可以追溯到1958年,目前提供1986年至今的会议文献百万余篇,形成专业馆藏。2015年起会议文献加工模式转为专业数字化外包加工,每年新增约10万篇会议篇名数据,1000余本会议论文集数据,1000余条会议相关信息数据。2017年起在“全国报刊索引中国学术会议报道”网站为个人用户提供服务。

2.1 文献采集定位、范围和渠道

2.1.1 文献采集定位

上海图书馆作为综合性研究公共图书馆和行业情报中心,对于文献收藏既要考虑到普通读者需求,还要兼顾文献的现期价值和潜在价值[5],因此,文献资源的采集定位分为两个方面:一是集聚情报研究能力为决策提供高质量的咨询服务[6];二是践行公益性原则,为广大读者提供优质的科学文化。这就要求会议文献的采集需要在服务科技、教育和生产等专业读者的同时兼顾普通读者服务,注重采集文献的专业性、广泛性、延续性、开放性,提供专题性深层次的学术文献服务。

2.1.2 文献采集范围

上海图书馆采集的学术会议文献采集范围早期以科技文献为主,1995年上海图书馆与上海科学技术情报研究所合并后,采集范围拓宽到人文社会学科类学术论文集。从2017年起,学术会议文献开始在“全国报刊索引”平台提供社会服务,会议文献收集范围也做出相应调整,更注重时事、更兼顾普通读者需求。因此,文献收集范围聚焦以下5个方面:图书情报、人文历史、科创中心和一带一路。目前,会议文献采集对象标准为省级以上政府部门组织,学术团体,科研机构高校等组织,主办或协办的在国内召开的学术会议、研讨会或各类论坛的论文集,涵盖自然科学和社会科学两个大类,包括会议前期、中期、后期产生的论文集、会议主旨发言、摘要集等文献。

2.1.3 文献采集来源和渠道

馆藏学术会议文献来源可分为书商采购和其他征集方式两种,其中以书商采购为主,占到全年文献采集量的90%以上,其他征集方式包括自主采集、网络采集、相关人员参会收集等。

书商采购模式的优点在于可以保障学术会议文献数字化加工项目顺利进行,按照采集方案对收藏等级、采集范围进行更好的质量控制,而其缺点在于书商采购方式有一定延后性,且加工流程需要流转周期,会议文献实效性不能完全得到保障。

主要以书商集中采购的文献采集模式原因有3点:一是会议文献采集范围广、产出时间不固定,文献获取和持续追踪上有一定困难;二是受限于财务制度,实际文献采集过程需要第三方完成订购、统计、资金管理等流程;三是学术会议文献编辑人员相对缺乏,在完成会议文献元数据标准维护、服务推广、编目的同时,较难安排专人完成年度文献采访任务[7]。

2.2 文献数量与结构分布

2.2.1 文献数量分布

2007—2018年,上海图书馆共收集学术会议文献论文73万余篇。自2015年起上海图书馆会议文献收集加工模式改为数字化加工项目后,每年文献收集量固定为10万余篇,论文集数量1000余本。

2.2.2 文献年代分布

上海图书馆2007—2018年馆藏会议文献的出版时间跨度为1978年到2018年,其中1978—1983年的文献占总数的0.11%,是所有年份中占比最少的;2004—2008年的文献占总数的28.40%;2009—2013年的文献占总数的40.27%;2014—2018年占总数的27.30%;2014年后出版量有所下降(图1)。经分析,主要有3个原因:一是数字化加工项目存在一定延后性,不能对最新出版的会议文献进行数字化加工,影响后续服务;二是随着文献出版信息的规范化,多数出版机构和企事业单位将更多资源倾斜向正式出版前的内部发行文献[8];三是受制于内部加工流程,目前上海图书馆还未开展数字化出版和开放获取的会议文献收集,从而对近年数字化出版的会议文献的收集有一定的缺失,因此出现文献数量下降的趋势。

图1 会议文献年代分布

2.2.3 文献类别分布

上海图书馆馆藏会议文献是以《中国图书馆分类法(第五版)》(下文为《中图法》)进行文献类目的知识组织和分类。《中图法》是以科学分类和知识分类为基础,同时结合文献内容特点和外表特征进行系统排列的类目表[9]。使用《中图法》进行分类可以依据文献内容、文献数量和文献特征对不同类目文献进行不同层级的展示。依据实际工作情况,在保障每个级别文献数量的前提下,上海图书馆会议文献总体分类深度为2~4级,社科文献方面一般不仿分,但遇到国别时需依据实际情况进行仿分;科技文献方面,对于文献内容较少的N大类(自然科学总论)、O大类(数理科学和化学)等,分类深度要求为3级类目,而对于文献数量较多,且实用性、科学性较强的R大类(医药、卫生)、T大类(工业技术)等类目,分类层级为5级。

对2007—2018年馆藏会议文献进行分类统计后发现,10年间,上海图书馆会议文献共收录社科文献15万余篇,占总数的21.48%;科技文献50万余篇,占总数的78.82%。其中,所有文献中占比前五个大类的分别是R大类医药、卫生(占34.06%)、F大类经济(6.58%)、D大类政治、法律(占4.92%)、S大类农业科学(4.45%)、P大类天文学、地球科学(占4.03%)(图2)。

图2 会议文献数据排名前五类目占比

由此可见,医药卫生领域的会议文献占比非常大,说明此类文献在发文量上有绝对优势,对该领域的研究有一定的参考价值。在剩余4个高占比大类中,社科、科技各占一半,说明文献渠道较为稳定,可以为用户在政治、法律、农业、天文学等领域的研究进行文献补充,有一定的研究价值。

3 上海图书馆会议文献数据库建设

3.1 数据库建设

上海图书馆会议文献数据库是由馆所“全国报刊索引”承建的特色数据库。该数据库的建设目前采用部分外包的数据加工模式。数据库后台管理系统及前台服务平台由外包公司开发、更新及维护;会议篇名基础数据由外包公司按著录规则加工后提交验收;会议数据、会议论文集数据、会议篇名分类数据由图书馆员工自行加工、审核,同时进行最后的oracle-solr同步。

后台加工系统分为会议信息和新闻采编发平台、会议论文集划到及加工平台、会议篇名基础数据加工验收平台、会议篇名分类数据加工及上线发布平台。因为这4个加工平台分属于不同加工部门,且在不同时期开发,目前还未能实现全加工流程平台化、系统化、模块化,因此数据在不同平台之间流转时存在数据格式不完全兼容,数据同步不及时等问题,这也是下一步后台加工系统需要解决的问题。

3.2 全加工流程

现有数据加工系统可以实现数据经过4个加工模块后发布到前台为用户提供服务。整个数据资源加工流程如图3。

图3 会议文献资源加工流程图

为了保障加工数据质量,在全加工流程中,会议信息、会议新闻、会议论文集、会议基础数据和会议分类数据都经过了数据查重、数据加工、数据审核(质量监控)、数据发布4个步骤。

此外,每一道加工工序都可对上一道工序的加工数据进行监督,对不符合质量标准的数据进行返工处理,通过系统内邮件通知相关人员进行后台及前台数据的及时处理,保障前后台数据、历史数据的唯一性、一致性和连贯性。

最后,会议信息、会议新闻数据和会议论文集数据有一定的实效性,而会议篇名数据因为外包原因有一定的加工流转周期,为了解决这一矛盾,系统中四类数据都有独立发布数据的功能,做到会议信息/会议新闻实时发布、会议篇名基础数据按月发布、会议篇名分类数据即做即发的数据上新规律,目的是为用户提供及时、准确、有效的会议相关文献及信息服务。

4 上海图书馆会议文献知识组织与特色服务

4.1 知识组织

上海图书馆馆藏会议文献所采用知识组织方式为分类法主题法,其主要实现方法为利用特定的分类法主题法进行学科分类、主题检索知识分类、主题聚类检索等,从而实现以文献为基础的传统意义上的知识组织系统[10]52。

4.1.1 三层元数据结构的适用性

馆藏会议文献目前采用MDB数据格式进行数字化加工,最小加工单位为“篇”,每篇会议论文均有相对应的PDF与之勾连。同时,三层元数据结构可分为会议、会议论文集、会议论文篇名3种资源类型,分别采用不同的3套元数据著录规则,通过唯一的ID进行数据勾连,3种资源类型有其特殊的元数据著录元素和著录细则。这种三层元数据结构有规范化、结构化、灵活化的特点,为后期会议文献的知识服务提供基础。其中会议信息本身还包括会议联系方式、会议新闻、会议相关单位、会议主旨发言4张子表,为用户进行多维度、多角度的知识服务,同时也为之后机构库建设提供数据支持。

其中会议和会议论文集为多对多的关系,而会议论文集和会议篇名数据为一对多的关系。同时在会议资源中形成系列会议(即“界次”的概念)、互见会议(即“暨”的概念)的数据结构;在会议论文集资源中形成相关论文集(即连续出版论文集的概念)的数据结构。

4.1.2 服务平台知识组织方式

2017年起,馆藏会议文献开始通过“全国报刊索引中国学术会议报道平台”进行面向个人用户的社会服务。服务层的知识组织主要是指面向用户的知识服务,包括知识元素揭示、信息检索、主题聚类、系统导航以及知识组织可视化等[10]52-53。

(1)知识元素揭示丰富规范。馆藏会议文献在数字加工阶段就注重知识元素揭示的丰富性和规范性。因此在中国学术会议报道平台中提供了深入文献内容层面的知识元素揭示,元数据字段完备。会议层面总共提供33个服务字段、会议论文集层面提供30个服务字段、会议论文篇名数据层面提供19个服务字段。全方位多角度突出文献的知识内涵和结构清晰的知识组织体系。例如:在会议层面除了揭示会议名称、会议召开时间、地点等,还注重揭示会议届次信息、会议主要内容、征文信息等,并对召开日期、报名截止日期、论文截稿日期等重要时间节点进行分字段揭示,为用户提供更好的知识服务体验。

(2)平台检索功能全面强大。中国学术会议报道平台支持会议和会议论文篇名的一框式检索,即在检索时,用户可选择对会议或会议篇名数据进行检索。同时,平台在会议、会议新闻、会议论文集层面提供不同字段的组合检索模式,检索字段丰富,页面交互友好,方便用户从各个层面进行有效的文献信息检索和学术研究(表1)。

表1 检索字段表

(3)文献聚类导航功能完备。中国学术会议报道依托丰富规范的元数据字段和文献数据,提供全面的检索结果聚类功能,展现方式多样化。例如,以“图书情报”为检索词在中国学术会议报道平台进行会议检索,在显示检索结果的同时,还分别显示会议召开时间和会议地点的聚类结果。另外,平台还提供图书情报、人文历史、科创中心、一带一路、自贸区建设五大主题的导航功能。

4.2 特色服务

4.2.1 个性化用户服务

网络时代用户对信息有多方面的需求,平台所提供的会议文献服务不但需包含客观的文化与科技信息,更需要提供个性化的知识信息服务[11],因此,中国会议报道平台在进行平台建设时充分考虑了用户的信息需求,以用户为导向,提供个性化服务,使用户习惯于定制化产品。一方面,用户在登录后可以收藏会议和会议新闻,并且在个人平台我的书房收藏中查看到会议和会议新闻的收藏分类。后期,平台还会依据用户的收藏内容,定期向用户推荐相同分类下的会议和会议新闻信息。另一方面,中国会议报道平台提供“我来推荐”的会议信息推荐通道,用户可以在相关界面推荐会议信息,等待后台审核通过后会议信息会纳入会议信息数据库,用户也将获得相应的“贡献值”和“书币”。用户可利用这些贡献值在全国报刊索引平台换取原文索取等服务,是平台众包模式的一种体现。这种激励模式不但能够增加平台的用户黏性,也能让用户参与到数字资源的建设中去,更是突出了平台的公益性,是精神激励为主、物质激励为辅的体现[12]。

4.2.2 移动端服务模式

自2000年起我国图书馆开始推行移动服务,随着技术的发展,App、微博、微信、自适应网页等技术在图书馆移动服务中都得到了应用[13]14。“全国报刊索引”的会议文献服务也抓住这一发展机遇,推出移动端服务模式。依据王丽丽等人的调研[13]17,基于微信公众号的移动服务已经是公共图书馆的标配,而App仍是图书馆移动服务的主要工具。因此,会议文献的移动端服务首先选择从微信公众号以及App开始推广。

(1)微信公众号推广。新媒体时代,微信公众号已经成为我国省级公共图书馆、高校馆开展文献资源服务、资源建设的重要手段之一[14],究其原因,是因为微信公众号已经成为普通民众日常移动互联的工具,并且图书馆可以借助微信公众号的一二级栏目构建符合各馆个性化需求的微主页,从而实现对图书馆资源、服务、活动的揭示[13]15。

基于此,上海图书馆会议文献服务在“全国报刊索引”机构版的微信公众号中为订阅用户推送会议预告和会议新闻等相关信息的服务。微信公众号定期向订阅用户推送相关主题的会议召开、论文征稿等信息。同时用户可以通过二级栏目中的月份对特定时间段内的会议信息进行查阅;另外,公众号还提供图书情报等4个特定主题的相关会议信息的聚类服务。

(2)移动App推广。如果说微信公众号的推广只是将部分会议服务推广到了移动端,进行的只是专题性的推广,那么“全国报刊索引”App的推出则是将上海图书馆会议文献的全流程服务实现了“移动化”。移动App是基于各种移动智能终端系统,集平台、社交、资源为一体的以注重用户体验为特长的移动应用程序[15]。因此,上海图书馆会议文献服务在“全国报刊索引”App中特设中国会议报道频道,同时为IOS与安卓用户提供服务。

目前,移动App中全国会议报道频道提供的主要服务内容包括:用户个人信息管理,即用户通过App管理自己的账号、收藏记录、专题列表等信息。其次是会议相关资源检索,这也是App最主要的服务内容,用户可以一框式检索数据库已经收录的会议预告、会议新闻、会议论文等相关资源信息。同时,针对会议预告和会议新闻的资源特点还提供召开日期、摘要截止等重要时间节点的可视化日历形式检索服务。另外是用户交流,即用户通过App向馆员推荐相关会议,与馆员互动。最后是利用图书馆其他服务,即用户可以通过将需要的会议论文加入购物车并提交付款的方式获得馆藏会议文献资源;此外,用户亦可以通过将相关文献加入专题的定制服务方式来接收馆员根据其兴趣进行的相关文献推荐服务。

5 会议文献建设与服务思考

5.1 注重资源共建共享,探索开放获取可能性

当前,图书馆传统的文献采访和管理模式已经难以满足网络环境下会议文献的建设和服务新需求,需要通过各方合作,共建共享资源建设。各个公共图书馆在做好本馆会议文献采访、建设和服务的同时,应该加强与其他高校、公共图书馆、行业学会、商业数据库等的沟通合作,提高对会议文献的开发和利用率。例如,2008年起,万方数据公司长期与中华医学会进行战略合作,通过共建共享,第一时间提供中华医学会旗下会议文献服务,更是于2019年10月完成了中华医学会全文数据库平台的上线工作。当然,由于种种原因,共建共享工作一直存在难度,建议进一步推进该项工作,建立联合数据目录,实现“分工协藏,资源共享”的合作模式,惠及更多用户。

另一方面,部分会议文献不再结集出版,而是采取开放形式在互联网上发布,为读者提供免费服务。这些开放形式的会议文献资源有生命周期短暂、需及时采访保存的特点[16]39,因此,建议对这些开放会议文献资源进行甄别,选取重要会议的开放资源进行收集加工并提供服务,实现会议文献的开放获取。这一措施一是可以对现有的会议文献采集数量和范围进行补充,很大程度丰富了馆藏资源;二是这类文献中的OA类文献资源不仅免费且有专门机构进行维护,可以为用户提供免费且高质量的会议文献服务[16]39。当然,对于网上数量繁多、类型各异、元数据组织方式不同的会议文献的开放获取需要建立一套行之有效的跟踪、采访、保存和服务模式。

5.2 完善现有数据加工流程,建设标准化数据库

现有的会议文献数据库加工系统还未能实现统一平台化,因此,考虑到数据库建设的长期性,应该设立专门的数字化小组来负责整个会议文献的全流程加工、外包方对接和后期维护工作。其次,将分属各个部门的数据加工平台进行整合,实现会议文献资源管理的标准化、流程化和模块化。最后,还应建立统一的元数据标准和规范,从而为实现各个自建数据库之间的互操作和资源共享创造条件。

5.3 建立个性化用户服务策略,形成品牌价值

目前,上海图书馆会议文献依托“全国报刊索引”的品牌价值同时向机构用户和个人用户提供专业服务,但是面向个人用户的社会服务模式刚刚实行,个性化服务程度有待提升。在之后的服务中,应该以用户的专业、兴趣、检索记录、个人背景等作为判断依据,为每个用户提供个性化的推荐服务[17]。此外,用户的兴趣和爱好是不断更新和变化的,这就需要建立长期追踪的差异化的用户服务策略。服务策略应以用户为导向,逐步提供个性化服务,使用户习惯于定制化产品;同时践行以用户需求为基准,以市场为导向的产品开发模式,依据用户和市场的需求及时调整服务和数据库产品,以适应用户新的需求变化,形成更强的品牌价值。

6 总结和展望

会议文献作为灰色文献的一种,在对政策制度、加工模式、版权保护等各方面的评估考量后,上海图书馆对这一文献类型的利用已经从之前的单一入藏状态转为向个人用户提供服务,这是对网络环境下会议文献知识组织和知识服务的优化与进步。未来应该从采集、加工、服务3个方面提升馆藏会议文献的价值,如王世伟先生所言,充分提升灰色文献的“历史价值、智库价值、学术价值、经济价值”[1]10。

猜你喜欢

上海图书馆学术会议加工
认识“超加工食品”
后期加工
第九届全国科学社会学学术会议通知(第一轮)
图书馆中文图书借阅排行榜(2019年12月)
第八届全全科学社会学学术会议通知
第十七届CCF 全国嵌入式系统学术会议(ESTC2019) 通知
复杂三维微细加工技术创新与研究
数字阅读推广新形式研究
中美公共图书馆社交媒体营销比较研究
创新创业环境下公共图书馆企业信息服务的转型