开放学术会议文献信息服务模式探索
——以中国科学院重要会议开放资源采集与服务系统为例
2015-02-13王春明姜恩波柴苗岭
●韩 红,朱 江,王春明,姜恩波,柴苗岭
(中国科学院成都文献情报中心,成都610041)
开放学术会议文献信息服务模式探索
——以中国科学院重要会议开放资源采集与服务系统为例
●韩 红,朱 江,王春明,姜恩波,柴苗岭
(中国科学院成都文献情报中心,成都610041)
开放获取;学术会议;服务模式;服务机制;系统集成
介绍了中国科学院在开放学术会议文献信息服务方面的实践与成效,分析了目前存在的问题与不足,并从机制建设、数据关联、系统集成、功能完善等方面提出了进一步推进开放学术会议文献信息服务的措施和建议。
1 以服务系统建设促进开放会议资源合理利用
学术会议文献是科学研究的重要参考文献类型之一,随着网络技术的发展与学术交流模式的改变以及开放获取(Open Access)运动的不断推进,学术会议文献资源也突破原有的商业出版模式,出现了许多以开放获取方式发布和传播的开放会议资源。
1.1 开展开放会议资源利用与服务的意义
开放会议资源主要是一些学术科研机构及学协会在网络上直接发布的其组织召开的学术会议的会议论文全文或摘要供用户免费使用,其目的是加快学术交流、扩展科研成果的传播范围和影响,这些开放会议资源与正式出版会议文献一样,能够及时反映相关学科领域研究的新发现、新进展、新成就、新动向和新观点,并且比正式出版的会议文献时效性更强、更符合当今科研人员获取文献的习惯并具有较高的学术价值,正越来越受到科研人员的关注和学术界的认可,对这类会议资源的需求也日益强烈。
但是,由于这类资源往往只在网络上发表并不再正式出版,具有动态性、分散性等特点,只有访问相关学术机构或学协会的网站才能分别获取,而图书馆由于受传统资源建设理念和模式的惯性影响,也未将此类资源进行系统有效的收集和组织,造成目前的会议文献资源保障体系主要由正式出版的学术会议文献印本和数据库组成,使学术会议文献,特别是非正式出版的开放会议文献成为较难获取的一类资源。[1]
全球每年召开的学术会议产生的会议论文达数十万篇,其中,以开放获取方式发布的学术会议资源也在不断增加,单个开放会议网站的访问量虽然不大,但从整体上就形成了规模优势;加之开放会议资源的生命周期非常有限,如不及时采集保存,很容易造成“灭失”。[1]中国科学院成都文献情报中心牵头研究建设的中国科学院重要会议开放资源采集与服务系统,正是为弥补这一缺失和满足用户对这类文献的需求所作的探索和尝试。
1.2 中国科学院重要会议开放资源采集与服务系统简介
中国科学院重要会议开放资源采集与服务系统(http://or.clas.ac.cn)的建设目标是遴选科学技术领域的重要学术会议,包括USENIX、CEUR Workshop、ESAIM、SIAM、PMC、BMC、iufro、Arxiv、斯坦福大学SLAC、IoP、DOE等国际著名学术机构的开放会议录,系统通过采集、保存、标引这些重要学术会议在互联网上发布的会议论文全文或摘要,为科研人员提供会议及会议文献信息的检索、浏览、原文传递和基于Google Map的可视化展示,科研人员还可以通过系统平台向图书馆员推荐会议及会议文献,通过这样的方式为用户合理利用与免费获取开放会议文献与信息提供了一条便捷有效的途径。目前,系统已发布会议信息2万余条、会议论文全文3.2万余篇。
1.3 系统服务对象需求分析
中国科学院重要会议开放资源采集与服务系统的服务对象有两种类型的用户:一类是自然人用户,包括科研人员和负责资源加工的图书馆员;另一类是机器用户,平台提供基于Web Service的第三方接口和基于RSS的最新信息发布,第三方工具可以通过上述标准协议获取平台的信息资源,在数据协议许可的前提下进行进一步的整合和应用。
自然人用户中的科研人员是系统资源的最终使用者,主要关注会议文献和信息的便捷获取,图书馆员关注如何高效地实现会议资源采集、规范组织与加工、发布并快速提供服务;机器用户则需要系统提供相应的接口和规范的数据,以实现不同类型开放资源服务系统的集成服务。
2 建设现状与成效
2.1 服务机制研究与建设
首先,系统建设机构在本单位的岗位设置中新设了开放资源建设和开放资源系统开发岗位,从人员方面确保系统建设工作的可持续开展。同时,在尊重知识产权的前提下拟定了系统管理和服务方案,其主要原则是系统一般只提供全文的原始URL链接,指引用户链接到原始网站下载全文,只在原始网站全文链接失效的情况下,才提供延时的Email全文传递,并提供中、英文的知识产权保护提示,以此尝试建立系统的长效服务机制,保障系统长期顺利运行。另外,系统建设者还在系统建设的各个环节引入院所协同和用户参与机制,以用户需求驱动系统开发与服务,变被动为主动,使用户不仅成为信息的索取者,更是信息的提供者,也使系统成为一个有着广泛用户基础,能为广大用户所用的系统。同时,满足项目建设各阶段知识需求,将用户可能存在的、能够支撑项目长期发展的创新信息及时吸纳到项目的开发建设中,为项目长期、稳定发展提供良好的基础。[2]
2.2 服务推广与宣传培训
在系统建设过程中将系统的服务推广与宣传培训纳入本单位的学科化服务、区域信息服务等工作中。首先,依托高素质的学科化服务团队,在每年的下基层院所服务活动中,将相关内容列入用户培训和年度宣传推广计划中,组织系统的宣传推广,对中国科学院重要会议开放资源采集与服务系统开展了多种形式的推介宣传活动,使科研人员了解到除了商业会议文献数据库外,还可以通过中国科学院重要会议开放资源采集与服务系统提供开放获取的方式获得丰富的会议信息和文献。部分研究所和学科组还在其主页上对这一系统进行公告和设置系统链接,仅2013年就向中国科学院18个研究所开展了133场宣传培训,参与科研人员达3244人次。其中,中国科学院近代物理研究所等5个研究所近30个课题群组平台希望能够将中国科学院重要会议开放资源采集与服务系统纳入其课题群组平台系统,方便研究团队检索使用会议资源系统。另外,在面向四川省内各地的科研院所以及上海、重庆、广西等地方科学院的区域信息服务中,也将该系统的宣传推广纳入其中,为地方科研用户推荐了一条获取学术会议信息与文献的有效渠道。
2.3 针对自然人用户和机器用户需求特点开展研发与建设
针对两类用户不同的需求特点,系统设计、开发了用户服务平台和资源采集加工平台。前者为科研人员提供资源浏览与检索、原文传递、RSS定制、资源推荐以及基于Google Map的可视化展示等服务;后者利用WebLench、PDFBox等开源工具并结合开放会议与会议文献资源的特点,实现了开放会议文献的采集、标引、审核、发布和用户管理的一整套工作流程。
另外,为了让开放资源能够更加广泛地得以应用,平台还研发了基于RSS和Web Service的第三方接口,为第三方应用系统无缝连接本平台提供了有效途径。目前,中国科学院群组平台已经依据相关接口开发了开放会议服务组件,已在中国科学院近代物理研究所、天津工业生物技术研究所、长春应用化学研究所、长春光学精密机械与物理研究所、南京地理与湖泊研究所等5个研究所的近30个课题组进行了部署和个性化定制。
2.4 服务效果
通过几年的建设和宣传推广,中国科学院重要会议开放资源采集与服务系统已经形成了基本的服务能力,达到了一定的服务效果。从来访者的分布情况看,国内访问者来自北京、上海、天津、重庆、宁夏、台湾、香港等31个省区市;国外访问者来自美国、德国、英国、俄罗斯、乌克兰、希腊等。从网站点击量看,截至2013年7月总点击量为12669213次(其中,用户:7973937次,蜘蛛:4695276次),平均日点击量:20141次。
3 存在的主要问题与不足
3.1 系统建设机制有待完善
(1)工作机制。目前,系统的建设主要是以项目管理的方式开展,资金来源于项目经费支持,没有固定的经费来源,虽然设立了专门的岗位,但并没有实现真正意义上的专职,工作人员还承担着其他一些业务工作,这不利于系统建设的深入和持续。为保证系统持续运行和服务的完善,需进一步探索更加适合的管理机制和工作机制。
(2)宣传推广机制。尽管采取了多种方式开展宣传与推广,但系统平台的普及性仍不够。目前,注册用户仅320位,还没有形成较为稳定的用户基础规模。另外,由于该系统与其他开放资源系统之间缺乏互通性,加上平台检索功能的精准性等内在因素,也影响了系统平台的推广;虽然在系统建设的各个阶段都引入了用户参与机制,但由于缺乏具体的用户鼓励政策,这些用户参与系统建设的积极性仍然不足,系统与用户之间的互动性相对较弱。另外,虽然为第三方系统应用提供了Web Service接口,并针对群组集成知识平台(IIP平台)和SKE平台开发了重要会议开放资源系统组件,但在实际推广过程中基本靠用户组依靠群组平台项目开展进行推介,缺乏更加有力的途径和制度上的保障。
(3)合作建设机制。相对于DOAJ、Highwire等开放期刊平台资源的集中和数量规模,开放会议资源分布较为零散,除CEUR、PoS、USENIX等少数几个相对较大的学术会议资源发布系统外,绝大多数开放会议资源均分散在学术机构网站或专门建立的会议网站上,这无疑给资源的采集和更新带来了困难,需要系统在资源搜集和获取方面与其他学术会议资源服务系统探索建立合作服务机制。
3.2 系统服务存在一些局限
(1)系统采集的开放学术会议论文的格式还比较单一。一方面,系统目前主要采集文本型的会议文献包括PDF和PPT格式的论文。从系统分析处理情况看,现在对于PDF格式的论文自动分析技术已基本成熟,但对于PPT的分析只能分析出题名和作者两个基本字段,有待于进一步完善分析模板,才能将这类会议论文更加准确、全面地揭示;另一方面,对于非文本格式音频视频文件目前还没有进行采集和加工,而这类文件也是学术会议文献的重要组成部分,有利于用户了解会议的详细情况。因此,如何为用户提供这类文献的服务是在今后的系统建设中需要考虑的。
(2)系统资源更新速度不够及时,需进一步跟上网上开放学术会议资源的更新速度,这可能与工作机制、资源获取渠道、系统的自动化程度都有一定关系。
(3)平台目前只提供了基于Web Service的第三方接口。后续将会逐步丰富接口类型,例如OAI-PMH、SRU以及嵌入式(基于JaveScript)的检索接口等。另外,应该提供更为简单、易用的第三方接口学习与部署材料(宣传册、部署视频等),扩大影响力度。
4 进一步推进开放学术会议文献信息服务及服务模式的思考
4.1 完善系统服务功能,促进开放会议系统与其他系统的集成与联合服务
(1)增强系统的自动化处理能力及与其他系统的关联。目前,开放会议平台的资源发现与标引环节主要还是由人工完成。虽然采用了部分措施来加强资源获取与标引的“自动”能力,但效果有限。因此,需要大力强化互联网学术会议资源的“自动”发现与预报能力,提高资源采集环节的工作效率。在标引环节,利用命名实体识别等技术提高会议文献信息抽取与信息识别的准确率。再者,在互联网环境下,各信息群落应该开放关联,真正形成Web of Data。虽然项目组利用D2R开源系统以RDF方式发布了部分会议及会议文献数据,[3]但是,根据关联数据5星标准来评价,尚缺乏最后1星,即与其他资源信息的关联。只有实现了这一关联,才能让用户通过开放会议平台的数据获取更多的相关信息。
(2)增强系统平台的服务功能,为科研用户提供增值服务。科研用户使用开放学术会议资源,除了借此途径获取到需要的会议论文,也希望了解这些会议论文的学术价值和影响力。学术研究成果以开放获取方式发表的好处之一是能够追踪到研究成果的查看次数和下载次数,实现基于文章的统计评价。开放会议系统也可以借鉴PLOS的ALM(Article Level Metrics)[4]文章计量服务、德国的OAS(OpenAccessStatistics)[5]开放获取统计项目的做法,通过对系统检索、浏览、全文下载等情况进行统计分析,并将统计分析服务作为一项增值服务提供给用户,这既有利于完善系统的资源建设,提高资源建设的目的性和权威性,也能让用户更充分地认识到开放会议资源的学术价值,吸引更多的用户关注和使用开放会议资源服务系统。
4.2 加强院所协同机制建设,全面推进开放科技资源文献信息服务
(1)制定切实可行的服务宣传推广计划,多途径推广开放学术会议文献信息服务。为改变本系统目前普及程度不高的情况,需要进一步加强院所协同机制建设,加强顶层设计,依靠群组平台建设项目等院中心提升科研一线服务能力的新增能力建设项目进行宣传推广,加大宣传推广的力度,联合学科馆员团队协同开展宣传推广,在更多的研究所和课题组部署重要会议开放资源系统组件,让更多的科研人员了解系统的资源与服务;积极组织更多的相关研究所图书馆承担不同类型、不同学科开放会议资源从遴选到采集、标引、审核、发布的全过程,落实用户参与机制,增强系统建设的互动性。
(2)加强系统集成,打造开放科技资源的整体服务实力。中国科学院于2009年启动了针对开放资源的建设与服务的知识创新工程重要方向项目,先后开展了综合科技资源集成登记、重要会议开放资源、开放科技课件、开放社会经济信息、开放获取期刊等不同类型开放资源的建设与服务探索实践,取得了初步的成效,但各平台之间关联互通与系统集成还有待加强。目前,各方面正在研究制定开放资源元数据集成工作方案,以期将各类资源与服务共同融入综合科技资源集成登记系统,形成中国科学院开放科技资源整体服务优势,以整体宣传方式在院内外的科研机构中进行推广。同时,应尝试与国家科技图书文献中心(NSTL)、中国高等教育文献保障系统(CALIS)等服务平台开展合作,大力提升开放科技资源信息服务的影响力。
4.3 优化工作机制,确保开放学术会议文献信息服务的可持续开展
(1)妥善处理系统建设中的利益关系,拓展开放会议资源的获取渠道。正如开放获取的发展进程中总是伴随着知识产权各关系主体的利益冲突一样,开放学术会议资源建设过程中也需要妥善处理好作者、作者所属机构、会议举办者、会议文献出版者之间的利益关系,合理并且合法地获取开放学术会议资源,确保资源的持续获取和及时更新。可以借鉴中科院开放期刊项目在内容采集方面的做法,与CEUR、USENIX等国际知名开放学术会议资源发布机构以及一些重要学术会议的举办者和会议文献出版者建立联系,了解其开放获取的政策和服务协议,尝试建立符合双方利益的数据共享与联合服务模式。这既可以保障开放会议系统资源的来源和数据的更新,也可以促使系统建立并形成一套具有自身特色又符合知识产权原则的开放会议文献信息服务政策。
(2)完善系统建设工作机制,切实推进开放学术会议资源的建设和服务。为保证系统的持续运行,还需进一步完善系统建设从项目机制到常规工作机制的转变,适当增加开放资源建设工作岗位,进一步明确岗位职责,制定常规工作计划和经费预算,完善工作考核方法。同时,继续对系统建设中的技术难点和政策机制问题以项目支持的方式予以激励。此外,在常规工作机制的建设中要更新观念,跳出图书馆资源建设中的常规模式,尝试引入“众包”(Crowdsourcing[6])的工作模式,将“众包”理念渗透到开放会议资源建设与服务的各个工作环节,从而形成基于“众包”模式的快速服务机制,通过“众包”业务的开展,寻找对开放会议资源建设与服务更有利、风险更小、成本更低的解决方案,[7]有效弥补资金和人力投入方面的不足,促进开放会议服务系统建设的深入和服务规模的扩大。
[1]朱江,等.会议文献开放资源采集与服务系统的建设[J].情报理论与实践,2010(7):117-119.
[2]陈漪红,朱江.会议开放资源采集与服务系统用户参与机制研究[J].图书情报工作,2011增刊(1):61-62.
[3]柴苗岭,等.开放会议资源的元数据研究[J].图书馆建设,2011(2):52-56.
[4]PLOS:Article-LevelMetricsmeasurethedissemination and reach of published research articles[EB/OL].[2014-03-25].http://article-level-metrics.plos.org/ alm-info/.
[5]The OAS infrastructure[EB/OL].[2014-03-25]. http://www.dini.de/fileadmin/oa-statistik/projektergebnisse/oas-poster-berlin8-noprint.pdf.
[6]Crowdsourcing[EB/OL].[2014-03-25].http://en. wikipedia.org/wiki/Crowdsourcing.
[7]盛芳,等.众包与众包馆员制度:助推图书馆服务转型[J].图书馆情报知识,2012(4):95-102.
G255.76
B
1005-8214(2015)06-0083-04
韩红(1966-),女,中国科学院成都文献情报中心副研究馆员,研究方向:用户管理与服务,开放资源建设与知识产权;朱江(1968-),男,研究馆员;王春明(1973-),女,副研究馆员;姜恩波(1972-),男,研究馆员;柴苗岭(1978-),女,馆员。
2014-09-18[责任编辑]李金瓯
本文系中国科学院文献情报能力建设专项研究项目“开放会议资源服务系统建设”的研究成果之一。