APP下载

大连医科大学SCI论文榜数据库的建设

2015-03-22

中华医学图书情报杂志 2015年11期
关键词:标引网页论文

, ,

自SCI论文量和影响因子成为我国高校有关项目评价的主要指标后[1],各机构相应的绩效标准和奖励政策也相继出台。高校SCI论文产出量显著增多,而且学校行政部门、管理人员和师生都对本机构的SCI论文收录和被引情况,以及期刊影响因子给予了更多的重视。高校领导希望掌握全校SCI论文产出数据,尤其是反映知识产权所有者的本校通讯作者或第一作者的论文数据,发文的期刊影响因子大小和国内同行学校相关情况;科研管理部门希望能随时直接获取详细的各部门员工SCI论文数据,以便于成果管理和统计上报;师生希望能够公示和展现发表的SCI论文。在此形势下,很多高校图书馆纷纷利用资源优势和技术能力,在网站上建立了SCI论文通报栏目。

1 国内高校网站SCI论文榜现状

通过浏览国内高校图书馆网站的SCI机构论文榜,从数据的加工程度来看,大致有3种发布方式。

一是基本无数据加工的RSS网页推送[2-4]。此方法多为订购SCI数据库平台的图书馆采用,馆员编制好检索策略,通过RSS定期抓取本机构新增的SCI论文数据,以题录形式显示在通报的网页上。用户点击题录中的论文题名进入SCI数据库官网平台可浏览论文的详细信息。但这种网页推送方式只显示SCI数据库每次更新时新增的数据,用户不能浏览本机构原有的全部SCI论文记录,而且因访问限制,用户不能随意进入SCI官网平台浏览详细信息。

二是对数据进行少量加工的静态网页展示[5-6],适合未订购SCI数据库平台的图书馆所用。馆员定期将检索结果加工处理成pdf、excel或doc格式文件,制成静态网页上传到网站。用户需要分别点击下载文件(通常是某个时间段的记录)才能浏览。但文件数量会不断增加,不便于用户浏览所有数据,而且这种静态方式提供的论文信息也有限。

三是对数据进行较多加工的特色数据库发布[7-8]。馆员定期检索获得论文数据,标引出作者的中文姓名及所属的二级单位名称,期刊影响因子等,使用网站和数据库技术(如ASP.net或清华同方TPI)在网站上发布,具有一定的组合检索和分组浏览功能。此方式适合拥有自建网站平台系统的图书馆。

目前在国内高校图书馆网站上,鲜见有与SCI论文榜相关的ESI(基本科学指标)高被引论文榜和机构排名等相关数据的栏目或网页。

2 大连医科大学SCI论文榜的内容

大连医科大学图书馆(以下简称“我馆”)论文榜[9]利用拓尔思公司的TRS数据库建库平台和WAS网站动态发布系统制作,提供的内容和链接较为丰富。以重要作者(通讯作者和第一作者)SCI论文榜为中心,建设各年影响因子、ESI、CPCI(会议录引文索引)、SCI期刊资料等相关数据库,形成了目前的四大功能模块:重要作者SCI论文榜、其他相关资源链接、浏览检索和咨询服务(图1中,#可进入详细信息网页,*可链接相关资源网页)。其中重要作者SCI论文榜是主要模块,论文题名可以链接到论文详细信息;检索模块和咨询模块增强了论文榜的服务性,既方便了用户查找数据和咨询论文情况,也有助于图书馆通过与用户的互动提高数据库建设质量。

图1 SCI论文榜数据库主页面四大功能模块

2.1 数据标引

对数据进行二次加工是论文榜建设的主要工作之一,通过足够的字段设计和细致的数据标引能够保证论文榜的浏览和检索效果。除了SCI官网数据库可套录下来的10多个字段外,我们还专门建立了一些专用于二次标引工作或详细揭示信息的字段,总共用20多个字段构成论文榜数据库结构的主框架。标引的字段主要有本机构的通讯作者和第一作者的姓名、下属二级机构、影响因子、电子全文,并通过人工阅读原文以筛选和标引出SCI官网未标引的并列通讯作者和第一作者。在标引数据时,还要注意甄别SCI平台中标引的错误数据。

此外,为了保证数据的及时入库,我们还需紧跟官网每周一次的更新频率,及时获取数据进行加工标引,并导入自建数据库。通过字段控制将重要作者的SCI论文发布在主榜上,同时也将未标引出重要作者的SCI论文与重要作者论文一并发布在“全部作者SCI论文榜”,方便用户浏览、查询。

2.2 ESI数据

ESI数据主要包括高被引论文(被引频次排名于该学科前1%的SCI论文)数量和机构排名(被引频次排名于该学科机构数量前1%)。这两项指标是SCI评价体系的重要组成部分,也是校领导和科研管理部门较为关心的内容。这些数据在官网上是动态变化的,每两个月更新1次,无历史记录可查。因此,我们定期检索ESI数据,建立了本机构历年高被引论文榜[10]。

机构排名适用于同期内各机构间横向比较,但因其是绝对指标,而ESI每期上榜机构数量变化较大,故不适合机构内不同时期的纵向比较。为此我们将各期的机构排名通过百分化折算为相对排名(我校被引排名/上榜机构数×100),制成时间曲线,直观地显示本校一段时期内的排名变化。这是我馆SCI论文数据服务的特色之一。

2.3 影响因子

期刊影响因子一直是高校SCI论文评价的重要指标,也是用户十分看重的内容之一。我们搜集了JCR(SCI期刊引用报告)中该期刊近10年的影响因子数据并建立数据库,通过网页嵌入脚本技术,在本馆论文榜中提供了影响因子的信息,不仅在重要作者SCI论文榜的“影响因子”字段一列中直接显示了刊发论文的期刊最新影响因子,而且在论文榜的二级网页中详细陈列了刊发期刊的历年影响因子。另外还在其他相关资源模块中,做了通往JCR影响因子查询平台的链接,用户可在此查看所有SCI期刊的影响因子。

对于新近改名的期刊,JCR里无其影响因子。但查到更名前期刊的影响因子,我们在数据标引时,用1个字段做备注,说明更名前刊名和影响因子,也显示在论文榜的主页面和详细信息页面中,从而为用户提供了全面的期刊影响因子信息。

2.4 其他方面

充分利用网页的超链功能,提供有关SCI数据的其他资料链接,如本校作者参与发表的全部SCI论文库、CPCI论文库、SCI期刊最新资料目录库等,满足用户使用数据时的各种信息查询需要。

2.4.1 电子全文

作为一种简单的机构库,论文榜也应担负文献收藏功能。我们除了在订购的全文期刊数据库和网上免费资源一一进行下载,还通过文献传递、论文作者传送或同行帮助,多方搜集了我校重要作者的SCI论文电子全文,上传到数据库中,用户可在校园网内下载浏览。重要作者的论文全文上传率最高时曾达到95%以上。

2.4.2 链接直达

针对用户的需要,我们还在论文榜尽可能增加有关信息点至官网页面的直接链接,免去了用户上官网层层查询的中间环节。在校园网内或其他许可使用SCI官网平台的环境下,用户通过点击论文榜中的“文献出处”或“期刊分区”,可直接跳至JCR官网平台查看该刊的详细信息;在二级网页点击“题名”,可直接跳至SCI官网里该论文的详细信息。

3 小结及建议

高校图书馆建立本机构的SCI论文榜,不仅是定期陈列被SCI收录的论文最新目录,还兼有机构库收藏本机构研究成果文献的部分功能。通过多角度为学校领导决策部门、科研管理部门、师生作者等不同用户提供服务,既有利于提升图书馆的学科服务形象,也对图书馆业务能力提出了更高的要求,促进馆员努力提高数据处理和学科服务水平。机构论文榜作为拥有机构库部分功能的特色库,应利用数据库建设平台来建设,通过字段关联构建和网页模板代码设计,可更好地发挥服务效果。对订购有官方SCI数据库的馆,使用RSS定期自动通报本机构被收录的SCI论文新记录是最省力的方式,但服务效果有限。在我校订购了SCI官方数据库后,并未采用RRS通报,仍保持了之前的建设方式,对检索套录的数据进行二次加工,并在发布的论文榜网页上增加了有关数据至SCI官网的链接,方便用户快捷进入官网平台浏览原始数据。

利用建库平台系统制作论文榜,需要考虑和注意以下几个问题。

3.1 重视数据质量

自建数据库并不是简单地将数据集从一个或多个外来库检索后转录到自建库,它涉及数据库的目标、规划、收集、加工、分析、发布、归档、保存和维护管理等一系列工作。数据服务只有客观、详细、全面、方便、及时、持久,才能切实满足用户的长期需要。数据要力求做到收集无遗漏,作者中文姓名要标引正确,以确保论文榜的权威性。机构论文的标引,需要标引者对机构作者名字、机构发展变迁历史有较为清晰的了解掌握。另外,由于SCI官网没有标引论文中并列的通讯作者或第一作者,馆员需阅读原文后才能甄别完成标引。我们应与作者主动联系,认真核查,提高论文榜的数据标引质量。

3.2 考虑持续维护能力

数据库建设将会耗费图书馆的大量人力和精力。信息资源在迅速增加,图书馆服务项目越来越多,而馆员数量不但没有较大的增加,甚至有所减少。在这种情况下,建设数据库并不断完善,扩大相关资源的链接量,进一步提高信息的揭示度,都会给图书馆带来越来越多的维护压力。

数据库建成和发布后,不仅记录数随着论文数量的增加而不断增加,而且库结构的字段数和信息的网页链接点也因资源变化调整而增加,意味着维护的工作量有增无减。故在选择建库方式时,应考虑持续维护的能力。

3.3 认真、耐心,有钻研精神

机构SCI论文的数据一年比一年多,二级机构时有分合或增减变化,而且新员工作者名字不断出现。另一方面,SCI论文榜的原始数据来源于官网平台,SCI数据每周更新,ESI数据一年更新6次,周而复始。近万种SCI-E期刊的数据每年虽只更新1-2次,但涉及论文榜里的全部论文期刊的影响因子大小变化。这些都使论文榜数据库工作量大大增加,需要馆员关心学校发展,注意官网各种数据的更新情况,耐心细致进行数据变更和转换处理。另外,用户在使用数据服务的过程中总会产生越来越多的需求,迫使馆员要去刻苦钻研,了解数据对象,进一步挖掘和揭示数据之间的相关联系,做好信息揭示服务工作。

3.4 与机构合作,与用户互动

我国多数图书馆的数据库建设都是自行立项、独自建库[11],缺乏用户参与。客观上来说,论文榜可为学校的成果统计和人才评估、高校学科教育研究等工作提出准确详细的数据,但更需要被用户认可。因而图书馆有必要与机构内的相关部门合作,借助机构的行政管理和科研管理,增强用户对数据库的依赖及参与的积极性。

图书馆不应仅限于标引数据和建数据库发布,在以质取胜、树立权威的基础上,还可以提供数据分析服务,甚至参与他们的相关研究,进一步拓展图书馆的学术服务,也更多地体现数据库建设的价值。论文作者也是论文榜数据库的用户,我们应在网页上开通交流渠道,接受他们的咨询和质疑,认真核查和答复,共同建设论文榜数据库。

4 结语

SCI论文榜是机构成果库的一个组成部分,利用建库平台系统制作能实现更好的服务效果。对于中小型图书馆,在资源、技术和人力水平有限的条件下,可从小处着手,做到务实、坚持、详细、准确、完整,逐步深入,努力完善力所能及的服务,获取用户和机构的欢迎和认可。

猜你喜欢

标引网页论文
中医古籍医案知识元标引方法的思考及对策
基于HTML5与CSS3的网页设计技术研究
档案主题标引与分类标引的比较分析
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登
2013年5—12月最佳论文