大数据时代高校图书馆开展学科服务研究——学科馆员工作案例解析
2015-01-06陈珊珊王婷
林 静 伊 雷 陈珊珊王婷
(1.厦门大学图书馆,福建厦门361005;2.北京化工大学信息质量研究所,北京100029;3.厦门大学物理系,福建厦门361005;4.北京化工大学图书馆,北京100029)
大数据时代高校图书馆开展学科服务研究——学科馆员工作案例解析
林静1伊雷2*陈珊珊3王婷4
(1.厦门大学图书馆,福建厦门361005;2.北京化工大学信息质量研究所,北京100029;3.厦门大学物理系,福建厦门361005;4.北京化工大学图书馆,北京100029)
〔摘要〕学科服务是高校图书馆的重要工作内容之一。随着大数据时代来临,通过对海量文献数据的挖掘来开展大数据知识服务将成为高校图书馆服务转型新方向。同时,作为一种全新的服务方式,在实践中学科馆员深入科研团队一线,直接参与科研项目也将成为一种新常态。因此,文章将以学科馆员为某校石墨烯科研团队提供知识服务为例,探讨高校图书馆开展学科服务的具体方法。
〔关键词〕高校图书馆;大数据;知识服务;学科服务;学科馆员;工作案例
1 开展学科服务是高校图书馆的重要工作内容
高校图书馆与公共图书馆不同的一个重要地方在于,其服务对象比较单一,主要是服务高校广大师生,而就其服务内容而言,则主要服务高校的教学、科研发展。高校图书馆开展学科服务,其目的在于细化服务内容,提升服务质量,满足学校的学科发展需要。具体而言就是要通过建立学科馆员制度,让学科馆员直接深入科研团队一线,参与科研项目,将图书馆的文献检索服务与学校的学科发展、科学研究等进行无缝对接。这就要求学科馆员自身在知识结构和专业能力上与其所服务的科研团队相匹配,同时具备检索全球相关学术信息的素养,以及熟知全世界各类专业数据库,进而能够全程参与科研项目,全面为学校的科研发展服务,直接为学校的学科建设贡献力量。
2 大数据时代高校图书馆知识服务模式创新
高校图书馆历来对信息技术的应用非常重视,几乎每一项新技术的出现,都能推动其服务升级。大数据时代,高校图书馆的数据处理方式、目的等都将发生巨变。在数字时代,高校图书馆的数据处理主要是将文献资料数字化、网络化,其目的是实现师生对学术数据的充分利用;进入大数据时代,对海量文献数据的分析将成为高校图书馆发展的新趋势,其服务重心也会逐渐由传统业务向数据挖掘转移。作为一种全新的服务方式,大数据知识服务是在海量数据的获取、存储、分析等过程产生的以数字化、网络化、智能化为基础的服务模式。在大数据时代对海量数据的处理能力意味着获取知识方式的改变。Jim Gray因此提出科学研究的第四范式——以协同化、网络化与数据驱动为其主要特征的数据密集型科学研究[1]。作为未来服务的新模式,大数据知识服务将成为高校图书馆转型发展的新方向之一。因此,新时期的学科服务,也主要指大数据知识服务。
文章提出新的学科服务模式,通过大数据分析告知新进教师(研究团队)或者力图转变研究方向的教师或研究团队一个值得研究的学科新趋势。从时间上来说,这个新趋势具有一定突增性且持续性。具体模式如图1:
(1)由教师或者实验组提交具体的研究主题及主题词,学科馆员根据此主题进行相应检索得到一定搜索结果。
(2)针对此主题研究成果进行文献共引分析与聚类分析,了解整个主题的研究范围。
(3)通过引文索引分析方法确定主题的新趋势。
图1 新学科服务模式
3 学科馆员在实践中如何开展大数据知识服务的案例分析
学科馆员的特长在于专业知识与检索技能的结合。如果没有专业知识背景,学科馆员就根本做不了学科服务。因此,在实践中我们要求学科馆员必须具有博士学位,必须是某一学科领域内的专业人士。同时,学科馆员与其他一般科研人员不同的地方在于其文献检索能力更强,其对专业数据库更为熟知,对数据分析软件使用更为熟练。因此,学科馆员在提供知识服务时,其工作侧重点在文献检索与分析上。
下文我们将着重以某学科馆员服务的国内某石墨烯研究团队为例,具体说明学科馆员如何开展大数据知识服务。在与某石墨烯团队进行接触过程中,他们要求学学科馆员通过文献检索分析一下近年来国内石墨烯研究发展趋势。为此,学科馆员利用SCI-EXPANDED数据库,使用CitespaceⅢ软件,通过引文共现与聚类分析绘制了近十年我国石墨烯研究前沿知识图谱,并利用引文网络和突变探测识别方式在图谱中分析国内石墨烯近年研发趋势。
3.1检索数据与分析工具选择是学科馆员开展学科服务的前提
检索数据与选择分析工具是学科馆员开展学科服务的第一步。如果数据检索不全,将直接影响后边的数据分析。如何工具选不好,也不能进行科学有效的数据分析。因此,开展学科服务,首先得保证数据来源的全面与准确和分析工具的科学有效,否则根本不可能很好地完成这项工作。
(1)根据某校石墨烯研究团队的要求,学科馆员以“graphene”(石墨烯)作为主题词,“China”作为机构地址,设置时间跨度为2004-2013年,在Web of Science数据库的SCI-EXPANDED进行相应数据检索,得到11 414条数据记录。
(2)我们利用CitespaceⅢ对搜索到的数据进行文献共引分析与聚类分析,绘制了10年来我国石墨烯研究的发展状况知识图谱(如图2所示)。
CitespaceⅢ参数设置如下:(1)设置“Time Scaling”的值为1,将2004-2013年分成10个时段。(2)控制节点的取舍方面,选择Top N方式,每个time slice中提取排名前10%被引次数最高的文献;(3)CiteSpace中的链接剔除功能(pruning)选择Pathfinder和pruning sliced networks,按照最小树生成算法裁剪生成的网络。文献共引分析后经过中心度计算及聚类分析得到27个聚类,网络模块性(modularity)为0.7898,轮廓值(silhouette)为0.6962。
一个聚类的质量由它的轮廓值反映,这也是它的同质性或一致性的指标。27个聚类中总共有19个聚类是轮廓值大于0.7,说明这些聚类高度同质化,因此图2只显示19个聚类。其中,大于10篇被引文献组成的聚类有14个,说明了国内石墨烯的研究前沿分布广泛。这些聚类主要涉及石墨烯的制备、特性、表征技术及其在材料、电子、化学、能源与生物医药等方面的应用研究等等。特别是聚类#0和聚类#1,被引频次排名前10名的文献均在这两个聚类中,但这些文献均是外国研究者发文,说明国内石墨烯的研究基础很大贡献来自于外国。
图谱中的聚类展现了过去10年来国内石墨烯研究领域及研究进展。下文将在这规模与质量均有一定水平的14个聚类中抓取相关聚类识别并分析2010年以来国内石墨烯研究新趋势。
3.2数据分析是学科馆员开展学科服务的核心
图2 2004-2013年国内石墨烯共被引聚类可视化图谱
如果针对海量文献数据不能进行科学有效分析,那学科馆员的服务将毫无意义。因此,在进行文献数据分析时,如何才能做到科学有效是学科馆员全部工作的关键。在进行大数据文献分析时,国内外常用的方法为“突现术语与引文共现分析”和“关键词与引文共现分析”[2-3]。因此,我们也采用此方法通过引文索引方式关注新形成的聚类以确定近年国内石墨烯研究的新趋势[4]。另外,聚类中的研究领域往往代表了新的知识基础,同时这些知识基础的施引文献更是研究前沿[5]。我们根据引文索引出更多的数据集,通过被引频次和被引突增值抓取相关被引文献与施引文献以确定最新趋势[6]。
(1)从图谱的聚类中选出适合代表最新趋势的聚类是个关键。一个聚类的平均出版年表明了它的新老程度,所以根据平均出版年确定聚类新旧[4]。从可视化图谱(图2)中得到平均出版年是2010以上的聚类只有#12,且具有一定规模,聚类共拥有10篇被引文献。因此,我们将通过聚类#12相关文献以确定新趋势。
图3 图谱中14个聚类的平均出版年分布
(2)聚类#12中聚类标识主要为“Oxygen Reduction Reaction”(氧化还原法)、“Co-doped Grapheme”(钴掺杂石墨烯)、“Efficient Oxygen Reduction”(有效氧化还原法)、“Nitrogen-doped Carbon”、“N-doped Carbon”(氮掺杂碳)、“Metal-free Electrocatalyst”(金属电催化剂),聚类#12的研究内容均与以上标识内容相关。
表1 聚类#12中重要被引文献
表1 (续)
表2 聚类#12具有被引突增性文献
如表1所示,聚类#12中被引文献排名前10名的文献有4篇文献是具有被引突增值,这4篇文献中3篇文献是关于石墨烯制备过程中自组装的研究,可见其是一个急切需要解决的难题。
如表2所示,这4篇文章均发文于2010年,Kim F 2010年讨论氧化石墨烯表面活性与二维组装,其被引用持续时间为2012-2013年,其他被引突增性文献被引用时间均维持在2011年。由此可以看出,氧化石墨烯的二维组装是国内研究者近年来开始关注的重点问题。
如表3所示,聚类的2012-2013年高引频次数的10篇施引文献可看出至2012年与2013年,石墨烯基复合材料在生物医学,光电,能源和传感等领域内已拥有广泛的应用前景,特别是出现了越来越复杂且与其他新技术结合的复合材料:如杂化石墨烯三维化(Dong,XC et al.,2012;Wu,ZS et al.,2012)和碳海绵改性(Wu,ZS et al.,2012)等等,研究机构分布在中国科学院金属研究所沈阳材料科学国家(联合)实验室,清华大学,上海交通大学,华东理工大学,南京邮电大学,北京理工大学,南开大学和中国科学院物理院。同时,发现有3篇文献既是聚类#12的2012-2013年的高被引施引文献,也是聚类中的被引文献。这3篇文献有力代表了聚类的研究趋势。
表3 2012-2013年聚类#12中按被引频次排名前10篇施引文献
从被引文献来看,聚类中被引频次高的文献和被引突增值高的文献均围绕着石墨烯基材料掺杂展开研究,不同的掺杂均有相应的制备方式及应用,包括了重点关注的热点:氮掺杂、金属氧化物掺杂与碳质材料掺杂等等;而从施引文献看出,随着石墨烯基复合材料的应用的扩大,其制备方式也越来越有针对性和越来越复杂,特别是氧化石墨烯基的纳米复合材料的二维组装技术对于实现大规模制备是个重要研究内容。
综上所述,从聚类#12中重要被引文献与近年的施引文献来看,通过改性增强其物化性能的石墨烯基复合材料制备是一个新趋势。
将此趋势及确定趋势的依据提供给某石墨烯研究团队,他们对国内同样研究石墨烯团队及研究团队的研究方向表示认同,同时对最近几年具有突变性且持续性的新趋势有了新的认识。总体上来说,他们对此次的服务是满意的,并且期望再次合作,以助于继续的科研工作。
4 结论
在大数据时代,高校图书馆学科馆员如何深入开展学科服务仍是一个值得继续探讨的课题。实践上中的难点是,所谓学科馆员提供的知识服务能否让人们满意,进而也可以这样说,这项服务是否具备很强的不可替代性。近年来,高校图书馆界所普遍焦虑的是,如果我们的服务不转型升级,那么我们还有存在的必要吗?可是要想真正做到服务的转型升级,其痛点和难点还是在于我们仍然还没有找到实现这种转型升级的具体路径。通过大数据知识开展学科服务,是我们正在摸索的一个新方向。从本文的研究中可以发现,其中有几个关键点需要注意。第一,文献检索的全面与否与检索策略的制定及是否使用专业数据库正相关。如果没有良好的检索策略和使用专业数据库,那么数据的来源一定是不全面的;第二,数据分析工具非常重要,没有有效的分析工具,学科馆员根本不能开展学科服务;第三,学科馆员的专业知识背景一定要与其所开展的学科服务对象的研究领域相符。如果学科馆员不具备专业知识,那么也是没办法开展学科服务的。因此,这就要求我们在选拔学科馆员时,首先考察的是他的专业背景。总之,利用大数据开展学科服务,对于学科馆员的要求是多方面的。这项工作能否开展的好,与学科馆员的个人素质密不可分。
参考文献
[1]Jim G.On eScience:transformed scientific method[C].Tony H,Stewart T,Kirstin T.The fourth needs paradigm:Data-intensive scientific discovery.Redmond,WA:Microsoft Research,2009:19 -33.
[2]侯剑华.国际能源技术前沿热点领域演进的可视化[J].中国科技论坛,2008,(11):140-144.
[3]吴学雁,艾丹祥,张延林.LED研究热点与前沿的知识图谱分析——基于SCIE中三种代表刊[J].情报杂志,2013,(4):127-133.
[4]陈超美.科学前沿图谱:知识可视化探索[M].北京:科学出版社,2014:247-300.
[5]Chen C.CiteSpaceⅡ:Detecting and Visualizing Emerging Trends and Transient Patterns in Scientific Literature[J].Journalof the American Society for Information Science and Technolo-gy,2006,57(3):359-377.
[6]Garfield E.Scientography:Mapping the tracks of science[J].Current Contents:Socail&Behavioural Sciences,1994,7(45):5-10.
(本文责任编辑:郭沫含)
Research on the Subject Service of the College Library in Age of Big Data——A Case Analysis of Subject Librarian
Lin Jing1Yi Lei2*Chen Shanshan3Wang Tingting4
(1.Library,Xiamen University,Xiamen 361005,China;2.Institute for Information Quality Studies,Beijing University of Chemical Technology,Beijing 100029,China;3.Department of Physics,Xiamen University,Xiamen 361005,China;4.Library,Beijing University of Chemical Technology,Beijing 100029,China)
〔Abstract〕The subject service is one of important job duties in the college library.As age of big data coming,the big data service with analyzing and processing of mass document information,is a new direction of library transition.Meanwhile,as a new service mode,subject librarian participating in the scientific research is becoming a new normal.Thus,based on providing acknowledge service to a graphene scientific research team,the paper discused the particular case of library subject service.
〔Key words〕college library;big data;knowledge service;subject service;subject librarian;case
通讯作者:伊雷(1979-),男,副研究员,研究方向:大数据与图书馆服务转型。
作者简介:林静(1981-),女,副研馆员,博士,研究方向:情报搜索与分析。
基金项目:国家自然科学基金青年科学基金“大面积双层、三层石墨烯薄膜的制备技术研究”(项目编号:51302233);中央高校基本科研业务费专项基金(ZK1001)“科技信息管理系统”(项目编号:20720140548);北京化工大学图书馆馆长基金“高校图书馆大数据知识服务助力学科发展研究”(项目编号:20141203)。
收稿日期:2015-10-07
〔中图分类号〕G252
〔文献标识码〕A
〔文章编号〕1008-0821(2015)12-0065-05
DOI:10.3969/j.issn.1008-0821.2015.12.012