数据库资源使用统计与用户检索行为分析
2018-07-09陈佳宇郭建伟燕娜张素娟
陈佳宇 郭建伟 燕娜 张素娟
摘 要:以北京市科学技术研究院采购的超星知识发现系统为例,依据数据商在线统计平台提供的使用报告,研究电子资源的利用情况。基于用户的检索行为数据、各学科电子资源的使用量,了解用户在检索过程中的习惯和对各学科电子资源的利用情况。为北京市科学技术研究院资源建设提供有针对性的指导意见,同时为信息资源订购工作的有效开展提供建议。
关键词:超星知识发现;数据库资源;用户行为
中图分类号:G717 文献标识码:A 文章编号:1671-0037(2018)2-79-4
Abstract: Taking the superstar knowledge discovery system purchased by Beijing Institute of Science and Technology Information as an example, this paper studied the utilization of electronic resources according to the reports provided by the data vendors online statistical platform. Based on the user's search behavior data, the use of electronic resources of various disciplines, the user's habits in the search process and the use of electronic resources of various disciplines were understood. It provide targeted guidance for the resources construction of Beijing Institute of Science and Technology Information, and provided suggestions for the effective development of information resource ordering.
Key words: superstar knowledge discovery; database resources; user behavior
隨着大数据时代的来临和数据密集型科研环境的形成,科研工作者对文献资源的利用行为以及其对资源内容、种类和获取方式等方面的需求都发生了巨大的变化,这对数据资源的采购数量、类型都提出了新的要求[1]。北京市科学技术研究院(简称“市科研院”)已逐步建立起有效的评估机制,并结合院所数字资源建设的特点及发展趋势,有效解决用户需求逐年增加和变化、资源涨价与有限的资源采购经费之间的矛盾,有针对性地调整订购策略,优化数据库资源。每年订购的这些数据资源实际使用情况如何呢?这就需要对已经采购的各个资源进行一定时间段的跟踪,准确地了解从资源开通使用之后一段时间内市科研院用户的实际使用情况,可以从数据库的登录次数、访问量、检索次数、下载量和点击率等角度进行研究。
本文通过对资源使用情况的统计,整体分析市科研院下属科研工作者对该类电子资源的需求。基于访问量,结合购买经费,粗略地评价市科研院对电子资源的成本效益,为市科研院资源建设提供有针对性的指导意见,同时为信息资源订购工作的有效开展提供建议。此外,各类学术数据库均提供了很多数据库的使用方法,比如初级检索、高级检索和专业检索等[2],如果这些检索方法使用不当,很难达到准确查找资源的效果,进而影响用户对资源的利用率。对用户检索行为的分析有助于我们了解用户的检索习惯,根据用户的检索习惯制订相应的推广策划,进而提高已购电子资源的利用率[3]。
1 超星知识发现系统的使用统计
1.1 检索方式统计
依据数据商提供的使用监测数据,可以大致了解到用户的使用情况,包括每个月份读者访问电子资源的情况。市科研院2016年5月底正式开通使用超星知识发现系统,通过2016年6—12月数据量统计发现,市科研院的电子资源访问量在这段时间呈现抛物线状态,其趋势与历年访问量趋势一致,且符合市科研院自身的科研现状。
从图1我们可以看出,2016年用户访问的高峰期集中在7月份和11月份,这两个月每月访问量都达到33 000多人次以上,这与市科研院下属院所年中科研成果汇报以及年底科研成果汇总及论文审核有一定关系;9月访问量出现小高峰,这是由于9月份是每年科研工作者评职称的月份,科研工作者对电子图书的需求也是很大的,因此访问量也出现了高值;访问量低谷期集中在6月份、12月份,每月访问量均集中在30 000人次左右,其中12月份最低,不到30 000人次,与访问高峰期11月份相差将近5 000人次,这主要由于市科研院各下属院所在12月份进行年底总结,科研人员主要精力集中在成果梳理上,因此,数据库使用量下降。
1.2 成本效益分析
2016年6-12月市科研院第一次集中开通使用超星知识发现系统,在开通的这段时间里,总访问量将近23万人次,月均访问量约33 000人次,从市科研院数据库资源使用统计分析报告(2016)可以看出,在行业、产业和工具相关数据库中超星知识发现系统是市科研院用户浏览、检索、下载最多的。在2016年市科研院购买的39个学术数据库里面,超星知识发现系统月均访问量排第五,仅次于(万方)中国学术期刊数据库、中国知网的学术期刊网络出版总库、中国知网的优秀硕士学位论文全文数据库、中国知网的博士学位论文全文数据库,说明科研人员对超星知识发现系统的认可度还是比较高的,下载量最高的万方中国学术期刊数据库篇均成本费用大约为0.76元。
在数据库使用统计分析的基础上,我们结合数据库的购买价格,将费用按时间平均折算,一次访问量的费用仅仅为0.26元。按照NSTL(国家科技图书文献中心)的收费标准,普通请求0.3元/页,代查请求0.3元/页,服务费2元/篇,超星知识发现系统一次访问量的费用接近国内目前广泛推广的NSTL中文文献0.3元/頁的费用,显然市科研院对该数据库的购置较合理,利用程度较高。
2 超星知识发现系统的用户检索行为分析
超星知识发现系统利用数据仓储、资源整合、知识挖掘、数据分析、文献计量学模型等相关技术[4],实现统一的学术资源搜索,通过分面聚类、引文分析、知识关联分析等实现文献的深度知识挖掘[5]。对用户检索方式和学科使用的统计,可以粗略地了解用户的检索行为。
2.1 检索方式统计
在超星知识发现系统首页检索框中输入查询词,点击“检索”,将在海量的资源中查找相关的各种类型文献,即为普通检索[6]。该类检索方式类似于百度搜索或者在各种商业网站查找需要的物品,用户只要在显示界面的搜索框里面输入查询关键词,点击检索框右边的“检索”按钮,即可完成基本检索,数据库里面该查询词相关的内容均显示在检索框下面。此时,一般检索出来的条数会很多、范围太泛,需要在结果中进行深度检索,在检索结果页浏览所查找关键词的数据。如:多维度分面、高级检索、专业检索、可视化、智能期刊导航、趋势展示[7]。
根据超星知识发现系统中检索的难易程度,本文将检索功能分为普通检索、专业检索和高级检索3种类型,进而了解不同科研工作者使用该类资源的检索习惯。
依据数据商提供的监测数据,将超星知识发现系统中的不同检索方式进行汇总统计,各类型的使用次数如表1所示。
图2显示了3种检索方式的比例分布,由图可知,市科研院用户在使用超星知识发现系统时,3种检索方式都有涉及。普通检索方式因其具有跟日常搜索引擎相似的界面,具有直观、操作简便等优点,相对而言,它的使用比例较大,约为34%。专业检索的使用涉及逻辑符号“与”“或”“非”、文献类型、通用字段、运算符等;高级检索虽然没有专业检索那么复杂,但涉及主题、题名、作者、作者机构、关键词、摘要等字段[8]以及语种、文献类型,也要求用户熟悉掌握逻辑符号“与”“或”“非”。后两种检索方式对数据库检索的专业知识要求较高。本文研究的对象北京市科学技术研究院用户,高级检索和专业检索使用量基本相同,虽然没有普通检索使用量高,但仅比普通检索使用比例低1%左右,这一现象说明,市科研院科研工作者对数据库检索相关使用技巧掌握较好,数据库使用水平较高。
高级检索和专业检索都涉及了文献类型,较普通检索结果可以缩小检索范围。如果对检索的结果不够满意,还可以加入逻辑符号,进行检索策略的调整。这些均能进一步缩小检索范围,提高检索的准确性。市科研院高级检索和专业检索的使用量占整体检索量的66%,虽然过半但是比例仍较低。这反映出用户在检索过程中对于精确检索行为的积极性和检索成熟度不够高。
2.2 学科使用统计
表2显示的是市科研院2016年6—12月超星知识发现系统不同中文学科电子图书访问量、全文链接使用量、文献传递使用量和收藏量。同一月份访问量、全文链接使用量、文献传递使用量和收藏量之间数量基本保持一致,我们重点以访问量作为分析对象。2016年6—12月电子图书总访问量为114 510人次,从表2和图3可以看出,访问量最多的学科为工业技术,为20 282人次;其次是经济,访问量为19 268人次;环境科学、安全科学访问量为13 720人次,文化、科学、教育、体育访问量为10 304人次,自然科学总论访问量为10 120人次;访问量最少的学科是天文学、地球科学和艺术,访问量都不足2 400人次;访问量居中的学科是政治、法律,交通运输,语音、文字,军事,农业科学等,访问量大约保持在3 000~4 000人次。
根据以上统计分析可知,重点学科是工业技术,经济,环境科学、安全科学,文化、科学、教育、体育,自然科学总论,学科使用统计分析的结果基本与市科研院的业务内容和发展情况相符。市科研院是以文科为主的科研机构,科研人员专业以文科为主。近年来,市科研院紧紧围绕首都经济建设和社会发展的需求,加强应用研究、高新技术研究和重大科技攻关,逐步形成侧重应用的多学科、综合性、跨行业的大型科技研发机构。
3 结语
数据资源有别于其他资源,其使用评价过程一直没有一个既定的方法和指标系统[9]。本研究主要以市科研院采购的超星知识发现系统为例,基于数据库后台监测到的数据资源的使用情况,研究市科研院下属单位对超星知识发现系统的利用情况。依据用户的检索行为分析,了解用户在检索过程中的习惯和对各学科电子资源的利用情况,进而了解用户对己购超星知识发现系统的使用情况,为是否继续购买提供依据。综合考虑以上因素,结合市科研院数字资源建设的特点及发展趋势,制定数据库资源订购方案。
参考文献:
[1] 刘艳红.数据密集型科研环境下的高校图书馆发展与思考[J].图书与情报,2014(6):127-129.
[2] 岳丹.高校数据库采购策略与技巧:以福州大学图书馆为例[J].大学图书情报学刊,2015(4):49-52.
[3] 刘佳音.高校图书馆电子资源使用与用户检索行为统计分析:以ScienceDirect数据库为例[J].大学图书馆学报,2012(2):81-86.
[4] 刘哲.2006—2015年我国机构知识库研究现状分析:基于超星发现平台与STADS的统计与分析[J].图书情报导刊,2016(4):114-118.
[5] 李爽,王玉香.2006—2015年阅读推广研究现状分析:基于超星发现平台的统计与分析[J].河南图书馆学刊,2016(4):106-108.
[6] 陈艳艳.科技查新中超星知识发现系统的运用[J].创新科技,2013(12):57-58.
[7] 张学梅.期刊论文语义检索与可视化导航系统研究:以数字参考咨询领域为例[D].南京:南京农业大学,2010.
[8] 谢奇,李立立,毕玉侠,等.五大学术搜索引擎比较[J].情报探索,2015(11):42-46.
[9] 王彦峰.综合考虑资源和环境的过程系统的评价指标和评价方法研究[D].西安:西安交通大学,2001.