图书馆资源利用统计系统设计与实现
2017-04-09李光助霍星明
李光助 霍星明
摘 要: 以空军第一航空学院图书馆为例,开发了图书馆资源利用统计系统工作平台。实现该平台的基础是完成对各资源库基础数据的采集工作。重点介绍了各资源数据库数据采集的实现过程:首先采用分布式查询方法调动各资源库基础数据,然后对基础数据进行分析采集,最后将采集到的数据汇总到采集数据库中。还简单描述了采集表格的设计和数据统计分析过程,并展现了图书馆资源利用统计系统实现效果。
关键词: 数据采集; 链接数据库; 自动化管理
中图分类号: TP 3 文献标志码: A 文章编号: 1671-2153(2017)05-0098-04
0 引 言
图书馆作为学术教学资源重要存储中心,其价值在于资源被读者充分利用。但很多军事院校图书馆未能实现各资源库互联互通,对图书馆资源利用情况进行统计,没有很好办法,往往通过手工方式进行操作,费时费力,错误率高,无法适应军队装备信息化建设的需求。
对于军校图书馆而言,开发一套图书馆资源利用统计系统对资源利用情况进行统计分析,具有重要意义。它可以为图书馆资源利用统计节省人力物力和时间,避免人为差错,为自动化管理提供方便;有利于图书馆动态掌握各资源数据库资源利用情况及动态掌握圖书利用情况,消除资源利用盲区,促进图书馆量化管理;它还有利于促进图书馆评估建设,检验图书馆学术保障资源服务能力和水平,为军校教学科研保障提供更科学服务。
1 设计表格
图书馆资源利用统计系统是一个集信息显示、数据集成、数据查询、数据汇总等功能为主的工作平台,系统的任务是采集和汇总各资源库基本数据。具体办法是采用计算机技术,根据特定时间和IP条件采用分布式查询方法调动众多异地异构数据库数据,通过数据采集将信息汇总到采集数据库中。由以上数据作为基礎,对相关数据进行汇总,生成图表,以网页形式呈现在前台。
1.1 采集表的设计
我院是一所任职教育军事院校,军队院校图书馆指标明确要求任职教育院校年生均到馆率≥30人次/年,生均网站点击率≥60人次/年,年生均外借图书量≥30件次/年,年生均数字资源浏览、下载量90≥件次/年。
考虑到馆人次、网站点击数、文献借阅量、资源浏览下载量指标,后台建立四张数据采集表分别对应4个指标。
绘制4张周采集表,分别为到馆人次表、网站点击数表、文献借阅量表、资源浏览下载量表。分别为[LibraryCome] 、[WebHit]、[BorrowBook]、[LoadDownHit],每张表以系队为字段,字段相同,便于将调用结果更新到每张表中。以[LibraryCome]表为例如下:
CREATE TABLE [dbo].[LibraryCome](
[ID] [int] IDENTITY(1,1) NOT NULL,
[DateID] [int] NULL,
[dui1] [int] NULL,
[dui2] [int] NULL,
[dui3] [int] NULL,
[dui4] [int] NULL,
[dui5] [int] NULL,
[dui6] [int] NULL,
[dui7] [int] NULL,
[dui8] [int] NULL
) ON [PRIMARY]
其他三张周采集表结构相同,以此类推。这样便于将采集结果根据系统自动判断分别更新到对应采集表中。
月采集统计表与周采集统计表基本相同。分别为[MonthCome]、[MonthWeb]、[MonthBook]、 [MonthDown]。这样便完成了采集表格的设计。
1.2 统计汇总表设计
如何以网页形式体现指标要求。我们分别从两个方面着手,将生均到馆率和网站点击率这两项合并计算为学员到馆人次。将年生均文献借阅量和数字资源浏览、下载量两项合并计算为图书外借量。
其中年生均到馆率指平均每位学员一年中来访图书馆的次数。来访图书馆次数根据图书馆门禁系统刷卡记录统计。年生均网站点击率指平均每位学员一年中点击图书馆网站次数。网站点击率从数据库后台记录的IP访问数据统计。
年生均外借图书量指平均每位学员一年中到图书馆外借图书的次数。图书外借量根据图书馆金盘管理系统(Malis)借书记录统计。数字资源浏览、下载量指平均每位学员一年中分别浏览、下载图书馆数字资源的次数。浏览和下载一次计作一件次。数字资源浏览下载量为数字资源浏览量和数字资源下载量两项之和。
根据以上,设计每周资源利用汇总表格(即周汇总表)。将以上4张周采集表数据按照一定查询条件利用sql语句分别插入或更新到对应的周汇总表格中。
完成汇总表格呈现样式后,根据以上表格生成实时更新网站。月汇总表和周汇总表基本相同。
2 网站开发
根据主要研究目标和功能规划,将系统划分为数据采集系统和统计分析系统两个基本模型。数据采集系统负责网站异地异构数据库访问数据的采集;统计分析系统负责利用采集的数据按条件进行统计,生成直观的图表,体现用户利用资源情况。
2.1 创立链接数据库
对于异地异构资源数据库的基础数据,一般采用分布式查询方法来实现异地调用。当数据源位于远程计算机上时,分布式查询可实现在整个网络内检索数据。它们能够让用户在查询和操作各个场地的数据时不必关心数据存储的场地,像操作自己本机数据一样方便[1]。
采用分布式查询方法来获取异地异构资源数据库数据,需要创建链接服务器。我馆数据库全部采用MSsqlserver数据库,这为采用链接分布式数据库提供便利条件。MSsqlserver数据库支持分布式查询,支持用户访问存储在多个SQL Server实例中的分布式数据和存储,支持用户访问各种可使用OLEDB提供程序访问的关系和非关系数据源中的异类数据[2]。创建链接服务器后,可对服务器运行分布式查询。
首先在一台本地服务器上通过mssqlserver为它们创建链接服務器:
EXEC sp_addlinkedserver 'Waiwen,'','SQLOLEDB','192.168.11.39
创建链接服务器登录名映射,这里以SQL认证的方式登录:
EXEC sp_addlinkedsrvlogin 'Waiwen','false',NULL,'sa','yhytsljhg,.123'
其他服务器以此类推创建链接服务器,并以sql认证的方式登录认证,完成链接服务器的创建和设置。
创建链接服务器后,通过分布式查询可以调用各个数据库后台数据,为下一步进行数据采集提供了技术支撑。
2.2 进行数据采集
图书馆有多个异地异构资源数据库,要通过技术手段调用它们后台ip访问记录数据并汇总到到馆人次表、网站点击数表、文献借阅量表、资源浏览下载量表中。方法是根据各资源数据库记录ip访问数据的表格字段编写sql语句,直接调用数据库访问数据。将查询结果直接插入到与之对应表格中。
需要说明的是,部分表(如资源浏览下载量表)需要从图书馆多个异构异地资源数据库中调用ip访问记录数据,汇总后插入相应采集表中。
调用各个数据库代码如图1所示,其代码如下:
switch (i)
{
case DBHelp.Shujuku.Menhu:
sql = "select count(*) from TLink.Mydb.dbo.Y_Counter where IP in (select IP from IPAddress where duiBie=@duibie) and (DateDiff(week,LoginTime,getdate())=0)";
dt = DBHelp.DataTable(sql, parm);
break;
case DBHelp.Shujuku.Waiwen:
sql = "select count(*) from Tnyk.Mydb.dbo.Y_WaiWen where IP in (select IP from IPAddress where duiBie=@duibie) and (DateDiff(week,LoginTime,getdate())=0)";
dt = DBHelp.DataTable(sql, parm);
break;
default:
sql = "select count(*) from TonyLink.Mydb.dbo.Y_Countera where IP in (select IP from IPAddress where duiBie=@duibie) and (DateDiff(week,LoginTime,getdate())=0)";
dt = DBHelp.DataTable(sql, parm);
break;
}
获取各异构数据库数据后,可以采用以队别为单位循环方式将各调取数据按照一定条件(如时间、学员队等)通过编写汇总程序以次插入相应采集表中,完成数据提取录入工作。以资源浏览下载量表采集为例,结果如图2所示。
2.3 进行统计分析
统计分析系统的任务是处理大量采集的数据。系统会将数据库中采集到的数据进行统计分析,并以图表的形式直观展现出来。
由于单位领导要求每周进行一次周汇总,统计上周数据。每月进行一次月汇总,统计上月数据。在编写程序时为了避免频繁执行程序耗费资源,采用每周第一天执行更新程序,更新上周和上月统计结果。也可采用定时器,在每周结束后自动更新统计结果。用Timer类的Interval属性,在Timer的Elapsed的事件中写执行程序,设置每隔一段时间执行Elapsed事件。这里采用定期更新方法。本研究采用系统时间判断方法进行更新,将上周或上月数据插到对应的上周或上月表中(图3)。
图3中,代码自动判断上周或上月,然后根据此判断结果自动将采集表中数据插入到对应的上周或上月汇总表格中,完成初始数据汇总工作,为最终页面呈现提供基本数据支持(具体实现如图3所示)。说明:全院每周、每月统计与学员每周、每月统计基本相同。
3 结束语
图书馆是信息资源收集、管理和传播的最重要的力量,是连接信息生产者与信息用户的主要环节[3]。图书馆资源利用率网站的设计与实现为图书馆资源利用科学评价提供科学依据,实现了图书馆对于资源服务绩效与使用状况的精确评估。为图书馆在数字资源购买与选择,数字资源针对性发展与建设,读者服务调整等方面提供了科学依据[4]。
参考文献:
[1] 张能立,李浩,杨绍明. SQL Server数据库的一种分布式查询解决方法[J]. 武汉理工大学学报(信息与管理工程版),2014(1):52-55.
[2] 王艳. 高校图书书馆促进大学生成长的实证分析[J]. 大学图书馆学报,2013(1):59-63.
[3] 李龙哲. 重新認识图书馆价值充分发挥信息的作用[J].天池学刊,1996(2):51-53.
[4] 史克红. 图书馆数字资源访问监控系统的设计与实现[J]. 图书馆理论与实践,2016(1):93-96.