通用型电子书选书系统的设计
2014-12-31毕艳芳曹学艳
毕艳芳,曹学艳
0 引言
近几年来,随着数字出版的发展,电子书由于其成本较低、占用空间较少等显著优势在高校图书馆数字馆藏中所占的比重越来越大[1]。在2008 年针对英国所做的关于电子馆藏的调查结果显示,3/4 的学术图书馆和一半的公共图书馆打算在2009 年增加他们的电子书馆藏,并且有一半的图书馆表示将以电子书作为各个学科核心书目的重要支持[2]。根据教育部高校图书馆事实数据库的统计[3],2010- 2012 年三年间,清华大学、北京大学、西安交通大学、上海交通大学和电子科技大学五所高校的电子书数量均有较大的涨幅,尤其是清华大学和电子科技大学,这两所高校图书馆2012 年的电子书数量较2011 年分别增长了254%和31%(如图1 所示)。
图1 2010-2012年五所高校电子书累积量
我国高校图书馆电子书的采购方式一般分为订阅(远程访问)模式和买断(镜像)模式两类。而买断模式由于其访问速度较快、不需要支付年度访问费用、采购灵活等优点,成为很多高校图书馆优先考虑的电子书采购方式。买断模式下的电子书选书流程如图2 所示,最终的书单由本校读者反馈推荐上来的“推荐书单”和采访馆员自行挑选的“自选书单”两部分组成。因此,买断模式电子书建设数量的剧增给图书馆员特别是采访馆员带来了全新的挑战。
图2 买断模式电子书选书流程图
目前,国内外专家学者已经针对选书系统做了一些研究,例如,Binge Cui 和Ankit Khera 基于不同的程序语言和辅助工具分别设计开发了不同的网上选书系统[4-5],邱成晓所研究开发的基于J2EE 技术的网上选书系统主要适用于网上书店等电子商务领域[6],孙卿采用UML 建模语言设计实现的图书荐购系统主要针对的是读者用户群的推荐书单这一部分[7],唐高芳在其研究成果中论述了选书荐购系统的运作模式、界面要求及系统的结构与功能,并没有涉及到选书系统的设计和实现[8]。上述研究成果中所涉及的选书系统,无一例外的均是针对选书流程中的推荐书单这一部分,并不适用于采访馆员所要集中选取的自选书单。而实际上由于采购时间短、院校师生选书时间有限,推荐书单上的书目较少且存在一定的片面性,因此很多时候选书的重任仍然落在采访馆员肩上。为了帮助采访馆员在短时间内集中挑选出适合本馆馆藏的电子书,本文基于Delphi 语言构建了由“数据导入/建库、选书、数据导出”三个模块组成的通用型电子选书系统。通过对Excel 表单格式的大批量源书目数据的读取和分析,系统从设定字段如:“学科分类、出版时间范围”等多字段、多途径对源书目数据进行过滤和筛选,获取满足学科发展需求和馆藏建设的最有价值和代表性的电子书目集合。
1 系统框图
通用型电子书选书系统的系统框图如图3所示。由于EXCEL 电子表格在数据处理过程中容易发生数据丢失或更改,因此选书系统的第一个环节就是数据导入/ 建库,即将XLS 或XLSX 格式的电子表格转换成MDB(Microsoft Database)存储格式的电子表单,以便后面进行的数据操作。在数据导入/建库过程中还可以对书单的字段进行一个选择和重命名。按照选书的习惯,书单的字段可分为三种类型:必备字段、有则必备字段、可选字段(如表1 所示)。这些字段采访馆员均可以在第一个环节中自行选择或更改。
图3 通用型电子书选书系统框图
建库完成后,将进入第二个环节—选书。在对大批量电子书进行挑选的过程中,学科分类和出版时间范围是采访馆员选书的重要依据。学科分类由数据库商提供,中文电子书和外文电子书的学科分类分别参照中国图书馆分类法和美国国会图书馆分类法来划分。出版时间范围以每五年为一个时间界限,分别为:1990 年以前图书、1990- 1994 年图书、1995- 1999 年图书、2000- 2004 年图书、2005- 2009 年图书和2010- 2013 年图书。出版时间范围不需要数据库商提供,系统在运行过程中将自动读取出版时间字段的前四位数字,因此出版时间字段的前四位必须是出版年代,如:2013/7/1,2013- 07- 01 等。
表1 书单字段
通用型电子书选书系统的最后一个环节是数据的导出。此过程是将已经选择的书目导出并保存为EXCEL 表单格式的数据,并返回给数据库商进行买断模式电子书的安装。
2 系统设计
Delphi 是Inprise(原Borland)公司推出的应用程序开发工具,具有功能强大、运行速度快、易于学习和使用以及开发效率高等特点。它是可视化应用编程开发环境、可重用性面向对象编程语言、快速编译器和数据库的完美结合[9]。
基于Delphi 语言的通用型电子书选书系统分为数据导入/建库、选书、数据导出三个部分。数据导入/建库部分的软件流程如图4 所示。特别注意的是在第一部分中,“学科分类”和“出版时间”是两个特殊字段,系统运行时需将这两个字段作统一的名称修改,以便完成第二部分选书环节的数据分类模块的显示。数据导入/建库部分的核心程序源代码如下:
图4数据导入/建库软件流程图
图5 选书和数据导出软件流程图
选书和数据导出两个部分的软件流程图如图5 所示。选书和数据导出两个部分的核心程序源代码如下:
3 系统测试
为了检测通用型电子书选书系统的性能,将测试表单数据(共计2 万条)导入该选书系统中。数据成功导入后,用户界面如图6 所示。按照表1 中所提到的必备字段、有则必备字段、可选字段结合选书习惯来对源书目的选书字段进行筛选。点击“保存”按钮后,系统会将EXCEL 表单文件自动转换成MDB 格式的电子表单。第一阶段的数据导入/建库结束后,进入第二个阶段—选书阶段。选书阶段的用户界面如图7 所示。界面左上侧分别提示各个学科电子书数量和已选的电子书册数。通过左侧部分的勾选框就可以进行电子书的选书。选书完成后直接点击“保存”按钮就可以将所选的书单保存成EXCEL 表单格式。通过测试,整个选书系统功能正常,操作灵活高效,选择的书目较为准确,完全符合最初的设计思路。
图6 测试数据导入用户界面
图7 选书用户界面
除了上述功能之外,基于Delphi 的通用型电子书选书系统还特别设计了“选书情况记录”窗口(如图8 所示),用户可以在这个窗口中查看上次选书的时间、已选图书的数量,同时还可以选择“新建选书任务”还是“继续选书任务”。这一独特设计使得整个电子书选书系统更加人性化。
图8 选书情况记录窗口
4 结语
当前电子书产业正蓬勃兴起,继数据库和电子杂志的发展和应用之后,近年来电子书正日益成为出版商、图书馆、作者等的关注焦点。本文从前期的系统框图设计到中期的软件流程图绘制再到后期的程序源代码编写、系统功能测试,完整地完成了一项基于Delphi 语言的通用型电子书选书系统的开发工作。该系统不受语种和提供商等书目信息的限制,处理源数据量大、操作灵活,避免人工处理过程中的“挑选- 复制- 粘贴”等重复性琐碎劳动和工作误差,具有科学、准确、高效的特点。利用该系统,采访馆员可以轻松高效地完成大批量、多语种以及各种类型的电子书选书工作,从而为图书馆电子资源的科学采购、筛选提供可靠性较高的技术辅助工具,具有良好的应用和推广价值。
[1] 胡振华.电子书产业发展下的高校图书馆馆藏建设研究[J].图书馆建设,2011(3):36- 39.
[2] 张晓林.现代图书情报技术快讯[J].现代图书情报技术,2009(1):104.
[3] 教育部高等学校图书情报工作指导委员会,中国高等教育文献保障系统.教育部高校图书馆事实数据库系统[DB/OL]. [2013- 07- 09]. http://www.tgw.cn:18080/.
[4] Cui,Binge,Chen,Xin. An online book recommendation system based on web service[C]//Proceedings of 6th International Conference on Fuzzy Systems and Knowledge Discovery, FSKD 2009. Tianjin:IEEE,2009:520- 524.
[5] Ankit Khera. Online Recommendation System[EB/OL].[2013- 09- 23]. http://scholarworks.sjsu.edu/etd_projects/97/.
[6] 邱城晓. 基于J2EE 的网上选书系统的实现[D]. 上海:华东师范大学,2005.
[7] 孙卿.山东省图书馆图书荐购系统的设计与实现[D].济南:山东大学,2010.
[8] 唐高芳.网上荐购系统在高校图书馆的应用分析[J].图书馆学研究,2008(1):19- 21.
[9] 高英,石文华. Delphi 数据库开发基础与应用[M].北京:人民邮电出版社,2006.