基于网上书店的一站式图书检索荐购系统研究
2015-08-17陈刚
陈 刚
(健雄职业技术学院图书馆 ,江苏 太仓215411)
基于网上书店的一站式图书检索荐购系统研究
陈刚
(健雄职业技术学院图书馆 ,江苏 太仓215411)
本文针对图书馆现有图书荐购系统的不足 ,分析了目前图书馆荐购中存在的采购和反馈的时效性问题和读者荐购的心理状态,指出只有采购和反馈工作做到快速及时,才能真正体现荐购系统存在的价值。本文结合网上书店的迅猛发展,提出 “以读者需求为中心”建立一站式图书检索荐购系统。本文介绍该系统以网上书店作为荐购知识库 ,从检索到荐购的系统架构和工作流程,以及系统中网上书店的信息采集和使用等关键技术。
网上书店 ;图书检索 ;荐购系统 ;一站式
近年来,网上书店迅猛发展,2013年全国网上书店数量为511家,比去年增长39.2%。销售总额176亿元,比去年增长54.4%,增速大大高于行业平均水平,显示出蓬勃的发展势头[1]。网上书店能够提供详细的书目信息、摘要、封面、目录以及评论等,可以为读者的荐购行为提供很重要的参考依据。以网上书店做为荐购知识库,既节省了图书馆自己构建知识库的时间,又可以使读者可以根据网上书店的库存情况来预测荐购图书的到馆时间,避免盲目等待和反复咨询。图书馆在网上书店采购图书亦早有尝试,以我馆为例,2013-2014年2年内我馆通过亚马逊、当当网等网上书店共采购了4 255册图书,到馆时间2天左右 ,到馆当天立即做好编目、加工工作并送交流通,通知读者来馆借阅。
“一站式”[2]名词起源于20世纪30年代国外的一种商业模式——“one-Stop shop”,即 “一站式购物”或 “一站式服务”,意思是只需在1个站点就能满足顾客的所有需要 ,不需要再去其他的站点。如京东、亚马逊等网上商城的一站式购物体验,新浪网、凤凰网等一站式的信息获取体验。一站式服务的思想在一定程度上与图书馆 “以人为本”的服务理念相一致的,都体现在要把顾客 (读者)的需要放在第一位。目前,国内图书馆使用比较广泛的自动化集成系统中检索和荐购的模块是独立且分开的,通常情况下这些系统的设计者思路是这样的:读者首先进入检索模块检索图书,如果找不到图书再去荐购模块进行荐购,登录并提交荐购图书信息,等待图书馆的工作人员审核、采购等等。但在大多数情况下,读者在检索模块检索不到想要图书的时候会放弃寻找该书,或去查找与该书主题相近的图书。据李明鑫、田丹[3]针对武汉大学、吉林大学两所985高校图书馆的学生用户调查显示 ,70%以上的学生从来没有参与过图书荐购。
1 当前国内图书荐购存在的问题
1.1荐购手段很多,收获效果不明显
图书荐购是图书馆文献资源建设的重要环节 ,荐购服务得到了越来越多图书馆的重视和利用,读者网上荐购已成为高校图书馆的常规服务手段。网上荐购的形式主要有系统荐购、表单荐购、E-mail荐购以及QQ、微博等社交工具荐购,其中以系统荐购为主[4],其他手段为辅。虽然荐购手段越来越多,但是效果却不甚理想,其中有些荐购虽然很有创意,但是缺点也有不少。比如微博荐购[5],虽然具有辐射效应,传播很快,但是对于读者的荐购,采编人员需要手工查重,对于荐购的数量统计也不方便,并且这种优势更适合用在新书推荐方面,而不是荐购。
1.2研究成果很多,考虑不够全面
国内图书馆对荐购系统的研究已有较多的成果,如刘佳佳[6]在收集读者检索信息的基础上与征订库的书目信息进行匹配形成荐购知识库。李明鑫、李柏炀[7]提出由某个云中心而不是个别图书馆独自完成荐购知识库的构建。王平、周虹等[8]基于INN-OPAC系统进行的改造,实现了书目信息自动查重、自动反馈处理结果、自动进入采编流程以及荐购者拥有优先预约借阅权,考虑的算是比较全面,但忽略了荐购知识库的作用和重要性。王泽贤[9]提出整合型荐购系统的解决方案,通过与OPAC和当当网、豆瓣网等外部系统的整合,获取更详细的图书信息,并实现了计算机自动提取录入书目信息。以上研究有的从构建荐购知识库角度出发,开发的荐购系统独立于图书馆的集成化系统之外,对于读者荐购后的图书馆所需要进行的决策、查重、采购、反馈等方面缺乏考虑,有的虽然实现了荐购系统的部分整合,但对分析荐购书目、时间成本、读者心理顾虑等导致图书荐购瓶颈的因素[10]欠缺考虑,因此即使荐购系统开发出来,读者的荐购率依然不高。
1.3荐购参与度较低,后续采购落后
虽然国内图书馆对于图书荐购越来越重视,大多数图书馆都在荐购系统、荐购方式、宣传等方面下了不少功夫,但收获的效果依然不佳。以笔者浏览南京大学图书馆汇文OPAC系统的荐购历史为例 (统计时间2015年1月4日),2014年南大图书馆全年荐购种数为3 680种,剔除一些测试信息、馆藏已有、不符合收藏以及读者胡乱填写的荐购历史 ,有效荐购图书约1 717条。以南大1.5万本科生在校生来计算,人均荐购图书仅0.245种,人均有效荐购0.114 种 ,该人均种数尚未把教职工、硕士、博士以上的在校生以及成人教育学生等统计进来,否则人均数字更低。再看荐购到书率 ,笔者统计荐购状态为 “已典藏”(已采购到馆并送交流通)的图书共840种,到书率等于840/1717,约为48.9%。再与我馆作比较,我馆于2012年开始尝试面向教职工荐购并网上采购图书 ,通过这两年的宣传和落实逐渐取得良好的效果。2014年我馆接受并网上采购教职工荐购图书的种数为1 326种,我院教职工数约为385人,人均荐购3.44种,到书率100%。详细的数据对比见表1:
表1 RR2014年南京大学图书馆和健雄职业技术学院图书馆荐购情况对比
从以上的对比可以看出,图书馆不仅要在荐购上给予足够的重视,更要把荐购以后的采购工作做好,只有做到采购及时、加工及时、反馈及时,才能使图书馆荐购的工作开展的更顺利、更有效率,使读者对图书馆的荐购工作更关心、更热情以及更加的支持图书馆的工作。
2 一站式检索荐购系统理论依据
本文在前人研究的基础上综合考虑各方优缺点,参考近年来美国大学图书馆界兴起的全新资源建设模式——读者决策采购[11](PDA),结合电子商务的快速发展带来网上书店的迅猛崛起,提出采用网上书店资源作为荐购知识库,在文献检索入口的基础上整合荐购系统 ,实现一站式检索荐购。
一站式检索荐购系统 (以下简称 “一站式系统”)既符合当前图书馆 “以读者为中心”的服务理念,也完美诠释了阮冈纳赞的图书馆学五定律[12]。一站式系统的思想即是以 “书是为了用的”为原则,读者通过该系统检索并获取到图书,即 “每一读者均有其书”、“每本书应有其读者”,没有检索到图书则通过检索到的网上书店的图书信息荐购给图书馆,图书馆在审核通过后从网上书店购买图书,只需2~3天即可到馆,编目、加工并通知读者借阅 ,这样就大大的 “节省读者的时间”,读者在很短的时间内获取到图书,就会有更多的动力来图书馆借阅、荐购图书 ,图书馆的文献资源得到了更大程度的利用,读者对图书馆的满意度也越来越高,图书馆和读者的关系就越来越和谐,进而促进图书馆成为 “不断增长的有机体”。
3 系统分析
大多数图书馆的图书检索系统是自动化集成系统的OPAC,比如高校图书馆使用汇文系统较多,公共图书馆使用ILAS系统较多。由于集成系统是封闭式的,图书馆无法自主修改,因此一站式系统的开发是独立于集成系统之外的。而对于一些有实力的图书馆使用自己开发的OPAC则可以在原有基础上做修改,可以大大减轻开发者的工作量。
3.1系统架构和工作流程
一站式系统的检索荐购适用于纸质图书、电子图书、音像资料、期刊数据库等图书馆的大部分资源,为了便于理解和描述,本文以纸质图书为例进行说明。
一站式系统的工作流程主要有检索、荐购、审核、网上采购、编目加工、送交流通、到馆通知等阶段。读者在检索过程中程序后台同时向馆藏服务器和网上书店发起查询 ,并将查询结果返回给读者,读者根据返回结果决定是否需要荐购。读者荐购提供了两种方式:匿名登录荐购和统一身份认证登录荐购。
统一身份认证荐购存在一定的局限性 ,比如对于关心和热爱母校的广大校友,可对其开放推荐系统[13],而目前在国内提供匿名荐购的图书馆屈指可数 。匿名荐购还有两个比较明显的优势。首先,教师无需登录即可推荐学生阅读书,教师对于专业书以及适合学生的课外书的了解明显要优于图书馆的采访人员 ;其次,匿名荐购使得图书馆采访人员能分清主次和重点 ,优先采购实名读者的荐购 ,匿名荐购的图书可以等待积累较多时批量向书商采购或网上采购 。
通过统一身份认证登录的用户的荐购信息将会在荐购记录列表公布,并且荐购记录有未订购、已订购、已到馆、不适合馆藏不予订购等提示信息。采编部馆员每天审核荐购信息 ,符合要求的当天就在亚马逊等网上书店进行采购,并及时更新荐购记录。通常情况下2天左右采购的图书就能到馆 ,编目人员及时分编加工、送流通,最后通过电子邮件、短信、QQ、微信等通知读者到馆借阅。详细的系统架构和工作流程如图1所示:
图1 RR系统架构和工作流程
3.2 检索荐购流程分析
一站式系统的入口类似百度、谷歌搜索的主页,以简洁大方为主,不需要过多的修饰和功能,比如提供题名、主题词、ISBN等多种查询方式,实际上大多数读者检索时采用的只有题名或作者两种方式,其他查询方式很少有人使用。读者在入口输入检索词,系统自动查询馆藏和网上书店,并将结果分两部分返回给读者,如果第一部分馆藏结果没有查到目标图书 ,则读者可以查阅第二部分网上书店的图书信息。网上书店的每条图书信息显示题名、作者、出版社、出版年、评分情况、荐购按钮以及快速荐购按钮 ,通过点击题名可以链接到源网站查看文摘、目录、评论等其他信息。
读者找到了目标图书后,可以通过两种方式进行荐购 ,如果读者需要图书馆提供到书提醒,并且希望能够尽快借阅到图书,则只需要通过统一身份认证平台登录并根据提示完善个人信息后即可荐购;如果读者想为图书馆的馆藏提供建议,或者不急于借阅该图书,可以通过匿名荐购,系统将会把荐购信息通过E-mail发送到采编部的电子邮箱 ,采编部将在一定时间内批量向书商订购或者网上书店采购。当读者通过前一种方式荐购时 ,只需点击荐购按钮即可以荐购成功 ,荐购按钮只有通过身份认证登录后才显示。在读者点击荐购按钮后系统会自动查询后台荐购记录是否有重复记录,如果存在荐购记录则不予荐购,并给出“已存在荐购记录,请亲耐心等待哦。”等提示语,同时在后台数据库中将该条荐购记录的人数加1,每条荐购记录的荐购人数给采编人员对于复本量的把握提供参考。如果读者采用第二种方式 ,则只需点击快速荐购按钮,无需手工登录,系统后台自动进行匿名登录 ,同时将该条荐购信息通过E-mail发送至图书馆采编部的电子邮箱。检索荐购的详细流程如图2所示:
图2 RR检索荐购流程
3.3系统的关键技术分析
3.3.1网上书店图书信息的获取和利用
网上书店的图书信息非常丰富、全面且准确 ,如何获取并利用网上书店的图书信息是实现一站式系统的关键。获取网上书店的图书信息比较简单,本文以PHP技术架构为例来示范如何拉取图书信息。其中要用到的主要工具是PHP的扩展cURL函数库,由于PHP/cURL的使用非常灵活,因此这里使用了一组cURL的封装函数LIB-http,LIB-http简化了cURL的使用 ,使用LIB-http函数里的http-get方法就可以下载网页信息。以采集当当网的图书信息为例 ,读者在一站式入口检索时输入检索词 “红楼梦”,在点击检索按钮后,PHP程序获取到读者输入的检索词后通过cURL模拟查询当当网,将查询结果保存在一个数组中,采集的关键代码如下:
|S target=″http:∥search.dangdang.com/?key=红楼梦″;
|S web-page=http-get(|S target,|S referer=″″);∥传入目标url获取该网页信息
通过http-get方法获取到目标网页信息后保存在数组 |S web-page中,该数组中包含3组数据 ,分别是请求的网页内容、网页传输的状态信息和有关错误的描述。我们只需要网页内容里的图书相关信息,因此 ,接下来最重要的工作就是解析下载的网页内容并显示在读者检索的结果中。通过查看获取到的网页源代码可以发现,相关的图书信息保存在id为component-0--0--6612的ul列表中 ,通过遍历ul列表中的li就可以获取每一条的图书的题名、作者、出版年、摘要等信息,并且点击题名链接可以跳转到当当网浏览该条图书的目录、评论等其他信息。解析的关键代码如下:
∥解析该<lu>保存在字符串 |S string中,参数EXCL表示解析结果将<ul>标签排除
|S string=return-between(|S page[′FILE′],′<ul id=″component-0--0--6612″>′,″</ul>″,EXCL);
∥解析 |S string字符串中<li>标签 ,返回数组 |S content-array |S content-array=parse-array(|S string,″<li>″,″</li>″);
∥循环遍历<li>得到图书信息
for(|S i=0;|S i<count(|S content-array);|S i++){
}
3.3.2优化检索功能 ,完善读者体验[14]
读者在检索时经常会遇到记不清较长的检索词 ,或者输入错别字的情况,在这种情况下即使馆藏有图书,读者也检索不到。搜索提示类似百度、谷歌搜索引擎的功能 ,在读者输入任意一个汉字或字母后,以输入的汉字或字母为关键词自动查询馆藏数据库并在搜索框下方返回相关结果,这样做不仅可以提示用户记起那些容易忘记的较长检索词,还可以节省读者打字输入的时间,提升用户的体验。该功能的原理是为搜索框添加一个键盘事件,每次输入完成键盘抬起时触发该事件,该事件的作用是通过ajax技术异步查询馆藏数据库,并将返回的结果显示在搜索框下方。其关键代码如下,以jQuery技术为例:
if(inputString.length==0){
∥如果搜索框内未有输入则隐藏搜索提示框.
}else{
autoSuggestionsList的搜索提示框中
}
读者在检索图书的时候经常会遇到输入错别字而检索不到图书,或由于检索词中含有冷门字、生僻字 ,输入法中打不出来的情况,基于拼音纠正的搜索纠错即可以解决这样的问题。其原理是将读者输入的检索词自动转为拼音 ,然后通过全文检索和模糊查询的方式查找该拼音是否存在于marc中,从而获得检索结果。以php技术为例,实现该功能需要借助一个将汉字转化为拼音的类,通过这个类将读者输入的检索词转化为拼音并作为新的检索词来查找馆藏,这样读者即使输入 “汉字+拼音”的格式也能查找到馆藏书目。查询的sql语句示例如下:
selectm-title,m-author,m-publisher,m-pub-year from marc wheremarc-rec-no=(selectmarc-rec-no from marc-data where marc01 like′%yan jiu shiyimen yishu%′)
4 结 论
当然,一站式系统也存在一些问题。在检索时需要通过类似网络爬虫的程序来获取网上书店的图书信息 ,可能会涉及到版权问题 ,在应用该类程序之前最好应该向一些相关单位进行查询,以免造成侵权行为。网上书店的网站结构可能会在一定的时间内做出修改,程序员需要经常地关注一站式系统,一旦发现问题要及时解决,以免系统出bug等问题造成荐购失败。匿名荐购存在被不法分子利用,发送垃圾邮件的可能 ,万一真的发生这种情况,可以适当的将匿名荐购的权限限制在校内IP范围内,应该可以避免99.9%被垃圾邮件轰炸的命运。如果还不能避免,就暂时关闭匿名荐购权限,等待一段时间再重新开放。
[1]2014中国出版物发行业年度发展报告 [EB/OL].http:∥www. chuban.cc/ky/jj/201501/t20150112-163036.html,2015-01-12.
[2]One stop shop[EB/OL].http:∥en.wikipedia.org/wiki/One-stopshop,2014-04-08.
[3]李明鑫 ,田丹.图书荐购用户参与行为的调查与分析 [J].图书情报知识 ,2014,(1):97-101.
[4]史丽香.高校图书馆读者网上荐购的现状与思考——基于对50所高校的调查 [J].图书馆论坛,2013,33(5):117-122.
[5]陈大莲 .高校读者微博荐购图书的应用探析 [J].图书馆工作与研究 ,2014,(2):58-61.
[6]刘佳佳 .基于书目检索信息的图书荐购系统 [J].图书情报工作 ,2012,56(15):82-87.
[7]李明鑫,李柏炀.基于云中心荐购知识库的图书荐购系统研究[J].图书情报工作,2012,(6):55-59.
[8]王平,周虹,吴冬曼 ,等.基于INNOPAC系统构建清华大学图书馆读者荐书服务模式[J].现代图书情报技术 ,2008,(12):90-94.
[9]王泽贤 .高校图书馆整合型荐购系统的设计与实现 [J].图书情报工作,2013,57(20):116-122.
[10]蔡宝家 .图书荐购发展瓶颈及对策——以集美大学图书馆为例 .[J]图书情报工作 ,2014,58(16):96-99,109.
[11]刘华 .“读者决策采购”在美国大学图书馆的实践及其对我国的启示 [J].大学图书馆学报 ,2012,(1):45-50.
[12]阮冈纳赞.图书馆学五定律 [M].北京 :书目文献出版社,1988.
[13]刘丽静 .高校图书馆读者网上荐书的调研与思考 [J].图书馆杂志,2012,31(6):53-55.
[14]朱茗 .图书馆OPAC功能改进之探讨 [J].大学图书馆学报,2011,(3):66-70.
(本文责任编辑:郭沫含)
Research of One-stop Books Retrieval and Recommendation System Based on On-line Bookstore
Chen Gang
(Library,Chien-shiung Institute of Technology,Taicang 215411,China)
Considering to the insufficiency of the presentbooks recommendation system for libraries,the paper analysed the timeliness problem for purchase and response in the present libraries recommendation and thementation of the readers in recommending,point to only achieved opportunely for purchase and responseworking,and it is truly incarnating the value of recommendation system.Combining the briskly growth of on-linebookstore,the paper proposed tobuild theone-stop books retrieval recommendation system by“reader demands centered”.This paper introduced the system which used on-line bookstore as recommendation knowledge base,the system architecture and theworkflow from retrieval to recommendation,and the pivotal technology of the system for information collection and using in the on-line Bookstore.
on-line bookstore;books retrieval;recommendation system;one-stop
陈 刚 (1982-),男,助理馆员 ,研究方向 :信息技术、文献资源建设。
10.3969/j.issn.1008-0821.2015.05.012
G250.7
A
1008-0821(2015)05-0063-05
2015-01-23
本文系苏州健雄职业技术学院青年科研基金项目 “基于现代科技手段的图书馆服务创新研究”(课题编号:2013QNJJ14)研究成果之一。