校地共建图书馆复合式推送服务研究
2015-11-27孙海双公笑
孙海双+公笑
关键词:校地共建图书馆;信息过载;个性化信息推送;频道推送
摘 要:文章基于对河南科技大学图书馆面向校内外推送服务现状的分析,针对“信息过载”、信息推送需求强烈的现象,对邮件推送服务进行了重新设计,并对课题查新服务进行了频道推送设计,对推送服务中用户个性化需求进行复合加工,建立特色需求分析数据库。
中图分类号:G250 文献标识码:A 文章编号:1003-1588(2015)11-0053-04
1.1 信息推送技术概念
信息推送技术又称为PUSH技术,于1996年由Point-CastNetwork公司提出,如今已经成为一项相当成熟的技术[1]。Push技术的出现与发展,把越来越多用户从无尽的信息“拉取”中解救了出来,并转变信息发送方式为主动的有的放矢,把信息主动发送给有需要和感兴趣的用户,从而把信息的发布者与接收者从烦琐的信息推拉进程中解救出来。
1.2 信息推送技术方式简介
1.2.1 基于Web服务器扩展的CGI推送方式。Common Gateway Interface,简称CGI,是外部应用程序与Web服务器之间的接口标准,在物理上是一段程序,运行在服务器上,可以为客户端HTML页面提供接口[2]。在图书馆实际应用中,客户通过外部客户端应用程序登记需求留言,CGI程序将信息提供至服务器,信息服务对“需求留言”进行分析并处理,之后将结果按照一定要求反馈回CGI客户端。这是最简单意义上的信息推送服务,其特点是只有当用户主动登记“需求留言”时,服务器才可以推送给用户其所感兴趣的定制信息。
1.2.2 后台客户代理分析推送方式。后台客户代理分析推送方式属于一种更高级的推送技术范畴,客户并不需要填写太明确的需求留言,只需要有参与信息采集分析的意愿,其他的全交给代理服务器处理。代理服务器在后台收集用户使用特定工具的具体操作过程,然后通过信息分析服务器分析用户对特定信息的需求与喜好程度,并在用户不再参与的情况下,继续帮用户收集与其需求相符的信息并加以分析,最后按一定的方式推送给用户[3]。 在这种实现方式中,对信息需求的收集和推送都是由代理服务器处理的[4]。从用户角度看,这种方式节省了用户进行需求留言的时间;从信息发布者的角度看,发送的内容理论上更加科学简洁,缓解了服务器发送大量信息时的负载压力,更加高效。
1.2.3 频道服务器式推送方式。频道服务器式推送方式在日常生活中的应用越来越广泛,特别是在一些视频类网站。这一技术通过结合信息发送主体本身的意愿与优势,建立不同主题和类型的信息发布频道来开展信息推送服务。这种频道式的推送方式,简化了信息发布者的发送过程,让精于特定频道内容编纂的整理人员集中于特定的频道发布端,让需求特定内容的人的关注点集中到特定频道,信息传输的目的性更加明确,信息需求者的获取流程也更加简便,有效地提高了信息获取的效率。
1.3 我国高校图书馆信息推送技术服务需求
1.3.1 借阅服务。以各种形式存在的文献资源借阅服务,一直都是图书馆的核心业务,其传统的借还业务已经非常成熟[5],且大部分高校图书馆已经实现了查询与借阅的自动化,但是在实际馆藏数据查询方面还是有一些问题。如:当用户在查询机上使用馆藏数据查询系统时,查询不到所需数据,可能是因为该数据图书馆尚未收录,也很有可能是因为用户自身信息检索能力不足,对检索“关键词”的选择与使用不合适等。普通高校图书馆对于此类问题的关注度较低,急需一套基于计算机技术的图书检索问题追踪反馈系统(推送系统中分析反馈推送模块)。
1.3.2 课题查新服务。面对科技工作者的课题查新服务也是图书馆的一项核心业务,图书馆查新部根据提交者所给定的课题,与各大文献数据库进行比对,并将其所提交课题文献表面层的研究状况反馈给科技工作者。国内一些较大的高校图书馆,会向提交者提供其课题研究方向的最新资讯,当查新工作人员具有一定的学科背景时,还可以给予科技工作者一定程度上的学术建议。这一过程在实际操作中是非常烦琐的,它需要查新者与提交者反复沟通,并为其提供相关文献以参考,但这一服务又对查新工作者本身关于特定课题的相关科学素养要求较高,有时并不能很好地给予提交者非常恰当的建议,图书馆同样需要一套更简洁化的辅助交互系统。
1.3.3 区域科技文化传播。高校图书馆如今不仅担负着为高校师生服务的任务,由于一些地缘原因,高校图书馆还要担负着为传播地方科技文化的任务。如:校地共建图书馆不仅担负着为高校科研工作者服务的任务,而且担负着为地方科技工作者服务的任务。但在图书馆实际运行中,很少有地方科技工作者会走进科技共建馆,不仅是因为图书馆所处地理位置与借阅条件等的限制,还因为在服务区域内,需求推送服务不到位,这是担负新时期重要责任的高校图书馆必须面对的一个问题。
1.4 我国高校图书馆信息推送服务发展趋势
在“信息过载”的今天,高校图书馆亟须通过个性化的推送技术,提高信息传送的有效率,减少信息传送时间,在适当的期间把适当的信息传递给适当的用户。图书馆作为一个主要的信息传播体,必须跟上当今世界的步伐,不断改进服务理念与服务方式,将传统的被动服务转变为主动服务,在满足时代要求的同时,更要向个性化方向迈进,以满足不同用户的个性化需求[6]。如:校地共建图书馆既要满足校内师生的科研教学需求,还要满足地方读者的查询借阅需求,应依托地方政府文化教育行政平台和高校科学教育平台,扩大科学文化辐射范围,基于不同读者的不同情境需求,开展个性化信息服务。
2 图书馆新式信息推送技术的研究
2.1 样本图书馆推送服务现状
公笑,孙海双:校地共建图书馆复合式推送服务研究
公笑,孙海双:校地共建图书馆复合式推送服务研究
样本图书馆——河南科技大学图书馆(洛阳市科技图书馆)是一所校地共建图书馆,同时担负着为地方科技工作者和校内学者科研工作服务的任务[7]。在校地共建馆服务对象更复杂化的特殊前提下,信息推送工作将会遇到很大的困难。其面向校内外不同背景读者的推送方式研究还处在初步探索阶段,提供的推送形式仍比较单一,推送效果也因为用户背景的不同而千差万别。
推送技术本身已经是一项比较成熟的技术,进行理念创新并开发新的信息推送方式,将使校地共建图书馆能更好地推动高校科研进步和地方经济发展。
2.2 图书馆新式邮件推送方式
利用电子邮件进行推送,是推送领域里最常用的方法,但是在图书馆行业,邮件推送服务一直面临诸多问题:①自动化的邮件推送速度快,但是面向每个用户推送的内容基本相同,信息不能很好地匹配用户需求。②人工邮件推送虽然能保证信息对于用户的有效性,但是要求实施邮件推送的馆员具有较高的相关科学素养。在校地共建图书馆用户来源多样化的前提下,维持现有馆员数量,并要求馆员具备多样的科学素养,基本上很难实现,这种精准的一对多人工推送,操作上不实际,也不能保证信息的时效性。
传统的邮件推送信息采集往往采用文本评价、评分和用户基本信息采集等方法来完成对用户偏好的收集,但在实际应用阶段,用户对问答式信息采集较为抗拒,推送接受载体也较为局限,所以图书馆传统邮件式推送服务必须进行改进。基于Web服务器的CGI技术与客户代理技术,我们为图书馆新式邮件推送系统做了如下设计:①校内依托现有邮件系统,为每个在校学生和已办理借书登记的社会读者,开通以“学号(借书卡号)@haust.lib.com ”为地址的邮箱,精准推送地址。②馆藏图书查询系统与学生一卡通、社会读者卡进行查询绑定,用户在查询馆藏图书时,后台服务器记录分析用户操作记录,进行需求分析,确定推送内容。③当用户所查询文献不存在时,数据库根据用户所输“检索词”,自我优化分析并选择相近类型文献推送至用户邮箱以供其选择。当馆藏无相关文献时,服务器反馈信息于图书采编部,采编部可根据文献需求频次与相关度,做出采购分析,当所寻文献到达入库时,将信息反馈至特定读者,精准信息收集(见图1)。
图1 图书馆新式邮件推送系统2.3 频道服务器式网络辅助定题推送服务
在进行传统图书馆课题查新工作时,查新员总要为课题的提交者提供相关课题的研究现状,但特殊课题的研究状况很难掌握,课题提交者也并不都具有较高的科学文献检索能力,频道服务器式网络辅助定题服务针对的就是这个问题。
河南科技大学图书馆结合学校以工科为研究重点,结合地方主要以矿山机械、轴承、玻璃、石油化工、国防科技为支柱产业,确定了以工科为频道的试点推送服务,具体的操作如下:①搜集车动、机械、材料等几个专业近10年国家级专业核心期刊收录的所有文章。②利用文献计量学对各专业核心期刊所收录文章的关键词进行词频分析,并对结果进行排序。③将这些行业核心文章定期推送到服务器频道上,供课题提交者阅读了解最新行业动态,并将基于文献计量学的关键词词频分析结果也呈现出来,以供用户参考。④通过对各个频道浏览量和实际反馈的全面分析,精简浏览较少频道的工作量,添加更加需求的频道(见图2)。
图2 图书馆频道服务器式推送在频道式推送的后期,可以尝试设立“学科馆员”制,从而将推送工作水平提升到一个新的高度。“学科馆员”应当具备较高的图书馆业务水平、广博的文化基础知识及学科背景、较熟练的计算机技术;应当熟悉各种检索功能、检索策略,能运用高效的检索技巧回应用户需求,能根据专业特点,将网上信息资源加以收集、分类、整理,编制索引资源库,实现资源导航[8]。
2.4 依托现有其他的交互式平台(微信、微博等)的推送服务
微信公众账号具有群体推送文字、语音、图片等信息的功能,利用这一功能,高校图书馆可以利用微信向读者群体主动推送各类他们期待了解的信息,如新书通报、数据库更新、学术讲座信息等[9]。此外,用户可以通过关注图书馆的微博来实现对推送信息的接收,且可以通过留言及时向图书馆反馈信息。
3 推送系统的部署与安装
3.1 推送服务器的配置
笔者建议在图书馆中心机房调配出两台服务器来负责整个推送系统的信息收集、整理与推送,将馆藏图书目录数据与馆藏数字资源储存到该服务器硬盘当中,配置需求数据库、信息库、推送服务器。安装校内网邮件系统,导入在校教职工、学生、社会读者(已办卡登记)的信息,生成以编号信息为邮件地址的信息接收邮箱,配置信息发送机制。
3.2 新式邮箱推送服务的信息采集端配置
测试期选取五个读者量较大的书库,在其馆藏查询机上安装用户操作记录软件,并匹配识别用户身份的读卡硬件外设,跟中心机房服务器进行配对连接,测试用户在使用查询机找不到所需文献时,是否能正常反馈查询信息至需求数据库。同时,记录需求数据库信息处理时间,制定科学合理的推送服务时间与频率,并根据服务器运行状况与读者反馈意见,逐步在馆内其他查询机上调试安装。
3.3 频道式推送的架设
在内网增设辅助定题频道,测试初期以工科为样本频道,选取30余种该行业核心期刊作为信息推送来源,并细分为3个子频道。每半个月,对所选来源关键词进行词频分析,得出词频排序并上传至频道网页,对往期词频排序记录也予以保存。在做好词频排序的前提下,约稿校内相关专业学科专家,对词频排序结果进行人工矫正,将软件自动排序结果与实际有机地组织起来,做出专业观点汇总,避免单纯排序可能造成的学术误解,并根据反馈情况及时进行人工化工作。最后进行汇总评价,逐步开展其他学科的辅助定题。
4 服务器安全与维护
4.1 服务器数据安全
在服务器的运行安全与数据安全方面,需要采用热备服务器与热冷备硬盘相结合的方法。热备服务器负责整个推送系统的需求采集、数据运算与信息推送。馆藏资源目录信息与电子资源数据更新不太频繁,且每次更新数据量较小,可将其放置于一块定期更新的硬盘上且不需要热备。另外,一张热备硬盘除了存储冷备硬盘所存储的 馆藏资源数据外,还需要同步存取来自服务器的用户录入信息,供服务器提取馆藏数据对比分析与推送,定期将生成数据备份至冷备硬盘。馆内有新增文献目录信息与电子资源信息时,将信息更新存储热冷备硬盘。这样,在服务器与数据库损坏时,迅速启动冷备硬盘进行数据恢复,可以将数据的损失降到最低,大大增强了系统数据的安全性。
4.2 权限设置与运行优化
在进行频道式推送网站建设时,课题组发放了若干测试账号,有面向图书馆工作人员的拥有上传词频分析结果排序权限的账号,有面向特定学科带头人的拥有词频分析排序优化与文章发布权限的账号。这些账号都可以在校园网覆盖范围内访问服务器并对频道内容进行相应的操作。
推送服务主要对象是校内师生与地方科技工作者,其具有流动性较大的特点,由于推送系统是一个长期运营的服务系统,所以需要定期对非活跃用户信息进行清理,减少推送服务的无效工作量,减小服务器压力。由于推送服务的用户信息收集端都安装在传统的PC端,需要定期检查PC端软件的运行情况,保证其处于健康状态。在频道式推送的管理端,可以根据用户反馈,对频道页面布局进行优化设计,使用户能更加方便地找到自己所需要的信息。此外,还要注意对服务器端的硬盘维护,注意硬盘的使用寿命,定期进行更换。
参考文献:
[1] 曾慧敏,阳卫文.RSS信息推送技术在农村信息化中的应用[J].中国农村小康科技,2010(7):21-24.
[2] 尚辉.基于ARM&Web的智能安防系统网关研究与设计[D].西安:西安科技大学,2010.
[3] 郭连生.基于大规模定制的高校图书馆信息服务模式研究[D].天津:河北工业大学,2013.
[4] 李春刚.数字图书馆个性化信息推送服务研究[D].长春:东北师范大学,2007.
[5] 杨红玲.高校图书馆业务流程重组研究[D].湘潭:湘潭大学,2013.
[6] 王文彬.浅谈现代图书馆服务模式的转型与创新[J].东方企业文化,2012(19):108.
[7] 杨鹏.校地共建图书馆之服务创新:以河南科技大学图书馆暨洛阳市科技图书馆为例[J].科技情报开发与经济,2014(6):32-34.
[8] 百度百科.河南科技大学图书馆[EB/OL].[2014-05-05].http://baike.baidu.com/view/2390352.htm.
[9] 靳秀霞,赵红.探析高校图书馆微信公众账号的运营方式[J].科技视界,2013(36).