APP下载

基于RSS的数字图书馆个性化信息推送服务

2009-10-13

现代情报 2009年8期
关键词:个性化服务数字图书馆

孔 季

〔摘 要〕在分析RS S含义和特点的基础上,探讨RSS在图书馆个性化信息推送服务中应用的实现。详细分析了基 于RSS的图书馆个性化信息推送服务的工作原理,最后,结合JSP和Oracle等技术,并详细论 述了系统实现的开发过程。

〔关键词〕RSS技术;信息推送; 个性化服务;数字图书馆

〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编 号〕1008-0821(2009)08-0078-03

Personal Information Push Servic e Based on RSS TechnologyKong Ji

(Library,Qufu Normal University,Qufu 273165,China)

〔Abstract〕Based on analyzing the definition and characteristics of RSS technology, this paper discussed the applications of RSS technology in personal information

push service of library.The emphasis put out the expatiating on operational prin ciples of personal information push service of library.It combined the key techn ologies of JSP and Oracle,constructed a push services system model of digital li brary.

〔Key words〕RSS technology;i nformation push service;personal service;digital library

随着信息技术和网络的发展,信息资源日益丰富且多样化,加之读者的信息需求也越来 越专门化并具有不确定状态,因此图书馆需要不断创新服务环境和方式,为读者提供基于个 性化的信息推送服务。RSS拥有强大的信息聚合和推送功能,被越来越多的数字图书馆应用 ,日益受到用户的接收和欢迎。

1 RSS的含义、特点及应用

1.1 RSS的含义

RSS是Web2.0最重要的技术应用之一,通常被认为是“Really Simple Syndication”的简 称,即“真正简易聚合”。它是一种用来分发和汇集网页内容和元数据的XML格式,这种元 数据可以包含标题、摘要或者URL[1]。信息提供方或内容发布者,可以利用RSS编 制Feed(频道)提供给用户订阅,也可以将其他站点的相关内容集成到自己的站点上。用户则 可以通过一种叫做RSS阅读器的软件,订阅这些RSS Feed,将多个信息提供方或内容发布者 的站点上感兴趣的内容聚合在阅读器中进行阅读。

RSS是1999年由Netscape最早发布,用于发送新闻标题,被称为“推”技术,后来UserlandSoftware发展了其简化版本。与此同时,另外一组开发人员却在复兴最初的RDF版本(0.9) ,并最终发布了一个RSS 1.0的版本(Rich Site Summa)[2]。虽然RSS有许多版本 ,各有其特性,并适用于不同类型的内容,但是大多数RSS工具和整合工具都支持两者。

1.2 RSS的特点

RSS通过一个通用的格式,使内容提供者和接收者都能从中获益。对内容提供者来说,RSS技 术提供了一个实时、高效、安全、低成本的信息发布渠道;对内容接收者来说,RSS技术提 供了一个崭新的阅读体验。

1.2.1信息传递的高实效性和低成本

RSS作为互联网上“推”(push)技术的实现,能够将新内容在服务器中出现的第一时间被“ 推”到用户端阅读器中,极大地提高了信息的实效性和价值。服务器端内容的RSS包装在技 术实现上也极为简单,而且是一次性的工作。RSS使长期的信息发布边际成本几乎为零,几 乎是传统的电子邮件、卫星传输、互联网浏览等发布方式所无法比拟的。

1.2.2 个性化的“聚合”功能

RSS能够实现多源信息的“聚合”,将互联网上很多不同源信息以feeds订阅的方式集中到同 一点[3]。因为RSS是一种被广泛采用的内容包装定义格式,所以任何内容源都可 以采用这种方式来发布信息,包括新闻站点、图书情报机构站点等。而在用户端,RSS阅读器软件的作用就是按照用户的喜好,有选择性地将用户感兴趣的内容来源“聚合”到该软件 的界面中,为用户提供多来源信息的“一站式”服务。

1.2.3 对垃圾信息的屏蔽

RSS用户端阅读器软件可以完全由用户根据自身喜好,以“频道”的形式订阅值得信任的内 容来源。这种方式就可以屏蔽掉其他所有用户没有订阅的内容以及弹出广告、垃圾邮件等令 人困扰的信息内容。此外,对下载到阅读器软件订阅的RSS内容,用户可以进行离线阅读、 存档保留、搜索排序、相关分类等多种管理操作,使阅读器软件不仅是一个“阅读器”,而 且是一个用户随身的“资料库”。

1.3图书馆RSS推送服务的主要内容

1.3.1 新书通告RSS

新书通告是指将每批到馆的新书通过一定的形式介绍给读者,使读者能够及时了解图书馆最 新图书动态并找到自己所需图书,以提高图书利用率。目前国内许多图书馆传统上通过联机 书目系统(OPAC)自带的新书通告模块,按“人文和社会科学类中文图书”、“科技类中文图 书”和“西文图书”等三大类,报导每周新上架的中外文图书,在一定程度上满足了新书报 导需要,但这种方式有如下缺点:新书通告栏目在主页中的位置不醒目、不易按照详细的学 科分类浏览、无法在所有新书书目中做限定检索、需要读者重复访问同一栏目等,所有这些 都给读者浏览和了解某一主题领域的新书带来不便。通过开展新书通告RSS服务,能够将新 书书目即时主动推送到读者桌面,读者不必直接访问网站就能得到更新的内容,读者也可根 据自己所关心的学科领域和兴趣有选择地订阅新书书目,通过本地的RSS阅读器实现新书书目的查询和集中管理,查询到的书目可直接链接到图书馆的OPAC系统。

1.3.2图书馆最新动态RSS

图书馆经常会发布一些时效性较强的信息,用来宣传图书馆的各项服务和最新动态。比如按 照信息内容的不同,分设“图书馆公告”、“电子资源动态”、“报告厅学术报告”3个动 态栏目,通过JSP动态网页发布技术,实现最新公告、培训、数据库试用、学术报告通知等 动态信息的发布。在此基础上,构建RSS服务功能,有助于将这些最新信息及时推送到读者 桌面,能够使读者在第一时间了解图书馆的最新动态,提高服务水平。

1.3.3 商业数据库RSS服务

目前许多图书馆购买了大量商业数据库提供RSS服务,按照其服务方式,归纳起来有两类: 一是基于检索词的订购,用户在检索页面中输入检索式,在返回检索列表的同时系统会自动 给出一个RSS Feed URL,用户订阅这个URL后,每次数据库更新记录的同时,用户将得到相 关的最新信息。EI、Proquest、PubMed等商业数据库提供该类服务;二是基于期刊目次(TOC )的订购,按照收录期刊的目次提供RSS Feed URL,当新一期的目次入库时,自动通知用户 最新的期刊目次信息,有代表性的商业数据库有:IEEE、IOP、Nature、Science、中国期刊 网等[4]。按照这两类RSS服务,将商业数据库RSS服务集中组织,并通过统一的页 面揭示给读者,能帮助读者了解数据库资源变化情况,方便读者订阅自己感兴趣的信息。

2图书馆RSS个性化信息推送服务 的工作原理和流程

在通常情况下,读者要获得图书馆的网络资源服务,首先进入图书馆主页网站,然后选择相 应的服务链接,通过一站式检索或单个系统的逐步检索获得所需结果,如图书借阅情况、新 书通报、预约图书或数字资源文献等。这种服务是被动式的服务,用户必须主动关心才能知 道结果,同时对用户的计算机技术能力和时间耗费都有很大的要求。我们设计的目标是通过 对图书馆数字资源系统集成,根据用户个性化需求,生成RSS摘要,用户只要定制服务频道 ,就能将用户关心的最新信息即时主动地推送到用户桌面通过RSS阅读器就能获得满意的推 送服务,而不必直接访问网站就能得到更新的内容。基于数字图书馆R推送服务模型结构如图1所示。

其中:(1)个性化服务定制模块包括用户注册、服务的定制管理和频道发布等功能。主要 完成读者个人信息的收集,所需文献资源的主题、关键词,检索式和文献资源需求的详细描 述的登记以及发布可以订阅的个性化频道和一些公共频道的列表。(2)身份认证模块包括 用户管理和身份认证功能。主要完成注册用户的审核,用户权限的限制。对于某些频道订阅 有权限限制,进入频道后,首先进行身份认证,通过身份认证后,对应的频道才能订阅。( 3)自动搜索引擎主要根据用户需求,搜索相应资源,取得文献的链接地址和文献摘要等相 关信息并归类形成RSS信息摘要存入频道摘要数据库。(4)频道生成模块,根据摘要数据 库自动生成个性化频道以及公共频道。(5)学科馆员整理模块主要根据查看读者定制需求 ,对读者提出的检索式等做优化操作,对形成的RSS摘要进行过滤性剔除,以期获得更符合 读者需求的文献资料。这样可以避免出现信息过载的问题,同时更能贴近用户的真实需求。 (6)交流反馈模块。交流反馈在系统中占有重要作用,通过交流沟通,特别是学科馆员的 沟通指导,更能挖掘出用户的个性化行为,同时也能使用户更了解系统功能。当用户选择定 制以后,他就将被加到该定制的名单之列,交流模块就是在此基础上构建的。交流模块包括 实时交互和异步交互,前者通过集成Net-Meeting中的文字聊天、网络白板、网络会议、网 络呼叫中心等实现,后者通过电子邮件或留言簿等方式实现。通过交流模块可以实现用户和图书馆员的讨论以及用户之间的讨论。(7)日志记录模块。主要记录用户历史订阅和推送 文献的阅读情况,以便作统计分析和日志挖掘,为进一步提高个性化服务打下基础。

3 基于数字图书馆的RSS推送服务系统的开发与实现

下面以JSP+Oracle开发环境介绍RSS最新通告服务为例,介绍的基于数字图书馆的RSS推送服 务系统开发与实现过程。

3.1 技术分析和实现

“主页动态发布系统”采用JSP/Servlet服务器引擎tomcat,结合Apache Web Server实现 动态页面的解析和静态文件的访问服务,后台数据库为Oracle。为方便读者订阅,我们设置 3个栏目,提供“图书馆公告”、“电子资源动态”、“报告厅学术报告”3个栏目的RSS Fe ed。我们知道RSSFeed实质上是一个XML文件,这就将问题转化为:如何通过后台数据库将符 合条件的记录输出成RSS Feed要求的标准XML格式,有两种实现方式:

(1)通过程序直接输出静态的XML文件,当数据库中记录变化时(比如添加,修改与删除),自 动实现XML文件的更新。读者订阅的RSS链接实质上是一个静态文件(比如:http:∥ lib.qfnu.edu.cn/rss/testdb.xml),也就是说,每次访问RSSFeed不需要与后台 数据库做交互,服务器负载较小;(2)通过调用JSP脚本动态生成XML文件,读者订阅的RSS链 接实质上是一个动态链接,读者每次访问RSS Feed需要与后台数据库做交互,服务器负载较 大[5]。

通过对两种技术实现方式的对比,我们倾向于前者,因为读者为了能即时获得最新信息,一 般将RSS阅读器访问RSS Feed的时间间隔设置的比较短(默认设置一般为10分钟或1小时以内) ,读者端的频繁访问势必增大系统开销,动态访问对系统资源的占用和给服务器带来的负担 都远远高于静态页面,尤其对访问量和并发用户量较高的系统来说,采用前者将大大节省系 统开销,提高系统效率。

3.2 核心代码

我们通过编写JSP程序,实现了图书馆最新动态自动生成RSS Feed功能。下面以“电子资源 动态”RSS服务为例,介绍该程序实现的关键步骤:

(1)建立数据库链接

(2)通过循环读取符合条件的记录,构造RSS Feed中每个内容

ResuhSet rs;

sqlname=″select from news where classname=′newdb′″;

rs=stmt.executeQuery(sqlname);

while(rs.next())

{

id=rs.getString(″id″);

title=rs.getString(″title″);

java.sq1.Date date=rs.getDate(″issuedate″);

description=rs.getString(″content″);

link=″http:∥mail.lib.qfnu.edu.cn:9902/homepage/announcezview.jsp?id= ″+id;

content= content+″″+″ ″+″″+title+″″+″ ″+″+date+″″+″ ″+″″+link+″″+″ ″+″″+″ ″;

}

(3)输出静态的XML文件

File f=new File(″../testdb.xml″);

if(exists())

f.delete();

FileOutputStream fo=new FileOutputStream(f);

PrintStream so=new PrintStream(fo);

so.println(head+content+tail);

so.close();∥关闭文件

4 结 语

比尔•盖茨早在《未来之路》中就曾预言,未来信息服务必须满足用户高度个性化的要求[6]。基于数字图书馆的RSS推送系统,根据用户个性化需求,采用统一的搜索引擎 生成摘要数据库,结合读者的反馈并在学科馆员的人工干预下,优化用户定制和过滤摘要数 据库,实现了动态频道技术和静态频道技术相结合以及推送服务智能化,能够较好地为读者 提供信息资源服务,满足读者的要求。在系统试运行过程中。获得了较好的评价。如何完善 统一的搜索引擎,减轻学科馆员工作强度,使之更贴近读者的需求以及提供更多的RSS频道 是进一步研究的方向。

参考文献

[1]邵晶,等.对大学图书馆资源整合与揭示现状的分析与思考[J].大学图书馆学报,2008,(5):90-93.

[2]黄如花,陈朋.基于网络的集成化信息检索[J].中国图书馆学报,2005,(1):46- 49,60.

[3]吴振兴.RSS元数据在门户网站建设中的应用[J].现代图书情报技术,2004,(10) :60-64.

[4]赵阳.图书馆RSS应用探索[J].图书馆建设,2007,(1):83-85.

[5]柯青.基于RSS技术的个性化信息服务新方式——由雅虎看RSS在搜索引擎中的应用[ J].情报理论与实践,2005,28(5):539.

[6]比尔•盖茨.未来之路[M].北京:北京大学出版社,1996.3:12.ΚΚ

猜你喜欢

个性化服务数字图书馆
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究
浅析“互联网+”时代的图书馆管理