基于RSS的新标委网站信息推送及演示系统初探
2012-08-15屈海涛王日花屈武
文|屈海涛 王日花 屈武
引言
长期以来,由于缺乏统一的中文新闻信息技术标准,我国国内各新闻单位及海外华文媒体形成了无数个“信息孤岛”。2010年7月15日,全国中文新闻信息标准化技术委员会(简称:新标委)正式成立。新标委的成立是新形势下我国传媒业发展的需要,是适应全球传媒格局变革调整的需要。新标委将围绕“扩大我国媒体的国际传播能力”这一课题,结合新媒体的发展战略及“三网融合”下的新形势,推进一系列重要技术标准体系的立项研制和推广实施。
为了更好地宣传新标委,推动标准化方面的各项工作,为广大用户提供更好的标准服务,新标委建立了自己的网站(网址:http://www.news-standards.org/)。但是,网站在提供服务的方式是机械和被动的,不能主动、及时并有针对性地为用户服务。因此,要运用现代经营方式和信息技术改造并提升新标委网站的服务和水平,网站信息推送及其服务模式的研究成为重要内容。早在20世纪90年代中后期,国内外研究机构就开始探讨利用计算机网络为用户提供更好的推送服务。比如:美国康奈尔大学的My Library,是一个以用户为中心、用户可操作的、个性化地收集组织数字资源的一个门户,即用户从网站所提供的全部数字资源里,选择自己需要的信息组织在My Library中,之后访问My Library,用户将获取与此相关的最新内容。此外,几大搜索引擎如新浪、百度、Google等也相继推出了自己的信息推送服务。国内自2001年渐渐掀起了信息推送服务的研究热潮,比如:中国知网CNKI推出的信息推送服务等。但是,信息推送服务的研究大多停留在理论研究阶段,真正付诸行动的还为数不多。
基于此,本文提出一种基于RSS的新标委网站信息个性化推送服务模式,并建立一套与之相适应的推送服务演示系统。提出的模式能够充分利用新标委网站的资源,具有个性化和一站式等共性服务的特征。因此,本文提出的推送模式能够更好地满足新标委标准化工作的需求,研究具有较高的理论意义和实用价值。
信息推送概述
1.定义
信息推送是依据一定的技术标准和约定,自动从信息资源中选择特定的信息,按照每个用户的特定要求,在适当的时候传递给用户的技术。两种基本的信息推送技术是自动拉取和事件驱动,自动拉取技术是根据用户要求发送方按照预先约定的时间,自动提交所指定的新信息。事件驱动技术是以规则为基础,推送管理方判断预先设置的规则是否发生,如发生则将相关信息或内容提交给用户。
2.信息推送方式
手机短信:手机短信推送具备了身份识别、通信终端、支付终端和广告媒介等几大特点,而且便携性和互动性非常好。缺点是传送的信息流量小,适合于通知、简单提要等服务形式。
电子邮件:大多数的门户网站都有自己的邮箱系统,可以以E-mail的方式做一对一的信息推送, 可以用来实行通知、提要、自动拉出等信息推送服务形式。
网页方式:在一个特定网页内给用户提供他自己订阅的信息。基本原理是:用户通过HTML表单向服务器定制需要的信息;服务器通过CGI生成用户需要的Web网页,再传送到用户的浏览器端进行阅读。
客户代理:客户代理对Web站点的搜索从其根目录开始直至用户指定的页面,当搜索到该页面后便将所有遍历的内容都返回用户。Web站点需要提供其资源列表和资源的更新状态等信息,以配合客户代理的搜寻工作。
频道方式:将某些站点定义为浏览器中的频道,用户可以像选择电视频道那样去选择收看感兴趣的、通过网络播送的信息,且可以指定其播放的时间。该方式包括Push服务器、客户端及开发工具等一整套集成应用环境。
3.RSS信息推送
RSS是一个可用多种扩展来表示的缩写:“RDF站点摘要(RDF Site Summary)”、“真正简单的网站联合(Really Simple Syndication)”、“丰富站点摘要(R i c h S i t e Summary)”。RSS技术是一种数据规范或标准,该规范要求网站在发布新信息时要遵循的标准格式,是一种用于共享新闻标题、摘要等内容的XML文件。
RSS将网站看作一系列频道(Channels)的组合,各个频道又包含了一系列资源(Items),RSS技术的优势在于通过使用RSS阅读工具就能够访问和自动更新用户所指定的自定义内容。RSS的用途非常广泛,可应用于专题讨论、即时信息阅读、软件发布等,新标委网站可利用RSS这种新的方式来加强与用户的联系。其优点表现在:时效性强、内容个性化、有效屏蔽垃圾信息、操作简便易于使用等。
RSS推送是一种基于频道方式的技术,RSS突出的是信息的主动服务,即改过去的“人找信息”为“信息找人”。但是,传统的RSS推送模式存在针对性差、不满足用户的个性要求、信源任务重等缺点。以新标委网站为例,具有很多特色的信息资源;然而,用户对于新标委的发展动态及网站提供的服务了解不多、对电子信息的认知率不高,信息推送服务的整体水平较低。因此,必须对传统的RSS推送模式进行改造,了解用户的需求,对目前网站信息推送服务状况进行梳理,从而优选出个性化RSS信息推送新模式。
新标委网站个性化RSS咨询服务
1、RSS信息推送咨询
通过构建新标委网站信息推送在线咨询系统,可为用户提供在线的、实时的资讯服务。通过网页的用户在线咨询平台,咨询员可以与用户进行即时的文字交流和音视频交流,解答用户有关新标委网站资源与个性化服务的相关咨询。从而,可以了解广大用户使用网站资源的情况,包含用户的使用习惯、对信息资源的偏好、对新标委网站主页意见、资源检索中遇到的普遍问题等。
这种推送咨询是一种主动性服务,能让用户感受到新标委热情、友好的待客态度,并能有效激发用户信息反馈,从而有利于形成互动沟通关系,为了解和满足用户需要奠定良好基础。同时,这种推送咨询实现了用户需求满足的最大化,坚持了以用户为本,强调了用户与新标委之间、用户与信息资源之间的和谐。
2、RSS信息咨询实施
个性化RSS信息咨询服务包括:用户信息需求了解、专题信息搜索、生成信息文档、主题聚合、产生RSS提要库、信息内容集结、产生RSS 种子、推送到用户兴趣库等。因此,用户个性化信息搜集、提取是重要的前提条件,基本方法有:
访谈调查:以用户座谈会或电话等形式征集对RSS信息推送服务的了解和使用情况,包括对新标委网站电子资源的熟悉程度、在使用电子资源过程中遇到的问题、使用习惯等方面。
问卷调查:对用户划分不同的组别,如单位不同、业务不同、层次不同等,分别投放分众信息。也可以通过对用户历史的数据挖掘,对用户个体推出定制的信息推送。分析问卷,确定新标委网站RSS信息推送的具体内容。
网络调查:利用新标委网站的用户反馈模块,对用户进行定期的网络调查,征求其对新标委网站的需求意见与建议;编写用户参考资料,网站利用指南和信息资源的使用指南。
新标委网站一站式RSS信息推送
理念决定方向,服务方向明确,服务的针对性强,在很大程度上就能满足用户需求,达到预期的服务效果。新标委网站要求对用户要能提供一站式服务,用户通过简单的操作,一步到位地得到有关信息资源或线索的全方位服务,从而实现对各种不同形式的信息服务功能的高度、有效整合。新标委网站一站式RSS推送涵盖了分类定制数字资源、推送最新信息、建立与搜索引擎的连接,提供良好的业务导航服务等具体内容。从本质上说,就是让用户“进入新标委网站RSS推送,就能满足所有的需求;联系一个人就得到全面的服务”。
首先,用户只需要登陆自己的RSS注册信息,就可以实时查阅自己新标委网站预约和订阅信息。一站式服务理念的提出避免了很多繁琐的使用规程、减少了重复性的劳动,增加了资源的使用效率。其次,用户也可以将查新、检索、咨询的内容以E-Mail等形式发到RSS推送信箱,在未做记录的情况下由系统完成其服务要求。最后,新标委网站提供RSS推送和使用指南演示系统,包括用户教育和培训,网站服务导引、数据库使用方法及新的服务功能介绍等。
新标委网站RSS推送与使用指南演示系统
新标委网站RSS推送与资源使用指南是对以实景录像和Flash动画等方式,借助相关软件来开发出演示系统。系统包括新标委网站情况介绍和资源RSS推送指南,也包括一些学术资源及使用。该系统利用多媒体技术直观性、交互性的特点来实现,从而取代了用户个别指导等重复性劳动。在新模式下,可以把演示系统进行抽象、形成一个动态的基于Web2.0的Service,进而形成一个共性技术,在各个门户网站进行推广。
1、用户RSS资源订阅的实现
为用户提供个性化推送服务, 首先必须获取用户个性化的信息需求特征, 建立用户兴趣档案。通过注册登录的用户可以建立自己的RSS资源订阅,系统记录下该用户每次关注的相关信息并进行数据挖掘分析,向用户推送其感兴趣的资源信息。该模块可以用AJAX和XML实现,用户和系统建立HTTP连接,客户端向系统发送AJAX请求,系统通过XML格式的文件向客户端发送包含用户感兴趣信息的AJAX响应。关键技术是如何使用jQuery或者EXT库实现 AJAX通信,可以使用DOM4J实现XML的拼装和解析。
2、咨询即时通信的实现
咨询服务是用户和系统管理员可以进行即时通信,交流用户感兴趣的相关信息,体现了以人为本的新标委网站服务理念。通过SERVLET和JSP实现,用户将相关信息发送给服务器端SERVLET,该SERVLET将用户信息路由到管理员界面,从而实现用户和管理员的实时通信。关键技术是如何实现SERVLET将信息路由到管理员界面。
3、信息推送关键字提取的实现
新标委网站RSS信息发布者首先就要确定RSS信息源,也就是需要从其中抽取内容的网站,然后要对该网站的信息源进行分类,通过对该网站的结构分析,再根据用户的兴趣需求与信息源进行匹配,由此产生关键字的定位信息。该方法提高了用户体验,将用户和管理员通信的信息记录并进行关键字的提取和索引,待通信完毕直接将提取出的关键字在索引库中进行搜索。实现通信和搜索的无缝连接。可以参考LUNCENE框架的提取关键字的开源代码,该部分源代码可以实现对一段文字进行关键字的提取和索引,从而实现一站式的服务。关键技术是如何剥离LUNCENE源代码中与业务逻辑无关的代码。
4、演示系统业务与建模的实现
简易使用的推送服务演示系统,可以用F L A S H对该系统进行建模,进行逻辑功能的模拟。MiCROMEDIA FLASMX进行建模,通过该软件将上述需求进行建模和实现。关键技术是如何熟练该软件进行业务语义建模。
总结
本文提出一种基于RSS的新标委网站信息个性化推送服务模式及演示系统。首先,该模式克服了那种坐等用户上门的传统服务的弊端,使新标委网站在面临搜索引擎、咨询机构的主动信息服务时,反应更加灵活高效;同时,该模式实现了网站信息服务方式在时空、方式、内容等多层面的个性化。其次,提出的个性化RSS推送咨询和一站式RSS推送服务理念体系了以人为本,是一种适用于新标委事业发展的服务模式。最后,本文对提出模型相应的演示系统的开发进行了阐述,使得提出模型具有理论和实用价值,为在相关领域更好地推广该模型做了铺垫。