基于用户信息行为的移动图书馆信息服务研究
2012-06-28庞士梅
庞士梅
(安徽医科大学第一附属医院,合肥 230039)
1 引言
随着3G时代的来临,移动互联网的飞速发展,移动图书馆信息服务成为图书情报领域研究的热点话题。本文从基于移动互联网的用户信息行为着手,提出一种移动图书馆系统建设方案,并探讨了3G、4G和云计算等新技术在移动图书馆服务中的应用。构建基于用户信息行为的移动图书馆服务模式,其主旨在于拓展图书馆的服务领域,发挥对用户的引导作用,丰富移动图书馆的服务模式。
2 国内移动图书馆发展现状
2.1 移动图书馆信息服务概念
目前,较为公认的说法是:“移动图书信息服务(Mobile Books Information Service)或移动图书馆(Mobile Library),是依托目前比较成熟的无线移动网络、国际互联网以及多媒体技术,突破信息资源的时空限制,通过使用各种移动设备来方便灵活地进行图书信息的查询、浏览与获取的一种新兴的图书馆信息服务,是数字图书馆电子信息服务的延伸与补充”。但学术界对于移动图书馆信息服务一直没有一个统一的定义,对其概念的界定大多不够明确。
2.2 移动图书馆信息服务系统构建现状
国内图书馆大都通过短信平台开展移动图书馆服务。随着移动互联技术的发展,摆脱时间和空间束缚的移动学习模式已经成为未来学习模式中一种重要的发展趋势并逐渐走向实用化,而移动图书馆(如:手机图书馆)的出现成为图书馆继网络服务之后的新兴服务领域。由于手机短信平台与图书馆自动化系统难以做到无缝链接,致使传送的信息内容、服务类型有限,再加上公益性与收费的冲突,使移动图书馆服务未能得到很好的普及和发展。鉴于此,随着移动图书馆信息服务相关项目的开展,学者们对移动图书馆信息服务的研究目前已进入技术层面。
3 用户信息行为在移动图书馆中的应用
3.1 系统平台架构
基于用户信息行为的移动图书馆系统由四个部分组成:移动终端、移动接入互联网、适配中间件平台和行为信息化的数字图书馆系统。相对于传统的移动图书馆系统,移动图书馆系统增加适配中间件平台,用于支持纷繁复杂的移动终端;后端的数字图书馆系统是基于用户信息行为的数字图书馆系统。
3.1.1 移动终端
移动终端下载安装客户端软件,经移动接入互联网,通过适配中间件平台实现对后端的数字图书馆系统的高速访问。
3.1.2 移动接入互联网
随着移动互联网的飞速发展,目前移动接入互联网正从2G过渡到3G网络,并辅以WLAN网络覆盖移动终端用户,以及未来4G接入网络的覆盖。移动接入互联网主要包括:2G、3G、WLAN等接入网络,以及支持对4G网络的扩展。
3.1.3 适配中间件平台
适配中间件平台进行数字图书馆系统内容的获取、解析、适配、转换、排版、压缩,并以高效压缩后的二进制协议的方式传送给移动终端展现,达到良好用户体验的目的。
3.1.4 数字图书馆系统
数字图书馆系统为移动终端用户提供移动终端软件的下载渠道,为移动图书馆系统管理人员提供系统的维护管理和统计分析管理等功能。
3.2 系统功能
基于用户信息行为的移动图书馆系统的功能架构图如图1所示:
图1 基于用户信息行为的移动图书馆系统的功能架构图
3.2.1 移动终端
移动图书馆系统的移动终端按功能域划分为三层:
底层:完成移动终端与适配中间件平台通讯、客户端终端适配以及移动终端本地能力调用等任务。
中间层:提供应用层与底层互通的接口,主要包括:私有协议解析引擎、页面渲染引擎、动画引擎和缓存管理等模块。
应用层:实现移动终端主要的功能,主要包括:浏览功能、首页功能、图书展示功能、下载功能、历史记录功能、书签功能、个性设置功能、工具功能等。
3.2.2 适配中间件平台
适配中间件平台按功能域划分为四个域:
移动终端接入域:完成移动终端访问的接入功能,保证快速安全的访问,包括:访问控制、访问日志、缓存、负载均衡等功能。
移动互联网接入域:完成移动终端访问中间件平台的互联网接入功能,包括 2G、3G、4G或WLAN等。
核心域:完成中间件平台的核心功能,包括:移动终端界面适配、排版/渲染、协议转换、分页浏览、版面微调和纠错等功能。移动终端界面适配采用抽象工厂、泛型和接口等设计模式,实现对多种移动终端(如:手机、平板电脑和笔记本电脑等)和流行的多种移动终端平台操作系统(如:IOS、Andriod、Windows Mobile等)的支持。
应用接口域:实现对数字图书馆系统快速平衡地访问,包括WEB缓存、访问控制等功能。
3.2.3 数字图书馆系统
基于用户信息行为的数字图书馆系统按功能域划分为四个域:
用户访问域:实现数字图书馆系统的管理门户,包括:业务门户、WWW门户、WAP门户和客户端下载服务等功能,通过WWW门户和WAP门户为用户提供移动图书馆系统移动终端的下载渠道。
应用域:图书产品管理(图书目录检索、图书借阅管理、图书下载);用户管理(用户分群、用户特征信息管理);分析功能(用户信息分析、用户特征分析、用户喜好分析、同类产品分析);基础管理(系统管理、权限管理、数据一致性管理、图书信息管理);数据管理(数据采集、数据处理);增值功能(智能图书推荐、图书产品引入分析)。
数据支撑域:用户信息行为库(用户基础画像、用户图书画像、用户标签库等)和图书产品信息库。
接口域:通过与外部系统接口交互以及与适配中间件平台的接口。
4 关键技术分析
本系统的特点是以用户信息行为和图书产品信息数据为中心,进行相关数据的采集、分析处理工作。因此,数据采集和数据处理工作采用的技术,需要重点考虑下列技术:
4.1 数据采集
数据采集模块,主要实现用户信息行为的获取,建设用户信息行为库。
4.1.1 基于DPI技术的数据采集模块
DPI(Deep Packet Inspection)技术,即深度包检测技术,是一种基于应用层的流量检测和控制技术,当IP数据包、TCP或UDP数据流通过基于DPI技术数据采集设备时,该系统通过深入读取IP包载荷的内容实现对OSI七层协议中的应用层信息进行重组,从而得到整个应用程序的内容,然后按照系统定义的内容分类对流量进行采集。
基于DPI技术的数据采集模块,通过在访问互联网链路上部署基于DPI技术数据采集设备,对用户上网流量进行DPI深度包检测,获取用户上网行为,包括:用户上网阅读图书信息、用户访问图书网站的URL信息、用户搜索图书排名信息等,建设用户信息行为库。
4.1.2 基于插件/脚本技术的数据采集模块
数据采集模块,还可以通过在客户端软件(移动终端客户端软件或者宽带上网客户端软件)中内嵌插件(如:动态链接库)或脚本程序(如:页面内嵌脚本和点击行为脚本)的方式,在用户上网过程中采集与用户相关的行为数据,建设用户信息行为库。
用户信息行为数据采集基于网络嗅探的方式进行实现,例如:利用WinpCap抓取用户的上网数据(如访问URL、搜索关键字等信息)。
用户其他行为信息,如进程快照、硬软件配置等信息,则利用与操作系统(如Windows)相关的API进行获取。
4.2 数据处理
本系统采用云计算技术实现基于用户信息行为的数据处理模块。
4.2.1 云计算技术介绍
云计算技术是分布式处理、并行处理和网格计算的发展,或者说是这些计算机科学概念的商业实现。云计算的基本原理是将数据计算分布在大量的分布式计算机上。
云计算是在网格计算发展的基础上融合虚拟技术、IaaS(Infrastructure as a Service,基础设施即服务)、Web2.0、分布式计算、公用计算等技术的集合体。其中,虚拟技术是云计算技术的核心。虚拟技术将处于网络中的服务器、存储器虚拟成一个资源池,统一灵活调配,每一个应用部署的环境与物理平台无关,而是通过虚拟平台进行管理,以实现对应用的扩展、迁移和备份。
4.2.2 基于云计算的数据处理模块
本系统的软硬件平台建设,通过在X86平台上部署虚拟化软件(如VmWare虚拟化软件)方式建设X86云资源池,同时采用并行数据处理模型(如MapReduce),对结构化数据表(如BigTable)实现数据挖掘整理。
通过引入云计算技术,建设适配中间件平台和后端的数字图书馆系统,可以节省建设投资,实现平台平滑扩容以及资源的重复利用。
5 总结与展望
本文从基于移动互联网的用户信息行为着手,结合云计算、移动接入互联网(如:3G、4G和WLAN等)等技术,提出基于用户信息行为的移动图书馆系统应用探讨。随着物联网技术的不断发展,未来可对物联网技术在移动图书馆系统中的应用进行探讨,进一步完善用户信息行为库的建设,实现用户与移动图书馆的实时互动。
[1]齐亚双,李永先,薛伟莲.我国移动图书馆信息服务研究综述[J].图书馆学研究,2010,(22).
[2]徐恺英,刘晓辉,赵 旭,徐 瑶.基于移动学习的手机图书馆服务模式研究[J].图书情报工作,2010,(11).
[3]曹 梅.略论用户信息行为研究的演进[J].图书情报工作,2010,(2).
[4]胡 荣.浅论云计算技术在数字图书馆中的应用[J].科技创业月刊,2011,(7).