APP下载

基于知识发现的电子政务个性化信息服务研究

2013-03-16刘爽

河南科技 2013年1期
关键词:电子政务数据挖掘个性化

刘爽

(北京林业大学 北京 100083)

电子政务是国家信息化发展的重点。随着电子政务的发展,政府信息服务被提升到新的更重要的高度。目前,大多数政府机构都有自己的网站,并在此基础上向用户提供政务信息及服务,然而,大多数电子政务网站提供的都是具有普适性的信息服务,缺乏特色和针对性,无法满足用户多样化、差别化的信息需求。开展电子政务个性化信息服务的需求日益增加。

1 知识发现与个性化信息服务

1.1 知识发现概念、步骤及方法

知识发现是20世纪80年代兴起的交叉学科。Fayyad等人对知识发现给出了如下定义:指从数据库中获取正确、新颖、有潜在应用价值和最终可理解的模式的非平凡过程。知识发现包括三个关键步骤:数据准备、数据挖掘及结果表达和解释。1、数据准备,又包括3个子过程:数据集成、数据选择和数据预处理。将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊性,处理数据中的遗漏,清洗脏数据,缩小数据处理范围,提高数据挖掘的质量;2、数据挖掘,选择数据挖掘算法,根据选定的数据挖掘算法对经过处理后的数据进行模式提取;3、结果表达和解释。运用可视化方式对模式进行表示,形成用户可理解的知识,并通过兴趣度评价,确定对用户有用的知识,存储形成可更新的知识库。

1.2 个性化信息服务的内涵

个性化信息服务能够满足用户个性化的需求,是网络环境下信息服务向纵深发展的结果,也是信息服务发展的主流模式。

个性化信息服务是以符合用户兴趣、身份和满足用户特定需求的信息形式为其提供具有针对性的服务。个性化信息服务包含两层次的含义:个性化信息。用户根据自身兴趣爱好和需求定制的、反应个体特征的信息;个性化服务。信息提供者针对用户个性和特点选择甚至预测出最重要的信息和服务并主动传递给用户,能动态调整服务内容以适应用户需求的变化。

个性化信息服务有三方面的内容:服务时空个性化、服务方式个性化和服务内容个性化。动态的调整、选择和组合信息资源以适应用户需求的变化,并且提供能够使用户直接解决问题的知识性信息。

随着信息技术的快速发展和社会信息化程度不断提高,人们面临的信息环境发生了很大变化,利用信息的方式方法出现了许多新特点,决定了电子政务服务对象的个性化区别,这就需要电子政务针对具体服务对象开展个性化特征化服务,这是电子政务发展的必然趋势。

2 知识发现在电子政务个性化信息服务中应用的目的

电子政务个性化信息服务就是在电子政务信息服务中,针对信息用户的特定需求,以合适的方式,主动向用户提供经过集成的相对完整的信息组合或知识组合。

传统的电子政务以政府为中心,政府在向公众提供信息时往往是面向大众的具有一定的普适性。而在当今网络和信息环境下,人们不再满足于单纯上网浏览信息,需求呈现出多样化和复杂化特点。传统电子政务没有更好的考虑用户需求的复杂性与差异性,更没有考虑到用户的深层需求和潜在需求。要解决这种信息服务需求与供给不匹配问题,就要求电子政务以用户需求为中心,根据用户的个性、偏好和需求变化,动态、主动地向用户提供满足其个性化需求的信息组合,并引导其使用这些信息,创造新价值。

由此,知识发现在电子政务个性化信息服务应用的目的在于全面、深入、准确的识别用户需求,采用特定方式、主动提供有针对性的电子政务服务,实现电子政务从以政务为中心向以用户为中心的根本转变,有效提高电子政务信息服务的质量和效率。

3 电子政务个性化信息的知识发现过程

用户个性化信息的知识发现是电子政务个性化信息服务的核心和基础。电子政务用户个性化信息的知识发现过程包括数据准备与预处理、数据挖掘、模式表示与评价三个步骤。

3.1 数据准备与预处理

电子政务用户个性化信息来源主要包括两方面:一是用户在电子政务网站注册的个人信息,这部分信息存储于电子政务系统的数据库;二是用户在电子政务系统中的各种行为信息,如用户访问、浏览网页记录、服务请求记录、信息检索记录等,这部分信息利用网络日志、用户cookie进行提取和收集。用户个性化信息从不同方面反映用户偏好、特征、习惯等,对其进行跟踪、记录和处理是电子政务用户个性化信息知识发现的基础。

预处理是在数据挖掘之前,对所收集的数据进行必要的操作,主要利用算法进行数据净化。并不是所有的用户行为记录对知识发现都是有用的,因此有必要用数据净化来去除冗余信息。

3.2 数据挖掘

运用数据挖掘手段分析用户数据,有针对性的提供用户需要的信息服务。可应用于电子政务个性化信息服务的数据挖掘方法主要有以下几种:

1.分类与聚类分析。数据分类的目标是通过分析数据集,构造分类模型,该模型能把数据库中的数据记录映射到给定的类别,从而可以用于数据预测。而当要分析的数据缺乏必要的描述信息,或者根本就无法组织成任何分类模式时,利用聚类函数把一组个体按照相似性归成若干类,使同一群组的数据尽量相似,不同群组的数据差别尽可能大。

电子政务系统通过分析用户个人信息、使用行为等个性特征进行用户分类和聚类,形成不同的用户细分群体,为电子政务个性化信息服务实施提供可靠依据。

2.关联和相关性分析。指发现大规模数据集之间的关联或相关关系,从某一数据对象信息推断另一数据对象信息,寻找出重复出现概率高的知识模式。

在电子政务个性化信息服务过程中,通过用户经常使用的服务类别推出其信息服务需求,从而主动为用户提供其可能需要的电子政务服务,并将同质服务推荐给同类型用户。

3.顺序发现和时间序列分析。顺序发现指确定数据组中的顺序模式,即发现一些项跟随另一个项。例如可以根据用户的身份推出用户可能需要的电子政务信息服务项目。

时间序列分析的任务是发现属性值的发展趋势。如可以通过分析用户操作的周期性特征,预测用户行为,从而在适当时间提供适当的电子政务服务,提高信息服务质量。

3.3 模式表示与评价

在对用户个性化信息进行挖掘之后,运用可视化技术识别所发现的各种模式,使其对用户可视,将模式转化为知识,并根据兴趣度、支持度进行评价,形成用户信息知识库或用户信息模型,以支持各种个性化应用。

4 基于知识发现的电子政务个性化信息服务模式

知识发现在电子政务个性化信息服务中的典型应用主要有个性化界面定制、个性化信息推送服务、个性化信息推荐服务和个性化信息检索服务。基于知识发现的电子政务个性化信息服务模式如图1所示。

4.1 个性化界面定制服务

个性化界面指用户根据自身偏好自行进行界面结构的设计布局,如页面中包括哪些模块或服务,各模块的布局方式,图像、菜单等的位置设置,界面色彩设置等。是一种较为简单和直接的电子政务个性化信息服务形式。

图1 电子政务个性化信息服务模式

4.2 个性化信息推送服务

信息推送是电子政务个性化信息服务的又一应用。推送技术是目前个性化信息服务中应用较多的一种智能化信息代理技术。它根据用户定义的准则,自动搜集用户最感兴趣的信息,并适时推送给用户,使用户不必每次访问固定的网站就可以获得由网站发布的最新信息。提高了用户获取信息的效率。用户在电子政务系统中设置个人定制信息,电子政务系统根据定制关键词自动提取相关内容,定期将更新的内容以电子邮件或频道形式推送给用户。推送服务打破了传统的信息获取方式,减少了用户上网搜索的工作量,将个性化的信息直接送给用户,是电子政务主动提供个性化信息服务的重要手段。

4.3 个性化信息推荐服务

个性化信息推荐是指通过对用户信息的过滤和挖掘,了解用户的需求和兴趣,实时、个性化的为用户推荐相关信息和服务。在电子政务中即是为不同用户推荐不同的政务信息和服务。与推送服务不同的是,推荐服务不以用户提交定制信息为前提,而是基于通过知识发现得出的用户个性化信息需求。用户不一定要提交定制信息,系统借助知识发现技术自动为用户提供其可能需要的信息和服务。

4.4 个性化信息检索服务

个性化信息检索是指能为具有不同信息需求的用户提供个性化检索结果的技术,即对不同用户提交的同一查询词语也能按照不同的用户需求而生成不同的检索结果。个性化信息检索有助于解决目前的搜索引擎系统中存在的检索准确率低、结果冗余严重、信息获取成本高等问题。运用知识发现技术,跟踪记录用户检索行为,挖掘用户偏好和特征信息,为用户提供个性化的信息检索服务。

随着网络环境和信息技术的不断发展,用户特定信息需求与海量信息之间的矛盾日益突出,只有个性化的信息服务方式才能解决这一矛盾。电子政务个性化信息服务是电子政务的主要发展趋势之一。将知识发现技术应用于用户个性化信息的获取,为电子政务开展个性化信息服务提供依据。但目前还存在一些问题,例如如何动态捕捉用户需求的变化以及如何处理基于知识发现的电子政务系统的复杂性与用户易用性之间的关系,这都是今后研究的重要方向。

[1]史海燕.基于知识发现的数字图书馆个性化信息服务研究.图书馆学研究,2010(19):36-43

[2]董慧.个性化信息服务关键技术研究,2009年信息化与信息资源管理学术研讨会论文集:176-182

[3]杜春光.个性化信息服务的模式研究及策略分析.国家图书馆学刊,2005(02):63-66

[4]胡昌平.个性化服务中的信息资源重组与整合平台构建.情报科学,2006(02):161-165

[5]段尧清.个性化电子政务信息服务模式.情报杂志,2007(06):9-14

[6]李菲.基于数据挖掘的电子政务个性化推荐服务框架研究.商业时代,2010(25):47-48

[7]周杨姊.基于知识发现的数字图书馆个性化信息服务.中国成人教育,2010(17):61-62

[8]邓立恒.基于网络的个性化信息服务研究.科技情报开发与经济,2009(07):17-18

[9]李树青.个性化信息检索技术综述.情报理论与实践,2009(05):107-113

猜你喜欢

电子政务数据挖掘个性化
探讨人工智能与数据挖掘发展趋势
论基于云的电子政务服务平台构建
坚持个性化的写作
新闻的个性化写作
基于并行计算的大数据挖掘在电网中的应用
上汽大通:C2B个性化定制未来
电子政务工程项目绩效评价研究
一种基于Hadoop的大数据挖掘云服务及应用
中国电子政务的“短板”
满足群众的个性化需求