APP下载

基于用户兴趣模型的个性化农业信息推送系统

2015-10-20于辉辉屠星月郭承坤

江苏农业科学 2015年9期

于辉辉++屠星月++郭承坤

摘要:为解决我国农业信息服务平台利用率低、农民自主获取信息能力差的问题,本研究在对农业信息化技术发展现状和农户的实际需求分析的基础上,构建了农户兴趣模型,利用信息推送技术设计实现了个性化农业信息推送系统。该系统可构建动态用户兴趣模型并对其实时更新,实现了有效、准确的农业信息推送。

关键词:农业信息;用户兴趣模型;信息推送技术

中图分类号: S126文献标志码: A文章编号:1002-1302(2015)09-0458-03

农业信息化是发展现代农业的动力引擎,而相比于发达国家农业信息化程度,我国农业信息化的发展还相对落后[1]。近年来我国农业和农村经济虽发展迅速,但由于我国农民的知识水平普遍较低使得实现农业全面信息化仍是一项相当艰巨的任务。其中,如何使得从事农业的人员及时获得有效可靠的农业信息是实现农业信息化的重要内容之一[2]。传统的农业信息服务方式已经不能满足农户、农商等从事农业人员对信息的需求。因此,部分传统的农业信息服务诸如信息中心、图书馆、资料室等,必须革新其信息服务方式,充分利用当前先进的信息传播技术实现高效率、高质量的信息服务[3]。与此同时,随着Internet技术的发展,网络上的信息资源呈指数增长,其膨胀趋势日益增多,但采用Internet信息浏览方式获取信息效率低且准确性差,且由于农业从业人员尤其是广大的农民受物质条件和自身科技文化水平的限制,获取信息等能力较弱。因此,如何使用户识别信息、及时获得信息服务是当前农业信息服务面临的实际需求[4]。推送技术是一种新的信息服务模型,根据用户的特定需求,对其搜索的信息进行过滤、处理、分类之后提供个性化的信息服务[5]。推送技术可充分利用已有的信息资源,主动开展信息推送服务,为农业相关人员及时提供市场供需信息、病虫害防治信息、气象信息推送等,进一步深化农业信息化进程[6]。针对如上的问题,本研究构建了农户兴趣模型,利用Web Services技术和信息推送设计实现了个性化农业信息推送系统,该系统可将信息服务提升到知识服务,以便广大农民或从事与农业相关职业的人员实时有效地获得所需的农业科技信息,以此提高我国农业信息服务的水平。

1系统需求分析

个性化农业信息服务的系统主要解决“信息获取”“信息推送”“信息应用”这3个问题,即获取什么信息推送给用户,获取的信息如何推送给用户,推送的信息服务于谁的问题[7-8]。解决这些问题首先需要了解农户的需求,然后采用信息检索技术获取所需数据,最终根据用户的需求将获取的信息利用推送技术推送给用户。农村信息服务的主体对象主要包括广大农民、农村基层农业技术人员、农村党员干部、大学生村干部、农业企业、农业经纪人、种养大户、回乡创业者和农业科技园区管理者等,可见农业经营的群体规模十分巨大[8]。目前,大多数农业从业人员的科技文化素质还不高,但他们对信息和知识的需求十分迫切。为了实现信息的准确推送,需要根据用户的需求实现对用户分类即建立用户兴趣模型,满足不同用户对信息的需求[9]。通过需求分析确定了本系统主体架构与流程,如图1所示:系统基于B/S架构进行设计,客户端用户通过浏览器访问站点资源,同时系统通过浏览器和注册信息建立用户兴趣模型。服务器端是推送系统的主要部分,首先服务器端定时从网站采集关于农业的信息资源,存入数据库;同时服务器需采集站点的访问日志并依据技术要求对日志进行处理,建立用户访问模式并结合用户访问网页内容建立用户访问模式描述文件,构建用户兴趣模型库。

2用户兴趣模型

用户兴趣模型是农业信息服务系统个性化信息推送的重要依据,即根据系统获得的用户信息构建用于表示用户个性化需求的模型。目前建立用户兴趣模型的方法多种,如用户信息抽取、用户信息反馈,通常采用多种方式组合的方法进行用户模型构建。图2为本系统的用户兴趣模型构建方法,系统主要采用用户信息抽取(注册、浏览行为、浏览内容等)和用户信息反馈2种方法组合对用户模型进行构建,弥补了仅采用注册信息建立模型不可更新的缺点,并通过用户信息反馈针对性地修改用户兴趣模型,从而建立一个相对全面准确的用户兴趣模型,为农业信息的准确推送奠定基础。

2.1用户信息抽取与反馈

用户兴趣模型初建时提取用户的注册信息,形成用户的初步兴趣库并将提取的信息按照规则存入后台用户兴趣数据库中。由于根据用户注册信息初步构建的模型过于简单,且简单关健词筛选机制容易造成信息的准确性差问题,因此需根据辅助信息(浏览行为、浏览内容等)对用户的模型进行修改。同时,为更准确地表达用户的信息需求,采用用户反馈的方法,即引入用户的兴趣偏好对建立的兴趣模型及时进行修改。

2.2三元组用户兴趣表达

利用三元组实现用户兴趣表达。农业网络信息分类比较简单明确,可以利用关键词对信息进行分类,因此用Keyword表示关键词组向量,用Person表示用户分类,即用表示了用户对信息的需求。为得到更加准确的兴趣模型,采用了用户反馈的方式对该模型进行实时修改。其中用户反馈信息用Situation表示,该特征是用户对所收到的推送信息给予的主观评价,表示了用户的兴趣度。最终将用户兴趣模型定义为一个三元组:。其中Keyword的定义如下:Keyword=,其中R表示关键词之间的逻辑与、或、非关系。Person为上述的用户所期待的目标分类,使用1,2,3,…,n表示分类代号。Situation对应于用户对信息的反馈评价,将situation根据用户对信息的兴趣度按照从高到低的顺序分成5类:很好、好、一般、差、很差,在数据库中分别用数字5、4、3、2、1来表示信息的权值。

2.3用户兴趣模型构建流程

随着用户查询次数和反馈次数的增多,将形成大量的三元组合,对其进一步挖掘,即可构建用户兴趣模型。当用户收到系统推送过来的信息并给出相应的评价后,推送给用户的来自Person(类)含有Keyword(关键词)的信息将属于一个特定的Situation。这样经过用户与系统的反复交互过程,每个Situation都有1个对应于一系列三元向量的词典。初期,词典为空,每收到用户1次反馈信息,都根据对应的Person和Keyword更新对应的Situation词典。若相应的第1次出现,则将它记录到词典中,若词典中有该二元向量,则将它的数量传到词典中。由此,将用户接收的来自某一个category含Keyword的信息表示为1个的三元组,每个用户的兴趣都可以描述成多个这样的三元组。每个对应1个Situation,Situation可等于5个不同的值,每个Situation都有1个词典。这几个概念以及实际的数据结构组成了表示用户对特定信息的感兴趣程度,据此建立相应的用户兴趣模裂,如图2所示。由于用户的兴趣、知识等会随时间变化而变化,因而建立的用户兴趣模型也要随之变化。用户兴趣模块会根据每一条用户反馈更新对应的Situation词典,这样就能及时地更新、完善系统对用户兴趣的理解。

3系统设计

3.1系统架构

系统的总体架构如图3所示。它主要由服务层、网络层和应用层3部分构成,其中服务层由服务器和中间服务器构成,网络层中数据与信息可通过Internet、3G/WLAN等网络传输。服务层包括农业信息数据库和农业数据仓库,主要信息来自于与农业信息相关的互联网;中间服务器可自动利用Heritrix框架进行特定农业信息的收集,并结合基于Web的数据挖掘技术获取农民直接关心的最新的农业科技信息、市场供求信息、国家政策信息、市场行情等;应用层中的手机客户端是面向android智能手机用户而开发的应用,主要功能包括两大部分,一是农业信息浏览查询;二是农产品供需信息发布。

3.2系统功能模块设计

系统的服务对象主要为涉农人员,例如农民、农产品贸易人员、农技人员、农业科研人员等。系统的目标是针对这些用户的需求,根据用户兴趣模型,定时为农户提供最新农业信息。本系统中信息源主要来自农业综合信息服务平台,所有的农业信息都来自该平台的数据库。系统的功能模块如图4所示:

(1)用户管理模块:用户管理模块对用户信息进行管理,该模块重点实现用户兴趣模型的构建。该模块可抽取用户的注册信息、浏览信息、反馈信息等存入到数据库中,根据兴趣模型的构建方法构建兴趣模型。因此,该模块是系统重要的组成部分,是实现个性化农业信息推送的关键环节之一。

(2)信息采集模块:信息采集模块从农业综合信息服务平台上获取农业科技信息、市场供求信息、国家政策信息、市场行情等农业信息。

(3)信息推送模块:信息推送模块主要包括RSS(really simple syndication,简易信息聚合,也叫聚合内容)信息发布功能、邮件推送功能、短信推送功能。RSS信息发布功能是负责将采集的信息资源进行再组织,使信息资源符合RSS规范再发布,以便供用户使用。邮件推送功能和短信推送功能是系统的最终目的,是根据用户需求选择的服务方式。

(4)后台管理模块:后台管理模块主要对后台的数据库、系统参数及用户的权限等功能进行管理。

3.3系统流程设计

系统的流程设计如图5所示。首先用户注册登录,该步骤可以获得用户的原始信息;然后根据用户的浏览信息、反馈信息等构建用户的兴趣模型;最后,系统将获得的农业信息根据用户兴趣模型,以RSS信息、邮件及短信的方式推送农业信息服务。

3.4关键技术

本系统中涉及的关键技术包括RSS信息发布、信息推送等,具体如下:

(1)RSS信息发布技术:RSS为一种新的推送技术,获得了广泛的应用,并极大地推动了信息服务的发展。RSS信息推送服务的原理为:内容提供者提供RSS feed并根据内容的变化实时更新RSS feed,用户借助RSS阅读器把RSS feed的URL地址添加到阅读器中,定时同步RSS feed的信息即可阅读,同时也可以根据自己的需求进行订阅服务。

(2)信息推送技术:信息推送主要是短信推送和邮件推送。短信推送是该系统的首要设计,该推送技术是继广播、报纸、电视和网络四大媒体之后的一种新兴的大众传播媒体,业内人士称之为第五媒体。由于手机短信具有接收简单、价格低廉、覆盖面广等优势得到了农民广泛的应用。邮件推送则是以E-mail推送的方式,是最简单也是目前应用最广泛的一种推送方式。随着网络的日益普及,电子邮件已经成为人们交流的一种常用工具和人们获取信息的一种重要手段。

4结束语

将传统网络环境下的农业信息推送和信息服务扩展到农业知识推送和知识服务,是农村信息服务的必然趋势和发展方向。本研究在Web Service开发平台的基础上,构建了三元组用户兴趣模型,结合RSS发布技术、信息推送技术、数据库技术等分析研究了个性化农业信息推送系统。该系统可构建动态用户兴趣模型并对其实时更新,有效、准确地实现了农业信息推送。通过本系统,用户可以随时随地通过手机学习和了解感兴趣的最新农业科技信息,也可对农产品的需求、价格等信息进行发布与收集,还可实现物流配送往来的信息交流,最终解决农业信息推送和农产品流通难题,提高农民在市场中的竞争力,增加农民收入。

参考文献:

[1]陈威,郭书普. 中国农业信息化技术发展现状及存在的问题[J]. 农业工程学报,2013(22):196-205.

[2]孙艳梅,谭峰. 农业信息化发展的意义与对策[J]. 农民致富之友,2013(13):122-122.

[3]李期位. 农业信息智能推送技术的研究与实现[D]. 北京:中国农业科学院,2006.

[4]戴起伟,董钊,曹静,等. 面向农村社区的信息推送服务平台技术设计与应用[J]. 科技与经济,2009,22(4):49-52.

[5]綦科,谢冬青. 基于内容的短信分类系统的设计与实现[J]. 广州大学学报:自然科学版,2011,10(5):43-47.

[6]孙小华,王福顺,杨会英,等. 基于智能手机的农业信息服务系统研究[J]. 科技和产业,2013,13(6):33-36.

[7]沈典. 基于信息推送的领域垂直搜索引擎研究[J]. 电子世界,2012(8):86-87.

[8]李志芳,冯秀芳,赵红旗. 基于用户兴趣模型的信息推送系统研究[J]. 太原理工大学学报,2011,42(5):503-505,509.

[9]崔新强,郭雪梅,唐俊,等. 基于短信方式的农业个性化气象服务探索与实践[J]. 湖北农业科学,2012,51(20):4506-4509.杨欣,颜伟,朱银,等. 江苏省农业种质资源平台办公室信息管理系统的设计研究[J]. 江苏农业科学,2015,43(9):461-463.