APP下载

改进的RSS信息推送技术在农地流转中的应用

2016-01-11关茜,岳建伟,刘方

遥感信息 2015年1期
关键词:行政区农地用户

改进的RSS信息推送技术在农地流转中的应用

关茜1,岳建伟1,刘方1,陈云浩1,宫阿都2

(1.北京师范大学 资源学院,北京 100875;2.北京师范大学 环境演变与自然灾害教育部重点实验室,北京 100875)

摘要:我国农地流转过程存在双方沟通不畅、信息不对称等问题,建立合理有效的信息沟通机制是解决当前农地生产要素合理流动和优化配置的有效途径之一。本文在分析农地流转信息推送特征的基础上,提出将RSS信息技术应用到农地流转信息推送领域,并探讨在RSS信息推送模型中引入地名匹配步骤,进一步提高农地流转信息推送的查全率、查准率和综合分类率。

关键词:农地流转;信息推送;RSS;地名匹配

Improved RSS Information Push Technology in

Transfer of Agricultural Land

GUAN Xi1,YUE Jian-wei1,LIU Fang1,CHEN Yun-hao1,GONG A-du2

(1.CollegeofResourcesScience&Technology,BeijingNormalUniversity,Beijing100875;

2.KeyLaboratoryofEarthSurfaceProcessesandResourceEcology,BeijingNormalUniversity,Beijing100875)

Abstract:There is miscommunication and information asymmetry problem in agricultural land transfer process.Creating a reasonable and effective information communication method is one of the effective means to solve the reasonable flowing and optimized configuration of current agricultural production factors.Based on the analysis of the rural land information push feature,this article proposed applying RSS push technology to the agricultural land transfer area and discussed introducing the place name matching step into the RSS information push model,which can further improve the recall,precision and comprehensive classification rate of the information push process.

Key words:rural land transfer;information push;RSS;place name match

1引言

近年来,我国农地流转活动愈发频繁,渐具规模。农户与农户之间沟通不畅,缺乏切实有效的沟通机制,已成为影响农地流转效率和规模的重要因素之一。政府作为农户之间重要的沟通桥梁,主动式的信息服务能力不足,如何从农民被动寻找信息转变为主动向农民推送信息,已成为农村信息化建设的一个重要发展方向[1]。简易信息聚合(Really Simple Syndication,RSS)是一种简单XML格式,用于为内容整合客户端提供选择性的、汇总过的Web内容[2]。RSS技术凭借实时、高效、安全、低成本的特点,成为众多领域不可缺少的新技术[1]。目前,已有研究探讨RSS技术在农业信息化领域中的应用[1,3-4],但是针对农地流转领域的研究尚未多见。本文研究将RSS技术应用到农地流转领域,解决农户间沟通不畅问题,为相关政府部门提供主动式的信息服务机制提供参考。

2基于RSS的农地流转信息推送技术分析

2.1RSS信息推送技术

RSS是一种用于共享新闻及其他Web信息的数据交换规范,起源于网景的“推技术”,是一种基于XML的Syndication技术,是在互联网上被广泛采用的内容包装和投递协议[5]。目前国内外许多网站都提供了RSS信息服务。RSS信息推送技术模型如图1所示[6]。

RSS将网站看作一系列频道(Channels)的集合,各个频道又包含一系列资源(Items),因此通过对频道及所含资源的描述可实现对作为资源整合网站的描述[7]。利用RSS元素描述的网站内容汇总文件称之为一个RSS Feed。RSS Feed是遵从一定规范的标准XML文件,当前应用最广泛的是RSS 2.0规范[8]。RSS Feed由网站生成,再由客户端通过内容整合使用。

2.2农地流转信息推送对象

农地流转信息推送对象可以分为买方、卖方和组织管理者三类。买方着重关心农地转出信息,卖方对农地需求信息更加关心,组织管理者则对流转的最新动态、流转政策法规等信息较为关心。通过对实验区内信息接收对象进行走访调研,发现信息接收对象在筛选接收到的流转信息时具有明显的“地缘性”倾向,比如位于重庆市长寿区的信息接收用户,会对位于长寿区的流转信息进行进一步的查阅,而对位于不相邻行政区的流转信息则不再查阅,产生这种现象的主要原因是信息接收用户出于对交通、成本、家庭等因素的考虑,不愿选择在地理位置上偏远的流转地块。因此,信息接收用户的“地缘性”倾向可以作为提供信息推送个性化服务的方向。

通过对目前国内较为成熟的农地流转信息网站发布的信息(农地转入转出信息)进行统计,发现农地流转信息包含具有共性的内容:流转面积(亩)、流转价格(亩-1·年-1)、流转地块的位置、土地类型、流转形式(转包、代耕、出租、转让、入股等)、联系人以及联系方式,说明这些内容应作为信息推送的主体信息。

2.3基于RSS的农地流转信息推送机制分析

基于RSS的农地流转信息推送机制的一般思路是政府将农地流转网站中发布的信息根据频道分类(农地转入信息、农地转出信息等频道)后,打包成分门别类的RSS Feed。手机等客户端根据需求,接收并解析感兴趣类别的RSS Feed,从而实现分类别的农地流转信息的浏览;系统根据用户浏览行为的反馈,建立用户兴趣模型,将用户可能感兴趣的信息推送给用户。推送机制如图2所示。

图2 基于RSS的农地流转信息推送机制

在此,关注的农地流转仅限于农用地的流转,即农用地承包经营权的流转。农地流转信息即是指农用地承包经营权在流转的过程产生的信息流实体,具有内容共同性、空间位置信息重要性、时效性等特点。转入转出信息普遍包含对农用地的共同属性的描述;农地流转的结果造成转入方因行使农地的使用权而在空间位置上产生移动,转入方出于成本考虑显示出对转入农地空间位置的关心;农地流转信息随供需变化不断更新,因而具有时效性。农地流转信息推送对象可以分为买方、卖方和组织管理者三类。不同的信息推送对象关注不同内容的农地流转信息,买方关心农地转出信息,卖方对农地需求信息更加关心,组织管理者则对流转的最新动态等单方面或多方面的信息较为关心。通常信息推送对象对农地流转信息的时效性要求较高,对流转信息中地名信息关注度高。

基于RSS的信息推送机制由于只涉及到信息分类过程,每个类别中仍包含部分或大量用户并不关心的信息,因而信息冗余程度仍较高,用户个性化程度差;信息推荐时,兴趣模型忽略了用户对地名信息的关注度,没有考虑到信息推荐的地域性差异。在此基础上,本文提出添加地名匹配步骤的农地流转信息推送机制:①改进RSS信息推送模型。在原有RSS信息推送模型的基础上,添加地名匹配步骤,筛选出用户感兴趣的行政区范围内的农地流转信息。②改进个性化用户兴趣模型。在原有的RSS三层兴趣模型的基础上,添加地名匹配步骤,进一步提高推荐信息的准确度。

3考虑地名匹配的RSS农地流转信息推送技术研究

3.1基于RSS和地名匹配的农地流转信息推送流程设计

由于地名信息是土地流转信息中非常重要的一部分,大多数用户会通过地名来寻找土地。而且地名之间存在包含与被包含的空间关系,所以在进行土地流转信息推送时要着重关注地名信息。地名匹配即将地名与基准行政区划数据库中的地名属性做比较,找到其对应的行政区划编码,根据编码规则判断是否含有下级行政区划。如果含有,则返回下级行政区划名,并根据这些行政区划名排除干扰信息的过程。若对一组地名进行匹配分析,则找到对应行政区划编码后选取较小行政区域的行政区划编码进行判断。

图3 基于RSS和地名匹配的农地流转信息推送机制

3.2考虑地名匹配的RSS信息推送模型

农地流转信息具有内容共同性,其中地名信息是必不可少的属性之一。将地名匹配步骤纳入到RSS信息推送模型研究的基本思想是在各个类别的农地流转信息中添加必要的地名信息,并生成包含地名信息的RSS Feed文件。用户订阅某些类别的农地流转信息时指明所关心的行政区范围。系统在该类别的农地流转信息RSS Feed中,通过地名匹配步骤筛选出包含用户订阅的行政区范围下地名信息的信息条目,将这些信息条目推送给用户。信息推送模型如图4所示。

图4 考虑地名匹配的RSS信息推送模型

3.3顾及空间位置邻近的RSS用户兴趣模型改进

通过地名匹配步骤可以严格地筛选出某一行政区范围内的信息条目,但存在其他情况比如某一用户身处行政区交界处附近,该用户除了关心自身所在行政区内的信息,也比较关心相邻行政区的农地流转信息。考虑到这种情况,研究考虑空间位置邻近的RSS用户兴趣模型,将潜在的用户可能感兴趣的信息主动推送给用户。该模型的基本思想是在原有的RSS 3层用户兴趣模型的基础上,引入地名数据层,构成基于RSS数据源的4层用户模型结构,在原关键词权重TF-IDF算法中添加地理空间邻近度因子,对地名关键词根据空间位置关系计算权重,地名关键词权重与空间邻近度成正相关关系,从而实现考虑空间位置邻近的用户兴趣信息推荐,模型如图5所示。

图5 顾及空间位置邻近的RSS用户兴趣模型

关键词原基于RSS数据源的用户兴趣模型权重TF-IDF算法[9]:

(1)

关键词其中,ni,j是该在文件dj中的出现次数,关键词就是将文件dj文本分词后,剔除其中对于用户兴趣建模无意义的词(感叹词、介词、连词、象声词和助词等)之后剩下的词[4],分母则是在文件dj中所有关键词的出现次数之和。考虑到关键词出现的位置,如式(2)所示。

TF=∂×ptitle+β×pdes+γ×ptext

(2)

摘要式中,∂、β、γ分别表示关键词出现在标题、和信息体原文中的频率;ptitle、pdes、ptext分别表示关键词为标题、摘要和信息体原文的权重值,为大于0小于1的参数值[10]。

(3)

TFIDFi,j=TFi,j×IDFi

(4)

转入和转出地块信息包含共同的关键信息地块所在行政区域、地块面积、地块价格和土地利用类型。提取上述4个关键词作为农地转入用户和农地转出用户的兴趣信息模型关键词。组织管理者依照个人需要可能对农地转入、农地转出、交易动态、法律法规等一个类别或多个类别感兴趣,使用行政区区域关键词构建用户兴趣信息模型。进行分词时,构建行政区域、地块面积、地块价格和土地类型词库样本,准确提取上述4类信息,并对4类关键词赋予较高的权重值,对于行政区域关键词,还需要在原权重值的基础上考虑空间邻近度因子。考虑空间位置邻近的关键词权重TF-IDF算法。

TFIDFi,j=TFi,j×IDFi×Q(z)

(5)

关键词式(5)中,Q(z)为分段函数,Q(z)=1时表示行政区和用户订阅的行政区相同,否则根据行政区与毗邻情况逐级递减。表1为重庆市部分区县间的空间临近度因子。

表1 重庆市部分区县间的空间临近度因子

关键词在初始阶段,系统根据用户的类别按照上述用户兴趣信息模型提取,计算关键词的权重并将相关信息推送给用户。通过用户浏览反馈积累一定数量的用户兴趣样本后,可以对某个用户的兴趣数据进行TF-IDF关键词权重计算,得到该用户感兴趣的其他关键词加入该用户的兴趣信息关键词模型,从而更新该用户兴趣信息关键词模型。

4模型验证

本文以重庆市为例,建立农地流转网站,在网站中设置农地转入、农地转出、最新动态、政策法规4个频道,在每个频道下面录入包含地名信息的信息体,并给每一个频道发布添加地名匹配步骤的RSS服务。开发基于Android的RSS客户端软件,在软件登录时,模拟买方、卖方和组织管理者3类用户,分别订阅农地转出信息(A)、农地转入信息(B)和最新动态信息(C)3类信息,并假定3类用户关心的行政区范围为重庆市长寿区。采用信息获取中的监测评估标准查准率(Rprecision)、召回率(Rrecall)和F1综合分类率进行模型验证。查准率、召回率和F1测试值的计算公式如下:

(6)

(7)

(8)

式中,m为系统推送的相关信息体数目,l为系统总的推送的信息体数目,n为所有相关的信息体数目。

经实验,改进前后的RSS信息推送及推荐模型的实验结果比对见表2(表中以斜线分隔改进前后的结果)。

表2 改进的RSS信息推送及推荐模型测试结果前后对比

关键词注:实验中,式(2)的∂、β、γ均设为1,即不考虑出现位置的影响。

doi:10.3969/j.issn.1000-3177.2015.01.022

中图分类号:TP274文献标识码:A

收稿日期:2013-12-09修订日期:2014-02-19

基金项目:福建省科技计划重点项目(2014Y0032);福建省自然科学

作者简介:贺晓晖(1989~),女,硕士研究生,研究方向为空间分析及空间决策支持系统。

通讯作者:陈楠(1975~),男,副研究员,博士,研究方向为地理信息建模与分析技术。

原RSS信息推送模型只是粗略地对信息类别提供定制和聚合,并没有对信息内容提供进一步的筛选和过滤,信息推荐时也没有根据信息推送对象建立用户兴趣信息模型。由实验结果可以看出其应用于农地流转信息推送领域存在了大量的信息冗余,信息的查全率、查准率和综合分类率不高;在原RSS信息推送模型中添加地名匹配步骤,在类别定制的基础上添加对信息内容体的地名匹配过滤,筛选出用户真正感兴趣的数据,并通过提取用户兴趣关键词的用户兴趣推荐模型对推送信息进行补充,应用于农地流转领域得到了较好的查全率、查准率和综合分类率,说明添加地名匹配步骤的信息推送模型改进是可行的。

5结束语

本文利用RSS技术在信息推送方式上的动态性、时效性等特点,将其应用到农地流转信息推送领域,并引入地名匹配技术弥补RSS技术个性化服务不足的缺点,具有一定的现实意义。实验表明,改进后的信息推送模型相比原始模型提高了信息推送准确度,同时保证了一定的信息召回率。目前模型正处于理论验证阶段,还存在很多问题:①使用其他算法计算空间临近度因子,比如坐标计算等进一步提高临近度因子的合理性;②获取更合理的TF-IDF值,根据关键词出现在标题、摘要和正文中的位置设置不同权重、考虑用户长短期兴趣的影响以及提高分词结果的准确度进一步提高TF-IDF的计算结果准确度;③用户兴趣信息关键词的权值对结果影响较大,参数设定问题是今后研究的重点。

参考文献:

[1]曾慧敏,阳卫文.RSS信息推送技术在农村信息化中的应用[J].新农村建设,2010,(7):21-24.

[2]周艳,陈永健.基于RSS技术的信息发布系统设计与实现[J].北京联合大学学报(自然科学版),2008,22(4):40-43.

[3]王政嘉,李征,王健.基于RSS技术的移动化农业信息服务系统研究[J].河北农业科学,2011,16(1):99-102.

[4]郭立军,朱群雄.基于RSS数据源的用户兴趣模型改进及应用[J].北京化工大学学报(自然科学版),2011,38(1):125-129.

[5]彭召波,武友新,冯豫华.RSS技术在信息发布系统中的应用研究[J].计算机与现代化,2006,(9):67-69,80.

[6]于金海,郭军成.基于RSS的图书馆网络信息推送服务[J].科技情报开发与经济,2007,17 (29):38-39.

[7]袁勇智.基于RSS的Web信息发布和集成技术[J].现代图书情报技术,2004,(2):60-62.

[8]Berkman Center for Internet & Society at Harvard Law School.WIncr D.RSS 2.0 Specification[EB/OL].http://blogs/law.harvard.edu/tech/rss,2006-10-09.

[9]方延风.科技项目查重中特征词TF-IDF值计算方法的改进[J].情报探索,2012,(1):1-3.

[10]王平,朱明.基于RSS信息源建模与更新[J].计算机仿真,2005,22(12):45-48.

E-mail:395400558@qq.com

E-mail:fjcn99@qq.com

猜你喜欢

行政区农地用户
京字头
农地细碎化对农地流转的影响
农村土地流转问题及对策研究
上榜派出所统计表
上榜派出所统计表
小田变大田破解农地零碎化
关注用户
关注用户
关注用户
当前农地产权与流转制度改革研究