APP下载

基于物元分析的遥感影像查询多属性决策模型

2016-05-25霞,周艳,杨

地理与地理信息科学 2016年2期
关键词:数据项物元关联度

杨 晓 霞,周 艳,杨 容 浩

(1.成都理工大学地球科学学院,四川 成都 610059;2.四川省应急测绘与防灾减灾工程技术研究中心,四川 成都 610041;3.国土资源部地学空间信息技术重点实验室,四川 成都 610059;4.电子科技大学资源与环境学院,四川 成都 611731)

基于物元分析的遥感影像查询多属性决策模型

杨 晓 霞1,2,3,周 艳4,杨 容 浩1,2,3

(1.成都理工大学地球科学学院,四川 成都 610059;2.四川省应急测绘与防灾减灾工程技术研究中心,四川 成都 610041;3.国土资源部地学空间信息技术重点实验室,四川 成都 610059;4.电子科技大学资源与环境学院,四川 成都 611731)

通过构建物元模型将遥感影像的查询问题转化为多属性决策问题。设计了基于拓扑和度量关系相结合的关联函数,定量评价遥感影像各属性与用户需求的关联度;利用熵权法确定权重反映用户兴趣在遥感影像元数据项上的侧重,从而得到个性化的评价结果。实例评价结果证明了该方法的合理性与可行性。

遥感影像查询;多属性决策;物元模型

0 引言

随着遥感技术的发展,遥感数据呈现出明显的大数据特征,遥感影像日益多元化,影像数据量呈指数级增长;数据获取的速度加快,更新周期缩短,时效性越来越强[1]。然而,遥感资源和用户迅速增加的同时,也出现了“信息过载”问题[2],用户很难准确获得所需的信息,信息利用率反而下降。现有的遥感数据共享平台大多提供若干查询条件,然后返回查询结果由用户浏览下载,但用户对查询结果的满意度普遍较低。原因在于:1)遥感影像具有多源、多维、多尺度、多时态特征,需要在多个属性上对用户需求的满足程度进行综合评价;2)缺少个性化机制,对于不同用户提供的相同查询条件,系统都返回相同的结果。解决上述问题的途径在于进一步提升查询结果的准确率和个性化,需要解决以下难题:1)多属性的遥感影像对用户需求满足程度的定量综合评价;2)反映用户差异的个性化信息的获取与应用。

遥感影像不同于普通的文本数据或网页信息,不仅具有空间特征、空间关系特征、非结构化特征等,还表现为多尺度、多时态特征,因此,现有的面向文档和网页的个性化搜索方法[3,4]并不能很好应用于遥感影像。遥感影像元数据用于描述数据集的内容、质量、表示方式、空间参考、管理方式及其他特征信息。目前遥感数据共享平台对遥感影像的查询往往通过对元数据的查询来完成,查询条件主要包括:空间范围、时间范围、频谱范围、空间分辨率范围、传感器类型等。在OGIS、SQL3等空间查询的标准中,针对空间问题的查询操作可以归纳为几何操作、拓扑操作、空间分析操作3类[5],通过从距离关系、方向关系、拓扑关系及空间关系相似性等方面进行分析,可以针对用户需求得到相关区域的空间数据[6-9]。遥感影像的查询结果由空间范围、时间、频谱、分辨率等多个属性共同决定,因此,遥感影像查询可以转化为多属性决策问题,解决方法有传统的TOPSIS方法[10]、改进的TOPSIS方法[11]、集对分析法[12]等,目前已在城市交通、水环境质量评价等方面得到广泛应用。

本文通过构建物元模型将遥感影像的查询问题转化为多属性决策问题。将查询条件中涉及的核心元数据以区间数的形式表达:空间范围以面的形式表达,频谱范围以线的形式表达,成像时间、分辨率等以点的形式表达。采用物元分析方法建立遥感影像物元模型,设计了基于拓扑和度量相结合的关联函数定量计算遥感影像与用户需求的关联度。根据用户查询历史数据,采用熵权法确定各核心元数据的权重,反映用户兴趣在遥感影像各元数据项上的侧重。最后,利用上述关联度和权重计算效用度,实现对查询结果的个性化定量评价,从而使不同用户查询后得到最符合自己需求的排序结果。

1 多属性决策问题描述

多属性决策是利用一定的函数关系对有限个备选方案在有限个决策属性下的信息值进行综合集成,进而对方案进行排序和择优的过程[13]。若将用户需求作为理想方案,将遥感影像查询初选结果数据集A={a1,a2,…,am}作为备选方案集,将元数据项X={x1,x2,…,xn}作为决策属性集,则矩阵Y=(yij)m×n表示m个备选方案对n个决策属性的决策矩阵。从决策理论的角度看,效用度是指备选方案与理想方案的相对贴近程度,通常效用度越大说明该方案越接近理想方案,越能满足用户需求[13]。本文依据效用度的大小对所有备选方案进行排序择优,以确定最终的查询结果列表次序。效用度计算公式如下:

(1)

式中:zij为第i个备选方案ai与理想方案在第j个元数据项xj上的关联度,wj为 xj的权重,ai的效用度ui即为各个元数据项关联度的加权和。

可见,解决问题的关键在于对备选方案在各个元数据项上关联度的定量评价与权重的确定。

2 遥感影像多属性决策物元模型

物元分析法是一种多元数据量化决策的新方法,适合于多因子、多属性的评价问题[14]。遥感影像多属性决策物元模型的建模思路为:首先根据用户提出的查询条件建立理想物元,然后将查询初选结果作为备选方案并构建多维物元,设计关联函数计算出备选物元与理想物元的关联度,最后通过计算效用度对各方案进行排序并确定最优结果。

2.1 遥感影像物元模型

物元指描述事物的基本元,它可以用三元组R=(N,c,v)表示,其中N表示事物,c表示特征的名称,v表示N关于c所取的量值,这三者称为物元的三要素。若一个事物由多个特征元组成,则用n维物元描述[14],物元模型的一般形式如下。

(2)

(3)

式中:yi代表ai的物元模型,xj为决策属性的第j个元数据项,yij为ai在xj上的区间范围。

2.2 理想物元

理想物元R*是各属性值均达到最优值构成的物元,一般形式如下:

(4)

2.3 设计关联函数计算关联度

由于遥感影像各个元数据的含义不同,不同元数据项属性值的计算方法也不同,使得物元模型各个特征的量纲各异。为使评价结果具有公度性,本文通过构造关联函数将各属性进行标准化处理。

常用的关联度评价标准有距离和夹角余弦,但是这两类标准更适合于衡量单点之间的关联度。然而衡量遥感影像是否满足用户需求的标准在于是否包含或者重叠了用户查询范围,而不是距离上的接近。本文设计了关联函数,基于拓扑与度量关系分析对备选物元与理想物元的关联度进行定量评价。

(5)

式中:zi1代表yi1与r1的关联度,yi1∩r1为yi1与r1的重叠区间。

表1 r2与yi2在二维区间上的拓扑关系Table 1 The topological relationship between r2and yi2

根据拓扑关系,设计二维区间的关联函数如下:

(6)

式中:zi2代表yi2与r2的关联度,area()为求面积的函数。

考虑到地球是一个近似的旋转椭球体,因此由两条子午线(经线)和两条平行圈(纬线)围成的椭球表面是一个椭球面梯形,其面积的计算公式如下[16]:

(7)

式中: L1和L2为经度范围,B1和B2为纬度范围;b和e2为椭球元素值,因我国1980年国家大地坐标系采用1975年国际椭球,其参考椭球在我国境内与大地水准面最为密合,故采纳1975年椭球元素值,b=6 356 755.2881575287m和e2=0.006694384999588。

(8)

3 挖掘用户兴趣确定权重

用户兴趣隐藏于检索历史中,检索频率越高的元数据项对于用户兴趣的贡献就越大,反之则越小。本文用权重wj描述不同元数据项xj对用户兴趣的贡献,反映不同元数据项之间的相对重要性。权重对搜索结果排序有着重要影响,熵权法确定的权重较客观且符合实际[17]。按照信息论基本原理,熵代表该属性在该问题中提供有效信息量的多少,如果属性的信息熵越小,则该属性所提供的信息量越大,在综合评价中所起作用理当越大,相应权重则越高。本文将用户对不同元数据项的检索次数作为信息熵指标,直接根据指标的原始信息通过统计的方法获得权重,尽量消除各指标权重的主观性。

根据检索历史,将用户在过去一段时间内的检索记录分为k组,分别统计每一组内对n个元数据项的检索次数,并且用一个矩阵B=(bij)k×n记录,其中bij表示第i组检索记录中用户对元数据项xj的检索次数。

利用熵权法确定权重,需经过以下3个步骤:

(1)原始数据标准化处理:

(9)

式中:sij为用户第i组检索记录中对元数据项xj检索次数的标准化值,bij表示第i组检索记录中对元数据项xj的检索次数;min(bpj) 和max(bpj)(p=1,2,…,k)分别为k组检索记录中元数据项xj被检索次数的最小值和最大值。

(2)计算各元数据项的信息熵。按照信息论基本原理,信息熵的定义如下:

(10)

(11)

(3)计算元数据项权重。令元数据项xj的权重为wj,则:

(12)

4 模型评价结果

本文将文献[18,19]中方案 1-6 的实验数据作为备选方案集,并模拟生成了近一段时间用户对遥感影像的检索记录,对本文提出的模型和方法进行验证。

步骤1:将用户的查询条件作为理想物元:

步骤2:建立备选方案1-6的物元模型:

步骤3:根据关联函数式(5-8)得到备选方案的关联度物元模型:

步骤4:采用熵权法计算权重,模拟生成近一段时间用户对遥感影像的7组检索记录,由式(10-12)得各元数据项的权重向量为:

W=(0.1120,0.4799,0.1737, 0.2344)T

步骤5:由式(1)得6种备选方案的效用度为:

u1= 0.533,u2= 0.298 ,u3= 0.298,

u4=0.414,u5= 0.408,u6=0.209

效用度越高则与用户需求的关联程度越高,所以返回给用户的查询结果列表a1> a4> a5> a2> a3> a6,方案1为最佳方案。通过与文献[18]对比分析可知,该评价结果可信,评价方法可行。

5 结语

本文在考虑遥感影像特点的基础上,设计了基于拓扑和度量关系的关联函数,定量计算各核心元数据与用户需求的关联程度,采用多属性决策方法提高了遥感影像查询的查准率和个性化水平。本文只针对4项核心元数据进行了分析,今后继续对其他元数据(如传感器、轨道号、产品级别、数据质量等)进行研究。此外,关联函数还有待于进一步优化,以空间分辨率为例,由于低分辨率的影像可由高分辨率影像重采样而来,因此分辨率高于查询条件的遥感影像的关联度应大于分辨率低于查询条件的遥感影像的关联度。这就要求在设计关联函数时除了考虑区间覆盖的拓扑关系外,还应该与实际应用相关联,才能不断提升遥感影像共享的应用水平。

[1] 李德仁,张良培,夏桂松.遥感大数据自动分析与数据挖掘[J].测绘学报,2014, 43(12):1211-1216.

[2] 陈洁敏,汤庸,李建国,等.个性化推荐算法研究[J].华南师范大学学报(自然科学版),2014,46(5):8-15.

[3]BRINS,PAGEL.TheanatomyofalargescalehypertexualWebsearchengine[A].Proceedingofthe7thWorldWideWebConferenceBrisbane[C].1998.

[4] 刘金红,陆余良.主题网络爬虫研究综述[J].计算机应用研究,2007,24(10):26-29,47.

[5] 艾廷华,帅赟,李精忠.基于形状相似性识别的空间查询[J].测绘学报,2009,38(4):356-362.

[6] 杜世宏,秦其明,王桥.空间关系及其应用[J].地学前缘,2006,13(3):69-80.

[7] 刘瑜,龚咏喜,高勇,等.地理空间中的空间关系表达和推理[J].地理与地理信息科学,2007,23(5):1-6.

[8] 邓敏,李成名,刘文宝.利用拓扑和度量相结合的方法描述面目标间的空间关系[J].测绘学报,2002,31(2):164-169.

[9] 李学渊,陈时磊,边凯.矿山开发要素空间拓扑关系的判定与应用[J].测绘通报,2015(3):49-52.

[10] JEE D H,KANG K J.A method for optimal material selection aided with decision making theory[J].Materials and Design,2000,21(3):199-206.

[11] 夏宇,朱欣焰.利用区间分析的空间信息智能分发决策[J].武汉大学学报(信息科学版),2013,38(9):1103-1107.

[12] 叶跃祥,糜仲春,王宏宇,等.一种基于集对分析的区间数多属性决策方法[J].系统工程与电子技术,2006,28(9):1344-1347.

[13] YOON K.System selection by multiple attribute decision making[D].Manhattan,Kansas:Kansas State University,1980.

[14] 杨春燕,蔡文.可拓学[M].北京:科学出版社,2014.

[15] 胡启洲,张卫华.区间数理论的研究及其应用[M].北京:科学出版社,2010.

[16] 孔祥元,郭际明,刘宗泉.大地测量学基础(第二版)[M].武汉:武汉大学出版社,2010.

[17] 周荣喜,刘善存,邱菀华.熵在决策分析中的应用综述[J].控制与决策,2008,23(4):361-366.

[18] 李新广,范明虎,杜武.面向空间信息智能分发的动态化用户偏好模型研究[J].测绘学报,2011,40(5):646-654.

[19] 夏宇.面向空间信息智能分发的用户偏好模型研究[D].武汉:武汉大学,2009.

Multi-attribute Decision Making Model of Remotely Sensed Image Query Based on Matter-Element Analysis

YANG Xiao-xia1,2,3,ZHOU Yan4,YANG Rong-hao1,2,3

(1.EarthSciencesSchool,ChengduUniversityofTechnology,Chengdu610059;2.SichuanEngineeringResearchCenterforEmergencyMapping&DisasterReduction,Chengdu610041;3.KeyLaboratoryofGeoscienceSpatialInformationTechnology,MinistryofLandandResourcesoftheP.R.China,ChengduUniversityofTechnology,Chengdu610059; 4.SchoolofResourcesandEnvironment,UniversityofElectricScienceandTechnologyofChina,Chengdu611731,China)

The growth in the remotely sensed image available has led to information overload,as navigating through and finding relevant information has become more and more challenging.In this paper,a multiple attribute decision model is proposed to assist the user in his/her quest for accurate data.By constructing a matter-element model,the solutions of the remotely sensed image query can be converted into the solutions of multiple attribute decision of an alternative scheme.In addition,correlation functions combining topology with metrization are proposed to evaluate the similarity degree between user′s requirement and data quantitatively.The entropy-weight method is used to calculate the weight from user early search record,which reflects user preference on different metadata of remotely sensed image.Therefore,the advantages and disadvantages of different schemes can be compared.Finally,an example is given to show the usability of the presented model.

remote sensing information query;multi-attribute decision making;matter-element model

2015-10-21;

2016-01-09

国家自然科学基金项目(41201440;41471332;41101354);教育部博士点基金项目(20125122120014);四川省应急测绘与防灾减灾工程技术研究中心开放基金资助项目(K2015B002,K2014B001);四川省教育厅理科重点项目(15ZA0078)

杨晓霞(1977-),女,博士,讲师,研究方向为地理信息服务。E-mail:yangxx2003@126.com

10.3969/j.issn.1672-0504.2016.02.006

P208

A

1672-0504(2016)02-0027-05

猜你喜欢

数据项物元关联度
基于信息熵模糊物元的公路边坡支护方案优选研究
基于PSR和物元可拓模型的跨界河流健康评价
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
基于Python的Asterix Cat 021数据格式解析分析与实现
中国制造业产业关联度分析
中国制造业产业关联度分析
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
基于物元分析的桥梁加固效果评价
广义区间灰数关联度模型