地理信息科学中尺度概念的诠释与表达
2022-08-12艾廷华
艾廷华,张 翔
1. 武汉大学资源与环境科学学院,湖北 武汉 430074; 2. 中山大学测绘学院, 广东 珠海 519082
尺度作为科学术语中的重要概念,是描述研究对象幅度特征、实施学科划分的依据之一。以还原论为研究范式的经典科学,试图对物质世界层层剖分得到不同大小目标作为相应学科的研究对象,其中划分的依据便是尺度[1-2]。例如,纳米科学就以特定尺度下的物理特性作为研究对象问题,生态环境在特定尺度下具有的自我生态修复能力也是尺度效应的典型问题。而与还原论相对的复杂性科学,采用系统整体思想的研究范式,揭示不同规模大小系统的规律,其中尺度效应也是其重要的研究问题之一[1]。复杂性科学通过自相似性、分数维等尺度度量揭示复杂系统的构造功能[3]。文献[1]提出了复杂世界的简单尺度法则,即生命体、公司、城市等复杂系统的生长与衰败符合特定的尺度法则[1]。例如,城市规模扩展,驱动基础设施的扩展不是等比例的,而是有15%的衰减[1],这一发现对城市复杂系统的治理具有重要意义。
地理信息科学中,尺度是描述地理现象、过程、变化信息学机理的重要度量指标[4],与层次、水准相对应。GIS是对连续地理现象的离散化表达(不论是目标模型还是场模型),必然是在一定精度、水准下的重采样表达。认知科学的观点,尺度体现了人们对地理事物、空间现象认知的深度与广度。地理学、生态学等对尺度的定义倾向于地理、生态现象的范围大小、覆盖广度、时间期间[5-8]。而地理信息科学、地图学的尺度概念更多描述现象表达的精准与深度,可以理解为空间数据表达的粒度、地理规律抽象的层次、用户信息感受的水准、地理场景表达的景深、数字孪生要素衍生的层级等。相应地,“尺度变换”的功效也从传统的系列比例尺地图生产,更多地转向概括抽象所体现的新功能角色,服务于地学规律的概括提炼、多层次用户的认知适应、众源数据的跨尺度更新、多视角场景的映射变换。把尺度变换当成一种新的数据挖掘方法,是对过去GIS分析主要依赖数学统计方法的有益补充[9]。尺度变换所体现出的特征降维、主特征提取、局部相关体现了大数据分析与传统样本数据统计分析的差别[10]。在人工智能深度学习模型也能找到契合点,如卷积深度学习中的“池化”对应着显著特征过滤,采用的选取、压缩的操作与地图制图尺度变换有异曲同工功效。开展新视角下的尺度变换研究,可以融入大数据时代人工智能研究的热潮中,并以地理信息科学的独特视角为智能化问题研究做出本学科的贡献[11]。
随着地理信息科学研究的不断深入,尺度的外延也在不断拓宽。传统地图学的尺度局限于空间比例尺描述,新时代地理信息科学中尺度的描述不仅局限于空间域,在时间、语义及两者或三者集成的混合尺度表达上越来越重要[12-13]。在尺度的内涵表达上,有学者认为在所有科学概论术语中,尺度承载的内涵过多而导致意义混乱[14],结果导致不同视角下的尺度描述往往产生二义性。一个典型的例子,尺度对应着范围与比例尺理解,当提到大尺度(large scale)时,有可能是指“广泛的范围”或者“大比例尺”,但在地图适宜表达上大范围往往对应着小比例尺,这样对大尺度的理解就会产生完全相反的对立结果。
学科交叉和发展不断赋予地理信息科学尺度概念丰富的含义,为避免不同上下文下尺度概念理解的歧义,对尺度概念作梳理,剖析不同尺度子概念的定义、应用范畴与特征差别很有必要。本文旨在总结GIS尺度概念的外延、内涵与类型,试图给出GIS尺度概念的完整表达,将其置入3×3矩阵的描述框架模型,并对空间关系尺度的描述模型作深入讨论。
1 GIS尺度概念综述
尺度的基本含义为大小、范围、级别、等级、标度等,是度量的基本指标,有关研究总结了尺度的量表系统包括定名量、等级量、差异量和比率量[15],4种不同指标反映了尺度度量的不同量化能力,按照以上顺序定量化描述的能力逐渐加强。地理信息科学涉及的度量问题差异大,需要不同视角的尺度概念描述。地理信息科学相关的学科与技术赋予了尺度具体的定义,在地图制图学上确立为比例尺,即地图上的距离与实际距离的比率;地理学上确立为研究对象的相对大小,即地理环境(研究范围)和细节等[5];遥感技术中则包含了空间、时间、光谱3个尺度概念,分别对应3个特征上的分辨率。地理信息科学中的尺度涉及的问题太多,从内涵外延定义到映射变换的尺度概念,从特征性质到作用功效的尺度分类,从数据加工到服务赋能的尺度控制,从多细节表达到多粒度知识概括的尺度抽象。有关学者从不同视角确立了GIS尺度的关注的热点问题,文献[14]则认为包括尺度的定义、分类与作用功效,文献[16]认为包括尺度本体、尺度变换、尺度效应及最佳尺度4个方面。本文基于尺度的基本问题和地理信息科学的应用需求,在梳理有关学者的研究成果基础上,将从尺度的内涵、尺度的依赖及不变性、尺度的演绎变换3个方面进行总结。
地理信息科学(geographic information sciences,GIS)的尺度内涵回答度量什么的问题,由研究对象的性质、关注特征和服务目标决定。GIS研究涉及的矢量图形、栅格图像、时间讯号、语义文本等不同格式的数据对应着不同的尺度内涵。观测对象角度认为尺度是指研究范围的大小、空间领域覆盖[17],基于测量观测行为则可以将尺度确定为分辨率或者数据的粒度[18]。由于地图是对地观测技术链的信息表达,尺度在地图学上更多是从表达度量上确立,是一种表达尺度,由此产生多尺度表达、层次细节(level of detail,LOD)表达等感兴趣的问题[13,16]。在生态环境研究中个体、种群、群落、生态系统和景观等的组织对应着组织尺度,还有功能尺度,该尺度概念的建立基础为层级理论[6,19]。GIS尺度内涵取决于信息加工处理的过程,本征尺度描述地理本体固有的尺度特征,而观测尺度、分析尺度则是在一定仪器设备、量测手段、分析模型条件下的度量结果[12]。GIS尺度的内涵目前还是在概念层面的定义,缺乏形式化的模型定义。相对而言,遥感科学技术中的3个尺度概念:以像素大小定义的空间尺度、采集时间间隔定义的时间尺度、光谱频域特征定义的光谱尺度,在尺度概念的形式化表达上要完善得多。GIS尺度内涵如何从定性的概念化描述向定量的模型化表达是有待研究的问题。
GIS尺度效应描述尺度的作用机制[19],即不同维度特征的度量存在内在的关联机制,表现出相互间的耦合、协调与交互。受地理现象的空间相关、空间异质性影响,大多数空间分析是尺度依赖的[7],如生态景观的碎片化、空间格局的剖分与观测尺度或分析尺度相关,因此有不同尺度下对地理现象空间格局和景观过程研究的结果是不一样的结论。尺度效应首先是观测范围的大小与粒度的精细层次要协调。对于实际空间具有分形特征的现象,要有适宜的分数维度量[20-21],否则就会完全歪曲度量结果。其次,尺度效应表现为尺度某种特征的不变性。自然与社会中的不少系统、现象和模式并不随尺度的变化而改变特征[16,22],或者在不同尺度下有相似的结构或分布(自相似)[20],具有尺度不变性的系统通常可以用一个“特征尺度”来刻画,比如人类身高。在复杂系统研究中,提出了基于分形和空间几何关系的模型揭示复杂系统的尺度规则[23-24]。城市作为复杂系统的案例,由于面临可持续发展问题,地理学家通过类比研究了城市的异速生长,探查其能源、经济、交通、创新等与城市尺寸与发展阶段之间是否具有不变性的规则[25-26]。GIS不同内涵尺度间的协调在可视化、分析中具有重要意义,有关研究提出了空间比例尺与时间比例尺的协调问题[12]。在地理信息多尺度表达空间中,如何选取适宜的信息容量,对本体现象的信息传送和客体受众的认知解译达到最佳效果,需要分析尺度空间信息容量的变化规律,早期的Topfer法则属于该问题的回答[27]。在大数据技术下全数据集取代样本数据集的研究[28-29],也将产生尺度效应的新问题。
尺度变换是地理信息科学中的关于尺度的重要操作,传统上该问题表现为不同比例尺地图间的地图综合[30]。在大数据时代,尺度变换被赋予了新的内涵,更多地表现为空间知识概括[9],是基于归纳性空间思维方法,通过选取、提炼、抽象行为从大量空间信息内容中获得主体、核心、普适性规律特征。尺度变换本质上是粒度的变换,把一个尺度上获得的信息或知识推广到其他尺度,也称为跨尺度信息转换[5-7,9]。完整的尺度变换包括从粗粒度到细粒度和从细粒度到粗粒度两个方向的变换。前者表现为空间内插,如DEM的内插[31-32],在遥感图像处理中基于3个尺度概念的耦合关系,实施的图像融合也属于该操作[33];后者表现为空间的概括抽象,即传统的地图综合。地图综合不是简单的数据压缩,是对地理区域特征的抽象概括,涉及综合前的地理特征模式识别[34]、综合中的尺度变换算子设计[30]及综合后的结果数据质量评价[35],有关地图综合研究的综述参见文献[36]的总结。GIS中的尺度变换有一个有问题,即多尺度表达,这是一种“连续”“无级变焦”式空间表达功能,从用户角度观察视点越近,获得的信息越多、越详细,观察视点越远,获得的范围越广、信息越概略。实现多尺度表达的方法较多[13,16,30],文献[13]总结了4种:多级尺度显式存储、初级尺度变化累积、关键尺度函数演变及初级尺度自动综合。由于尺度依赖的非线性,尺度转换、地图综合是一个难题[7,30],通常被认为是GIS中的瓶颈问题。人工智能领域的机器学习、深度学习技术强势兴起为该难题的破解提供了新的策略,一批基于CNN、GCN、GAN等深度学习模型的地图综合方法在多种算子的优化决策[37-38]、复杂环境下的图形特征概括[39-40]、保持形状认知特征的图形模板式综合[41-42]中应用,产生了较好的尺度变换结果。人工智能技术在GIS尺度变换的研究将是未来发展的重要方向,核心是尺度特征、尺度效应的领域知识与数据驱动深度学习模型的深度耦合,突破单纯运用深度学习而面临的样本不足、缺乏普适性迁移、尺度变换结果难解释等瓶颈[10]。
2 地理实体尺度概念表达的3×3矩阵
在总结现有GIS尺度概念表达方法的基础上,本文试图将不同尺度概念结合对其作完整的诠释。IT数据建模关注建模对象的两大特征——实体自身特征和实体间联系,产生实体联系模型(entity-relationship model,ER模型),GIS基于该模型化思想对地理现象、事件、过程建模,对应地包括地理实体和实体关系描述。两方面信息表达都需要特定的尺度来度量模型特征,由于两者的差异,需要分开建立尺度概念。本节先讨论地理实体的尺度概念,下一节讨论地理实体关系的尺度概念。
2.1 结合内涵与外延的尺度矩阵
概念的定义涉及内涵与外延两个范畴。顾及GIS的完备功能,它对地理实体现象本身的描述包括空间、时间、语义3个特征[4],相应地需要3把尺子对其空间、时间、语义特征度量,据此,可以将GIS尺度概念的外延确定为空间、时间、语义3个维度,如图1所示。
图1 GIS中地理现象的尺度度量
从尺度概念的内涵分析(具体度量什么?),用尺子度量一个地理实体、地理现象或地理事件,首先关注其存在、发生的范围,再次考察其表达的详尽性或粒度精细性,如果对于周期性分布、重复性变化的现象,还要关注其频率,为此本文定义尺度概念内涵的3个内容:广度、粒度、频度。每个尺度外延都涉及3个内涵方面的度量,为描述尺度外延与内涵完备结合的模型,采用3×3矩阵,如图2所示。该矩阵的行表达3个内涵:广度、粒度和频度。矩阵的列表达3个外延:空间、时间和语义。该矩阵包含9个元素,分别表达空间广度、空间粒度、空间频度、时间广度、时间粒度、时间频度、语义广度、语义粒度及语义频度,可看作是尺度概念剖分的子概念。具体每个尺度子概念描述如下:
图2 结合内涵与外延的地理实体3×3尺度矩阵
a11为空间广度,地理实体在空间域上覆盖的范围、延展的区域;a21为空间粒度,地理实体在空间域上被表达、被记录的最小尺寸;a31为空间频度,周期性延展地理现象采样的空间间隔;a12为时间广度,动态现象在时间域上存在或被表达的时间期间或范围;a22为时间粒度,动态现象被表达、被记录的最小分辨时间段;a32为时间频度,周期性重复时态现象采样的时间间隔;a13为语义广度,地理实体属性所覆盖的分类体系范围;a23为语义粒度,地理实体语义分类达到的细分层次;a33为语义频度,地理现象可重复性语义表达中的语义间距。
该尺度矩阵模型涵盖了地学不同学科、行业、领域的尺度概念。如地理研究中表述的“全球尺度”“流域尺度”“县域尺度”“1000年尺度”“50年一遇”“万年级别”“国家法律与地方性制度”等为尺度的广度概念(空间大小、时间长短、语义范围)。地图学与地理信息技术中“多尺度表达”“尺度细节LOD”“战略战术意义”则对应着尺度的粒度概念(层次细节)。尺度的频度概念对应着周期性、重复性现象的描述,褶皱地貌、河流的弯曲摆动具有周期性变化的空间特征,水位的季节性变化、河床的沉积物等则是周期性变化时间特征的体现。关于语义的周期性变化,难以在实际的地理现象中找到直接的案例,但通过间接转化,将语义信息转化为向量空间的波形曲线后,基于傅里叶、小波变换可提取其周期性变化特征。在知识图谱、深度学习模型中充分利用语义信息的词向量,建立语义距离的计算、语义关系推理,便涉及了语义信息的频率度量问题。
尺度矩阵中关于粒度这一行的3个指标,在GIS研究中具有重要意义,本文将对该指标深入剖析。GIS中的尺度变换实质指的是粒度的变换,是指地理现象、地理事件、地理过程在空间粒度、时间粒度、语义粒度上的变换。粒度有高分辨率与低分辨率之分,这样,尺度变换具有两种形式:一是从高分辨率到低分辨率转化的尺度变换;二是从低分辨率到高分辨率转化的尺度变换。
图3 基于粒度变化的两种尺度变换形式
2.2 空间粒度
空间粒度又称空间分辨率,是描述地理现象、事件、过程的空间特征的最小几何尺寸,反映空间特征显著性的层次水准。受表达能力、认知能力、用途目的的控制,低于空间粒度的小尺寸空间实体、几何特征被忽略。空间粒度确立的依据是地理场景构成的层次性规则,即地理现象构筑中的整体-部分原则(Part-of)。依据一定规则可以将空间划分成不同的格局,形成多层次的金字塔结构,选取不同层次的空间粒度表达反映了地理场景的不同抽象化概括。
空间粒度的表达取决于数据模型,在场模型表达中的空间粒度由场空间剖分的结构单元决定,包括规则网格(正三角形、矩形、正六边形等剖分)的几何单元大小、不规则网格的平均剖分单元大小。在对象模型表达中空间粒度则由地理场景中地理实体、地理现象的空间几何特征层次决定。地理实体的描述可分为3个层次:要素层、目标层、几何细节层。要素是具有相同语义特征的目标集;目标是具有独立地理意义的表达实体,是构成要素的基本单位;几何细节则是几何表达上的划分细节,构成目标的基本单元。当尺度变化,数据表达发生变化的主体对象可以有3个层次:要素层、目标和几何细节,分别对应不同的变化粒度。要素层属于语义特征,不受空间粒度控制,而目标层与几何细节层属于空间特征,受空间粒度控制。目标级空间粒度对应空间表达的地理实体的面积、长度等几何特征的最小单位,如房屋面积、河流长度等,小于该阈值的地理实体在地理场景中不予表示。几何细节级空间粒度对应地理实体的几何细节特征的最小尺寸,如海岸线上的最小弯曲、土地利用图斑剖分后的最小单纯形面积等,小于该阈值的在地理场景中不予表示。
2.3 时间粒度
时间粒度又称时间分辨率,地理现象变化过程表达的最小时间间隔,是描述地理事件产生、发展、演化、消失过程的时间精细度指标。时间粒度可反映事件变化过程时态特征显著性的层次水准,受表达能力、认知能力、用途目的的控制,低于时间粒度的小变化、精细过程、微弱快照等时间特征被忽略。由于时间的表达采用了精确的数量指标,不论是精细尺度下的秒、分、小时,还是大尺度下的季节、年代、世纪等,均可采用一维线性结构描述,在时间线性结构上的分辨刻度大小即为时间粒度。地理环境的变化在相应的历史承载体上留下了特定年纹层信息,地学研究借助湖泊沉积、树轮、冰芯、石笋等可以对年、十年、百年、千年、万年级不同时间尺度,反演气候、生态、物候等的变化过程,湖泊沉积、树轮、冰芯、石笋等对应了不同时间粒度的研究对象。
时间粒度的表达取决于地理事件的数据模型,地理事件、变化过程建模目前主要有3种形式:快照序列模型、对象变化模型及面向事件模型。①快照序列模型对地理事件演化在时间线性结构上记录一序列快照,各个快照间既相互独立,又具有前序后继的线性关系。在快照序列模型中,时间粒度表达最为简单,利用时间线性结构上的时间间隔表达。如GPS轨迹记录仪按照设置的采集频率获取位置信息,采集频率的时间间隔即为时间粒度。②在对象变化模型中,基于面向对象(object oriented,OO)建模思想对变化的地理对象建模,定义一批产生、演化、发展、消失等过程型函数,驱动地理对象产生位置移动、边界扩展、语义改变等。在对象变化模型中的时间粒度由过程型函数的演变时间步长确定,即演化一步需要跨越的时间长短。③在面向事件的模型中,以事件标识号为主体,地理实体、时间过程、语义属性为事件对象的描述,对事件变化过程通过离散化处理得到相邻时间状态之间的间隔即为时间粒度。
地理事件在实体世界变化过程存在固有的本征时间粒度,而在地理信息科学分析应用中又有表达时间粒度,两种时间粒度间的比率关系构成时间比例尺(与常规地图的空间比例尺类似)。描述地理场景变化过程的时间比例尺可以是1∶N,1∶1,N∶1(N>1)3种情形。1∶N为快速展示(播放)慢变化,如地下水的季节性变化在几秒钟内展示;N∶1为慢镜头展示快变化,如地震灾害在数秒内发生及其波及范围,用分钟级尺度展示;1∶1则为真实变化的实时展示,如运钞车的实时监控获取它的位置移动信息,其时间比例尺便为1∶1。由本征时间粒度和表达时间粒度的比率关系建立的时间比例尺概念,与空间比例尺一样都是描述地理现象、地理事件的表达值与真实值的比率关系,但时间比例尺具有N∶1和1∶1情形,而空间比例尺一般不具备这种比率情形。
2.4 语义粒度
语义粒度针对语义特征中的层次结构、分类特征,描述语义层次的级别。语义粒度可以定义为语义层次树结构的节点层次,低于层次阈值的语义特征便不表达。如土地利用数据的属性层次(一级用地、二级用地、三级用地),行政区划的省、地市、县、乡、村等,构成了不同的语义等级。
基于本体论原理,概念性质描述包括组成成分、结构模式、分类等级、服务功能等,这些本体性质的描述部分可以通过层次结构展示,形成树结构的形式化表达[43]。本体论研究中对语义信息的层次树总结了4种形式,反映了不同模式的层次结构,如图4所示,4种树结构通过上下层节点间的构成关系来反映,分别是:
图4 语义层次描述的4种结构树示例
(1) Part-of层次,描述概念成员构成的整体部分集合关系。例如,在产业结构中,金融业是第三产业服务业的一部分,种植业是第一产业农业的一部分。
(2) Kind-of层次,描述概念之间性质继承的类型组合关系,类似于面向对象中的父类和子类之间的关系。例如,在土地利用类型表达中,果园是园地的一种,水田是耕地的一种,耕地则是农业用地的一种。
(3) Instance-of层次,描述概念类与实例间的个例明细关系,借用了面向对象模型中的概念。例如,京九铁路是铁路交通类的一个实例。
(4) Attribute-of层次,描述概念间性质分解关系,表达某个概念是另一个概念的属性,通常描述概念的功能与表象特征。例如“升学率”“在校人数”是对中等教育概念的属性展开描述。
通过语义层次树结构的节点层次、级别可以定义语义粒度。语义层次性是对结构构成、类型划分、功能特征等性质经过概括综合得到的抽象表达,在认知理解上不如空间层次性那样形象直观,可以通过语言学修辞法“隐喻”技术将抽象的语义粒度映射为形象直观的容易理解的空间粒度。
2.5 尺度子概念间的联系
在地理实体3×3尺度矩阵中,行、列元素间的联系具有不同的表现,反映了尺度子概念间的依附关系及作用机制。具体发生在尺度内涵的广度与粒度之间、尺度外延的时间粒度与空间粒度之间、语义粒度与空间粒度之间。有关联的两个尺度子指标各自变化,但其联合作用具有特定的关系需要维护,在GIS数据采集、可视化表达、度量分析实际应用中应当遵循其间的变化规则,可以归为GIS中的尺度效应的部分规则。
广度与粒度的关系表现为,对大范围、长时间期间的时空现象应采用粗粒度的记录表达,对小范围、短时间期间的时空现象则采用精细粒度的表达。基于该匹配准则,粒度的表达可以区分绝对粒度和相对粒度,后者通过与广度的比例关系来描述。如ArcGIS软件中对空间坐标记录的精度阈值grain、weed可以通过用户定义图幅范围的1/2000或其他表达,这比固定阈值的绝对粒度要灵活。广度与粒度匹配规则若能达到精确定量描述,则可以回答地图表达的经典基础问题“特定区域的地物现象在地图上表达到什么精细层次?”。如图5所示,视觉判断(a)、(b)是适宜的表达,(c)则对小范围采用粗粒度表达,是不适宜的。
图5 地图表达范围与表达粒度的组合
在外延上,空间、时间、语义三维度是独立描述地理实体现象的信息特征,但相互间又有特定的关联,集中表现在粒度上。在GIS尺度表达上,时间粒度与空间粒度具有相似的变化趋势,即粗粒度的空间特征对应着粗粒度的时间特征,反之亦然。这是由于时空现象演化中大范围的变化慢(地质构造板块的移动),小范围的变化快(轨迹线表达的车辆行驶)。在时间地理研究中,采用时空棱柱模型表达时空现象[44],如图6所示,简化后圆锥体的竖向高表达时间轴,横向截面表达空间范围,则两种粒度的组合有4种情形:①粗空间粒度+粗时间粒度;②粗空间粒度+细时间粒度;③细空间粒度+粗时间粒度;④细空间粒度+细时间粒度。其中中间两种是不合适的表达。具体案例在时空轨迹线可视化有体现,在大范围(如省域高速公路网络)上可视化表达移动车辆,采用精细时间粒度(如设定2 s获取一次定位位置),但视觉上并不会获得2 s间隔的移动变化,浪费计算资源。
图6 时空棱柱模型中两种粒度组合表达的示意
语义粒度与空间粒度同样具有一定的关联。在地理现象分类特征上,高层次语义特征对应大的空间范围,精细层次则对应小的空间范围,在土地利用图表达上对比分析用地类型等级与图斑大小、破碎化关系就会发现两者的匹配趋势。基于语义与空间在粒度层次上的匹配关系,可以实施相互间的映射,将抽象的语义层次特征映射为形象的空间可视化表达,即为隐喻地图的表达。空间的层次化表达诸如政区划地图的多边形包含、河流网络中的主次直流的汇合,可以很形象地用来表达诸如学科层次上基金批准数量(图7)、技术领域申请专利信息。隐喻地图的表达的实质体现了非定位语义信息的空间化[45-46],而语义粒度与空间粒度的匹配则控制着两者的转换过程。
图7 自然基金各学科层次获批项目的隐喻地图表达(仿空间行政区划图)
3 空间关系尺度
除实体自身描述外,实体间关系的表达也需要尺度度量。完整的实体关系描述地理实体现象之间的相互作用、相互依存构成的空间关系、时序关系、关联关系等,体现了空间分布的结构态势、时间延续的前序后继、事件发生的前因后果等联系。其中,空间关系是GIS要素关系中的重要内容,空间关系表达的详略层次由空间关系粒度描述,空间关系粒度是指空间目标在拓扑、距离、方向上表达的最小可辨析关系,可通过关系层次树上的节点深度描述。
3.1 拓扑关系粒度
拓扑关系是地理实体在拓扑变换下不变的空间关系,该关系不考虑距离、方位上的几何度量。拓扑关系表达的精细粒度描述具有重要意义,是不同层次空间分析、空间推理的基础。定义拓扑关系粒度的层次树,有赖于拓扑关系表达的语义距离计算及在此基础上的聚类,即将语义相近的关系聚类归纳出新的高层次的关系描述,从而构造层次结构,每个节点对应特定的关系语义描述,叶子节点为最基础的拓扑关系描述,越往上层级越高[47]。关系树建立后,根据树节点层次定义拓扑关系的粒度。
对拓扑关系状态集的聚类可以基于“拓扑关系概念邻域”的方法[48],拓扑关系集R中任意关系ri与rj计算其相似性s(ri,rj),基于相似性距离的远近构建拓扑关系的概念邻域图。基于Egenhofer九交叉模型[49],有两种方法可计算拓扑关系相似性[48]。一是对拓扑关系r1与r2的3×3二值矩阵进行比较(在九交叉模型中的每个元素值定义为二值0/1,分别对应外部、边界、内部3个拓扑子集间有无交叠),通过逻辑差运算统计9个元素中不同值的数量,差异值越多表明两种关系相差越远,反之两种关系越相似。二是认为拓扑关系(实际上可推广至一般性的空间关系)由一种状态r1变换到另一种状态r2,是通过多个相邻关系状态逐步演变过来的,在关系演变的邻域空间中,演变的步数越少,两关系越接近,因此,关系的相似性定义为转换操作的中间步数。依据上述两种方法可以得到图8所示的线面拓扑关系的概念邻域图及拓扑关系结构树,获取树的不同节点层次便得到线面拓扑关系粒度。
图8 线面拓扑关系的多粒度表达
拓扑关系粒度反映了拓扑关系表达LOD的细节程度,由图8可知,可以在九交叉模型上将19种线/面拓扑关系概括为4种关系(在内、在边界、穿越、在外部),反映了拓扑关系粒度的差异。“在内”关系是一种粗粒度的表达,线目标在面目标内部具体是何种分布态势不再细节化考察,而5种“在内”关系具体的矩阵表达则是细粒度的,刻画了线的边界、线内部与面目标多边形的不同组合。
3.2 方向关系粒度
方向关系描述两目标(考察目标与参考目标)间的相对方位,对方向关系定量化、等级化表达中不同LOD详细程度定义为方向关系粒度。方向关系的描述根据参考系、目标的几何维数、几何形状等不同有多种模型描述[50],方向关系表达的参考系包括:①本征参考系(intrinsic)描述,目标固有的内在的方向部位(位置语前后左右表述),是不同观察者公认、不存在二义性的表达,如建筑物的正门、入口;②观察者参考系(deictic)描述,以观察者的位置、面向作为参考系,确定观察者自己的前后左右,划分为4个方位区域;③外参考系(deictic)描述,以地球的极点(南、北极)作为方向参考系,确定4种主方向东、南、西、北,通常成为主方向(cardinal direction)。在确立参考系之后划分不同方向部位时,有精细的多部位划分和粗略的少部位划分,体现出方向关系粒度的差异。
以外参考系下的主方向关系模型为例,可以划分4个方向部位东、南、西、北,也可划分8个方向部位东、南、西、北,东南、西南、东北、西北,进一步还可划分为16个方向部位。这里的四方向、八方向、十六方向的定义即为方向关系粒度的体现,划分的部位越多,方向关系粒度越精细。如图9所示,方向关系的两种粒度表达,其中八方向关系粒度可以用于网络数据的可视化得到典型的地铁线路图可视化地图[51](schematic map),该表达中边的连接或者转折均为45°、90°、135°、180°中的一种,表现为八方向关系粒度,是对线段间真实方位角连接的高度抽象概括得到的粗粒度方向关系表达。而四方向关系表达则更为概括,通常在电路图表达中应用,所有连接转折角为直角。
图9 两种方向关系粒度(四方向与八方向)及在数据可视化中的应用
3.3 距离关系粒度
距离关系是地理规律提取的重要控制指标,反映空间相互影响的程度。地理学第一定律就是以空间距离为控制因子的交互作用规律,空间自相关系数计算也是以距离为控制参量,空间要素分布的核密度计算也是以距离的远近作为衰减效应的控制,地理现象的带状规律、空间异质性的表达都是将距离作为重要条件。在这些地理规律表达中涉及距离表达详细程度的问题,即距离关系粒度。
距离关系定义取决于空间类型,在欧氏空间、网络空间、拓扑空间、集合空间等与地理信息学科相关的几种空间表达中,产生了欧氏距离、网络路径距离、曼哈顿距离、Housdalf距离、最优代价距离等,这些距离概念都面临不同粒度LOD表达。距离关系的认知表达是一维的线性结构,通过远、近的描述刻画空间距离上的联系程度,距离关系粒度的精细与粗化则表现为远、近划分的细节层次,通过等级量划分(例如8级、6级或者4级)刻画距离关系的精细粒度[52]。如图10所示,参考于中间红色目标A,与其具有邻近距离关系的表达可以采用两种粒度,图10上为精细粒度的表达,图10下为粗粒度的表达。精细粒度的表达其距离关系的等级划分较多,粗粒度的表达其距离关系的等级划分较少,图10中距离关系等级表达与采用不同等高距的地貌等高线表达类似。扩大距离关系间隔等级则为精粒度到粗粒度的转换,缩小距离关系间隔等级则为粗粒度到精粒度的转换。
图10 两种粒度下的距离关系表达(参考于中间红色目标的距离影响域)
4 结束语
本文研究在总结尺度概念的不同定义、度量和模型后,对GIS中的尺度问题进行了完备的梳理,从ER实体联系模型出发,引出地理实体E的尺度概念,进而定义为3×3的矩阵,进一步对实体联系R的尺度描述聚焦空间关系讨论了拓扑、方位、距离关系的粒度表达问题。在地理实体尺度矩阵中将外延的空间、时间、语义和内涵的广度、粒度、频度进行了完备地结合。由于粒度表达在GIS中具有特殊重要意义,本文重点对粒度进行了深入剖析。关系粒度是一个新的概念,该粒度描述的对象不是实体,而是实体对、实体组合,由两个或多个实体构成的分布态势、结构、依存在拓扑、方位、距离上产生的关系表达。由于不同关系状态具有不同相近度,在关系的语义距离上聚类产生层次结构,确立了空间关系粒度计算方法。GIS中的尺度研究脱胎于过去的空间比例尺概念及地图综合技术,在大数据人工智能时代,迫切需要在广阔的视角开展该问题的研究,以下几个方向的研究将是未来发展需要关注的。
(1) 尺度概念的形式化表达。建立GIS尺度概念的定量化模型,确立粒度、频度等在GIS表达、度量、分析中解析模型。随着GIS研究对象和服务领域的拓宽,要扩展尺度概念的外延,在空间尺度基础上更多关注语义尺度、时间尺度、空间关系尺度等相对新的概念。
(2) 尺度效应、尺度不变性特征。地理实体现象间的共位分布、耦合关联、交互变化机制中,反映到尺度领域中存在哪些特殊效应?从复杂性系统科学视角如何发掘GIS尺度效应?相关尺度子概念在各自变化同时存在哪些联合作用的不变性?
(3) 尺度变换在空间知识发掘中的作用。尺度变换本质上是一种空间思维的归纳行为,从大量具体、个例、底层数据中通过粒度过滤、层次归并、语义概括获得普适、统一、高层的空间知识,是对过去GIS尺度变换仅仅服务于地图综合的目标扩展。