APP下载

一种构建地理国情本体属性库的方法
——以天津市为例

2013-03-03张志军李承鑫

城市勘测 2013年3期
关键词:国情本体天津市

张志军,李承鑫

(1.天津市测绘院,天津 300381; 2.武汉大学测绘遥感信息工程国家重点实验室,湖北武汉 430079)

一种构建地理国情本体属性库的方法
——以天津市为例

张志军1,2∗,李承鑫1

(1.天津市测绘院,天津 300381; 2.武汉大学测绘遥感信息工程国家重点实验室,湖北武汉 430079)

地理国情监测是测绘服务科学发展的新手段和新途径,其主要任务是为各级政府综合决策提供客观、公正和准确的专题信息。如何实现地理国情专题信息的语义共享是地理国情提供跨行业、跨部门和跨学科的地理信息服务亟须解决的关键问题。本文基于本体的理论,提出一种构建地理国情本体属性库的方法,以天津市地理国情监测内容及其服务行业为知识域,对地理国情进行概念化和形式化表达,并用protégé软件实现了本体属性库的建设。

地理国情监测;地理概念;语义;本体

1 引 言

地理国情是我国基本国情的重要组成部分,是从地理的角度分析、研究和描述国情,是空间化可视化的国情信息[1]。其内容涵盖了国土疆域、地形地貌、地表覆盖、交通网络、江河湖泊、城镇布局、人口与生产力空间分布、资源环境状况、灾害分布等丰富的自然与人文地理信息[2]。地理国情的内涵决定了地理国情具有跨行业、跨部门、跨学科等特性。

地理国情监测是综合利用以3S技术为核心的现代测绘技术,对地理国情进行动态、定量的监测,从地理空间的角度客观、综合展示国情国力。地理国情监测是党和国家赋予测绘工作的新职责、新任务和新要求,是测绘服务科学发展的新手段、新途径。开展地理国情监测工作应立足于基础测绘,重点为各级政府综合规划、决策、监督等服务,提供客观、公正和准确的参考信息和数据,与此同时与相关业务主管部门的管理和监测内容互为补充[3]。

天津市地理国情监测项目于2011年就45个专题展开了监测工作,并将监测成果整理入库,建立监测系统为各行业和部门提供地理信息产品服务。为辅助不同领域的用户对地理国情相关地理概念的理解,从而提升地理国情服务的通用性和适用性,本文试图以该监测体系中的地理国情专题信息为概念范畴,以形式本体为基础,分析地理国情涉及地理概念的语义,提出一种构建地理国情本体属性库的方法。

2 国内外研究现状

地理信息共享和互操作一直是地理信息科学领域的热点问题,目前不同系统之间的互操作在语法层面得到了较好解决,然而在信息语义层面仅有一些阶段性的成果[4~9],想要达到地理信息系统设计与开发者追求的“最高境界”[10]还有待深入的研究和探索,地理信息的语义建模被认为是具有挑战性的关键课题[11]。如何从用概念表达的对象中抽取出其本体语义,是建立地理国情本体的关键和实现地理国情信息共享的基础。国内外很多学者试图利用本体方法研究地理概念语义[12~20],这种方法也被认为是地理信息集成和共享的有效途径。与此同时,地理本体和应用本体在地理信息集成方面也取得了一定的成果。

综上所述,本体方法可以在一定条件下实现不同数据集的集成,也能在特定语义层次上完成地理对象的语义转化,然而如果地理对象缺乏明确的、形式化的语义表达,将会为其共享造成巨大的不便。

3 本体相关理论和方法

3.1 概念的描述

对地理对象的概念性描述一般都是基于自然语言文字的,与描述者的知识、经验和背景有很大的关系,导致在概念描述时存在着很大的歧义性。如“高层建筑”在维基百科中被描述为:“具有较多层数高度较高的建筑”,其中“较多”和“较高”两个术语带有很强的主观性,其判别阈值取决于领域背景:中国《民用建筑设计通则》将10层及以上的住宅建筑和高度超过24 m是公共建筑称为高层建筑;而《日本建筑大辞典》将5层~6层至14层~15层的建筑定为高层建筑。

3.2 语义表达的方法

对地理概念的语义描述就是表达从一个地理概念空间到另一个地理概念空间的映射关系。地理概念空间之间的映射关系的研究也是当前认识语言学领域对语义理论研究的一个热点[21]。地理概念空间的转换或对应主要有比喻法、代数法、概念集成/绑定法和属性枚举法,其中属性枚举法是最容易理解的方法,即将概念的属性一一列举出来。

每个概念都与一定的属性或性质关联,这些定义的属性足已确定对象的相关外延[22]。属性枚举法就是基于这点,用地理概念拥有的属性来描述概念。如“高层建筑”可以用“占地面积”,“建筑面积”、“层数”、“高度”等描述其特征。即如何找到概念(“高层建筑”)的本质属性(本体性质)是枚举法的关键。

3.3 形式本体和概念化

为减少对地理国情描述的歧义和澄清自然文字描述的语义,需要对地理国情所表达的对象的本质进行分析,明确地理对象的本体语义。为达此目标,形式本体的方法为地理国情的概念化提供了有力理论基础。形式本体指用系统的、形式的和公理的方法对事物存在的形式和方式进行的逻辑开发的方式。本体被描述为用于描述形式词汇意图含义的逻辑理论,即对世界特殊概念化的本体承诺。

4 地理国情本体构建方法

根据创建本体的5个基本准则(清晰性、一致性、可扩展性、最小编码偏差及最小本体承诺),本文基于本体开发工程理论和已有的本体创建方法,结合天津市地理国情监测内容的特征,提出了一种构建天津市地理国情本体的方法。主要包括5个步骤,如图1所示。

(1)明确本体的范围和目的:本文所要构建的地理国情本体库包含概念的范围为天津市地理国情中所有的地理概念;本体建立的目的是为天津市地理国情概念建立一套语义描述体系,从而为地理国情信息的共享和语义互操作服务。

(2)列举概念:尽可能列举出领域内的所有概念,对每个概念在不同领域中的定义进行资料分析和总结,得到每个概念的定义并集。

图1 构建地理国情本体的步骤

(3)概念化:采用属性枚举法对每个概念进行语义表达,形成知识框架。

(4)形式化表达:用形式化语言将先前得到的天津市地理国情概念模型进行外在表达,本文采用OWL DL语言进行本体的表达和建库。

(5)评价验证:根据相应的评价标准对所建立的本体进行验证。

本文所述的方法是一个迭代的过程,所创建的地理国情本体在特定阶段是一个相对完善的本体,随着客观世界的变化和地理国情内涵的丰富,还需要反复的评价与修改。

4.1 天津市地理国情本体构建的范围和目的

天津市地理国情监测项目从城市建设、生态环境、地表变化、土地利用和地质变化5个方面就城镇化进程等45个专题展开了监测工作。本文所构建的本体库的所涉及的地理概念范围与之相对应,详情如表1所示。

天津市地理国情本体库涉及概念示例表 表1

4.2 天津市地理国情的概念化

天津市地理国情的概念化是指以天津市地理国情所涉及的地理概念为研究对象,分析其所要服务的知识领域,根据相关标准建立概念的语义描述集,确定每个概念语义的描述集和属性集,从中提取出本体属性集,从而实现地理信息的概念化,具体过程如图2所示。

图2 地理国情的概念化过程

以水系为地理国情概念对象,其水系的概念化定义为:

D={水系对象域}

W={水系对象所有可能状态}

假定V为地理国情中涉及水系的词汇,水系的形式本体为:

4.3 天津市地理国情形式化表达

本体描述语言从自然语言到描述逻辑形式多种多样,语言的形式化和规则性越高就越利于机器理解。对于地理国情本体,支持推理的能力是很重要的,它可以检测概念间是否互相矛盾,以保证本体的质量。网络本体语言OWL(Web Ontology Language)是由W3C(国际万维网联盟)发布的共享本体的标记语言,用来描述万维网文档和应用中的类和类之间的关系,并可以通过形式化语义实现逻辑推理。综合考虑地理国情本体所需要的表达力和推理能力后,本文使用OWL DL作为地理国情本体的描述语言。它主要针对概念、性质、个体之间关系的描述,以保证强大的语义表达能力。

由OWL描述的一个本体主要包括三种组成元素:类(class),实例(individual)和属性(property)。类代表一些实例的集合,OWL还支持对简单类进行并、交、补运算等集合操作得到的复杂类;实例作为类的成员出现,是领域中实际感兴趣的对象;属性是实例之间的二元关系。在OWL中有两种属性:对象属性和数据属性。

4.4 地理国情本体属性库的构建

选择合适的建库工具是快速、成功地构建本体的关键。好的本体编辑软件应该具备本体录入、一致性检查、可视化、查询、推理等功能。protégé软件是目前使用最广泛的本体编辑器之一,它提供了图形化和交互式的本体设计环境,其OWL Plug-in支持OWL描述语言,满足地理国情本体属性库的构建需求。

在OWL语言语法中,一个本体属性由类(A)、实例(B)、属性(C)三部分组成,并采用三元组(A→CB)描述三者的关系。使用protégé软件构建地理国情本体属性库的过程也就是对地理国情本体属性的每个组成部分进行构建的过程:

类的构建:建立基本本体属性(如“对象”、“成因”、“时间性”、“物质性”、“空间性”、“量度”等)的所有子类及实例,如图3所示。

图3 属性的创建

实例的构建:针对个顶的本体属性(如“成因”),其分支及具体值即为实例(“成因”可分为“人工”和“天然”,而“天然”的实例有“冰川作用”、“风蚀作用”等),如图4所示。

属性的构建:对于“功能”、“目的”之类的动词,在protégé中采用属性进行表达,如图5所示。

图4 实例的创建

图5 类的创建

5 结 语

测绘地理信息科技发展在“十二五”提出了“构建数字中国、监测地理国情、发展壮大产业、建设测绘强国”的总体发展战略。地理国情监测工作将是我国测绘地理信息发展的新方向,本文就如何提供地理国情信息服务展开思考和研究,通过分析发现,要实现地理国情信息语义共享的关键是使其语义描述明确且形式化,而本体属性枚举法是一种有效的方法。

在此基础上,本文以天津市2011年监测成果及其服务行业为研究对象,提出了一种地理国情本体的建库方法,这种方法可以应用其他地理概念的形式语义分析,得出明确的形式语义,为解决地理信息的语义共享提供有效的理论基础和技术方法。然而,地理国情涉及地理概念极其复杂,如何在地理国情本体属性库的基础上,真正实现所有行业之间的语义关系的推理和定制化地理国情信息的提取,还有待于进一步研究。

[1] 徐德明.监测地理国情服务科学发展[N].人民日报,2011-03-29.

[2] 张继贤,刘继平.关于地理国情监测的若干思考[N].中国测绘报,2011-3-8.

[3] 刘若梅.测绘部门开展地理国情监测工作的定位思考[N].中国测绘报,2011-4-8.

[4] Bishr Y.Overcoming the Semantic and Other Barriers to GIS Interoperability[J].International Journal of Geographical Information Science,1998,299~314.

[5] Fonseca F.Egenhofer M.Using Ontologies for Integrated Geographic Information Systems[J].Transactions in GIS,2002,6(3) [6] Frank A.U.Tiers of ontology and consistency constraints in geographic information systems[J].International Journal of Geographical Information Science, 2001,667~678.

[7] Kavouras M.and Kokla M.Ontology-Based Fusion of Geographic Databases,Spatial Information Management,Experiences and Visions for the 21st Century,International Federation of Surveyors,2000.

[8] Klien,E.,Lutz,M.Ontology-Based Discovery of Geographic Information Services-An Application in Disaster Management [J].Computers,Environment and Urban Systems,2006,30 (1):102~123.

[9] Bernard,L.,U.Einspanier,S.Ontology-based Discovery and Retrieval of Geographic Information in Spatial Data Infrastructures[R].Geotechnologien Science Report No.4,2004.

[10] Vckovsky,A.Special Issue:Interoperability in GIS[J].International Journal of Geographical Information Science,1998,12(4):297~298.

[11] Kuhn W.Modeling the Semantics of Geographic Categories through Conceptual Integration[J].GIScience 2002,108~118.

[12] Dean Jones.Developing shared ontologies in multi-agent systems[A].In ECAI’98Workshop on Intelligent Information Integration[C].Brighton,U.K.,August,1998.

[13] Kavouras M.Kokla M.Comparing Categories among geographic ontologies[J].Computers&Geosciences,2005,31 (2):145~154.

[14] Tomai E.and Spanaki M.From ontology design to ontology implementation:A web tool for building geographic ontologies[A].8th AGILE Conference on Geographic Information Science[C].2005.

[15] 张德海.NKI国家和地区地理知识的获取与分析[D].昆明:云南师范大学,2002.

[16] 陈建军,周成虎,王敬贵.地理本体的研究进展与分析[J].地学前缘,2006,13(3):81~88.

[17] 崔巍.用本体实现地理信息系统语义集成和互操作[D].武汉:武汉大学,2003.

[18] 景东升.基于本体的地理空间信息语义表达和服务研究[D].北京:中国科学院研究院,2005.

[19] 孙敏,陈秀万,张飞舟.地理信息本体论[J].地理与地理信息科学,2004,20(3):6~11.

[20] 王红,李霖,王振峰.基于本体的基础地理信息分类层次研究[J].地理信息世界,2005,3(5):27~30.

[21] Fauconnier,G.Mappings in Thought and Language[M]. Cambridge uk:Cambridge University Press,1997.

[22] 汪子嵩.亚里士多德关于本体的学说[M].北京:人民出版社,1997.

中国城市规划协会城市勘测专业委员会华东专家组2013年工作会议在常州淹城顺利召开

(本刊讯)根据年度工作计划,中国城市规划协会城市勘测专业委员会华东专家组2013年工作会议于5月10日~12日在常州淹城召开。本次会议由华东专家组举办,常州市测绘院承办,华东专家组全体专家出席了会议。会议特邀了城市勘测专业委员会主任委员、专家委员会主任赵通海,天津市测绘院马华山院长、华北东北专家组组长胡珂总工程师,并邀请了其他非华东专家组成员的江苏省省辖市城市勘测院院长,共80多人参加了此次会议。

会议由城市勘测专业委员会华东专家组组长储征伟主持,常州市规划局李青副局长出席开幕式并致欢迎词。会议期间,赵通海主任委员向大家传达了协会2013年工作要点,指出当前我们正处在城镇化发展的新阶段,城市规划管理的内容和方法不断更新,这些对城市勘测、地理信息产业提供了更大的机遇和发展空间,也对城市勘测单位提出了更高的要求。城市勘测单位要加快业务拓展,壮大实力提高服务与保障能力。

储征伟组长传达了2013年城市勘测专业委员会专家组组长石家庄会议精神,专家组研讨了今年及今后华东专家组的相关工作,与会代表与专家还交流了城市勘测工作经验、科研成果和学术信息,传递最新政策并展开了热烈讨论。常州市测绘院刘全海院长向代表们演示该院最新信息化成果;南京市测绘勘察研究院有限公司就地铁隧道结构安全自动化监测系统应用进行了报告。

本次会议期间得到了常州市测绘院的周到细致服务,与会代表全体成员向其表示衷心感谢!

(中国城市规划协会城市勘测专业委员会华东专家组,常州市测绘院供稿)

A M ethod for Building Geographical Conditions Ontology Attribute Library——Exem p lifying Tianjin

Zhang Zhijun1,2,Li Chengxin1
(1.Tianjin Institute of Surveying and Mapping,Tianjin 300381,China; 2.The State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing,Wuhan University,Wuhan 430079,China)

As a new tool and new approach in the scientific development of surveying and mapping service,themission of geographic national conditionmonitoring is to provide objective,fair and accurate thematic information for integrated decision-making atall levels of government.How to realize the semantics sharing of geographic national condition thematic information is the key problem for geographic national condition to provide cross-industry,cross-sectoral and interdisciplinary information service.Based on ontology theory,this paper proposed amethod for building geographic national conditions ontology attribute database.Conceptualization and formal representation aremade for geographic national information,and Tianjin is selected as knowledge domain for itsmonitoring content and service users,protégésoftware is used to build ontology attribute library.

fundamental geographic information;geographical concept;semantics;formal ontology

1672-8262(2013)03-9-05

P208

A

2012—12—10

张志军(1983—),男,工程师,研究方向为地理信息应用和智慧城市。

国家863项目(SS2013AA120303);国家自然基金(41001307)

猜你喜欢

国情本体天津市
有趣的云
眼睛是“本体”
家国情 诗词魂
如果画笔会说话?
天津市第三届“未来之星”初中数学邀请赛
推广生物乙醇汽油:迫切且合乎国情
基于本体的机械产品工艺知识表示
地理国情监测知识支持库初步设计
特定国情教情中的中小学校自主权
专题