APP下载

海量动态异构空间标绘信息实时接入技术

2017-04-28倪金生刘翔杨劲林李莹苏晓玉朱学山

自然资源遥感 2017年2期
关键词:自动识别异构词典

倪金生, 刘翔, 杨劲林, 李莹, 苏晓玉, 朱学山

(北京航天泰坦科技股份有限公司,北京 100070)

海量动态异构空间标绘信息实时接入技术

倪金生, 刘翔, 杨劲林, 李莹, 苏晓玉, 朱学山

(北京航天泰坦科技股份有限公司,北京 100070)

随着全球经济建设和社会发展,社会各界对互联网空间信息的需求日益广泛。通过分析动态异构空间信息特征及来源,建立空间数据自组织规则,采用互联网信息地名识别与内容整合技术、万个级用户协同标绘技术、基于虚拟资源池的动态异构空间信息存储技术、空间数据的自适应显示技术和断点续传的要素级数据更新机制,对海量全球动态异构空间信息实时接入方法进行原型设计。结果表明: 海量动态异构空间信息实时接入技术解决了标绘信息的实时传输,实现了多尺度下的标绘数据的实时/准实时显示,确保了海量空间信息资源服务的实时性和可读性。

动态异构; 空间标绘信息; 动态接入

0 引言

协同交互工作于1984年由Irene Greif和Paul Cashman等提出,当时是为了描述他们所组织的有关如何用计算机支持来自不同领域与学科的共同工作的课题。随着计算机技术和互联网络信息技术的发展,协同交互技术的研究适应了信息化社会中人们工作方式的群体性、交互性、分布性和协作性特点,因此该技术被认为是未来社会中广泛采用的技术[1]。随着对协同交互技术研究的日益深入,研究人员对协同交互系统的概念越来越趋于一致。Ellis在1991年提出“协同交互系统可以定义为这样的计算机系统,它支持一组用户参与一个共同的任务,并提供给他们共享环境的接口”。协同交互技术的实质是通过计算机网络为用户建立一个共享环境,在这个环境下,用户可以相互合作来共同完成一项工作[2]。

目前协同交互系统非常多,如桌面会议系统、远程教学、远程医疗、远程实时军事指挥、分布式虚拟环境、协同写作与编著系统、工作流系统等。基于数据库的协同标绘系统同样属于协同交互系统,它体现了协同交互工作的2个基本特征: 多协作对象和共享信息协同交互。协同标绘最多也最早运用于军事指挥上,目前在国际上,外军已将一些较为优秀、实用的系统用于军队作战和指挥。以美军为例: 20世纪70年代末开始研究计算机辅助标图(以下简称机助标图)的方法; 80年代初初具规模,80年代末进入成熟阶段; 90年代后,美军已在多次局部战争和军事演习中使用机助协同标图系统,协同标图系统提供在地理信息基础上叠加显示来自战场空间相关的各种实体信息的能力[3]。在国内,计算机标图工作起步较晚。目前,已经开发出成熟、实用的单机标绘系统,其中不乏一些优秀之作,如相关单位开发的标图系统、参谋系统等。网络环境下的协同标绘也已经有不少研究,比如信息工程大学测绘学院已经做出了原型系统,但是离真正实用还是有一定的距离。

虽然许多因素制约了协同标绘在实际中的应用,但是国内外学者近年来对协同技术研究的深入,尤其是协同编辑和工作流等相关技术及理论研究的深入,为解决GIS协同标绘问题提供了解决思路,使得GIS协同标绘的实现成为可能。本文在综合以往研究工作基础上,针对目前国内外发展的需求,提出了基于万级用户的全球系统标绘技术的研究方法和思路,并对其进行了原型设计。

1 研究内容

全球动态异构标绘信息实时/准实时接入的技术难点包括基于网络信息的地名自动识别及空间定位、基于虚拟资源池的全球动态异构标绘信息接入、标绘信息自适应实时/准实时显示、动态异构标绘信息的更新等。基于网络信息的地名自动识别及空间定位通过建立全球范围内的地名索引库,利用地名自动识别,从相关的网络文本中提取地名,从空间数据库中获取地名坐标,目的是实现地名的自动识别和空间信息的定位; 基于虚拟资源池的全球动态异构标绘信息接入实现标绘信息在服务器端和客户端的传输和客户端快速定位,还原展示标绘数据库中的标绘信息,是标绘信息的再现; 标绘信息自适应实时/准实时显示基于细节层次(levels of detail,LOD)、影像金字塔和GIS符号化,建立不同尺度下空间标绘数据的显示规则,为后续的数据实时显示、动态发布提供基础; 标绘信息的更新采用断点续传的要素级数据更新机制,确保遥感应用资源元数据信息的实时性和唯一性。

2 技术路线及原型设计

全球海量动态异构空间信息实时/准实时接入技术是全球动态异构空间信息协同标绘的重要组成部分,主要包括动态异构标绘信息的获取与接入。

针对动态异构标绘信息实时/准实时载入的主要任务,结合标绘信息的自身特点,进行动态异构标绘信息的来源分析,对标绘数据进行入库,利用标绘信息内容整合技术生成标绘知识,采用基于多维数据索引结构实现动态异构数据的接入,基于时空关联规则的标绘数据的更新,实现全球动态异构标绘信息实时/准实时接入,具体技术路线如图1所示。

图1 全球动态异构标绘信息实时/准实时接入技术路线图

2.1 动态异构标绘信息的获取

首先分析动态异构标绘信息的特征,建立标绘数据组织规则; 再针对数据的来源,通过人民搜索引擎、人工标绘以及数据截取等方式,获取动态异构标绘数据,并对其进行地名自动识别,进行标绘数据的入库; 最后对标绘数据库中的数据进行整合(参见多尺度空间标绘数据内容整合与实时动态发布),获取标绘知识数据。图2为动态异构标绘信息获取的技术流程图。

图2 动态异构标绘信息获取的技术流程图

2.1.1动态异构标绘信息的分类

动态异构标绘信息的是指多形态、多结构化的标绘数据,按其表现形式及其属性特征划分,主要包括文字、图片、视频/音频、矢量数据、栅格数据以及三维模型等数据类别。

2.1.2 动态异构标绘信息的来源

基于数据获取的途径,动态异构标绘信息可以通过人工标绘以及网络数据的截获获取。人工标绘数据是指人工手动标绘的数据,包括文字、文本、图片、视频/音频、空间矢量数据、栅格数据以及三维模型等形式,这些数据都以统一的规则存放于标绘知识库中,并具有时空属性特征; 网络数据截获主要利用系统提供的协议编程接口来实现,通信时,数据首先被写入本地主机的socket中,然后该socket通过网络接口卡(network interface card,NIC)的传输介质将传来的信息发送到另一台主机的socket中,从而实现数据的截获。

2.1.3 基于网络信息的地名自动识别及空间定位

通过对GIS地名库及专题地名库进行整合处理,构建比较完整的城市地名词典和地名索引库; 通过地名自动识别,从相关的网络文本中提取地名,从空间数据库中获取地名坐标,最终将具有空间属性的数据存入标绘信息数据库。图3为该流程的技术框图。

图3 基于网络信息的地名自动识别及空间定位技术流程图

基于网络信息的地名自动识别及空间定位关键技术主要包括地名词典的数据组织、地名词典空间索引的构建和单句地名的自动识别。

1)地名词典的数据组织。要实现对任意文本和任意形式的地名都能自动识别出来,地名词典应具备地名完备性。词典越完整,地名识别的效果就越好。采用“分层分块”的地名数据组织方式构建地名词典,根据不同类型和不同区域专题数据,提取相应层和相应区域的地名作为地名词典。这样既保证了词典的数据完整性,又提高了识别效率。

2)地名词典索引库的建立。构建地名词典索引库的目的主要有2个: 一是提高对地名词典的检索效率,类似于普通词典中的检索目录,同时这也是借鉴了GIS中对空间数据进行索引的思想; 二是从地名词典中提取相关特征字和特征参数,为快速地名识别做好相关准备工作。地名词典索引库的构建过程如图4所示。

图4 地名词典索引库的建立流程图

首先遍历地名词典,将所有地名首字去重后排序; 然后构建全局单字索引,并在索引中存储对应的所有地名记录ID和最大地名长度。

3)单句地名的自动识别。单句地名自动识别可分为2步进行: 一是地名单元切分,二是编码分析和单元合并,具体的切分算法流程如图5所示。图中S1表示待切分的地名字符串,S2表示经过单句地名识别后输出的字符串结果,H表示从待切分的地名字符串左起选取的首单字,MaxLength和L分别表示遍历地名词典索引库得到的单字的最大长度及对应词典的地名链表;W=S1·Left(MaxLength)为一个字符串截取函数(W,S1及MaxLength均为变量),表示从左起截取S1字符串的MaxLength个字符,函数返回的结果存储在W字符串中。图中DI表示地名词典索引库,C表示地名单元对应的行政区划编码,P表示地名单元到句首的相对距离。

图5 单句地名自动识别方法流程图

2.2 基于虚拟资源池的动态异构标绘信息接入

动态异构标绘信息的接入主要解决标绘信息怎么在服务器端和客户端传输,并在客户端如何快速定位还原展示标绘数据库中的标绘信息。

建立在标绘数据自组织模型和互操作模型之上,针对不同类型标绘数据的特点,将已存在于分布式数据库中的标绘知识数据(经整合后的标绘数据),依据数据的存储机制,实现分析、提取和转换等预处理操作,对外提供动态异构标绘信息的快速访问能力,并且将标绘信息快速定位还原显示。图6为该流程的技术框图。

图6 基于虚拟资源池的全球动态异构标绘信息接入技术流程图

2.2.1数据的传输方式

数据的传输方式主要包括端/端发送方式、多播发送方式和广播方式[4]。端/端发送方式主要用于客户端与服务器建立连接后,客户端标绘的数据传送给服务器端; 多播发送方式是针对不同层面级别的用户,从“控制层面”和“数据层面”2个方面实现数据载入的控制; 而广播方式是主机之间一对所有的通讯模式,网络对其中每一台主机发出的信号都进行无条件复制并转发,所有主机都可以接收到所有信息。

数据库中的标绘信息数据必须转换成网络数据报才能在服务器端和客户端进行传输,接收端收到网络数据报后再进行还原,因此网络数据报是整个数据的传输基础,具体表现形式为XML。

2.2.2 标绘信息映射

基于网络数据报的传输技术,针对计算资源、I/O资源分布不均衡以及服务器节点存在异构性的特点[5],采用虚拟资源池和虚拟映射的技术,将每一个服务器按照其处理能力计算资源数量,并将计算出的资源加入资源池中,进行统一的分配与调度,从而实现异构环境下混合负载的均衡分布,采用保证数据的快速传输。其技术流程如图7所示。为了加快系统的处理速度,可以按区域将空间标绘信息从服务器传送到某一虚拟的资源池中,当用户鼠标点击某一区域范围时,直接将需要显示的标绘信息指向该区域所对应的虚拟资源池,再将其映射到实际用户的操作界面。

图7 基于虚拟资源池的全球动态异构标绘信息的映射技术流程图

2.3 标绘信息自适应实时/准实时显示

基于LOD、影像金字塔和GIS符号化,建立不同尺度下空间标绘数据的显示规则,突破标绘数据的自适应显示技术,实现多尺度下的标绘数据的实时/准实时显示,主要工作包括标绘数据的显示规则的建立和标绘数据的实时/准实时显示[9]。数据实时显示的机制如图8所示。

图8 数据实时显示机制

2.4 动态异构标绘信息更新

基于“分布式文件系统+数据库”的存储机制,采用断点续传的要素级数据更新机制实现动态异构标绘信息的更新。

动态异构标绘信息的更新包括搜索引擎数据的更新和协同标绘数据的更新[7]。搜索引擎数据的更新是指由搜索引擎获取的数据利用基于网络信息的地名自动识别及空间定位技术对搜索引擎获取的数据(网页)进行处理,并存入标绘信息数据库; 标绘数据的更新是指对实时标绘的数据进行整合后,存入标绘信息数据库,对数据进行更新的过程。

3 结论

本研究取得的主要技术成果有: 在动态载入中解决了标绘信息的实时传输; 突破了标绘数据的自适应显示技术,实现了多尺度下的标绘数据的实时/准实时显示问题; 在协同标绘模型中解决了万级用户协同标绘角色访问控制和冲突消解机制,从而实现兆字节级动态数据实时或准实时接入连接,以及万个用户级的协同标绘。

[1] Boujut J F,Blanco E.Intermediary objects as a means to foster co-operation in engineering design[J].Computer Supported Cooperative Work(CSCW),2003,12(2):205-219.

[2] 温泉,何建敏,曹杰,等.面向协同制造的分布式对象与虚拟设计环境研究[J].通信学报,2006,27(11):154-160. Wen Q,He J M,Cao J,et al.Study on collaborative manufacturing oriented distributed objects and virtual design environment[J].Journal on Communications,2006,27(11):154-160.

[3] 刘海涛.GIS协同标绘技术研究[D].济南:山东大学,2006. Liu H T.The Research of GIS Collaborative Plotting Technology[D].Ji’nan:Shandong University,2006.

[4] 李菲,俞波,郭亚宁,等.桌面视频会议系统研究开发[J].计算机工程与科学,2003,25(3):56-59. Li F,Yu B,Guo Y N,et al.Research and development of desktop video conference systems[J].Computer Engineering and Science,2003,25(3):56-59.

[5] 郑浩,冯毅雄,谭建荣,等.一类制造资源的协同建模、优化与求解技术[J].计算机集成制造系统,2012,18(7):1387-1395. Zheng H,Feng Y X,Tan J R,et al.Collaborative modeling,optimization and solving technology for one manufacturing resource[J].Computer Integrated Manufacturing Systems,2012,18(7):1387-1395.

[6] 余粉,王光霞,万刚.大数据量遥感影像的快速调度与显示[J].海洋测绘,2006,26(2):27-30,40. Yu F,Wang G X,Wan G. Rapid allocation and display of massive remote sensing image[J].Hydrographic Surveying and Charting,2006,26(2):27-30,40.

[7] 白玉琪,杨崇俊.空间信息搜索引擎研究[J].中国矿业大学学报,2004,33(1):90-94. Bai Y Q,Yang C J.Research on spatial information search engine[J].Journal of China University of Mining and Technology,2004,33(1):90-94.

(责任编辑: 邢宇)

A real-time access technology for massive dynamic heterogeneous spatial information

NI Jinsheng, LIU Xiang, YANG Jinlin, LI Ying, SU Xiaoyu, ZHU Xueshan

(BeijingAerospaceTitanTechnologyCo,LTD,Beijing100070,China)

With the development of global economy and society, international spatial information is needed by community increasingly. The features and sources of dynamic heterogeneous space information are analyzed and, on such a basis, organizational rules of spatial data are established. Using international place names identification and content integration technology, tens of thousands of users’ collaboration plotting, dynamic heterogeneous spatial information storage technology based on virtual resource pool, adaptive display of spatial data and mechanism of breakpoint continuingly element level data updating, the authors prototyped the method of massive global dynamic heterogeneous spatial information real-time/near real-time access. The design and research results show that the real-time access technology for massive dynamic heterogeneous spatial information solves real-time transmission of plotted information, realizes the real-time/near real-time display of plotting data on multiple scales and ensures the real-time and readability of massive spatial information resources and services.

dynamic heterogeneous; space plotting information; dynamic access

10.6046/gtzyyg.2017.02.32

倪金生,刘翔,杨劲林,等.海量动态异构空间标绘信息实时接入技术[J].国土资源遥感,2017,29(2):221-225.(Ni J S,Liu X,Yang J L,et al.A real-time access technology for massive dynamic heterogeneous spatial information[J].Remote Sensing for Land and Resources,2017,29(2):221-225.)

2015-09-17;

2015-12-15

国家“863”计划项目“星机地综合定量遥感系统与应用示范” (编号: 2013AA12A303)和“全球海量空间信息更新关联与主动服务系统”(编号: 2013AA12A402)共同资助。

倪金生(1964-),男,博士,主要从事空间信息处理与行业应用服务等方面的研究。Email: jasonni@apollotg.com。

TP 722.6

A

1001-070X(2017)02-0221-05

猜你喜欢

自动识别异构词典
ETC拓展应用场景下的多源异构交易系统
基于数据挖掘的船舶航迹自动识别系统
试论同课异构之“同”与“异”
太阳黑子自动识别与特征参量自动提取
米兰·昆德拉的A-Z词典(节选)
米沃什词典
基于卫星遥感图像的收费站位置自动识别与校核
船舶自动识别系统对船舶救助的影响
词典引发的政治辩论由来已久 精读
吴健:多元异构的数字敦煌