互联网影像地图和街景地图数据检测
2023-10-11王晓迪蔡艳辉闫庆庆陈春希
王晓迪,蔡艳辉,闫庆庆,马 旭,陈春希,党 宇,白 金
(1.国家测绘产品质量检验测试中心,北京 100830)
互联网地理信息服务特指一种在Web环境下进行访问的网络地理信息服务[1]。随着计算机、通信、互联网技术的快速发展,百度地图、高德地图、腾讯地图等互联网地图服务市场迅速扩张[2],日益成为大众生活中不可或缺的重要内容,但在方便大众的同时,也对地理信息监管带来了巨大挑战。近年来,国家陆续发布的系列文件和标准提出了相应要求,如《地图管理条例》[3]设置了“互联网地图管理”专章,对互联网中登载使用地图等行为的保密、地图审核和备案等提出了明确要求;《公开内容表示若干规定》等系列法规政策对互联网地图公开表示的内容做出了明确具体的规定[4]。
相比线划地图,互联网影像地图和街景地图在信息内容表现上更加丰富,用户使用更直观,体验感觉更好,受到普遍欢迎;但也因其信息量大,存在更多信息泄露的潜在风险。客观、准确地对其数据进行检测,是监管互联网地图的重要基础[5]。目前,在导航电子地图数据生产和质量检测方面,发布了CH/T 1019-2010 《导航电子地图检测规范》[6]和GB/T 28441-2012《车载导航电子地图数据质量规范》[7],但对互联网地图数据检测的标准和方法较少;赵宁[8]提出了互联网地图数据的质量元素,但未包含具体检测方法。本文以互联网影像地图和街景地图数据检测工作为例,对其数据现状进行分析。
1 产品现状与数据生产流程
在互联网影像地图产品方面,各家图商都将其作为主要的基础地图产品,提供了较完善的服务,高分辨率影像对县级以上城市的覆盖率较高。在互联网街景地图产品方面,个别图商提供了大多数县级以上城区主要街道的在线街景地图服务,部分图商已下架街景地图业务。
数据生产流程包括:①信息收集,内容包括步行采集、车辆采集、企业用户信息、互联网信息、航空摄影测量与卫星影像、呼叫中心等;②导航数据生产,即绘制地图道路、POI、背景、图片、实时交通、三维城市等;③通过数据转换、编译测试后,地图即可根据需求实时发布在车载导航、移动导航、互联网位置服务以及政府企业应用上。
2 检测内容、方法与流程
2.1 检测内容
1)互联网影像地图数据检测内容。根据《公开地图内容表示若干规定》及其补充规定等要求,互联网影像地图数据检测的主要内容包括地面分辨率和空间位置精度。地面分辨率包括影像地图的像元分辨率和地物分辨率,像元分辨率为影像地图单位像素覆盖的地面单元大小;地物分辨率为影像上能详细区分的最小地面单元尺寸。由于互联网影像地图服务通常采用不同分辨率的遥感影像来实现不同比例尺视角下的用户浏览,因此只检测最高地面分辨率影像,并统计使用的遥感影像分辨率种类。空间位置精度,即影像地图数据提供的地物位置精度。
2)互联网街景地图数据检测内容。根据《基础地理信息公开表示内容的规定(试行)》《公开地图内容表示若干规定》[9]及其补充规定等要求,结合互联网街景地图内容和使用特点,互联网街景地图数据检测的主要内容包括国家规定的不允许公开表示的地理信息内容,将实景影像地图中不允许公开表示的内容分为涉军类、非涉军类和属性标牌类,通过多种途径收集参考数据,并将参考数据按上述3 类进行整理、分析和归纳。参考数据应包括大比例尺地形图、可公开表示机场名录、中国国家地名信息、各行业相关网站发布的涉及地理信息的可公开信息等。
2.2 检测方法
2.2.1 互联网影像地图数据检测方法
1)地面分辨率。像元分辨率为影像数据单位像素对应的地面几何距离,对于给定的影像数据,它是一个与影像相关的固定值。目前发布的互联网影像地图服务都是经过处理的影像瓦片格式数据,基于OGC的互联网瓦片格式标准,从当前互联网上直接下载样区特征地物最大级别互联网遥感影像标准瓦片,选取典型线状地物的长度,分别测定线状地物两端的地面坐标,计算线状地物的平面投影距离;通过Photoshop、ArcGIS等软件获取瓦片地图上特征线状地物两端的像素值(图1)。
图1 瓦片左、右端像素值
互联网遥感影像分辨率的计算公式为:
式中,d为线状地物长度;m为线状地物的像素数,为浮点像素距离,暂不考虑纵、横向分辨率的差异。
式中,mx1、mx2为线状地物其中一个端点的像素宽;my1、my2为线状地物另一个端点的像素高。
地物分辨率为基于影像数据分辨地面物体的能力,一般与影像获取设备和影像识别技术相关。应用上,地物分辨率通常与像元分辨率之间存在Kell系数关系。Kell 系数随影像的不同而不同,一般大于2.0。从互联网遥感影像地图最大级别缩放至最小级别,记录不同遥感影像更换的次数。各检测区域内分辨率检测点应分布均匀,影像地图瓦片为同一个放大级别,参照GB/T 24356-2009 《测绘成果质量检查与验收》[10],检测点数量不少于20个,以算术平均值作为样区的互联网遥感影像分辨率。
2)空间位置精度。由于互联网地图数据都经过保密技术处理,其服务接口提供的坐标输出实际上包括地图本身的精度和保密技术处理引入的扰动值,因此空间位置精度不完全符合通常的位置精度概念,本文采用位置偏差定义该检测结果。通过接口选取互联网遥感影像上的特征地物点作为检测特征点,在影像地图上,通过互联网地图软件提供坐标输入接口获取特征地物点的互联网遥感影像坐标,从高精度参考影像数据(如高分影像)中获得对应地物点的实地坐标,进而统计位置精度。
根据GB/T 24356-2009《测绘成果质量检查与验收》[10],各检测区域内特征点应均匀且不少于20 个,若特征点少于20个,则以误差的算术平均值代替中误差;若大于20个,则按中误差进行统计,以误差的算术平均值代替中误差。
2.2.2 互联网街景地图数据检测方法
依照地理信息检测内容列表,从当前互联网实时运行的地图网站上直接对检测区域涉及的图商街景地图数据进行图面浏览检查,对疑似敏感POI信息进行关键字搜索,检查不允许公开的敏感信息是否进行了删除或局部技术处理。相关内容包括军事设施(军事单位、军事标识)、重要设施(公共安全、水利和气象设施、电力、通信、管线、战略储备)和交通要素(铁路、公路、桥梁和隧道、通行信息、机场)。基于敏感POI信息库,采用符合性判定,确定被检内容是否为敏感信息。
2.3 检测流程
结合上述检测内容与方法,本文总结出一套检测流程,主要分为数据准备、数据检测、形成记录、结果分析4个阶段。
3 检测实例
3.1 检测概况
本文选取3家较有影响力的互联网地图图商公开互联网地图服务中的互联网影像地图和街景地图数据,选择8 个互联网影像地图区域(表1)和11个互联网街景地图区域(表2)开展检测。
表1 互联网影像地图数据检测区域表
表2 互联网街景地图数据检测区域表
检测结果表明,3 家图商互联网影像地图数据的最高像元分辨率均值分别为0.42 m、0.51 m和0.50 m,对地物可识别度无明显差异;3 家图商互联网影像地图数据平面位置偏差在不同样区偏差不同,均值分别为1 311 m、495 m和561 m;1家图商的互联网街景地图数据在大部分检测区域内表示规范,但也存在对个别军事单位、重要设施、桥梁限高和载重等不可公开表示内容未处理或处理不彻底的情况。
3.2 互联网影像地图数据检测结果
1)互联网影像地面分辨率。对8个检测区域影像地图的数据分辨率进行检测:图商A影像地图数据采用4~6 种分辨率影像,最高、最低像元分辨率分别为0.39 m、0.45 m,平均为0.42 m,影像瓦片最大支持19 级;图商B 影像地图数据采用4 种分辨率影像,最高、最低像元分辨率分别为0.46 m、0.53 m,平均为0.51 m,影像瓦片最大支持18 级;图商C 影像地图数据采用5 种分辨率影像,最高、最低像元分辨率分别为0.45 m、0.54 m,平均为0.50 m,影像瓦片最大支持18 级。图商B、图商C 分辨率相近,图商A 分辨率略高。地图数据地面分辨率检测情况详见表3。
表3 互联网遥感影像地图数据分辨率检测结果表
2)互联网影像地图平面位置精度。经检测,8个检测区域互联网影像地图的数据空间位置偏差为:图商A影像地图数据平均为1 311.1 m,其中最小值为西宁市,最大值为北京市;图商B影像地图数据平均为495.3 m,其中最小值为西宁市,最大值为襄阳市;图商C影像地图数据平均为561.8 m,其中最小值为西宁市,最大值为襄阳市(表4)。8个区域3家图商影像地图数据整体趋势基本一致,其中西宁市的平面位置偏差较小,图商A的平面位置偏差显著高于另外两家。
表4 互联网遥感影像地图数据位置精度检测结果/m
3.3 互联网街景地图数据检测结果
经检测,个别图商互联网街景地图产品存在敏感信息,典型问题如下:
1)军事设施方面。存在对军事单位名称、标识未处理或处理不彻底情况,见图2、3。
图2 军事单位标识处理不彻底
图3 军事单位名称、标识未处理
2)重要设施方面。存在对不宜公开表示的气象台站设施的未处理情况(图4),对不可公开表示的管线设施未处理或处理不彻底等情况(图5),对不可公开的重要战略物资储备和管理设施未处理等情况(图6)。
图4 气象站设施名称未处理
图5 管线设施名称未处理
图6 测量标志未处理
3)交通要素方面。存在对不可公开的道路交通设施未处理和处理不彻底等情况(图7~9)。
图7 道路限高未处理
图8 过街天桥限高未处理
图9 公路桥载重未处理
4 结语
本文对互联网影像地图和街景地图数据检测的相关技术方法进行了探索,并对检测结果进行了分析,为后续相关工作积累了一定的经验。该检测方法仍有优化空间,将在下一步工作中继续研究完善:①在互联网街景地图中自动识别地理信息检测内容列表的敏感内容,设计自动检索和模糊查找插件,将查找出的问题定位到街景地图上,人工再进一步审核;②设计端点对象捕捉插件,在选取典型线状地物端点时,减少选点精度误差;③依据香农采样定理推算不同影像的Kell系数。
由检测结果可知,当前互联网影像地图和街景地图数据存在一定的涉密地理信息隐患问题,应开展互联网地图数据检测工作,加强监管;也呼吁互联网地图从业人员进一步提高地理信息保密意识,使得互联网地图服务产业更加有序地发展[11]。