中巴经济走廊(喀什至伊斯兰堡段)高分正射影像数据集
2019-11-17韩立钦张耀南田德宇康建芳
韩立钦,张耀南,田德宇,康建芳,2
1. 中国科学院西北生态环境研究院, 科学大数据中心,兰州 730070
2. 国家特殊环境、特殊功能观测研究台站共享服务平台,平台服务中心,兰州730070
3. 中国科学院大学,北京 100049
4. 甘肃省测绘工程技术研究中心,甘肃天水 741000
数据库(集)基本信息简介
引 言
中巴经济走廊是“一带一路”战略大局的重要组成部分,北起中国喀什、南至巴基斯坦瓜达尔港,主要沿中巴公路展开,包括公路、铁路、油气和光缆通道在内的一条经济大动脉[1]。走廊穿越喜马拉雅山、喀喇昆仑山、兴都库什山,地势北高南低(海拔 460-4750 m),峡谷深切、冰川广布、雪峰林立[2]。气候垂直分带明显,植被受气候、海拔、地形影响,不均匀发育显著,特殊的自然地理条件使研究区内冰崩、雪崩、冻融、滑坡、泥石流、岩崩、洪水、冰湖溃决等各类地质灾害频发,给基础设施规划建设带来了极大的挑战[3-5]。
近年来,随着SPOT等一系列卫星遥感数据的推出,高分影像在区域制图[6]、灾害监测[7]和资源调查[8-9]等领域迅速普及。以高分对地观测系统宏观、快速、动态、高空间、高时间、高光谱的优势开展中巴经济走廊地质灾害专题制图、灾情监测,同时融合气象、水文、地质、冰川、冻土、土壤类型等数据,建立孕灾认知、演变分析的机理模型,将对该区域基础设施建设提供有力的数据支持和保障[10-11]。
本数据集全部采用国产高分专项数据资源,也是国内大规模利用国产高分数据制备中巴经济走廊基础影像数据的一次尝试,实现了中巴经济走廊(喀什至伊斯兰堡段)2 m分辨率,中巴公路两侧约60 km的数字正射影像图(DOM,Digital Orthophoto Map),其中中国境内415公里(G314国道),巴基斯坦境内809公里(N35国道)。本数据集丰富了此区域空间数据资源,同时拓展了高分数据的应用领域。
1 数据采集和处理方法
1.1 数据来源与预处理
数据源主要有卫星影像和数字高程模型,如表1。中巴经济走廊(喀什至伊斯兰堡段)正射影像数据全部来源于我国高分辨率对地观测系统高分一号和高分二号卫星,高分一号为2013-2017年成像的全色2 m、多光谱8 m数据,高分二号为2015-2017年成像的全色1 m、多光谱4 m数据。在成像条件较好的中巴经济走廊中国段及巴基斯坦北部地区,影像云量控制在5%以下,巴基斯坦中部地区云量控制在10%以下,并进行相应的去云处理。其中高分一号数据占97.2%,高分二号为影像空白区补充数据。
表1 研究采用数据列表
本数据集通过ENVI和ArcGIS软件工具,利用数字高程模型对高分一号、高分二号影像数据进行正射校正、全色与多光谱融合、匀色、镶嵌等处理。由于高分一号和高分二号卫星影像采集的时间分辨率限制,研究区影像资源横跨5个年份,考虑到不同成像时间的季节差异,对高分一号所有影像数据进行统一匀色。对于高分一号未覆盖区域,利用高分二号影像资源作为补充,独立进行匀色处理。最终按照一定范围裁切生成数字正射影像分块数据集,供用户分块检索使用(图1)。其中,正射校正、数据融合的精度与效果是数据生产的关键。
ASTER GDEM[12]数据是NASA根据新一代对地观测卫星Terra星载热辐射和反射计(即ASTER)3N和3B波段垂直向下观测成像,历时近10年制作完成。数据空间分辨率为1″×1″(约30 m×30 m),全球范围内置信度为95%时,垂直精度约为20 m。本研究区域多为高寒山区,地面高精度控制数据几乎为空白,DEM精度很难保证。
图1 正射影像生产流程
赵国松[13]等在华中地区3°×3°的研究区分析发现,ASTER GDEM产品高程值比STRM DEM平均低5.42 m。刘勇[14]指出山区的STRM DEM精度要比平原地区低很多,但是总体精度可以接受。如图2所示,在对公格尔-慕士塔格地区的ASTER GDEM、STRM DEM和ASTER L1T单景DEM统计分析发现,ASTER L1T单景DEM有明显异常,ASTER GDEM和STRM DEM无明显异常,但是STRM DEM最大值比慕士塔格峰主峰海拔多出200 m以上,而ASTER GDEM与实地测量值基本相符,因此,本数据集利用ASTER GDEM作为正射校正的高程数据源。
图2 高程数据统计分析结果
1.2 数据处理方法
1.2.1 RPC正射校正模型
卫星影像正射校正模型分为严格的几何纠正模型和近似纠正模型。本数据集无法精确地获知高分一号和高分二号的传感器参数与轨道参数等,不能建立共线方程,而多项式近似纠正模型适用于地面平坦地区。因此,面对地形较为复杂的中巴经济走廊地区,选择RPC有理函数模型法进行影像正射校正。
有理函数模型[15]是将影像中的像点在像方坐标系中的坐标(r,c)和其对应的地面点,经过空间转换投影后在物方坐标系中的空间坐标(X,Y,Z),用比值多项式关联起来。为了增强参数求解的稳定性,将地面坐标和影像坐标正则化到-1.0~1.0之间。
定义如下:
在式(1)中,(Xn,Yn,Zn)为正则化的地面点坐标,(rn,cn)为正则化的像点坐标。多项式P1,P2,P3,P4如式(2):
多项式系数0≤n1≤3;0≤n2≤3;0≤n3≤3,且n1+n2+n3=3,每个多项式P1,P2,P3,P4都是包含了20个系数的三次多项式,如式(3):
且满足:
式(4)中的X0,Y0,Z0,Xs,Ys,Zs为地面坐标进行位移的比例系数;r0,c0,rs,cs为影像坐标进行位移的比例系数。式(3)中的a,b,c,d是多项式系数,且a0,b0,c0,d0通常取值为1。
1.2.2 影像融合方法
遥感影像融合[16-17]是对多个传感器影像进行多级别、多层次的处理过程,以达到提高影像分辨率、增强目标特征、提高分类精度的目的,是提升遥感影像应用能力的重要手段。本数据集采用最邻近扩散全色锐化法(Nearest Neighbor Diffusion pan-sharpening,PanSharpening)完成高分一号和高分二号卫星影像全色与多光谱数据融合。与比值变换法(Brovey Transform,Brovey)、主成份变换法(Principal Component Analysis,PCA)和正交变换法(Gram-Schmidt,GS)等方法相比较,PanSharpening方法能够较好地保持多光谱影像的色彩、纹理和光谱特征,通过反映影像质量的均值、标准差、平均梯度、光谱质量的偏差指数、相关系数和影像信息量的交叉熵几个方面进行影像质量定量评价。
(1)均值(μ)
影像的全部像元灰度的算术平均值,反映了影像中地物的平均反射率。其中,F(i,j)为融合影像F在像素点(i,j)处的灰度值,M和N为影像F的大小。均值越高,则影像整体亮度越高。
(2)标准差(std)
标准差由均值间接得到,表示影像灰度像素值与平均值的离散程度。其中,F(i,j)为融合影像 F在像素点(i,j)处的灰度值,M和N为影像F的大小,μ为灰度平均值,标准差越大,灰度离散程度越大,影像反差越大,视觉效果越好。
(3)平均梯度(g)
平均梯度反映了影像的平均灰度变化率,即清晰度。F(i,j)为融合影像 F在像素点(i,j)处的灰度值,M和N为影像F的大小,其值表示融合影像中的微小细节反差和纹理变化特征,在融合影像中,平均梯度越大,影像清晰度越高。
(4)偏差指数(dc)
光谱扭曲度直接反映了融合影像对原光谱影像的失真程度。其值表示融合影像与原多光谱影像像元灰度值的差异和匹配程度。其中,F(i,j)为融合影像F在像素点(i,j)处的灰度值,M和N为影像F的大小,A(i,j)表示原多光谱影像在像素点(i,j)处的灰度值,偏差指数越大,影像失真越强烈。
(5)相关系数(cc)
相关系数反映了融合影像与源影像之间光谱特征的相关程度,以及融合影像光谱信息的保持能力。其中,F(i,j)为融合影像F在像素点(i,j)处的灰度值,M和N为影像F的大小,A(i,j)表示原多光谱影像在像素点(i,j)处的灰度值,μF与μA分别表示融合影像与源影像的灰度平均值。相关系数越大,融合影像从源影像中获取的信息越多,融合效果越好。
(6)影像信息量(ceA,F)
影像的熵值反映了影像信息的丰富程度。交叉熵(ce)用来衡量A、F两幅影像灰度分布的差异。对于一幅单一影像,各像素的灰度值是相互独立的,则影像灰度分布为P={P0,P1,…Pi,…Pn},Pi表示影像像素灰度值为i的概率,即灰度值为i的像素与影像总像素之比,l为影像总的灰度级数表示两幅影像像元灰度为i的概率。交叉熵越小,融合影像灰度分布与源影像的差异越小,即融合影像包含源影像的信息量越多,融合效果越好。
2 数据样本描述
本数据集分为中巴经济走廊(喀什至伊斯兰堡段)正射影像分幅数据、正射影像分幅索引数据和ASTER DEM数据。正射影像为2 m分辨率,部分1 m分辨率,TIFF格式,分幅索引数据采用SHP格式保存,所有数据的坐标系为WGS1984。局部数据结果如图3。
图3 中巴经济走廊(喀什至伊斯兰堡段)局部正射影像数据集
3 数据质量控制和评估
3.1 正射校正精度评估
本数据集采用基于 RPC参数构建有理函数模型的基础上,在正射校正过程中,利用优化后的ASTER GDEM进行第一次纠正,并对不正常变形区域,勾画边界进行掩膜处理,逐一将掩膜区域进行二维DEM可视化编辑,进行高程平滑,最后将修正后的DEM再导入正射校正模块,以此保证正射校正精度。
以研究区盖孜河谷区域样例影像(成像时间2016年)为例,从影像像元误差进行正射校正精度分析。在目标影像和参考影像上均匀选择25个检查点,其中参考影像来源于天地图第16级基础影像,空间分辨率为1.88 m。以参考影像为基准,目标影像检查点对应的最大误差X方向为0.35个像元,Y方向为0.4个像元;均方根误差X方向为0.42个像元,Y方向为0.38个像元。
从地面实测点与目标影像地物目标进行点位绝对定位精度误差分析,实测检查点来源于2017年中巴经济走廊科学考察中利用差分GPS实测的控制点,控制点分布如图4所示。由于研究区地处帕米尔高原与喀喇昆仑山交汇的无人区,实测控制点布设在中巴公路两侧标志明显的路基上,样例区段共7个,以其绝对定位误差与影像中对应标志点进行解算,统计影像标志点的平均平面中误差,结果表明,单点定位平面中误差最大为3.36 m,平均平面中误差为1.18 m。
3.2 影像融合评价
从目视角度上定性评价融合效果,Brovey方法颜色失真较大;GS方法清晰度较差;PanSharpening方法和PCA方法整体效果较好,但PanSharpening方法纹理较细腻,色彩、光谱等信息保持较好,高分影像采用PanSharpening方法融合效果较好,如图5所示。
图4 地面检查点分布
图5 四种融合方法效果
基于融合效果定量评价指标的计算公式,主要针对蓝、绿、红和近红外4个波段,分别对4种融合方法进行定量统计,结果如表2所示。
表2 融合效果评价
Brovey变化的结果是均值、标准差及平均梯度值都较低,影像质量效果较差,影像细节不清晰。虽然其影像信息量和相关系数与其他方法相当,但其偏差指数过高,光谱失真现象较严重。
GS变化的结果是均值、标准差与PCA和PanSharpening方法相当,但平均梯度较低,混合像元较多,地物分辨能力较差,其偏差指数值过高,光谱失真现象较严重。
PCA变化的结果是均值、标准差和评价梯度值较高,影像质量效果较好,虽比PanSharpening方法稍低,但比Brovey和GS方法优势明显。另外,其偏差指数较低,光谱失真较小,信息量保持不丰富。
PanSharpening变化的结果是均值、标准差和平均梯度与PCA方法能力相当,但比Brovey和GS方面优势明显,影像质量较好。光谱偏差指数值整体较小,光谱信息保持失真较小。相关系数值整体偏大,融合信息保持能力强。影像信息熵比其他方法均小,融合效果细腻,信息量丰富。
因此,从实验结果看,PanSharpening方法较适合与本区域高分影像融合处理。
3.3 镶嵌接边评价
其中影像镶嵌采用平均值作为栅格单元值,把多景影像按镶嵌线进行无缝拼接,主要包括计算轮廓线、颜色校正、影像羽化/调和、接边等处理步骤,镶嵌接边精度如表 3,影像接边处色彩过渡自然,地物合理接边,无重影现象,纹理清晰,效果如图4所示。
表3 影像镶嵌接边精度评价
4 数据价值
中巴经济走廊主要穿越多年冻土、冰川、积雪区,气候环境恶劣,人烟稀少,基础影像数据匮乏,国产米级分辨率影像数据几乎为空白,开展本区域冰川、积雪、冻土等特殊环境要素调查迫切需要高分辨率DOM数据。
本文基于国产高分一号、高分二号遥感数据,利用遥感图像处理软件开展中巴走廊高分DOM数据生产。针对正射纠正中的复杂地形影响,采用RPC有理函数模型进行纠正,针对全色与多光谱影像融合,采用PanSharpening工具,并与Brovey、GS、PCA等方法进行对比分析,最终实现了正射影像半个像元纠正精度,获得纹理清晰、光谱损失较小的正射数据集。
中巴经济走廊正射影像数据是走廊内工程选址、设计和规划的重要基础数据,也可作为全球气候变化背景下,走廊资源调查的本底数据。在正射影像数据基础上,结合气候、水文、生态等数据综合分析,对区域内工程长期安全运营和生态环境可持续发展有着重要意义。
5 数据使用方法和建议
中巴经济走廊(喀什至伊斯兰堡段)正射影像数据集保存为栅格TIF格式。ArcGIS、QGIS、ENVI、ERDAS等常用的GIS与遥感软件可支持该数据的读取和操作。
致 谢
感谢高分辨率对地观测系统甘肃数据与应用中心提供的高分影像数据,感谢美国航空航天局与日本经济产业省提供的ASTER GDEM V2高程数据,感谢美国DigitalGlobe商业卫星与IKONOS商业卫星公司提供参考影像数据。