基于动态聚类分析的卫星测高波形分类*
2011-11-14汪海洪罗志才周波阳周林兵
周 浩 汪海洪 罗志才 周波阳 周林兵
(1)武汉大学测绘学院,武汉 430079 2)海岛(礁)测绘技术国家测绘局重点实验室,青岛 266510 3)武汉大学地球空间环境与大地教育部重点实验室,武汉 430079 4)中国地震局地震研究所,武汉430071)
基于动态聚类分析的卫星测高波形分类*
周 浩1)汪海洪1,2,3)罗志才1,3)周波阳1)周林兵4)
(1)武汉大学测绘学院,武汉 430079 2)海岛(礁)测绘技术国家测绘局重点实验室,青岛 266510 3)武汉大学地球空间环境与大地教育部重点实验室,武汉 430079 4)中国地震局地震研究所,武汉430071)
结合卫星测高回波波形特征,以移动最小欧氏距离为相似度统计量,提出了一种基于动态聚类分析原理的雷达测高波形分类算法——最短距离法,实现了对雷达测高波形的有效分类。利用穿过台湾海峡的T/P波形数据,对比分析Beta-5和脉冲峰值方法分类结果,验证了该分类方法的可行性,并确定了近海测高波形合理分类的K值。
卫星测高;波形分类;T/P卫星;动态聚类分析;最短距离法
1 引言
波形分类是卫星测高数据处理中的一项重要工作。随着波形重定技术的发展,近海或非海洋表面的测高数据质量得以改善和广泛利用。由于目前的几种波形重定方法或改进方法对不同反射面的返回波形不具有普适性,要最大限度地提高非开阔海域的测高数据质量,必须根据波形特征对回波波形进行分类,从而选择适应的波形重定方法,提高该区域下的卫星雷达测高精度。因此,波形分类的好坏将直接影响波形重定结果。波形分类还可以用于确定反射面的性质,例如Yang等[1]利用测高波形确定南极海冰密集度。
针对卫星雷达测高波形分类研究,Lee等[2]提出了脉冲峰值作为波形分类的指标。Dabo-Niang等[3]提出了利用模型曲线对雷达测高波形进行分类的方法,推动了波形分类方法的研究。杨元德等[4]对照Beta-5和脉冲峰值(PP)分类法,给出了波形相关移动分析法,将波形区分为镜面波形和散射波形两类。汪海洪等[5]尝试应用聚类分析进行测高波形分类,验证了系统聚类方法的可行性,并取得了较好的分类结果。本文在此基础上利用动态聚类分析理论,提出了一种基于最短距离算法的分类方法,对台湾近岸海域T/P卫星测高波形数据进行分类,通过与Beta-5分类法及PP分类法进行综合比较,验证了该方法的可行性,并确定了波形分类的最佳K值。
2 测高回波波形类型
卫星测高回波波形是雷达回波功率随时间变化的曲线,与反射面之间存在对应关系,当反射面的反射性质接近,相应的两回波波形接近,属于相同波形类型,反之属于不同的波形类型[6]。测高最初应用在海洋方面,波形比较规则,可用 Brown(1977)、Hayne(1980)模型函数模型表达,称为海洋波形;而非海洋波形主要来自非开阔海面,一般存在多个反射面,如近岸、极地冰盖、陆地等,波形呈现不同的形状。图1给出了近岸海域几个不同特征的测高回波波形,其中横轴表示距离门(range gate),可以转换为时间或者距离,纵坐标为规格化后的回波功率。根据不同的分类标准,测高波形形状有不同的划分,如可分为海洋型(图1(a))、尖锥型,或陆地型(图1 (b))、宽峰型(图1(c))、多峰型(图1(d))等4类[5],也可简单分为海洋型、非海洋型(除图1(a)外的另3种波形),或依Laxon(1994)方法[7]分为漫射波和镜面波,还可根据按波形中峰值的个数分为:单一斜面波形,双斜面波形和多子波波形等[8]。
图1 4种雷达波形参考样本Fig.1 Four reference radar waveforms
3 最短距离聚类算法
3.1 动态聚类
动态聚类的主要思想是事先将样品进行粗略分类,然后按照某种最优聚类准则反复修改不合理的分类,直至达到合理的分类结果为止[9]。动态聚类必须先确定一批具有代表性的凝聚点,即聚类中心[10]。
动态聚类方法在确定聚类中心时,以距离作为相似程度,计算各个样本到聚类中心的距离,其公式为[11]:
式中,Di为第i个样本到各个聚类中心间的最小距离,S代表样本数据集,d(Xi,Cj)为第i个样本到第j个聚类中心间的距离,一般取欧氏距离。
3.2 最短距离聚类法
由于测高波形是一个多维的数据集,部分波形因反射面性质及卫星至反射面的距离的影响有可能在时间上(横轴方向)有位移现象,若按经典动态聚类分析算法确定聚类中心,将会导致一些形状相似的波形不能正确归类,聚类中心也会因此发生改变而不具备代表性。为避免上述因素影响,使分类达到全局最优。本文采用最短距离算法,取代K均值算法确定聚类中心。
假设现有两个测高波形Xi、Xj,其第p个阀门上的功率值分别为Xi,p、Xj,p,阀门总数为N,位移参数为s,取值为±s0之间的整数,则移动最小欧氏距离计算公式为[5]:
对于T/P卫星波形数据,阀门总数为N=64,位移参数取s0=10,顾及到各个测高波形的振幅不同,为避免尺度不一致问题,在计算距离值时采用规格化后的功率值˜Xi,p进行计算,规格化公式为:
顾及初始中心受制于样本输入顺序进而影响聚类结果[12],在选取初始聚类中心时,依据式(2)计算各波形样本间的距离矩阵。选取最大距离值对应的两个波形作为两个不同类的初始聚类中心,然后再以这两个聚类中心为基础,在剩余波形样本中找出与前两个聚类中心距离之和最大的那个波形作为第3个聚类中心,再以与这3个中心距离之和最大的准则寻找第4个聚类中心,依此反复,直到选取K个初始聚类中心。具体过程按如下式递推,则第K个聚类中心选取原则为:
式中,d(Xck,Xcr)为初始聚类中心递推函数值;Xck为需要寻找的第k个聚类中心,d(Xi,Xcr)为其余样本与第r个聚类中心的距离。值得注意的是,此处的距离均为移动最小欧氏距离。
由于是选用波形样本间距离作为相似度统计量,很显然距离越大的两个波形差别越大,距离越小的反而越相似越容易聚为一类。对归类后的类内样本,我们以最小距离平方和为原则逐步选取各类下一次的聚类中心,依次反复,当聚类目标误差不超过给定阀值时,迭代过程中止,聚类完成。
判别函数为:
聚类目标误差函数为:
式中,d2(X)为聚类中心判别函数值,X为类内选取的新的聚类中心,Nr为第类内的样本个数;Err为聚类目标误差,d为移动最小欧氏距离,、分别表示第r个聚类中心经it+1次迭代前后的聚类中心。当Err不大于给定阀值时,聚类过程结束,得到最终分类结果。
4 实例分析与结论
以AVISO提供的T/P卫星观测数据为例,选取穿过台湾海峡的第30周第164号路径上的近岸波形数据进行分类实验,实验区覆盖范围为24°03'~25°30'N,119°43'~120°30'E(图2)。卫星测高波形数据经编辑处理后,共计280个波形,每个波形经压缩后为64个功率采样值,图3为280个连续波形序列图,其中时间轴上阀门间隔为3.125纳秒。
顾及到实验区非海洋波形所占的少数比例,这里将280个波形进行了K=2、3、4、5各种K值的聚类,图4给出了不同K值下的各个类的聚类中心,每个聚类中心代表该类的波形特征,其中横轴表示时间,阀门间隔为3.125纳秒,纵轴为规格化的回波功率。
图2 通过台湾海峡的T/P卫星的地面轨迹Fig.2 Ground trajactory of T/P pass164 over coastal Taiwan strait
图3 Pass164经过实验区域的所有波形Fig.3 All T/P altimeter waveforms over test area
图4 各类聚类中心Fig.4 Clustering centers for different K
由于一个聚类分析可以产生很多类,因此必须采用一个聚类评价标准确定最小分类数量,即所谓K值。考虑到波形的几何结构特征,这里采用常用的Dunn指数相对指标[13],对聚类的有效性进行评价。Dunn指数是基于类间分离度与类内紧密度比值的几何度量,计算公式为[14]:
表1 聚类有效性评价Tab.1 Evaluation of clustering validity
图4是不同K值下的各类别的聚类中心,每一个聚类中心代表一类特征波形。从图中可看出,当分类越少时,波形差异越明显。如分为两类时,只有散射波形和镜面波形。分类越多,波形差异越小,如K=5时,圆圈线所代表的波形与菱形线所代表的波形差异不大,实际上可归为一类。
从表1统计的结果可看出,类数为K=2时,Dunn指数最高,聚类结果最好,不同特征的波形越易区分开,但损失的波形特征信息也多;K=4时,Dunn指数最低,不同特征的波形区分较为困难,但可获取更多不同特征的波形分类信息,有利于依据波形特征选择各类适应的波形重定方法。值得注意的是K=5时,理论上分类信息应比K=4时更具体,指数应比上述更小,然而有部分特征相似的波形被分成了两类,造成评价指标值出现异常误差。
为验证该方法在雷达波形分类研究上的可行性,将上述结果与Beta-5和PP方法的分类结果进行比较。以Beta-5成功率作为判断Brown模型波的指标,Beta-5成功率越高,则回波波形是Brown模型波的可能性越大,对应的分类结果越可靠;以PP<1.8的波形占所有散射波形的比例作为脉冲峰值分类法的判断指标(比例越大,分类结果越可靠)。考虑到两种分类方法仅限于判断散射波形和镜面波形,这里仅对文中方法所分离出的Brown模型波进行检验。
表2统计了最短距离法在不同分类情况下对应的Beta-5成功率和PP确定的散射波形的比例。结果显示,Beta-5成功率均在96%以上,分类越多,成功率越高,表明最短距离法能够准确分离出Brown模型波,分类方法可行;采用PP指标波形分类的检验结果也表明,最短距离法分类结果是有效的。
当分类到K=4时,分类信息较丰富,能获取较多的波形特征,从而为每类波形准确匹配特定的最佳波形重定方法,对提高近海测高精度起到积极作用,分类最佳。尽管分为两类波形,聚类有效性最高,这是因为Brown模型波相对于非Brown模型波的特征较为明显最容易区分,但是这种分类无法区分非Brown模型波所包含的各种特征波形,不利于最佳波形重定技术的确定。
表2 最短距离法波形分类检验结果Tab.2 Verified results of classification based on minimum distance methods
5 结语
通过Beta-5算法和PP波形分类方法对比分析,验证了基于最短距离算法的动态聚类分析应用于雷达波形分类的可行性。本文提出的最短距离聚类法充分发挥了其无监督自学习能力,不仅能够准确区分海洋波形(Brown模型波)和非海洋波形,而且可以更加细致客观地划分复杂的非海洋波形,有利于为不同特征的波形匹配最佳的波形重定方法。实验结果表明,测高波形分为4类较为合理。不过对于具体的定量分类指标,还需要根据测高波形的复杂程度和实际应用需要作进一步研究,针对海况复杂程度不同的非开阔海域,最佳K值会有所不同。
测高回波波形的特征取决于地面类型,地面类型主要有开阔海面、海-陆反射面、海-冰反射面和冰面等,这些不同类型地面反射波形可能具有不同的几何特征和物理特征。在目前的波形分类方法中一般只依据波形几何特征,为了实现更准确的波形重跟踪,在后续工作中还需进一步结合不同类型地面回波波形的物理特征开展波形分类研究。
1 Yang Yuande,et al.Sea ice concentration over the Antarctic ocean from satellite pulse altimetry[J].Sci China Earth Sci.,2010,DOI:10.1007/s11430-010-4108-7.
2 Lee H,et al.Application of TOPEX altimetry for solid earth deformation studies[J].Terr Atmos Ocean Sci.,2008,19:1-2,37-46.
3 Sophie Dabo-Niang,Frédéric Ferraty and Philippe Vieu.On the using of modal curves for radar waveforms classification[J].Computational Statistics&Data Analysis,2007,51:4 878-4 890.
4 杨元德,等.复杂海域ERS-1卫星测高波形的波形分类方法研究[J].武汉大学学报(信息科学版),2011,36 (1):48-50.(Yang Yuande,et al.Altimeter waveform classification over non-open oceans[J].Geomatics and Information Science of Wuhan University,2011,36(1):48-51)
5 汪海洪,等.基于聚类分析的卫星雷达测高波形分类研究[J].武汉大学学报(信息科学版),2010,35(1):833 -835.(Wang Haihong,et al.Classification of radar altimeter waveforms based on cluster a nalysis[J].Geomatics and Information Science of Wuhan University,2010,35(1):833-835)
6 褚永海.卫星测高波形处理理论研究及应用[D].武汉大学,2007.(Chu Yonghai.The research of satellite altimetry waveform theory and application[D].Wuhan University,2007)
7 Laxon S.Sea ice altimeter processing scheme at the EODC[J].Int J Remote Sens.,1994,15:915-924.
8 高永刚,等.湖泊范围内TOPEX/Poseidon卫星测高波形分析[J].大地测量与地球动力学,2008,(1):45-49.( Gao Yonggang,et al.Waveform analysis of TOPEX/Poseidon satellite altimeter over lake[J].Journal of Geodesy and Geodynamics,2008(1):45-49)
9 高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.(Gao Huixuan.Applied multivariate statistical analysis[M].Beijing:Peking University Press,2005)
10 Cuesta-Albertos J A and Fraiman R.Impartial trimmed K-means for functional data[J].Computational Statistics&Data Analysis,2007,51:4 864-4 877.
11 但汉辉,张玉芳,张世勇.一种改进的K均值聚类算法[J].重庆工商大学学报(自然科学版),2009,26(2):144-147.(Dan Hanhui,et al.An improved K-means cluster algorithm[J].Journal of Chongqing Technology and Business University,2009,26(2):144-147)
12 连凤娜,吴锦林,唐琦.一种改进的K-means聚类算法[J].电脑与信息技术,2008,16(1):38-40.(Lian Fengna,Wu Jinlin and Tang Qi.An improved K-means cluster algorithm[J].Computer and Information Technology,2008,16(1):38-40)
13 杨燕,靳蕃,Kamel Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1 630-1 632.(Yang Yan,Qin Fan and Mohamed K.Survey of clustering validity evaluation[J].Application Research of Computers,2008,25(6):1 630-1 632)
14 Vendramin L,Campello R J G B and Hruschka E R.Relative clustering validity criteria:A comparative overview[J].Statistical Analysis&Data Mining,2010,3:209-235.
CLASSIFICATION OF SATELLITE ALTIMETER WAVEFORMS BASED ON DYNAMIC CLUSTER ANALYSIS
Zhou Hao1),Wang Haihong1,2,3),Luo Zhicai1,3),Zhou Boyang1)and Zhou Linbin4)
(1)School of Geodesy and Geomatics,Wuhan University,Wuhan 430079 2)Key Laboratory of Surveying and Mapping Technology on Island and Reef,SBSM,Qingdao 266510 3)Key Laboratory of Geospace Environment and Geodesy,Ministry of Education,Wuhan University,Wuhan 430079 4)Institute of Seismology,CEA,Wuhan430071)
According to the characteristics of satellite altimeter waveforms,a new classification of radar altimeter waveforms,called minimum distance,is presented.The method based on the principle of dynamic cluster analysis can efficiently classify the radar waveforms by using moving minimum Euclidean for similarity index.Topex/ Poseidon coastal waveforms across Taiwan strait are applied to comparatively analyze the classification results of pulse peakiness and Beta-5,and the feasibility of the classification is verified,and K value of reasonable coastal altimeter waveforms classification is determined.
satellite altimetry;waveforms classification;T/P satellite;dynamic cluster analysis;minimum distance
1671-5942(2011)05-0101-05
2011-03-19
国家自然科学基金(41174021);海岛(礁)测绘技术国家测绘局重点实验室资助项目(2009B04)
周浩,男,1985年生,硕士研究生,目前主要从事卫星测高研究.E-mail:zhouhao249@163.com
P207
A