(3)
d.大幅度快变化的电离层相位污染满足式(4)的两条准则之一
(4)
针对选取的数据,电离层相位污染分类方法的具体实现流程为:
a.参照斜向探测扫频数据中的传播模式信息,提取斜向探测定频数据中相应电离层传播模式(E层、F层)的双时响应C(tc,tp),其中tc表示时间,tp表示群时延,C(tc,tp)是一个复数矩阵;
b.通过提取的双时响应获取相位信息,具体表达式为:
(5)
其中Im(C(tc,tp))和Re(C(tc,tp))分别为双时响应的虚部和实部;
c.将获取的相位信息拉伸成一条连续的相位曲线;
d.对拉伸的相位信息使用多项式拟合得到一条斜线来拟合线性相位变化(要求拟合得到的斜线的斜率和初相使相位非线性部分均值为零且均方差最小[12]);
e.用拉伸的相位信息减去以上拟合的线性部分,得到相位的非线性部分,并经低通滤波器去除相位曲线上的杂波分量,获得最终的非线性相位分布[12];
f.预置A值:根据原始的相位统计数据,融合实际应用需求,具体确定时域相位扰动幅度范围尺度门限A,这里设定A为1弧度;
g.预置T值:根据原始的相位统计数据,融合考虑理论和实际情况,设定相位扰动周期尺度门限T值范围为(10±5)秒;
h.预置D、X值:D和X是频域的相位扰动尺度门限,根据选取数据相位统计情况,设定频域大幅相位扰动尺度门限D值范围为34~37 dB,频域小幅相位扰动尺度门限X值范围为27~31 dB;
i.基于步骤(7)~(8)设定T、D、X值,使用上述式(1)~(4)的电离层相位污染分类准则,通过每组分类结果的分析和设定值的调整,最终确定T、D、X值。
1.3 分类结果
使用以上电离层相位污染分类方法,对选取数据提取相位并分类,最终确定的D、X和T值见图1和图2所示。
图1 相位统计数据频域幅度分布
图2 相位统计数据周期分布
对选取数据提取形成共319组数据,该分类方法有效地将电离层相位污染区分为小幅度慢变化(55组,见图3)、大幅度慢变化(121组,见图4)、小幅度快变化(21组,见图5)和大幅度快变化(122组,见图6)四类具有典型特征的电离层相位污染。
图3 “小幅度慢变化”相位污染
图4 “大幅度慢变化”相位污染
图5 “小幅度快变化”相位污染
图6 “大幅度快变化”相位污染
2 相位污染类型自动识别研究
2.1 基于数据挖掘的相位污染类型自动识别方法
采用数据挖掘中的聚类分析(k-mean算法)[9-11],从电离层斜向探测定频频谱幅度角度,研究电离层相位污染的自动类型识别。电离层相位污染类型识别方法的具体流程为:
a.根据1.3节的电离层相位污染分类结果,将聚类数设定为4(相关距离采用欧几里得距离);
b.采用最大最小距离算法,从待聚类的样本中确定4个初始聚类中心;
c.计算每个样本数据到聚类中心的“距离”,将每个样本聚类到距离其最近的聚类中心的类型中去(相关距离采用动态时间弯曲距离,DTW);
d.计算所有聚类的均值作为新的聚类中心(相关距离采用欧几里得距离);
e.迭代执行(2)~(3),直到满足迭代终止条件。
上述流程中欧几里得距离具体表达式为:
(6)
2.2 迭代终止条件
迭代终止条件是在当前选择聚类个数k和初始中心条件下,使聚类有效性BWP指标(类间类内划分,Between-Within Proportion,BWP)达到最大。因此当迭代进行时,随着迭代次数的增加BWP指标值应逐渐增大,当达到最佳聚类后,BWP值开始下降,因此确定迭代终止的条件为BWP指标值达到最大。
令K={X,R}为聚类空间,其中X={x1,x2,…,xn},假设n个样本对象被聚类为c类,BWP指标及相关概念定义如下:
a.第j类的第i个样本的最小类间距离b{j,i}为该样本到其它每个类中样本平均距离的最小值,具体表达式为:
(7)
b.第j类的第i个样本的类内距离w(j,i)为该样本到第j类中其它所有样本的平均距离,具体表达式为:
(8)
c.第j类的第i个样本的聚类距离baw(j,i)为该样本的最小类间距离和类内距离之和,具体表达式为:
baw(j,i)=b(j,i)+w(j,i)
(9)
d.第j类的第i个样本的聚类离差距离bsw(j,i)为该样本的最小类间距离和类内距离之差,具体表达式为:
bsw(j,i)=b(j,i)-w(j,i)
(10)
e.第j类的第i个样本的BWP指标为该样本的聚类离差距离和聚类距离的比值,具体表达式为:
(11)
2.3 初始中心选择方法
采用基于最大最小距离算法实现初始中心选择。最大最小距离算法是模式识别领域中的一种基于试探的算法,其基本思想是取尽可能离得远的对象作为聚类中心,避免了初值选取时可能出现的初始聚类中心过于邻近的情况,不仅能够自动确定初始聚类中心,而且提高了样本划分的效率。
具体实现流程为:
a.根据样本集的特征,选取距离所有样本中心(均值)最近的一个样本作为第一个初始聚类中心C1;
b.当搜索的聚类数为2时,从待分类的样本中选出距离C1最远的样本作为第二个初始聚类中心C2,输出2个初始聚类中心;
c.当搜索的聚类数为3时,计算未被作为聚类中心的各样本与已确定类中心C1、C2之间的距离,并求出它们之中的最小值di,根据Dt=max{di},选择第t个样本作为第三个初始聚类中心,输出3个初始聚类中心;
d.依次确定第k个聚类初始中心,选择样本距离已确定中心所有距离中最大的作为第k个初始聚类中心,输出k个初始聚类中心。
上述实现流程中相关距离采用动态时间弯曲距离(DTW)。
2.4 类型自动识别结果
使用以上相位污染类型自动识别方法,自动识别选取数据的相位污染类型。共319组提取相位数据,通过最大最小距离算法选定4个初始中心,进行K-mean聚类,用BWP标准检验是否为最佳分类。
图7 “大幅度慢变化”类型相位污染自动识别结果
类型自动识别结果见图7~图10所示,绿色粗实线表示每类的类中心,其它细实线表示样本数据,第一类共87组数据,第二类共31组数据,第三类共82组数据,第四类共119组数据。将类型自动识别结果与第1.3节按照相位分布特性统计分类的结果对照,第一类为大幅度慢变化,自动识别匹配率为31.4%,第二类为小幅度快变化,自动识别匹配率为14.3%,第三类为小幅度慢变化,自动识别匹配率为36.4%,第四类为大幅度快变化,自动识别匹配率为40.2%。
图8 “小幅度快变化”类型相位污染自动识别结果
图9 “小幅度慢变化” 类型相位污染自动识别结果
图10 “大幅度快变化”类型相位污染自动识别结果
3 不同类型污染抑制算法研究
基于1.3电离层相位污染分类结果,采用已有典型解污染算法(最大熵谱估计法[3]、相位梯度法[4]、时频分析法[5]、特征分解法[6]和分段多项式建模法[7-8])分析研究不同类型污染的适用性抑制算法。
3.1 “小幅度慢变化”类型相位污染抑制
按照相位分布特性统计符合“小幅度慢变化”相位污染的斜测数据共55组,从中选取18组频谱展宽较大的数据,采用已选算法解污染处理后,经比较最大熵谱估计法的效果较好。其中,8组数据抑制后与抑制前无太大差别;10组数据抑制后,展宽变窄,频谱锐化度明显提高,如图11所示。也就是说最大熵谱估计法针对选取数据55.6%均有明显的污染抑制效果。
图11 最大熵谱估计法解污染结果(“小幅度慢变化”类型)
3.2 “大幅度慢变化”类型相位污染抑制
按照相位分布特性统计符合“大幅度慢变化”相位污染的斜测数据共121组,从中选取35组频谱展宽较大的数据,采用已选算法解污染处理后,经比较最大熵谱估计法的效果较好。其中,11组数据抑制后与抑制前无太大差别;3组数据抑制后结果反而变差;21组数据抑制后,展宽变窄,频谱锐化度明显提高,如图12所示。也就是说最大熵谱估计法对选取数据60%均有明显的污染抑制效果。
图12 最大熵谱估计法解污染结果(“大幅度慢变化”类型)
3.3 “小幅度快变化”类型相位污染抑制
按照相位分布特性统计符合“小幅度快变化”相位污染的斜测数据共21组,从中选取3组频谱展宽较大的数据,采用已选算法解污染处理后效果均不太佳,与抑制前均无太大差别。
3.4 “大幅度快变化”类型相位污染抑制
按照相位分布特性统计符合“大幅度快变化”相位污染的斜测数据共122组,从中选取62组频谱展宽较大的数据,采用已选算法解污染处理后,经比较相位梯度法的效果较好。其中,10组数据抑制后与抑制前无太大差别;4组数据抑制后结果反而变差;48组数据抑制后,展宽变窄,频谱锐化度明显提高,如图13所示。也就是说相位梯度法针对选取数据77.4%均有明显的污染抑制效果。
图13 相位梯度法解污染结果
4 结 语
使用试验获取的斜向探测电离层频谱数据,结合电离层电波传播特性,统计分析了回波数据相位变化快慢特性,依据相位时域、频域相关特征参数建立了电离层相位扰动分类识别准则。基于该准则,通过参数区域搜索的方式能够将电离层相位污染有效区分为“小幅度慢变化”、“大幅度慢变化”、“小幅度快变化”和“大幅度快变化”四类具有典型特征的电离层相位污染,该研究为不同类型电离层相位污染抑制处理算法的建立提供了重要数据支撑。
采用数据挖掘技术中的聚类分析算法对电离层相位污染开展了类型自动识别研究,分析了聚类算法中最常用的k-mean算法,并在此基础上,结合电离层电波传播特性,依据不同相位污染类型引起频谱展宽程度、谱峰分裂程度等显著特性,按照相位统计划分的四种典型电离层相位污染类型,建立了污染类型自动识别算法,使用该算法对试验获取的斜向探测电离层频谱数据进行了相位污染类型自动识别处理,结果显示“大幅度慢变化”、“小幅度快变化”、“小幅度慢变化”、“大幅度快变化”四种典型污染的自动识别率分别为31.4%、14.3%、36.4%、40.2%,平均识别率达30.6%.证明利用数据挖掘中的聚类分析算法对电离层相位污染进行自动类型识别具有一定的可行性。该研究可为OTHR及相关天波探测系统回波信号电离层污染的实时自适应分类提供技术支撑,对于进一步实时的电离层解污染研究具有重要意义。
基于电离层相位污染分类结果,采用已有典型解污染算法,开展了不同类型污染的适用性抑制方法研究。结果最大熵谱估计法对“小幅度慢变化”和“大幅度慢变化”类型污染具有较好的抑制效果,选取数据中分别有55.6%和60%的数据抑制后展宽变窄,频谱锐化度明显提高;相位梯度法对“大幅度快变化”类型污染具有较好的抑制效果,选取数据中有77.4%的数据抑制后展宽变窄,频谱锐化度明显提高。因而可见合理的电离层污染分类为进一步的解污染算法创造了较优越的使用条件,能够有效提高电离层解污染性能,从而提高OTHR及相关天波探测系统的能力。
进一步应深入研究的工作有:一是电离层相位污染分类的完整性,即上述四种分类是否就能够完全涵盖所有或绝大多数的相位污染类型;二是改进算法提高相位污染类型自动识别率;三是分析、验证已有解污染算法的适应条件、适用污染类型,并对其尚存问题进行改进,提高算法的解污染性能;四是对目前尚无解决方法的相位污染类型,从电离层电波传播和信号处理两方面,研究具体的解污染思路。
[1] 周文瑜,焦培南.超视距雷达技术[M].北京:电子工业出版社,2008.
[2] 凡俊梅,焦培南,肖景明.海洋杂波对高频雷达检测海面上低速目标的影响[J].电波科学学报,1997,12(2):205-210.
[3]BOURSILLONA,GAUTHIERF,PARENTJ.Useofmaximumentropyspectralanalysistoimproveshipdetectionbyover-the-horizonradar[J].RadioScienc-e,1987,22(2):313-320.
[4]PARENTJ,BOURDILLONA.“AmethodtocorrectHFskywavebackscatteredsignalsforionosphericfrequencymodulation”,IEEETrans.onAntennasandPropagation[J], 1988,Vol.36,No.1,pp.127-135.
[5]HOWLANDPE,COOPERDC.UseoftheWigner-Villedistributiontocompensateforionosphericlayermovementinhighfrequencyskywaveradarsystems[J].IEEEProceedings-F,1993,140(1):29-36.
[6]ANDERSONSJ,ABRAMOVICHYI.Aunifiedapproachtodetection,classificationandcorrectionofionosphericdistortioninHFskywaveradarsystems[J],RadioSci.1998, 33(4):1055-1067.
[7]LUKun,WANGJiong,LIUXingzhao.Apiecewiseparametricmethodbasedonpolynomialphasemodeltocompensateionosphericphasecontamination[C]//ProofICASSP.HongKong,2003:405-409.
[8] 李雪,邓维波,焦培南,等.多项式建模解电离层相位污染阶数选择新方法[J].电波科学学报,2009,24(6):1094-1098.
[9] 姜园,张朝阳,仇佩亮,等.用于数据挖掘的聚类算法[J].电子与信息学报,2005,27(4):655-662.
[10]田森平,吴文亮.自动获取k-means聚类参数k值的算法[J].计算机工程与设计,2011,32(1):274-276.
[11]周世兵.聚类分析中的最佳聚类数确定方法研究及应用[D].江南大学,博士学位论文,2011.
[12]陈罡,赵正予,王烽.应用武汉电离层斜向返回探测系统测量回波相位[J].电波科学学报,2007,22(2):271-275.[13]张贤达.现代信号处理[M].北京:清华大学出版社,2002年第2版.
鲁转侠 (1978—),女,陕西人,高级工程师,主要研究方向为电离层模式识别、传播特性分析及回波信号处理;
E-mail:zhuanxialu@163.com
李吉宁 (1982—),男,山东人,工程师,主要研究方向为电离层电波传播、高频雷达和信号处理;
李 雪 (1981—),男,黑龙江人,高级工程师;主要研究方向为电离层回波信号处理、雷达信号处理;
郭晓彤 (1989—),女,河北人,主要研究方向为电离层电波传播、雷达信号处理;
白 桦 (1981—),男,内蒙古人,工程师,主要研究方向为复杂电磁环境。
Research on Classification and Recognition Method of Ionospheric Phase Contamination
LU Zhuan-xia1, LI Ji-ning1, LI Xue1, GUO Xiao-tong2
(1.China Research Institute of Radiowave Propagation, Qingdao Shandong 266107, China; 2.Group 63898,henan jiyuan 454650)
The non-stationary characteristic of the ionosphere makes the phase disturbance of the radar echo signal of the ionosphere, long time coherent accumulation leads to the spread of clutter spectrum,this affects the ship and other target signal detection.By phase analysis of the ionospheric echo signal,the classification criterion of the ionospheric phase contamination are established.Based on this criterion, the ionospheric contamination can be divided into four types.An automatic recognition algorithm for ionospheric phase contamination is proposed based on the clustering analysis algorithm in data mining,this algorithm can automatically recognize the contamination type.The matching rate of the automatic recognition result and the phase statistical classification result is 30.6% on average.On the basis of the classification of ionospheric phase contamination, the correction algotithms has been studied by using the existing typical algorithms for different types of ionospheric contamination.the results are that success rates of the maximum entropy method are 55.6% and 60% respectively for the two kinds of small-amplitude-slow-hange contamination and large-amplitude slow-change contamination, the success rate of phase gradient method is 77.4% for large-amplitude-fast-change contamination.Therefore, it is proved that the reasonable real-time type recognition of ionospheric phase contamination can be used to create more favorable conditions for contamination correction, so as to effectively improve the performance of contamination correction, this has important significance for improving the performance of OTHR ship target detection.
ionosphere; data mining; oblique sounding; backscattering
��理论
10.3969/j.issn.1673-5692.2016.05.009
2016-01-10
2016-09-06
国家自然科学基金项目(61302006);国家自然科学基金项目(61331012)
:A
1673-5692(2016)05-503-07