目标检测定理
2020-10-23徐大专屠伟林
徐大专,胡 超,潘 登,屠伟林
(南京航空航天大学电子信息工程学院,南京,211106)
引 言
雷达、声呐和医学成像等目标探测系统可以从目标回波信号中获取目标的距离、方向和幅度等空间信息,正在国防部门发挥着重要的作用。雷达探测的主要任务是目标检测、参数估计和目标成像。对于成像雷达,仍然需要对处理出来的图像进行目标检测,因此,目标检测不仅是雷达探测的首要环节,检测结果将对后续信号处理产生重要影响。
目标检测一直是雷达信号处理所关心的主要问题,其性能通常采用虚警概率-检测概率指标体系作为评价标准,即在虚警概率恒定条件下,使检测概率最大化。已经证明,在虚警概率-检测概率指标体系下,纽曼-皮尔逊(Neyman-Pearson,NP)准则是最佳的。因此,NP 准则在目标检测中一直占有统治地位[1-2],特别是恒虚警[3-5]条件下,不同应用场景最佳检测器的设计。文献[6]指出,在复高斯杂波环境中最佳检测器的阈值取决于匹配滤波器的输出。文献[7]在高斯噪声且协方差未知情况下,采用广义似然比检验(Generalized likelihood ratio test, GLRT)检测分布式目标,推导了虚警概率的近似表达式,有利于设置GLRT 检测器的检测阈值。最近,NP 准则还用于多输入多输出(Multiple input multipe output,MIMO)雷达或相控阵雷达[8-10]相关领域的最佳检测器设计,还有一些研究致力于提高分集增益[11]等。
信息论方法在目标检测领域也有广泛的应用。1988 年,Bell 首先将互信息测度用于雷达系统的波形设计[12],以目标冲激响应与接收信号之间互信息为测度,Bell 证明了最佳波形设计对应于信道容量的最优功率注水解[13],该结论正好与通信系统的最优功率分配问题相一致。在Bell 的系统模型中,目标的距离信息隐含于冲激响应中。由于实际环境中目标位置是不断变化的,因此,自适应的波形设计方法显得尤为重要。由于Bell 的工作是针对目标检测问题提出来的,其模型并不区分不同的目标,因此,从本质上说,Bell 的互信息测度本质上是空间信息[14-17]中的散射信息。
2017 年以来,笔者提出了雷达参数估计的空间信息概念[14],将空间信息定义为接收信号与目标距离及散射的联合互信息[14-15],且通过理论推导得到了单目标/多目标距离信息和给定目标位置条件下散射信息的闭合表达式[15,18],从而将距离信息和散射信息纳入统一定义框架中[19]。最近利用空间信息理论研究了雷达分辨率[20-21],在理论上指出超分辨的可能性。目标检测的目的是从雷达接收信号中判断观测区域是否存在目标。那么,目标检测能否用信息论方法进行统一描述和刻画呢?本文通过引入目标存在状态变量,建立了结合目标检测与参数估计的统一系统模型。给出探测信息、检测信息和空间信息的严格定义,并证明探测信息是目标检测信息与已知目标存在状态的空间信息之和,从理论上解决了探测信息的定量问题,并推导出目标匹配和非匹配条件下检测信息的理论公式。提出了抽样后验概率检测方法,这是一种随机目标检测方法,其平均检测性能取决于后验概率分布。在此基础上,本文证明了目标检测定理,即,检测信息是可达的,反之,任何检测器的经验检测信息不大于检测信息。
检测信息作为目标检测领域新的评价标准,不同于虚警概率-检测概率体系。本文对信息论方法和NP 方法进行了比较,结果表明,信息论方法的检测概率小于NP 检测器,但检测信息大于NP 检测器。研究结果还表明,检测信息准则有利于弱小目标检测,具有广阔的应用前景。目标检测的信息理论突破了NP 准则一统天下的局面,为目标检测的系统理论和设计方法开辟了新的方向。
1 目标检测系统模型
设雷达发射波形是带宽为B/2 的理想低通信号,即ψ ( t )= sinc( Bt )。假设在观测区间内可能存在k个目标,那么,雷达接收的基带信号为
式中vk∈{0,1} 是表示第k 个目标是否存在的离散变量,vk= 1 表示目标存在,vk= 0 表示目标不存在。sk表示第k 个目标的散射信号,τk表示第k 个目标产生的时延,w (t) 是带宽为B/2 的复加性高斯白噪声(Complex additive white Gaussian noise, CAWGN),其实部和虚部的功率谱密度均为N0/2。
假设信号能量几乎全部在观测区间内,根据Shannon-Nyquist 采样定理,以Nyquist 速率对接收信号进行采样,即采样速率等于B,观测区间长度对应的采样时间为T,则总采样点数N = TB,称为时间带宽积。离散形式的接收信号为
式中xk= Bτk表示归一化时延,各噪声样值之间相互独立,其实部和虚部也相互独立,N0指噪声的功率谱密度,实部、虚部均为N0/2。
为了描述方便,将式(2)写成矢量形式
为目标存在矢量v = ( v1,v2,…,vK) 的对角化矩阵,U (x) = [ …,u( xk),…] 称为目标位置矩阵,uT( xk)=(…,sinc( n - xk),…) 是第k 个目标的采样波形。式(3)是含有目标存在变量和参数的系统模型,又称系统方程,其主要特征是直接在系统方程中引入目标存在矢量。
上面的系统模型与普通目标检测系统具有明确的对应关系,即目标存在状态变量为0 对应于假设检验H0,存在状态变量为1 对应于假设检验H1。
2 目标的检测信息与空间信息
下面从统计观点处理系统方程。对接收端来说,目标存在变量和目标归一化时延及散射参数都是不确定的,令V 表示目标是否存在的随机矢量,X 和S 分别表示目标的归一化时延矢量和散射矢量,w表示N 维复高斯噪声矢量,其概率密度函数(Probability density function, PDF)为
由系统方程,接收信号矢量Z 也是随机的。在给定存在状态矢量V 及X 和S 时,Z 的多维条件PDF 为
式(6)的条件PDF 定义了一个目标检测与参数估计的联合信道,由此可得如下探测信息的定义。
定义1 (探测信息) 设目标检测矢量的概率分布为P (V),归一化时延的先验PDF 为p(x),散射信号的PDF 为p(s),那么,目标探测信息定义为接收信号与目标的存在状态、位置及散射的联合互信息,即
式中E [·] 表示数学期望。
式(7)的互信息描述了接收信号含有的目标存在状态、位置及散射信息。
定义2(检测信息) 接收信号与目标存在状态之间的互信息I (Z ; V) 称为检测信息,即
定义3(空间信息) 已知目标存在状态V 条件下,接收信号与目标位置及散射之间的互信息I (Z ; XS|V) 称为空间信息[14,17,21],即
由于
则
再由定义2 和定义3 有
式(12)表明探测信息是目标检测信息与已知目标存在状态条件下空间信息之和。该式还揭示了探测信息的获取方法,即首先进行目标检测,所能获得的信息为I (Z ; V)。在已知目标状态后再进行参数估计,所能获得的空间信息为I (Z ; XS|V),故空间信息与参数估计密切相关。目前,在雷达信号处理中目标检测和参数估计通常是分开处理的,并且在进行参数估计时通常默认已知目标数。探测信息的定义将目标检测与参数估计在信息论框架下统一起来,为雷达探测的信息获取问题提供一个总体描述框架。
3 目标检测信息的计算
研究恒模散射目标检测信息的计算,分别考虑目标完全匹配和非匹配2 种场景。
3.1 恒模散射目标的检测信息
恒模散射模型是一种典型的非起伏目标散射模型,又称Swerling0 模型,这时复散射系数的模为常数,相位在[0,2π] 内均匀分布。多目标恒模散射信息的计算十分复杂,下面只考虑单目标情况。令复散射系数s = αejφ,这里 α 表示散射系数的模,φ 表示散射系统的相位。将s = αejφ代入式(6),则条件概率分布为
其中
式中,I0[·] 表示第一类零阶修正贝塞尔函数,R[·] 表示取实部。
在目标检测时,接收者没有任何关于目标位置的先验信息,故可假设目标位置在观测区间内的先验分布为均匀分布。在观测区间内对目标位置求期望得
再由贝叶斯公式得后验PDF 为
表示恒模散射目标的检测统计量。注意到| zHu( x ) |是匹配滤波器输出的模值,r (v,z) 是| zHu( x ) |的贝塞尔函数在观测区间内的时间平均。显然,r (v,z) 与普通的能量检测器不同,也就是说,已知目标散射和信道的统计特性后,能量检测器已不是最佳检测器。
式(20)是从信息论角度推导出的后验概率分布,代表检测器所能达到的理论极限,与检测器的具体结构以及检测方法无关。
定义4(抽样后验概率检测) 对后验概率分布P ( v|z )进行抽样产生的估计v̂称为目标存在状态的抽样后验(Sampling a posteriori, SAP)概率检测,记为v̂SAP,即
式中,v̂SAP检测器称为抽样后验概率检测器。SAP 检测器是一种随机检测器,给定接收信号时检测结果并不确定,但平均性能由后验概率分布P ( v̂|z )确定。
由后验PDF 可得目标检测信息为
式中,Ez[·] 表示对所有接收信号求期望。
3.2 已知恒模散射目标位置时的检测信息
已知目标位置时的检测信息,对应于匹配滤波器与目标位置完全匹配的情况。严格地说,已知目标位置的假设是欠合理的,因为目标检测的任务是检测目标是否存在,当然不知道目标的位置。然而,在信噪比(Signal-to-noise ration, SNR)较高时,完全匹配时的相关峰通常最大,将最大峰值用于检测也是合理的,只不过不适用于低SNR 情况。
本文考虑已知目标位置时的情况是为了便于同NP 准则进行比较。因为已知目标位置时,NP 检测器的检测信息、检测概率有闭合表达式。已知目标位置x0时的条件概率为
表示已知目标位置时的检测统计量,代入互信息公式
即得检测信息。
4 虚警概率和检测概率
目标检测器的性能通常采用虚警概率和检测概率指标评价体系,NP 准则在保证虚警概率条件下,使检测概率达到最大。实现NP 准则的检测器简称为NP 检测器。为了和NP 检测器进行比较,下面推导检测信息准则下的虚警概率和检测概率。
4.1 恒模散射目标的虚警概率和检测概率
令z0和z1分别表示无目标和有目标时的接收信号,那么
由抽样函数的性质uH( x ) uH( x0)= sinc( x - x0),匹配滤波器的输出为
对应的检测统计量为
下面对更一般的任意目标散射特性证明虚警概率定理。
定理1(虚警概率定理) 设信道为CAWGN 信道,目标位置在观测区间内均匀分布,如果观测区间足够长,则对任意散射特性,给定接收信号的虚警概率等于目标存在的先验概率,即
证明对任意散射信号s,接收信号为z = u( x ) vs + w,则条件概率分布为
对散射信号求期望得
式中p( s )表示任意散射特性。
在观测区间内对目标位置求期望得
再由贝叶斯公式得后验PDF 为
其中
接收信号为z0时,uH( x ) z = w ( x ),那么
由于观测区间足够长,则平稳过程的时间平均等于集合平均,那么
由于噪声服从均值为零,方差为N0的复高斯分布,可以证明
证毕。
由虚警概率的定义
立即得到如下推论:
推论1设信道为CAWGN 信道,目标位置在观测区间内均匀分布,如果观测区间足够长,则对任意散射特性,虚警概率等于目标存在的先验概率,即
对现代雷达探测系统,一次快时间采样点数N 可达几万到几十万量级,因此,定理1 和推论1 中观测区间足够长的条件通常都能满足。为了验证上述结论,图1 给出了不同SNR 条件下虚警概率与先验概率之间的关系。从图1 中看出,在低SNR(SNR=0 dB)时即使观测区间较小(N=64),结论也吻合得很好。在中等SNR(SNR=5 dB)时,当采样点数N>1 000 时也能吻合得很好。
考虑存在目标的情况。已知接收信号z1时,目标存在的概率为
式中目标位置和随机相位对统计量没有影响,不妨令之为零,那么
图1 不同区间长度和SNR 的虚警概率与先验概率Fig.1 False alarm probability and prior probability for different observation interval length and signal-to-noise ratio
则检测概率为
4.2 已知恒模散射目标位置时的虚警概率和检测概率
已知目标位置,且接收信号为z0时,检测目标存在的概率为
其中
则虚警概率为
类似地,接收信号为z1时,检测目标存在的概率为
其中
那么,检测概率为
5 纽曼-皮尔逊检测器的虚警概率、检测概率和检测信息
前面基于信息理论推导的检测信息与检测器的具体结构及检测方法无关。同样地,虚警概率与检测概率也与具体的检测器无关。下面研究NP 检测器的虚警概率、检测概率和检测信息。NP 检测器是一种似然比检测器,为便于比较,只考虑目标完全匹配情况,这时NP 检测器的性能有闭合表达式。
5.1 已知恒模散射目标位置时NP 检测器的虚警概率和检测概率
已知目标位置x0时,NP 检测器的性能具有闭合表达式[1],检测概率与虚警概率关系为
式中QM(·) 称为Marcum 函数,而阈值取决于虚警概率
5.2 NP 检测器的检测信息
Kondo[22]提出了NP 检测器检测信息的计算方法。NP 检测器的检测信息定义为目标先验状态与已知接收信号的后验状态V̂之间的互信息,即
式中PV̂( 0 )表示目标检测为不存在的概率,因此1- PV̂( 0 )表示目标检测为存在的概率。
A 表示在判决“目标存在”条件下的目标实际存在概率,D 表示在判决“目标不时存在”条件下目标实际不存在概率。
6 检测信息准则与NP 准则的比较
6.1 恒模散射目标检测信息的比较
以SNR 为参数,检测信息准则与NP 准则的检测信息的比较如图2 所示,其中实线表示检测信息准则,而虚线表示NP 准则。本文选取的0 dB 代表低SNR 工作条件,5 dB 代表中等SNR 条件。由于NP检测信息与虚警概率有关,故虚线是给定先验分布条件下,对所有虚警概率搜索达到的最大值,换句话说,虚线以下部分是NP 检测器的可达区域。结果表明,检测信息准则的可达区域均大于NP 准则的可达区域。 这是可以预料的,因为检测信息是信息论方法给出的理论值,可以证明检测信息是理论极限。
6.2 两种准则接收机工作特性曲线的比较
以SNR 为参数时检测信息准则和NP 检测器的接收机工作特性曲线(Receiver operating characteristic curve, ROC)如图3 所示。从图3 中可以看出,在2 种SNR 条件下,虚警概率相同时,NP 检测器的检测概率均高于检测信息准则。这种结果也是可以预料的,因为在虚警概率-检测概率指标体系下NP检测器最优。
图2 不同虚警概率和SNR 的检测信息与先验概率Fig.2 Detection information and prior probability for different false alarm probability and signal-to-noise ratio
综合所述,信息论方法的检测信息优于NP 准则,而NP检测器的检测概率优于检测信息准则。理论分析表明,即使对于弱小目标检测信息准则也存在检测的可能性,对弱小目标检测更有利。目前,两种准则哪种最优并无定论,但检测信息准则打破了NP 准则一统天下的局面,为目标检测领域开辟了新的方向。
7 目标检测定理
图3 不同信噪比的虚警概率与检测概率Fig.3 False alarm probability and detection probability for different signal-tonoise ratio
香农信息论的核心内容是编码定理。针对参数估计问题,作者已经证明了参数估计定理[23]。那么,在雷达探测、特别是目标检测领域是否存在类似的定理呢?在目标检测中NP 检测器一直占有统治地位,因为在虚警概率-检测概率指标体系下,NP 准则是最佳的。人们长期忽视一个基本的理论问题,就是(1)有没有不同于虚警概率-检测概率的其他评价指标;(2)最优检测问题,何种检测器是最优的,在什么意义上最优,最优的性能是多少?这正是目标检测定理需要回答的问题。
目标检测定理涉及的内容非常广泛,本文只针对单目标检测问题给出证明,但证明的框架可以推广到多目标检测中。在证明定理之前先定义需要用到的概念。
定义5(目标位置特性) 在观测区间上目标的归一化时延为随机矢量,归一化时延的先验分布p(x) 称为目标位置特性。
定义6(目标散射特性) 目标的散射信号为随机变量,散射信号的先验概率分布p(s) 称为目标散射特性。
定义7(目标先验分布) 目标存在状态的先验概率分布P(v) 称为目标先验分布。
目标的存在状态、位置和散射信号构成参数矢量χ= (v,x,s),目标先验分布P(v)、位置特性p(x)和散射特性p(s) 统称为目标特性p(χ) =p(v,x,s)。
定义8(检测信道) 检测信道(A,p(z|v),B) 由输入集、输出集和条件概率密度函数p(z|v) 组成。检测变量v∈A,输入集A= {0,1} 为检测变量取值的集合;接收信号z∈B,输出集B是复数域上的矢量空间;检测信道特性由条件概率密度函数p(z|v)确定。
检测信道与位置特性p(x) 和散射特性p(s) 有关,后面的检测信道都是指特定目标特性条件下的检测信道。
定义9(检测器) 检测器产生对目标存在状态v的估计v̂,检测函数v̂=d(z) 对给定的接收序列输出一个检测值v̂。
定义10(联合目标-信道) 联合目标-检测信道(A,P(v),p(z|v),B) 是指目标特性和检测信道组成的总体。
联合目标-信道定义了检测器所要面对的检测环境,这里假定检测器知道联合目标-信道的全部统计特性,但实际中检测器通常只知道一部分目标-信道统计特性。
定义11(检测系统) 检测系统(A,P(v),p(z|v),v̂=d(z),B)刻画目标特性、信道特性和估计器组成的总体。
一次检测过程由目标、信道和检测器几部分组成,简称为一次快拍。多次快拍将产生扩展目标和扩展信道,m次快拍的检测过程如图4 所示。图4 表明(Vm,Zm,V̂m) 组成一个马尔可夫链。
定义12(无记忆扩展目标) 无记忆扩展目标指扩展目标之间相互独立。
图4 m 次快拍目标检测系统Fig.4 Target detection system of m snapshots
定义13(无记忆扩展信道) 无记忆快拍信道(Memeryless snapshot channel,MSC)指多次快拍产生的扩展信道(AM,p(zM|vM),BM)满足
其中p(zm|vm)是第m次快拍信道。
联合目标-信道(A,p(v),p(z|v),B) 确定了后验概率分布P(v|z) 和检测信息。还需定义另一种与检测器相关的经验检测信息。
对于检测器而言,给定目标存在状态时,检测器是通过接收信号进行检测的,与检测器相关的检测信息定义为
定义14(经验检测信息) 检测器从M次快拍得到的经验检测信息定义为
定义15(可达性) 检测信息I(Z,V)称为可达的,如果存在一个检测器,其M次快拍的经验检测信息I()M(V̂;V)满足
定义16(联合典型序列) 服从联合分布p(v,z) 的联合典型序列{(xM,zM)}所构成的集合A()M ε是M长序列对构成的集合,其经验熵与真实熵之差小于ε,即
引理1对于无记忆快拍信道( AM,p( zM|vM),BM),如果v̂M是后验概率分布p( v|z ) 的M 次抽样估计,则(v̂M,zM) 是关于概率分布p( v̂M,zM)的联合典型序列。
证明:由于v̂M是后验概率分布p( v|z ) 的M 次抽样估计,则扩展后验概率分布PSAP(v̂M|zM) =P (v̂M|zM),那么
证毕。
由引理1 和联合典型序列的定义,立即有
定理2(目标检测定理) 检测信息I ( Z,V ) 是可达的,具体来说,设检测器已知联合目标-信道( A,P (v),p( z|v ),B )统计特性,则,对任意ε >0,存在检测器的经验检测信息满足
定理分为正定理和逆定理两部分,先证明正定理。反之,任何检测器的经验检测信息不大于检测信息。
正定理的证明:
根据目标先验分布独立产生M 次扩展目标状态vM,再根据vM和M 次扩展信道p( zM|vM)产生接收序列zM,则接收信号zM满足
采用抽样后验概率检测器,令v̂M是对于无记忆快拍信道p( zM|vM) 的M 次抽样估计,则由引理1,(v̂M,zM) 是关于概率分布p(v̂M,zM) 的联合典型序列。
根据联合典型序列的定义,对任意ε >0,只要快拍数足够大,有
由于p(v̂M|zM) = p(v̂M,zM) /p(zM),那么
逆定理的证明:
令v̂M= d ( zM)是任一检测器,该检测器的经验检测信息记为I (VM; V̂M)。由图4 可知,(Vm,Zm,V̂m)组成一个马尔可夫链,由数据处理定理
即任何检测器的经验检测信息不大于检测信息,证毕。
目标检测定理的证明是构造性的,就是说,SAP 检测是可实现的目标检测方法,其性能是渐近最优的。目标检测定理首次证明了目标检测性能的理论极限,可以为实际目标检测系统设计提供比较的依据。
8 结束语
本文给出目标检测信息的严格定义,并推导出目标检测信息的理论公式,从理论上解决了检测信息的定量问题。提出了抽样后验概率检测方法,并证明了目标检测定理。抽样后验概率检测是一种随机目标检测方法,与香农信息论中随机编码的思想一脉相承。目标检测定理指出,检测信息是可达的,反之,任何检测器的经验检测信息不大于检测信息。检测信息的概念和目标检测定理的证明是一个重要的标志,从此,目标检测可以建立在信息论的基础之上。
在目标检测领域NP 准则一直占有统治地位,虚警概率-检测概率指标体系是目标检测系统性能的评价标准。目标检测的信息理论以检测信息作为系统性能的评价标准,研究表明,基于检测信息准则的检测概率低于NP 检测器,但检测信息远大于NP 检测器。因此,目标检测的信息理论为目标检测的系统理论和设计方法开辟了新的方向。