雷达系统中的认知控制策略
2015-02-02周城宏钱卫平郭永强
周城宏,钱卫平,郭永强
(北京跟踪与通信技术研究所,北京 100094)
雷达系统中的认知控制策略
周城宏,钱卫平,郭永强
(北京跟踪与通信技术研究所,北京100094)
摘要:人类大脑通过认知控制来增强对周围环境的感知能力,雷达在探测和测量的过程中通过控制系统对自身状态的调节来增强工作性能;将认知控制引入雷达系统有助于雷达的智能化;基于如上出发点,首先概述了认知控制的研究状况和概念,类比了大脑认知系统和工程认知动态系统的共通之处,随后建立了认知控制的数学模型,将其归结为系统熵态的最优估计问题和最优控制问题,最后将认知控制策略引入雷达对目标的感知过程中。
关键词:认知控制;认知动态系统;信息缺失;双态模型;系统熵态
本文引用格式:周城宏,钱卫平,郭永强.雷达系统中的认知控制策略[J].四川兵工学报,2015(12):99-102.
Citation format:ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang.Cognitive Control Strategy in Radar System[J].Journal of Sichuan Ordnance,2015(12):99-102.
Cognitive Control Strategy in Radar System
ZHOU Cheng-hong,QIAN Wei-ping, GUO Yong-qiang
(Beijing Institute of Tracking and Telecommunications Technology, Beijing 100094, China)
Abstract:Human brain enhances the perception of environment by cognitive control, and similarly, radar control system adjusts state parameters to improve the detection performance. It is promising to introduce cognitive control into radar system to promote the intelligentization of radar. Based on the above background, the concept and research status of cognitive control in psychology and neuroscience were overviewed, and the similarity between human brain and cognitive dynamic system was discussed. Subsequently, a mathematical model of cognitive control was constructed, which can be equal to the optimal estimation and optimal control of entropic state. Finally the strategy of cognitive control in radar was put forward.
Key words:cognitive control; cognitive dynamic system; information gap; two-state model; entropic state
认知控制的概念起源于心理学和神经心理学。1959年Gardner第一次使用认知控制,用来描述认知过程中的控制原理并解释相关任务实验结果。随后1972年Hammond和 Summers提出 “人在执行认知任务中涉及知识获取和对已获得知识的认知控制两个不同过程”的观点,认为在认知任务和精神分析任务中知识的获取和应用是相互独立独立的认知过程环节,并从理论上引入认知控制的概念,用以阐述其在关于人类学习、判断和人际活动研究中的重要作用[1]。2005年,Brass从认知心理学的角度给出认知控制的定义,“认知控制过程指的是我们根据内在的目标协调思想和行动的能力”[2]。2009年,Kouneiher提出“认知控制在神经层面可以看做个体对其行为可能导致的后果和已经导致的后果进行评估的结果”[3]。此后2010年,Feldman和Friston在神经心理学中引入环境的概率分布表示观点,认为大脑系统可通过注意来优化环境的概率表示,以便减少环境感知的熵,实现不确定性的降低[4]。在人类大脑认知系统中,知觉的作用在于从噪声环境获取的观测量中提取出有效信息。大脑针对知觉信息通过采取应对行为来保持对环境信息的连续最优获取,这样的应对行为即为认知行动。例如,人类视知觉系统在黑暗环境中对物体无法准确识别,大脑通过放大瞳孔的认知行动来缓和对环境感知的不确定程度,此外,在条件允许的特定情况下也会通过开灯、开手电筒等决策行为应对。
1认知动态系统
认知动态系统是Fuster在人类大脑认知系统研究中提出的概念,用以描述视知觉中的知觉动作反馈过程,包含知觉动作回路(Perception-action cycle)、记忆(Memory)、注意(Attention)和智能(Intelligence)等基本要素[5]。知觉动作回路是大脑知觉系统的结构基础,如图1所示。在大脑视知觉系统中,皮质感觉区感知认知任务(环境)的视觉刺激,随后皮质运动区获得感觉区的信息反馈,通过认知行动的调节作用来适应环境以实现环境信息的最大获取。
图1 大脑知觉系统(左)和认知动态系统(右)基本结构
认知动态系统是对大脑知觉系统的高度抽象,控制器的调节行为依赖于知觉器感知环境后的信息反馈,知觉器的信息获取包含对环境状态的测量与估计,控制器的响应则涉及系统的最优控制。通过知觉动作回路的作用,认知动态系统最大限度地实现与动态环境的交互融合[6-9]。认知系统通过记忆存储知觉过程、反馈回路、控制过程中所获取的知识与经验,并反过来辅助、促进各过程中知识的获取、经验的提升以及模块功能的完善。注意以及智能,以算法的方式整合在知觉动作回路之中,保障控制功能的最佳实现。
通过类比将认知动态系统引入雷达系统,可构建具有人类认知特性的智能雷达系统。在工程背景下,环境信息通过测量过程流入知觉器,知觉器利用贝叶斯估计实现信息提取,信息反馈路径将知觉器与控制器联系一起,控制器在优化算法下执行最佳控制,控制系统的闭环回路由此形成。工程系统中的知觉动作回路是认知控制的基本结构,记忆、注意与智能等特性通过存储器、体制结构和智能算法等实现。
2量测信息的度量模型
2.1 信息缺失
测量信息由传感器在噪声环境中直接测量获得,包含有效信息和环境噪声、干扰等因素引入的无用信息;将测量空间向信息空间的投影,可提取有效信息,分为与当前任务需求紧密联系的相关信息和与之无关的冗余信息;在最小风险意义下,执行当前任务所需的信息为充分信息,相关信息是充分信息与有效信息的交集;充分信息中无法通过测量获取的部分,即充分信息与相关信息的差集为信息缺失(Information gap)[11],如图2所示。
图2 信息缺失概念示意图
工程系统中的认知控制可由如下定义给出:假设存在一个拥有知觉动作回路结构的类人脑随机动力系统,认知控制的功能就是调节从系统知觉部分向其执行部分流动的信息流,从而在最小风险意义下缩减当前任务的信息缺失。
2.2 双态模型
系统双态模型的思想为用系统状态和系统熵态表征系统信息特征。系统状态是系统信息的表征,是经典测量操作下的不变量(非量子理论体系);系统熵态是信息缺失的度量,是系统不确定度的表征。
2.2.1状态空间模型
在给定时刻,系统状态表征当前时刻的系统信息,同理,状态随时间的变化表征系统的演化行为。系统的真实状态无法直接获取,只能通过噪声环境下的观测量间接估计,如在先验信息条件下的贝叶斯估计。对系统的先验认识可体现在状态空间模型(State-space model)如图3所示,包含描述系统演化的状态方程和刻画系统状态获取的量测方程。
图3 状态空间模型
状态方程
xn离散时间系统状态为马尔科夫序列,状态方程表示从n时刻到n+1时刻的状态转移,n表示离散时间,状态转移取决于转移函数、当前状态和系统噪声,其中an(.,.)为状态转移函数,xn为当前状态,xn+1为下一时刻状态,ωn为系统噪声。如果系统噪声为加性噪声,则状态方程可简化为xn+1=an(xn)+ωn;如果状态转移为线性函数,xn+1=An+1,nxn+ωn,系统方程可简化为线性方程,其中An+1,n为状态转移矩阵;如果ωn为高斯过程,则状态方程为线性高斯系统,协方差矩阵可记为Qω,n。
量测方程:
yn表示目标状态量测量,量测结果决定于量测函数、当前状态、量测噪声,其中bn(.,.)为量测函数,vn为测量噪声。若量测噪声为加性噪声,则量测方程可简化为xn+1=bn(xn)+vn;若量测过程为线性函数,则量测方程可简化为xn+1=Bnxn+vn,其中Bn为量测矩阵;若vn为高斯随机过程,协方差矩阵可记为Rv,n,则量测方程为线性高斯的。
2.2.2系统熵态模型
由于系统本身、测量环节等存在一定程度的不确定性,因而系统的状态和观测量均用随机变量表征。系统状态即为一个概率分布,实际观测结果即为观测变量的实现。状态的获得需通过噪声环境下的测量,反之,可通过测量结果来估计系统状态的后验概率分布。信息缺失的概念刻画了系统状态的不确定程度,信息论中不确定度可由概率分布的全局量——熵表征,因而信息缺失可由系统熵态刻画,可定义为系统状态后验分布的Shannon熵。
若xn表示系统n时刻状态,p(xn)表示系统状态的先验概率分布,当获得n时刻观测量yn后,p(xn|n)表示该时刻系统状态的后验概率分布,该时刻系统熵态Hn|n定义为p(xn|n)的Shannon熵:
xn是随机变量,Yn是观测集{y1,y2,…,yn}。
3认知控制模型
雷达认知控制的基本思想在于通过控制系统实时调整自身状态来减小目标测量过程中的信息缺失。因而认知控制可以归结为两个子问题,即系统熵态的最优估计和系统熵态的最优控制。
系统熵态是系统状态后验概率分布的Shannon熵,因而系统熵态的估计取决于系统状态的感知。系统状态的感知过程是对系统状态进行获取和估计的过程。状态获取结果为传感器观测集,是观测随机变量的实现;状态估计可通过最小方差、最大似然、最小二乘等思想实现,然而,在具备系统状态先验信息的情况下,可通过贝叶斯估计在最小风险函数意义下实现最优估计。一般可采取最小平均风险函数意义下的贝叶斯估计。对于最小均方差准则,加性高斯白噪声下的线性系统,贝叶斯滤波器简化为卡尔曼滤波器;对于非线性高斯系统,贝叶斯滤波器可通过EKF、UKF或CKF等近似实现;非线性非高斯系统则选用Monte Carlo粒子滤波器。状态估计的准确程度取决于系统状态的后验不确定度,即信息缺失量,系统熵态可用系统状态的后验概率分布的Shannon熵表示。获得系统状态后验概率分布后,通过降低信息缺失来增强状态估计性能的最优控制是认知控制的基本思想。
在认知控制结构中,认知行动可直接作用于环境,从而间接影响知觉器的知觉过程,例如辨识在黑暗环境中的物体,开灯的行为便是通过改变环境提升对物体的知觉;认知行动也可作用于系统本身,例如改变传感器等结构的自身配置,在黑暗环境放大瞳孔来增加物体反射光的接收,认知雷达通过调整发射波形来改善当前目标探测性能;物理行动同样能够作用于系统,例如挪近物体位置有助于黑暗环境中物体辨识。
假设雷达的状态可由参数集Λ表征,其中Λ={λk|k=1,2,…,n},λk为表征雷达系统状态的参数,如载频、带宽、极化、功率、天线、波形等所有相关参量,雷达在n时刻发射的信号可由Λn表征,在雷达目标与环境的共同电磁散射作用下得到观测量yn,随之得到系统熵态Hn|n,因此Hn|n~Λn,因此在模型Hn|n(Λ)下求解Λ使得
如上的参数调整过程即为图4中认知控制器对系统的认知行动作用,雷达通过认知控制过程调整到优化发射状态后执行对目标的量测过程。本质上,Hn|n是控制过程的目标函数,而Λ是控制变量。
图4 认知动态系统中的认知控制结构
认知控制中,可将系统熵态定义为Hn|n,表示获取第n个观测量后确定的系统不确定度。与系统状态不同,系统熵态无法直接控制。例如,目标的位置与期望存在一定偏差,可直接改变目标位置进行补偿;然而目标的熵态与期望一定偏差,则无法直接减少目标状态不确定度,只能通过其他量间接控制。此外,系统熵态的减小,不仅仅要在局部实现,更要在全局实现。即在n时刻获得观测量后,通过采取控制行为,在降低n+1时刻系统熵态的同时,也要降低n+1之后所有时刻的系统熵态。
4结论
认知控制来源于心理学与神经科学,尚未在工程领域得到广泛应用。认知控制模拟人类认知系统,是以降低信息缺失为基本思想的信息控制方法。本文在对认知心理学和认知神经科学中大脑认知控制研究加以分析的基础上,通过类比将人类认知控制过程引入雷达系统,构建了信息缺失最小化的认知控制模型,并将问题转化为系统熵态的最优估计与控制,最终对认知控制在雷达系统中的作用进行了分析论述。认知控制是一种融合认知、信息与控制的新思维方法,在智能雷达系统中将有极大需求和应用。
参考文献:
[1]Hammond K R,Summers D A.Cognitive control[J].Psychological review,1972,79(1):58.
[2]Brass M,Derrfuss J,Forstmann B,et al.The role of the inferior frontal junction area in cognitive control[J].Trends in cognitive sciences,2005,9(7):314-316.
[3]Kouneiher F,Charron S,Koechlin E.Motivation and cognitive control in the human prefrontal cortex[J].Nature neuroscience,2009,12(7):939-945.
[4]Feldman H,Friston K J.Attention,uncertainty,and free-energy[J].Frontiers in human neuroscience,2010(4):17-21.
[5]Fuster J M.Cortex and mind:Unifying cognition[M].Oxford university press,2003.
[6]Haykin S,Xue Y,Setoodeh P.Cognitive radar:Step toward bridging the gap between neuroscience and engineering[J].Proceedings of the IEEE,2012,100(11):3102-3130.
[7]Haykin S,Fatemi M,Setoodeh P,et al.Cognitive control[J].Proceedings of the IEEE,2012,100(12):3156-3169.
[8]Haykin S.Cognitive radio:brain-empowered wireless communications[J].Selected Areas in Communications,IEEE Journal on,2005,23(2):201-220.
[9]Haykin S.Cognitive dynamic systems:Perception-Action cycle,radar and radio[M].Cambridge University Press,2012.
[10]Ben-Haim Y.Information-gap decision theory:decisions under severe uncertainty[M].Academic Press,2001.
[11]Arasaratnam I,Haykin S.Cubature kalman filters[J].Automatic Control,IEEE Transactions on,2009,54(6):1254-1269.(责任编辑周江川)
【信息科学与控制工程】
中图分类号:TN95
文献标识码:A
文章编号:1006-0707(2015)12-0099-04
doi:10.11809/scbgxb2015.12.025
作者简介:周城宏(1989—),男,硕士研究生,主要从事认知雷达体制与技术和动态目标的电磁散射研究。
收稿日期:2015-06-01