基于在线学习的智能抗干扰通信系统设计

2020-06-08马海波俞力周新冯熳

现代信息科技 2020年19期

马海波俞力周新冯熳

摘要：面对复杂多变的电磁环境，通信系统的抗干扰能力愈发重要，而传统的抗干扰方式缺少灵活性，无法动态适应复杂的传输环境。目前人工智能算法在抗干扰领域已有广泛研究，但大多只局限在某个方面，没有完整的抗干扰通信系统架构。基于上述问题，文章提出了一种基于在线学习的智能抗干扰系统架构，介绍了其系统工作流程;详细描述了系统各模块的功能和设计方案，证明了运用在线学习的方法进行智能抗干扰系统设计的可行性。

关键词：在线学习;智能通信;抗干扰通信

Abstract：Facing the complex and changeable electromagnetic environment，the anti-interference ability of the communication system is becoming more and more important，while the traditional anti-interference method lacks flexibility and cannot dynamically adapt to the complex transmission environment. At present，artificial intelligence algorithms have been extensively studied in the field of anti-interference，but most of them are limited to a certain aspect，and there is no complete anti-interference communication system architecture. Based on this，the article proposed an intelligent anti-interference system architecture based on online learning，introduced its system workflow;described in detail the functions and design schemes of each module of the system，and proved the feasibility of using online learning method for intelligent anti-interference system design.

Keywords：online learning;intelligent communication;anti-interference communication

0 引言

5G网络的规模化部署，已经在全世界范围内展开，与此同时，B5G/6G技术的研究已全面启动。作者在网络通信与安全紫金山实验室从事无线移动通信领域系统架构设计相关工作，研究发现随着无线移动通信系统中所使用的频段不断上移以及信息传输环境愈发复杂多变，通信的质量、效率对于无处不在的干扰越来越敏感，而传统的抗干扰方式[1，2]缺少灵活性，无法应对复杂多变的干扰环境，因此设计一个高效可靠的智能抗干扰系统迫在眉睫。

随着人工智能[3]技术的发展，在通信领域涌现了大量基于在线学习的智能算法的研究。电子科技大学的李少谦教授指出智能抗干扰技术是新一代抗干扰技术发展的新方向[4]，可通过对复杂电磁环境的感知，利用人工智能算法实现最佳通信;文献[5]以认知无线电为背景，研究了智能决策技术，将人工蜂群算法、基于反向传播的神经网络应用到决策模型中;文献[6]将深度强化学习算法应用到编码调制中，可有效减少通信方案策略变化所需要的功耗;文献[7]引入了自适应的交叉算子和变异算子，仿真表明系统的抗干扰性能显著提升;文献[8]提出了基于强化学习的Stacklberg博弈算法，采用纳什均衡求解，提高了通信用户的效用值函数。

本文在综合上述多种方案优缺点的基础上提出了一种基于在线学习的智能抗干扰系统架构，根据不同干扰环境，进行有针对性的自适应抗干扰方案设计，并对调制、编码、发射功率等多个参数进行联合优化，最终实现实时、高效、可靠的抗干扰通信。

1 基于在线学习的智能抗干扰系统架构

传统的抗干扰系统无法对环境进行自适应、工作效率低、缺乏灵活性，因此本文提出一种基于在线学习的智能抗干扰系统，其系统架构如图1所示。

详细的系统流程如图2所示，具体的流程为：

（1）頻谱感知模块感知各信道的干扰情况;干扰识别模块对当前信道中的干扰类型进行识别，频谱感知与干扰识别的结果被送入方案选择模块;

（2）方案选择模块根据频谱感知与干扰识别结果选择对应方案。情况1：当前信道无干扰，跳至（5）;情况2：当前信道存在干扰，但同时存在空闲信道，跳至（3）;情况3：当前信道存在干扰且无空闲信道，或者是连续多次采用情况2的方案后当前信道中仍存在干扰，跳至（4）;

（3）智能信道决策模块根据频谱感知结果选择空闲信道，并将该信息送给智能参数决策模块，至（5）;

（4）抗干扰决策模块根据干扰识别结果选择正确的抗干扰策略（直扩，跳频）与对应干扰环境下的误码率预测值，将该信息传送给智能参数决策模块，至（5）;当无法给出误码率预测方法时，根据模块中的预设参数，选择最优情况直接输出到调制发射端，至（6）;

（5）智能参数决策模块根据信道情况、信干噪比、功率、误码率、速率等因素，决策最优调制参数策略，并输出到调制发射端;

（6）调制发射端根据接收到的参数，调制并发射信号;一段时间后跳至（1），进入新的周期。

2 系统各模块功能与设计

2.1 频谱感知模块

频谱感知模块用来检测空闲信道，感知干扰在信道上的分布情况，为下一步干扰识别和方案选择提供依据。常用的频谱感知方法主要包括匹配滤波检测、循环平稳特征检测和能量检测三种，其具体的适用范围及主要优缺点如表1所示。

综上，基于能量检测的算法最为简单、快速，本文选择该算法完成频谱感知。

2.2 干扰识别模块

在本文提出的智能抗干扰系统中，通过干扰识别模块检测当前信道中干扰的类型，为后续的方案选择模块提供依据，使调制方案及参数选择更有针对性，进一步提高干扰环境下通信系统性能。具体的干扰识别系统框图[9]如图3所示。

特征提取是干扰识别模块的关键，传统的基于特征提取的干扰识别大多将干扰信号类比为调制信号进行研究，因此其识别方法也大体相同。在特征提取之前，首先要对信号做功率归一化处理，其目的是使样本数据的大小尽量符合标准正态分布，从而使学习器能够在统一的量纲上进行学习，能有效提高学习器的收敛效果和识别准确率，但是上述方法在干扰信号和调制信号混合的情况下识别效果并不理想，尤其在低信干噪比情况下，识别效果较差。因此，文献[9]提出了一种基于奇异值分解的干扰识别方法，在基本不增加计算量的同时，大幅提升了干扰识别准确率，因此本文拟采用该方法完成干扰识别。

2.3 方案选择模块

方案选择模块将干扰检测和频谱感知的结果汇总，分析信道中的干扰情况，并对将要采用的决策方式做出安排，该模块主要将干扰情况分为以下三种：

（1）当前信道无干扰;

（2）当前信道存在干扰，但其他信道受干扰较小，或干扰施加有规律，可通过调整信道规避干扰;

（3）当前信道存在干扰，且干扰相对智能，无法通过调整信道规避干扰。

2.4 智能信道决策模块

智能信道决策模块是实现高质量通信的关键，它根据频谱感知的结果，基于强化学习算法，通过学习干扰系统的信道切换策略直接切换到无干扰且质量最好的信道进行通信，减少了信道反馈时间，有效提高了工作效率。

文献[10]提出利用SARSA算法和Q learning算法解决信道决策问题。在SARSA算法下，考虑固定模式干扰和随机模式干扰，并假设干扰系统没有频谱感知能力，仿真结果表明在学习初期通信系统被干扰成功，但经过一段时间训练后通信系统可以完全规避干扰。在Q learning算法下设置干扰具有频谱感知的功能，仿真结果表明具备频谱感知能力的固定模式干扰和随机模式干扰需要更长学习时间。智能模式干扰下的仿真结果表明，当系统可以完全规避干扰时，用户和干扰方的Q learning参数相同，所需要的学习时间更短。同时该文献针对固定模式干扰情况下收敛速度慢的问题，提出了一种改进的Q learning算法，仿真结果表明所提算法可大大提高收敛速度。本文拟采用这种改进的Q learning算法完成智能信道决策。

2.5 智能参数决策模块

智能参数决策模块[10]以人工智能算法为核心，根据输入参数，如噪声功率、干扰类型及信干噪比等，结合预先设定的约束条件和用户要求/政策，对调制方式、编码方式、发射功率等通信参数进行决策，使系统能获得最佳的传输性能，其简化模型如图4所示。系统根据决策引擎中的优化决策算法在目标函数的解空间中寻找最优解，得到通信中相关参数的配置信息，然后根据用户要求的反馈更新知识库;也可以学习知识库中的通信案例，充分利用已知信息，由强化学习算法推理出下一个时刻的参数选择。

具体的智能参数决策引擎是要将待优化的目标和信道检测的结果以及可调参数关联，以得到最佳的决策方案。为改进传输质量、增加系统信息传输量、减小能耗等，本文考虑的主要目标函数包括：最小化误码率、最大化数据吞吐量、最低功耗、最小干扰以及最大频谱利用率。待优化的参数包括：传输功率、调制方式、调制进制数、传输频率、带宽、传输速率等。由于每个性能指标都和优化参数相关联，为了达到各指标的折中性能，需要对其进行归一化处理。具体过程为：首先对误码率、发射功率和平均信息传输速率等进行归一化处理;然后根据用户的需求选择加权系数，完成对目标函数的设计;通过目标函数将多目标问题转换为单目标问题，对系统的参数重新配置，实现当前环境下的最佳通信。

其中决策优化模块中，系统根据用户的需求或政策要求，通过人工智能算法在目标函数对应的解空间中进行全局搜索，以获得最优的系统参数配置，主要算法包括遗传算法、人工蜂群算法以及二进制粒子群算法等。

2.6 抗干扰决策模块

抗干扰决策模块主要根据干扰检测模块的识别结果，选取针对性的抗干扰策略。主要包括以下两个方面：

（1）抗干扰方式的选择：对单音、多音干扰，选择跳频的方式;对于部分频带等宽带干扰，选择直扩的方式;

（2）误码率预测：在调制方式、发射功率等其他参数的选择上，依旧需要智能参数决策模块来决定;而干扰决策模块需要通过公式法或查表法给出干扰环境下的误码率预测方法，并传给智能参数决策模块，使其修改目標函数。

3 结论

本文重点研究了基于在线学习的智能抗干扰系统设计，通过引入在线学习算法，设计了基于在线学习的智能抗干扰系统架构。在此基础上，对方案中的各个子模块，包括频谱感知模块、干扰识别模块、方案选择模块、智能信道决策模块和智能参数决策模块等，进行详细分析和描述。本文所提出的基于在线学习的智能抗干扰系统架构及详细设计，是通信系统中一种可行、高效的抗干扰解决方案。

参考文献：

[1] 陈青松，胡晓飞.无线通信抗干扰技术性能 [J].电子技术与软件工程，2018（21）：22.

[2] 郭冬.超高速跳频通信系统的设计与实现 [D].西安：西安电子科技大学，2015.

[3] GOODFELLOW I，BENGIO Y，GOURVILLE A.深度学习 [M].赵申剑，黎彧君，符天凡，等译.北京：人民邮电出版社，2017.

[4] 李少谦，程郁凡，董彬虹，等.智能抗干扰通信技术研究 [J].无线电通信技术，2012，38（1）：1-4.

[5] 王小青.认知抗干扰通信系统的智能决策技术研究 [D].成都：电子科技大学，2018.

[6] ZHANG L，TAN J，LIANG Y C，et al. Deep Reinforcement Learning-Based Modulation and Coding Scheme Selection in Cognitive Heterogeneous Networks [J].IEEE Transactions on Wireless Communications，2019，18（6）：3281-3294.

[7] DAI X. Allele Gene Based Adaptive Genetic Algorithm to the Code Design [J].IEEE Transactions on Communications，2011，59（5）：1253-1258.

[8] JIA L，YAO F，SUN Y，et al. A Hierarchical Learning Solution for Anti-jamming Stackelberg Game with Discrete Power Strategies [J].IEEE Wireless Communications Letters，2017，6（6）：818-821.

[9] 王梓楠.干扰环境下基于深度学习的调制识别方法研究 [D].南京：东南大学，2020.

[10] 周新.基于智能决策的抗干扰通信系统设计 [D].南京：东南大学，2020.

作者简介：马海波（1976—），男，汉族，黑龙江大庆人，高级项目经理，工程师，硕士，研究方向：5G通信系统架构。