6G卫星互联网通信安全抗干扰技术研究
2023-02-09鲁信金黄璐莹陈继林
鲁信金,黄璐莹,陈继林,雷 菁,李 为
(国防科技大学 电子科学学院,湖南 长沙 410073)
0 引言
伴随着移动通信技术的迅猛发展,未来6G研究创新窗口悄然而至[1]。卫星通信纳入6G网络作为其中一个重要子系统得到普遍认可,目前将卫星送入太空的竞赛正在火热进行中,人造卫星数量日益暴增[2]。为实现真正全球覆盖和数据传输,卫星网络与地面网络融合形成的“天网-地网”卫星互联网体系设计将不断完善,这使得网络通信从硬件到软件,再到网络管理都存在着不安全因素[3-4]。为此卫星互联网受到威胁和攻击的可能性越来越大,移动通信的脆弱性和安全问题日益突出。
天基卫星通信网络、空基通信网络、陆地通信网络和海洋通信网络构成了卫星互联网系统,其组成的复杂性和特殊性使得卫星互联网具有信道开放、节点暴露、拓扑高度动态变化等特点[5]。卫星节点暴露且信道开放使得卫星互联网中的卫星节点长期直接暴露于空间轨道上,从而星间、星地等链路极易受到窃听、伪造和干扰等威胁[6-7]。
① 窃听威胁:卫星互联网通信具有传输距离远、通信速率慢、卫星集群密集等特点,使得卫星间的通信更容易被敌方窃听。窃听方只需一个低成本的卫星接收终端,就可截获到卫星通信的传输信号,通过专业的信号分析进一步得到传输内容,解析出整个卫星系统的通信编码体制。
② 伪造威胁:目前卫星通信中的控制指令是由明文指令发送或者只进行简单的加密传输,很容易被敌方伪造出假的控制指令向卫星发出指令,造成卫星合法通信中断,使正常数据无法进行传输,甚至导致整个卫星互联网系统瘫痪。
③ 通信干扰威胁:卫星互联网的电磁环境复杂,极易受到恶意信号的电磁干扰以及大气中的电磁信号及宇宙射线等各类干扰,使得正常卫星通信的数据传输受到影响甚至发生中断[8]。另一方面,由于卫星互联网中的通信都是低功率传输,敌方可以通过大功率压制,使得合法的卫星通信业务无法正常传输,造成卫星的事实瘫痪。
为解决未来6G卫星互联网存在的上述问题,本文提出了卫星互联网无线通信安全抗干扰技术方案。首先,对于卫星互联网无线安全传输方案的设计,设计可变码率的安全polar编译码,使得编码码字更具有灵活性和适用性,而且编码和加密同时进行,保证系统的可靠性和安全性。此外,针对高速移动场景,设计新型调制即正交时频空(Orthogonal Time and Frequency Space, OTFS)调制加密方案,从而可以对抗信道的动态时变性。在OTFS调制系统中进行复数域等距变换,使得变换后的星座图呈现球状混乱,因而调制方式和信息得以隐蔽,增大了窃听者的解密难度。
其次,对于卫星互联网物理层用户身份认证,采用无线信道状态信息、设备射频(Radio Frequency, RF)指纹、物理层信号水印作为认证媒介,从而在底层有效防止用户的伪装和非法截获。卫星互联网的身份认证可以在对信号进行解调和解码之前进行,避免浪费信号处理资源。此外,物理层认证技术不用考虑数据链路层、网络层、应用层的安全机制的执行方式,有很好的兼容性。
最后,针对卫星互联网干扰环境下用户通信问题,研究中继-信道联合选择抗干扰决策优化方法。采用强化学习算法,将中继和信道决策过程建模为马尔科夫决策过程(MDP)。为了避免控制信道被干扰,同时考虑了控制信道的动态频谱接入。用户和中继节点通过不断地和环境进行交互,加强对环境的认知,使用户和中继节点能够在频谱环境动态变化且中继节点分布未知的情况下,分别获得最优的中继节点和传输信道策略。
1 卫星互联网无线安全传输技术
1.1 安全编码技术
针对卫星互联网信道编码层的安全,安全编码的目的是保证私密信息安全且可靠的前提下,尽量提高私密信息的信息传输速率。首先,在有密钥安全编码技术中,需要的密钥体积往往很大,如McEliece公钥密码算法[9]。其次,在无密钥安全编码技术中,通过加入校验冗余增强信息之间的联系来纠正和检测错误,使得合法接收端的信息误比特率低于正常工作所需的最小误比特率,从而增加可靠性;通过加入随机冗余减少信息间的联系,使窃听者无法从接收到的部分消息获知私密信息,增加了安全性;通过尽可能减少各种冗余,提高信息传输速率,增加了有效性。
由于polar码的编译码算法[10]都对码长有限定条件,即码长必须满足2的幂次方:N=2n。虽然当码长N固定时,信息比特长度K可以任意取值,编码速率R=K/N也能随之自由变化;但当信息比特长度K固定时,编码速率无法通过调整码长实现自由变化。从实际出发,希望设计编译码器在不改变基本编译码结构的情况下,使码长和编码速率都能够自适应调节。在设计速率可变的编码时,删余是码元缩减的重要手段,可以提高信道编码的效率,实现码字的速率可变性。基于polar码的编码结构和物理层加密技术,在进行polar码编码的过程中通过对生成矩阵的删余和polar码冻结位的删余进一步引入码字缩减,使得polar码码字长度减少,这样可以在不改变基本编译码结构的情况下,使码长和编码速率都能够自适应调节[11]。另外,收发双方通过物理层密钥提取技术,利用信道特点提取初始密钥,再利用混沌发生器进一步扩展生成混沌序列,用于控制删余码字,从而进一步提升Polar码传输安全性。图1为一种基于删余Polar码的通信系统方案。
图1 基于删余Polar码的通信系统模型
在物理层编码加密系统中,加密和纠错在物理层同时完成。首先,合法通信双方Alice和Bob对主信道进行密钥提取,由于无线信道的时空唯一性以及混沌系统的初值敏感性,窃听方Eve无法获取任何关于密钥的消息。其次,将提取的密钥传输至混沌序列发生器,产生扩展密钥即混沌序列。当Alice传输消息给Bob时,将明文通过编码加密模块,即利用混沌训练进行polar码删余的具体控制,得到删余码字X再传送至信道。Bob接收到信息Y后,利用译码解密模块,从而得到消息U。由于编码加密模块的存在,Eve窃听到的是加密删余后的码字Z,由于Eve无法获得密钥,因此无法得到删余方式。
接下来对其polar码的删余控制具体操作进行详细论述。令N和R表示删余前polar码的码长和码率,N′和R′表示自适应码长的polar码的码长和码率。一般的方案中通常不知道被删除的比特并且将凿空处的码字比特设置为无限大或者无限小,这使得误码率很大。本文提出的方案将通过在原生成矩阵GN删掉N-N′行和N-N′列构造一个新的N′×N′矩阵。同时,对应于生成矩阵所删掉行的N-N′个冻结位也被进一步删除。
图2 N′=6时的自适应码长的polar码构造
图3 生成矩阵和冻结位的删除选择
1.2 新型调制加密技术
广泛采用的OFDM系统固有的一个缺点是对频偏非常敏感,而面对快时变信道,OFDM受到了多普勒效应的影响,将会产生载波间干扰,导致性能极速恶化。而目前高铁、车联网等高速移动场景中,多普勒效应的存在又是无法避免的。针对这个问题,Hadani等人提出了一种新型调制方式,即OTFS调制[12]。OTFS在高时延高多普勒频移的快时变信道中实现可靠、高速的数据传输。
图4为OTFS系统的基本结构,显然OTFS在OFDM的发送端前,加了一级逆辛傅里叶变换(Inverse Symplectic Finite Fourier Transform, ISFFT),在OFDM的接收端后,加了一级辛傅里叶变换(Symplectic Finite Fourier Transform, SFFT)。通过这两级二维变换,将信息符号调制在时延-多普勒域上,使传输单元中的所有符号都经历几乎相同且变换缓慢的稀疏信道,能够获得时间和频率上的全部信道分集,从而可以对抗信道的动态时变性。OTFS的这些优点使其非常适合应用在具有严重时频双色散信道的卫星互联网通信场景中。
图4 OTFS系统框图
如图5所示,快时变信道响应在时延-多普勒(Delay-Doppler, DD)域中是稀疏的,在时间-频率(Time-Frequency, TF)域中表现则相反。信道的稀疏有利于提取到信道信息的一致性,可以节省密钥提取过程中信息协商时的通信资源[13-14]。此外,从稀疏信道中也可以更加轻易提取信道响应信息。该方案提取DD域中每条子信道的信道响应强度为初始值,经过混沌生成器产生密钥,从而进一步增加可用密钥数量。接下来,结合密钥对OTFS信号星座图进行相位旋转加密。
(a) DD域的信道响应
图6为合法接收方Bob和窃听方Eve的星座图对比。图6(a)为Bob经过相位旋转解密后的星座图集合,其点位清晰,可以很轻易地解调出星座图中的信息;在图6(b)Eve接收到的星座图集合中,由于随机旋转使得星座图相位信息全部缺失,在不知道密钥的情况下无法从中恢复出星座图原本的信息。
(a) Bob的接收星座图
面向OTFS安全传输是一个融合了通信波形设计和信息安全传输的交叉科学问题,将新型调制技术和物理层安全传输技术紧密结合在一起,能够同时满足卫星互联网通信网络中信息安全、高效、可靠传输的现实需求。
2 卫星互联网用户身份认证技术
卫星互联网物理层用户身份认证模型如图7所示,主要有非法伪装者、合法发送方和合法接收方构成。非法伪装者通过无线信道非法窃听获取合法用户的传输信息。发送方发来信息后,合法接收方将接收到数据进行鉴别。此时通过认证检测,判定是来自合法方还是伪装者,以达到身份认证的目的。
图7 物理层认证模型
卫星互联网物理层安全认证技术具有机密性、可靠性及易实现等许多特点和诸多优势。首先,物理层认证技术利用通信介质唯一性、时变性和复杂性的特点,能很好实现身份加密和认证,并且其特征很难被模仿,具有优良的机密性。其次,物理层认证技术不需要考虑物理层之上的安全机制执行方式,有很好的兼容性。最后,物理层认证技术可以在对信号进行解调和解码之前快速地对通信节点进行身份认证,从而避免对信号处理资源的浪费。
2.1 基于无线信道的身份认证
卫星互联网通信中由于路径损耗和信道衰落的存在,不同位置的用户信道状态也不同。考虑在时变信道中,利用无线信道的时间相关性辅助消息认证[15]。如果接收到的两个数据帧间的时间间隔比信道相干时间小,当这两个数据帧的信道状态高度相关时,则这两个数据帧由同一发送方发出;若不相关,则很可能是伪装者端发出。对此,可以从机器学习的角度对信道状态信息进行学习和检测,比如采用支持向量机(Support Vector Machine,SVM)算法[16],将SVM算法引入物理层通信中,通过对无线信道特征的训练和检测,实现对用户身份特征进行分类判别,从而完成对用户身份的认证。
采用二元假设检验的方式进行身份认证合法双方共享两组不同的密钥,将密钥信息隐藏在发送信号的相位中,通过信息符号进行问询和响应信息交互,如图8所示。两个信息符号经历相同的信道衰落,最后通过二元假设检验的方法实现身份认证判断。文献[17]提出了一种基于二元假设检验统计量改进的物理层认证方案,该方案可以使得窃听者的统计分布更容易与合法的通信节点区分开,在不同信道条件下具有良好的鲁棒性和优越性。此外,推导了所提统计量的均值和方差的近似理论闭式表达式。
图8 基于“问询-响应”的身份认证
2.2 基于RF指纹的设备认证
RF指纹[18]可通过收发机的硬件区别来识别不同的无线设备,卫星互联网用户可通过RF指纹设计识别系统进行身份认证。RF指纹分为基于瞬态信号的方法和基于调制域信号的方法[19]。基于瞬态信号的识别方法通过设备开/关机瞬态的无线电信号特征来进行识别,基于调制域信号的识别方法通过从部分已调制的信号中提取特征,根据这些特征进行识别。RF指纹信息具有普遍性、唯一性、稳定性、独立性和可测性等特点。
接收端的RF认证设计如图9所示,首先合法接收方对射频信号进行接收,然后进行滤波去噪预处理,再选取合适的提取算法获得RF指纹特征。将提取的RF指纹连同用户标签一起入库并且对这些特征进行训练,得到相应分类器。在实际卫星互联网场景下,随着用户数目的增加及通信机器的老化等因素,信号特征库需要进行不断地更新,分类器也需要定期进行重新训练。
图9 通信辐射源个体识别流程图
然而,针对现有的RF指纹身份识别,伪装者可通过重放/复现其用来做RF指纹识别的信号攻击合法用户端。但是复现RF指纹需要高端的信号分析仪来提取信号中的微小差异,且提取环境需要一个相对静止的信道。因此,可进一步对RF指纹识别信号进行设计,使攻击端难以提取RF指纹并复现。
2.3 基于物理层信号水印的认证
物理层信号水印[20-21]是将秘密的安全认证信息或标签叠加在主传输信息的波形上一起进行传输,不需要额外增加传输带宽。另外,还有一种在物理层认证射频信号的水印机制,通过将认证信息的每个水印比特与调制后的数据比特进行算数相加。接收端在解调之前采用相同的扩频码提取出水印比特,认证信号,并去除水印比特后,可以得到发送端原始发送的数据。
如图10所示,根据射频指纹和射频水印存在的位置,可以将其分为以下几类:编码水印、调制水印、频率指纹、辐射指纹和信道指纹。其中射频水印在基带信号处理以前,射频指纹集中在基带处理之后。
图10 射频指纹和射频水印的分类
然而射频指纹的存在会对无线信道的互易性产生较大的影响,从而间接影响无线信道密钥的生成效果。剥离了射频指纹的无线信道互易性增强,提高了密钥熵和密钥的生成速率,从而降低了比特错误概率。但是,发送接收设备的射频指纹无法同时剥离[22]。因此,可以对发送设备的射频指纹进行剥离,然后基于该指纹来实现认证操作;与此同时,采用一致性增强的方法来消除收发设备射频指纹的非对称性对密钥生成带来的影响。
3 卫星互联网通信抗干扰技术
图11 系统模型图
假设干扰环境设为双扫频干扰,并且干扰范围有限,通信方在未知动态环境下找出最优的传输策略(中继节点、传输信道)防止通信被干扰,最大化系统的吞吐量。
强化学习是一种重要的机器学习方法[23-24],它可有效解决智能体根据环境如何采取行动以获得最大回报值的问题。强化学习的学习过程可以看做是智能体与环境不断交互的过程,从而强化对环境的认知。在每次交互的过程中,智能体得到环境当前的状态St,然后做出动作At后,智能体会得到一个回报值Rt。智能体和环境间的交互会产生一个连续的决策序列:
Q学习是一种常用的抗干扰强化学习方法[26-27],Q学习的核心是Q值表Q(S,a)被用来评估在状态S下采取动作a的质量。将卫星节点和所有的中继节点都作为智能体,每一个智能体都维护各自的Q值表,用来评估每个状态下的不同动作的质量。由于智能体不断地和环境进行交互,Q值表不断进行更新,直到强化学习结束,最后,Q值表中的值会趋向于稳定状态。
在一个相干时间内将通信传输时隙分为若干个长度相等的时隙单元,传输时隙定义为K={1,2,…,K},将每个时隙划分为以下几个阶段,如图12所示。
图12 时隙结构图
① 数据传输阶段:给定初始状态S0=fj(0),卫星节点随机选择一个中继节点Ri,即在初始时隙卫星节点选择中继节点Ri并且发送数据。中继节点Ri任意选择一个信道ft(0)向地面用户节点转发信息;
② 宽带频谱感知阶段:中继节点通过宽带频谱感知探测当前时刻各信道的占用情况并获得干扰信道fj(k);
③ ACK反馈阶段:地面用户节点接收到数据信息后,计算当前时隙的接收信噪比,将当前感知到的干扰信道和接收信噪比通过ACK反馈给卫星节点和中继节点;
在接下来的K-1个时隙内,通过强化学习每个智能体都经历同样的过程来做出新的决策。在初始时隙,Q值表为全零矩阵,在后续时隙中,智能体通过Q学习更新Q值表来反映当前状态下所选动作的质量。这样的循环执行可以不断地强化智能体对环境的认知,从而使智能体在动态变化的环境中获取最优策略并达到持续稳定的状态。
图13显示了Q学习收敛前后干扰机和中继节点的信道选择时频。红色方框表示干扰信道,绿色方框表示中继节点的传输信道。二者的重叠部分表示中继节点的传输受到干扰。从图13(a)可以看出在学习的早期阶段,中继节点尝试在不同的信道中进行传输,被干扰的可能性很大高。如图13(b)所示,Q学习收敛后,中继节点完全可以避免干扰。
(a) 学习初期中继和干扰的时频信息
4 结束语
卫星互联网由于缺乏安全标准以及足够防护能力,安全问题可能随时发生。从窃取隐私到卫星被控制,敌方可以很容易地关闭卫星,拒绝提供服务。此外,还可以对卫星信号施加干扰或欺骗甚至可以实现对卫星的完全控制,因而对卫星互联网通信安全抗干扰技术研究势在必行。
卫星互联网无线安全传输可充分利用无线通信本身的信号格式和无线信道的物理特征,对物理层传输信息的特定格式进行加密从而实现安全设计。此外,利用无线媒介和物理层独特的性质可有效加强网络用户的身份认证工作。这些性质包括通信信道特征、收发硬件特征以及传输信号特征。最后利用智能化抗干扰技术,基于“感知-学习-预测-决策-反馈”的逻辑闭环,进行主动抗干扰决策,设计基于强化学习的中继和信道联合优化抗干扰方案,保证其数据传输的有效性和可靠性。