基于语义重要度的不等错误保护数据传输机制
2023-05-13郭帅帅GUOShuaishuai李树静LIShujing
郭帅帅/GUO Shuaishuai,李树静/LI Shujing
( 山东大学,中国 济南 250062)
随着人工智能的发展,各种新型通信对象大量涌现。通信网络不仅要支撑人与人(H2H)之间的交互,还要支撑人与智能机器(H2SM)的交互和智能机器与智能机器(SM2SM)的交互。星地融合的全覆盖和机器-机器意图通信或将成为6G使能的创新应用[1]。然而,传统通信系统中信息压缩和传输的方法已经逼近香农信息论极限。语义通信有望打破这一瓶颈,成为6G 的关键技术[2]。语义通信关注数据中蕴含的语义,结合背景知识提取与任务相关的语义,其通信目标是接收端在语义层面上恢复信息。现有关于语义通信的研究大多基于信源信道联合设计的思路,在仿真中表现出优越的性能,但在神经网络训练耗时和通信安全等方面仍存在一些问题[3]。本文从信源信道分离设计的角度出发,提出了一种基于语义重要度构造不等错误保护的传输机制。
1 传统通信与语义通信
传统通信以香农经典信息论为指导,按照技术堆叠的思路发展,系统复杂度和对资源的消耗都不断提高。语义通信拓展香农信息论,挖掘信息的语义维度,实现信息的高度抽象表征和智能简约传输。本节将从系统组成和理论基础两方面讨论传统通信和语义通信之间的异同。
1.1 系统组成
传统通信系统模型如图1所示,在信源到信宿之间采用信源、信道分离编解码。信源编码把经过采样和量化的模拟信号变换成数字脉冲,信道编码按照一定的协议对信息进行纠、检错编码,以弥补由高斯白噪声(AWGN)、信道衰落等引起的信息错误。信源、信道译码是编码过程的逆过程。
▲图1 传统通信系统模型
信源信道联合设计的语义通信系统模型如图2所示,该模型除采用信源信道联合编码外,还引入了语义编解码功能块。语义编码器和语义解码器都会使用神经网络。语义编码器从要传输的数据中提取出与任务相关的语义信息,并进行语义编码,降低传输数据的维数;语义解码器接收语义信息,并根据背景知识进行语义恢复。在这个过程中存在两种噪声,即物理信道中的物理噪声和语义信道中的语义噪声。背景知识库不匹配,或者传输内容存在歧义,都是语义噪声的来源[3]。语义噪声的存在可能使信源和信宿之间产生误解,导致语义失真。建立知识库可以解决这一问题。语义通信系统是一种基于知识的系统[3]。背景知识库的建立十分耗时,它在训练的过程中通过对环境的感知学习不断更新,但发送端和接收端所处环境与学习过程不同会导致两者的知识库不匹配[4]。通过收发端知识库共享可以减少这种不匹配,提高语义通信的准确性。但在实际应用中,出于对通信开销和隐私保护等因素的考虑,背景知识完全共享难以实现。
▲图2 信源信道联合设计的语义通信系统模型
信源信道分离设计的语义通信系统模型如图3 所示。信源信道的编解码和调制解调可使用经典的技术。添加一个训练好的神经网络可使系统根据背景知识对数据进行学习。引入神经网络是为了识别数据的语义重要度,以便对具有不同语义重要度的数据设置差异化的传输机制:重要度高的语义信息使用比特保护能力强的传输机制,重要度低的语义信息使用比特保护能力弱的传输机制。
▲图3 信源信道分离设计的语义通信系统模型
1.2 经典信息论与语义信息论
信息论是建立在概率论的基础上的,香农在文献[5] 中引入了信息熵的概念,以比特为单位衡量信息量,为通信过程建立数学模型,这奠定了通信的理论基础。对于特定的传输任务,如何衡量语义信息量,目前理论研究尚不完备。
1)信息熵与语义熵
经典信息论用信息熵H(X)表示无损传输的信源压缩上限。对于给定的信源X,其信息熵可以表示为:
信息熵的计算只考虑原始数据,而语义熵的计算还需要考虑语义。例如文献[6]从逻辑概率角度出发,将香农的通信理论从语法层面扩展到语义层面,定义了句子x的语义熵:
其中,P(x)是句子的逻辑概率。然而,这种定义存在逻辑悖论问题,且不具有普适性。从本质上讲,语义信息只是原始数据有损压缩后的信息。对此,我们先定义语义失真测度,然后依据失真测度推导率失真定理,再根据信息熵是无失真编码码率的下界,将语义熵描述为语义失真最小的编码码率的下界。这种定义方式具有普适性且与传统信息论逻辑自洽,有利于理论及其支撑下的编码技术的平滑演进。
2) 传统信道容量与语义信道容量
信道传输的信息量可以由信道输入X和信道输出Y间的互信息表示,互信息表达式为:
其中,条件熵H(X|Y)表示信道传输中信息量的损失。高斯信道容量取上述互信息的最大值,计算公式为:
其中,B 表示系统带宽,P 表示输入信号平均功率限制,N0代表噪声功率的谱密度。传统通信中信道容量的大小与传输的内容无关,而语义信道容量既与通信系统本身有关,也与传输任务有关。文献[6] 还开发了语义信道容量的定理。假设X 代表信道输入,Z 是从中提取的语义特征,Y 为信道的输出,离散无记忆信道的语义信道容量可以表示为:
其中,I(X; Y)表示语法信道的性能,C = sup{I(X; Y)}。H(X|Z)代表语义编码后的歧义,表示语义编码器的性能。代表接收消息的平均逻辑信息,其值越大表示接收者对接收到的消息的解释能力越强。在语法信道容量的基础上,语义信道容量的大小取决于
3) 率失真与语义率失真
率失真理论也叫有损信源编码定理。对于给定的最大平均失真D*,率失真函数R(D*)给出传输比特率的下限[7]:
其中,失真D与X和Y的距离有关。不考虑外部信息,语义率失真要同时考虑传输的失真和语义层面的失真。文献[8]中给出了一种计算公式:
其中,Ds是信源X和恢复信息̂之间的语义失真,Da是信道噪声引起的语义表征Z和接收端接收到的语义表征Ẑ之间的失真。
一些研究人员引入信息瓶颈理论来进行率失真权衡。文献[9] 设计了一种新的损失函数:
其中,α和β是调节互信息项和推理项的权重的参数。压缩项表示X所需的平均位数。推理项是编码器处的X和接收器捕获的̂之间的KL 散度,表示接收端推理性能。在文献[10] 中,作者利用信息瓶颈公式化了边缘推理系统的率失真权衡,损失函数如下:
其中,V是推理任务,失真项表示推理结果的不确定性,压缩项表示给定X条件下的Ẑ中保留的信息。
2 语义通信系统架构
语义通信系统的架构有信源信道联合设计和信源信道分离设计两种。语义通信的研究工作主要分为两类:一是以数据重建为目标,如文本图像的高质量传输;另一个是以执行任务为目标,如图像的分类、识别、分割和视觉问答等。现有工作主要集中于联合信源信道编码的语义通信系统。本章节按照数据重建导向和任务执行导向的分类方式对相关研究进行总结,并提出一种信源信道分离设计的方案。
2.1 信源信道联合设计的语义通信
1) 面向数据重建的语义通信
通信系统传输的数据类型主要有图像、文本和语音3种。面向数据重建的通信任务目标是在接收端恢复信源数据。对于此类任务,语义通信系统借助先验背景知识库,仅对提取的语义信息进行编码传输,而不是传输全部原始数据。大量仿真实验表明,语义通信系统具有比传统通信系统更高的鲁棒性和更低的通信开销。
文献[11] 提出了传输高分辨率图像的方案——基于深度学习的联合信源信道编码(Deep JSCC),将图像像素值直接映射为复值信道输入符号。编码器和解码器通过两个卷积神经网络进行联合训练。该方案分别在CIFAR-10 和Kodak 图像数据集中进行训练和测试。实验显示,在峰值信噪比和结构相似度方面,Deep JSCC 方案性能比传统的信源信道分离方案更优,在低信噪比区域的优势尤其显著,且在时变信道上表现出更高的鲁棒性。
文献[12]提出一种用于文本传输的方案,将互信息作为损失函数的一部分,通过恢复句子的含义不仅使系统容量达到最大,还可以使语义错误变得最少。文献[12]还定义了名为句子相似性的新指标,以描述两个句子在语义信息方面的相似水平。该指标的计算公式如公式(10)所示,其中BΦ代表BERT(一个巨大的用于提取语义信息的预训练模型)。
文献[13]设计了用于语音传输的语义通信系统(DeepSC-S),采用了联合信源信道编码的方式,尤其使用了压缩和激励(SE)网络来提取重要语音语义信息,并在电话系统和多媒体传输系统中验证了模型的适应性。结果表明,在两种情况下的信号失真比和语音失真感知评估等语音信号指标都优于传统通信。
2) 面向任务执行的语义通信
在面向任务执行的语义通信系统中,发送端要在知识库的支持下提取充分且尽量少的语义特征,并且忽略无关信息,使接收端能够根据接收到的语义特征有效地执行任务,同时最大程度地减少通信开销,提高资源利用率。面向数据的通信能够满足H2H 通信的需求,而H2SM 通信和SM2SM通信需要更加智能、高效的面向任务执行的通信。
文献[14] 研究了多用户语义通信,并将图像检索、机器翻译和视觉问答(VQA)3个智能任务作为传输目标,基于Transformer 提出了不同的模型。用于VQA 任务的系统模型在结合图像检索和机器翻译外,还加入了一种新的用于图像-文本信息融合的语义解码器网络。
文献[10]和[15]设计了一种用于边缘推理的语义通信系统,将特征提取器和联合信源信道编码器布置在边缘设备,利用信息瓶颈原理提取推理任务的相关特征,以低延迟进行准确边缘推理。对于动态信道条件下的图像分类任务,文献[10]提出了一种可变长度变分特征编码的端到端架构,可根据信道条件调整特征编码的激活维度数。该架构在延迟和准确率方面的性能良好。为弥补该设备感知的不足,文献[15]提出了用于多设备协作边缘计算的语义通信方案(VDDIBSR),并开发了一种选择性重传机制,以识别多个边缘设备的编码特征中的冗余。在多视图图像分类和多视图对象识别任务上进行的实验表明,VDDIB-SR与现有方法相比,实现了更高的分类和识别精度,同时降低了通信开销和延迟。
2.2 信源信道分离设计的语义通信
当传输任务或通信环境改变时,信源信道联合设计的语义通信系统需要对整个网络进行重新训练。这是一个非常复杂且耗时的过程。此外,信道中直接传输的语义特征容易受到攻击,存在隐私/秘密泄露等风险。现有的语法通信是基于信源信道分离定理设计的,且分离设计的通信技术已经非常成熟,这些都有助于语义通信系统信源信道的分离设计。
文献[16]提出了一种语义通信信号成形(SSSC)方法,以最小化语义损失。语义损失通过来自BERT模型的预训练双向编码器测量。该方法将信号集优化问题转化为受功率约束的矢量优化,能够合理设计星座图。因为考虑了每个信号点的语义,所以文中设计的信号星座是不规则的。语义相似度越高的信号星座点越接近,留出的空间就越多,有利于放置其他信号星座点。这里我们将所提出的SSSC 与二进制相移键控和正交相移键控等设计相比较。仿真结果表明,SSSC在减少语义损失方面能够带来显著性能增益。
本文提出了一种基于语义重要度构造不等错误传输机制的方案。基于背景知识,该方案在信源编码时对语义按重要度进行分类,根据重要度设置不同的误码率限制并采用不同的传输方案(包括信道编码等),为重要度高的语义信息构建强保护传输的传输机制,为重要度低的语义信息设计弱保护传输机制,用较少的通信资源实现良好的通信性能。
系统模型如公式(11)所示。对于要传输的数据X,根据背景知识将其语义重要度从低到高划分为n类,原始数据X 也分为n 组。对应地,传输机制也分为n 个等级,保护性能的强弱与等级高低一致。
我们在AWGN信道下用Mnist 数据集进行仿真实验,使用神经网络识别图片上的数字。不失一般性,我们假设语义重要度与数值大小一致(9 对应的重要度最高,0 对应的重要度最低),并与不区分语义重要度的传统通信方法进行对比。图4给出了在实现相同的误比特率(BER)条件下,信源信道分离的语义通信系统与传统通信系统BER性能对比。仿真中,重要数据对应数字9,共1 000 张图片,采用(7,4)汉明码+4符号正交幅度调制(4 QAM);次要数据对应数字0,共1 000张图片,采用(7,4)汉明码+64 QAM。为了公平对比,我们采用传统通信方案传输这2 000张图片,不进行重要度区分,均采用(7,4)汉明码+16 QAM调制。仿真结果显示,在BER=10-3时,我们所提的语义重要度感知的通信方法比传统通信方案节省了约3 dB 的功率。这一结果表明,区分语义重要度能够更好地保障重要数据的传输,从而节约通信资源。
▲图4 信源信道分离设计的语义通信与传统通信方案的性能对比
3 语义通信的开放问题
1)近年来,深度学习取得了巨大的进步,其在语义通信中的应用弥补了概率统计等理论基础的不足,使语义通信再次成为研究热点。但深度学习的可解释性差,语义信息度量、语义传输容量等基础理论问题仍未突破,语义通信的研究仍然缺乏一种通用的科学理论指导。
2)现有语法通信是基于信源信道分离定理而设计的,而目前语义通信系统的研究几乎全部采用信源信道联合设计的方法。通信网络中任何一个节点都有可能遭受攻击,而语义特征的提取是基于背景知识库的。按照理想的设计思路,在背景知识未知的情况下,系统中传输的信息是无意义的。也就是说,语义特征提取与语义编码的过程为语义通信提供了天然的加密层。实际上这种加密是否有效还有待考证。
4 结束语
传统的语法通信已经逼近香农定理的极限,在原有思路上提升性能只能依靠技术的堆叠,而这也带来了系统复杂度和能耗的提高。语义通信提供了一条新的发展思路,旨在构建“智能、简约、达意”的通信系统,且其在理论和技术方面都具有光明的发展前景和广阔的研究空间。