APP下载

基于生成对抗网络的电网信息隐藏方法

2023-12-08李圆智宋贤睿崔春霞

沈阳工业大学学报 2023年6期
关键词:机密信息译码器损失

陈 伟, 李圆智, 宋贤睿, 崔春霞

(1. 合肥工业大学 过程优化与智能决策教育部重点实验室, 安徽 合肥 230009; 2. 国网安徽省电力有限公司 电力调度控制中心, 安徽 合肥 230061)

为了实现具备安全性与便利性的隐匿通信,在通信过程中发送方与接收方均会采用信息隐写术。隐写术是指将具有高价值的关键信息秘密隐藏于图像、视频和音频等低价值的常见数据信息中,并在不引起第三方注意的前提下,实现秘密和隐匿的无损信息传递。目前由于计算机与互联网技术主要将图像作为信息传输的方式,所以绝大多数的信息隐藏算法也以图像为信息载体。根据实现方式的不同,图像隐写算法主要分为空域及变换域两种。其中空域方法是指直接将秘密信息嵌入图像中,该方法的典型代表为最低有效位(least significant bit,LSB)匹配算法[1]。随着研究的深入,对信息隐藏技术的研究也逐渐转向变换域方法[2],即利用某种算法变换将秘密信息嵌入到图像的对应变换系数中,其典型代表为离散余弦变换(DCT)算法[3]。需要说明的是,尽管空域方法的容量较大,但变换域方法的安全性与鲁棒性则更为优秀,且其还代表着信息隐藏技术的未来发展方向。

鉴于在无监督学习领域的优异表现,生成对抗网络(GAN)吸引了诸多信息隐藏研究者的广泛关注[4-6],并逐渐成为了该领域的热门研究方向。其中,HU等[7]基于深层卷积生成对抗网络提出了不依赖于信息载体的隐写算法,但其信息容量较小;WANG等[8]通过混合随机噪声与秘密信息,提出了具有多样性及安全性的信息隐写算法,然而其信息提取的难度与精确度仍有待优化。

为了提高信息隐藏算法的提取精度及安全性,文中引入了SE-ResNet块,并设计了编码器与译码器的详细结构。利用生成对抗网络中的四舍五入层及对抗样本,形成具有强大学习能力的端到端图像隐写模型,进而实现了对信息提取精确度及安全性能的提升。

1 信息隐藏模型

为了提高隐写算法的精确度及安全性,本文在生成对抗网络的基础上,设计了一种由编码器、译码器和判别器等部件组成的隐写模型。其中编码器属于信息的发送端设备,主要负责将机密信息嵌入至信息载体的多种纹理区域中;译码器属于信息接收端设备,负责从信息载体的复杂纹理中完成重要信息的精确提取;判别器则属于第三方攻击者设备,其可利用传输图像分析隐写模型中的重要秘密信息。通过利用多种设备,本文设计的隐写模型具体架构如图1所示。

图1 基于生成对抗网络的隐写模型架构Fig.1 Steganography model architecture based on generative adversarial network

由图1可知,在信息发送端,设原始图像的尺寸(通道数、高度和宽度)为(v,l,w),机密信息Mc的尺寸为(1,l,w),其信息的取值值域为二进制,即Mc∈{0,1}。在编码器的作用下,将原始图像与机密信息Mc相结合,再进行卷积,便可得到隐写之后尺寸为(v′,l,w)的图像。通常而言,隐写图像与原始图像的像素值均为浮点数值,二者在外观感知方面并无任何区别。在四舍五入层的作用下,隐写模型可将隐写图像的浮点数值转换为整数值,并将其发送至接收端。利用接收端的译码器,模型首先对隐写图像执行卷积逆函数运算;然后从卷积结果中提取与多种噪声混合的机密信息M′;最后再进行必要的去噪处理,以获得完整的机密信息M′c。在判别器部分,第三方攻击者必须截获处于传输状态的隐写图像,再利用已知的原始图像进行精确地判定及鉴别,进而重建经过隐写的机密信息。

1.1 SE-ResNet块结构

编码器和译码器是隐写模型的核心设备,二者分别位于电网信息的发送端和接收端。为了尽量保持图像的原始信息与特征图大小一致,本文将卷积函数的核大小设置为3×3,而步幅与填充则均为1。同时增加编码器的卷积核数量,并减少译码器相应的核数量,再删除神经网络中的池化层,从而提高编码器的图像输出质量及译码器的信息提取准确程度。

在编码器和译码器的结构中,本文分别引入了3个具备核心功能的压缩激励网络。SE-ResNet块是神经网络算法中的基本构成模块[9],其具有简易的结构与实现方式,可广泛应用于图像的分类及去噪等操作。该模块的具体结构如图2所示。

图2 SE-ResNet块的具体结构Fig.2 Specific structure of SE-ResNet module

由图2可知,在SE-ResNet模块的工作过程中,尺寸为(v,l,w)的原始图像首先须执行两轮残差层运算,以获得尺寸为(v′,l,w)的特征图像;然后利用Global pooling运算,对尺寸为(v′,l,w)的特征图像执行挤压操作,并输出相应的特征图;接着再利用两个完全连接层、整流线性单元与Sigmoid函数的运算,完成特征图的参数化运算;最后采用两轮残差层的运算结果,分别与参数化之后的特征图进行相乘及相加,并获取尺寸为(v′,l,w)的最终特征图。在隐写模型中,SE-ResNet模块的功能在于将机密信息融合至图像信息中,但并不破坏图像的全局信息。

1.2 四舍五入层

经过信号发送端的编码运算之后,隐写图像Gs处于三通道彩色或单通道灰度图像的浮点数值状态,此时,译码器较难执行正常的译码。为了保证译码器中多项运算的正常执行,编码器与译码器之间必须添加必要的四舍五入层运算。令gs表示隐写图像Gs中的像素值矩阵,G′s表示四舍五入之后的隐写图像,其所对应的像素值矩阵为g′s,则四舍五入层的像素值矩阵表达式为

g′s=gs+|Round(gs)-gs|

(1)

式中:Round为执行四舍五入的单像素值操作;“| |”为保留整数值的矩阵运算。在反向传播的训练过程中,该运算将不提供梯度。

1.3 判别器

`在图像隐写模型中判别器属于第三方攻击端设备,主要负责鉴别截获的图像是否存在隐写情况。在生成对抗网络训练期间,判别器须生成与原始图像相似度较高的数字图像,再利用和编译码器结构类似的SE-ResNet块与4×4最大池化层,对隐写图像进行精确鉴别,其内部架构如图3所示。

图3 判别器的内部架构Fig.3 Internal architecture of discriminator

1.4 损失函数

为了进一步提升现代隐写算法在分析时的抵抗能力,本文在生成对抗网络的训练过程中添加了一定数量的对抗样本,并对编码器、译码器与判别器的子网络分别设置了特定的目标损失函数,同时利用梯度下降算法优化模型的相关参数值。

在信息发送端,编码器必须同时执行机密信息的嵌入及隐写图像质量的提升操作。为了尽可能增强这两项功能,本文在生成对抗网络的训练过程中,利用均方误差的概念,增加了相应的损失函数,即嵌入损失函数Tc和质量损失函数Tq。令g表示尺寸为(v,l,w)的原始图像G的像素值矩阵,E和Di分别表示期望函数与判别器输出函数,Pd表示编码器产生的样本分布,则损失函数Tc和Tq的表达式为

(2)

Tq(g,gs)=-Egs-Pd[Di(gs)]

(3)

在信息接收端,译码器需要利用隐写图像实现机密信息的重建。针对这一重要功能,本文引入均方误差的概念,设置译码器的损失函数为Td。令Mc和M′c分别表示尺寸为(1,l,w)的机密信息及恢复后的机密信息,则损失函数Td的计算公式为

(4)

令αc、αq和αd分别表示嵌入损失函数、质量损失函数和译码器损失函数的加权系数,则隐写模型的标准损失函数Tst可表示为

Tst=αcTc+αqTq+αdTd

(5)

而在第三方攻击端,判别器首先需要鉴别截获图像是否存在隐写,再利用隐写图像恢复机密信息。本文设置了具有较高稳定性的判别器来训练损失函数,令P表示实际图像分布,x和Px分别表示图像中间区域的像素值及其采样分布,β表示裁剪率,则判别器训练损失函数TD的表达式为

TD(g,gs)=Egs-P{Di(gs)-Eg-P[Di(g)+

(6)

在模型训练过程中,由于添加了对抗样本,隐写模型有可能产生一些特殊的变化。针对这一现象,令t表示样本类别,T表示隐写模型的标准损失函数,x和σ(x)分别表示图像中间区域的像素值及对应的嵌入信息,则添加对抗样本之后的损失补偿为

ΔT=E[T(x+σ(x),t)]

(7)

令α和αD分别表示对抗样本损失补偿与判别器损失函数的加权系数,则在添加对抗样本之后,隐写模型的总损失函数为

Ttotal=Tst+αDTD+αΔT

(8)

2 仿真实验

2.1 仿真设计

为了验证信息隐藏模型的可行性与有效性,本文首先设计了针对译码精确度、安全性及时间消耗等指标的仿真对比实验。在具体仿真中,3个通用图像数据集2011BOSSBase、2014COCO和2015celebA的10 000张图片分别被引入至信息隐藏模型的训练过程中。模型测试过程采用未经训练的图像样本,同时机密信息利用随机方法生成。

基于同样的机密信息、训练数据集和测试数据等外界条件,本文提出的信息隐藏方法与其他具有较高性能的信息隐写算法均得到了实现。其中引用的对比算法主要有两种:1)HU等[7]提出的DCGANS算法,该算法可将机密信息转化为噪声向量,从而实现较高的信息提取能力与隐写安全性;2)ZHU等[10]提出了深度网络隐藏数据算法(HiDDeN),该算法通过增加大量的编译码器训练,充分提高了编码图像的视觉质量。

为了实现模型参数的优化,本文使用了梯度下降的方法。在模型初始训练阶段,基本的学习率设置为10-3,每批训练样本的大小均为12(batchsize=12),且所有样本均被训练了200次(epoch=200)。通过多次实验,本文选择了恰当的损失函数加权系数,从而提高了信息隐藏模型的收敛速度与稳定程度。其中,质量损失函数加权系数αq=10-3,嵌入损失函数加权系数αc=5,译码器损失函数加权系数αd=1,判别器损失函数加权系数αD=10-3。此外,执行仿真的服务器采用PyTorch深度学习框架,其CPU型号为Intel Core X i9-10980XE,显卡型号为NVIDIA GeForce RTX 2080Ti。

2.2 仿真结果

当完成必要的模型训练之后,以3种图像数据集的剩余照片作为测试数据集。本文从译码精确度、安全性与时间消耗等方面,分别对DCGANS算法、HiDDeN算法和本文所提信息隐藏方法进行了详细的测试与分析。

1) 在译码精确度方面,由于信息隐藏方法添加了四舍五入层,所以该方法仅能对整数像素值的混合图像进行译码,而无法处理浮点数像素值图像。译码精确度负责衡量安全通信中接收信息的成功概率,通过相应的测试及分析,本文对3种算法的整数图像译码精确度进行了统计和计算,结果如表1所示。

表1 三种方法的译码精确度Tab.1 Decoding accuracy of three algorithms %

由表1可知,对于BOSSBase、COCO和celebA等通用数据集,DCGANS和HiDDeN隐写算法的译码精确度均低于本文提出的信息隐藏方法。

2) 在安全性方面,信息隐藏方法需要具备抵抗隐写分析检测的能力。为了衡量算法的安全性能,本文分别选取了两种具有高检测能力与低计算复杂度的隐写检测模型,即XuNet[11]和YeNet[12]来对这3种算法的隐写结果进行反复分析与检测,从而实现对不同方法隐写检测准确率的统计[13-15]。在具体检测中,通过多次运行DCGANS、HiDDeN和基于生成对抗网络的信息隐藏方法,利用XuNet和YeNet模型对这些信息隐藏方法进行检测,并统计相应的检测准确率,其结果如表2所示。

表2 三种方法的隐写检测准确率Tab.2 Steganography detection accuracy of three algorithms %

从表2中可以看到,在隐写检测过程中,XuNet和YeNet模型对DCGANS以及HiDDeN算法的检测准确率均大于99%,且接近于100%,可知这两种算法难以抵御XuNet及YeNet隐写检测模型的分析。本文方法在一定程度上降低了XuNet和YeNet模型的检测准确率,即两种模型的检测准确率下降了约5%和3%。综上所述,针对高检测性能的XuNet和YeNet隐写分析模型,所有的信息隐藏方法在抵抗隐写检测能力方面均存在明显的缺陷与不足。

3) 在时间消耗方面,本文从BOSSBase、COCO和celebA数据集中随机选取了3 000张图像。其中celebA数据集的图像大小为128×128,数量为1 000张;而BOSSBase和COCO数据集的图像大小与数量相同,均为256×256及1 000张。对于数据集中的3 000张图像,依次利用3种方法进行编码与解码等操作,同时动态统计其消耗的平均时间,所得结果如图4所示。

图4 三种信息隐藏方法的平均时间消耗Fig.4 Average time consumption of three information steganography algorithms

由图4可知,在相同数量图像的隐写过程中,本文方法的时间消耗明显优于DCGANS算法和HiDDeN算法,说明所提方法具有优异的实时性,故能以更快的速度执行图像的多种隐写操作。

通过总结译码精确度、安全性及时间消耗等仿真结果可知,与经典的DCGANS和HiDDeN算法相比,基于生成对抗网络的信息隐藏方法具有更加优秀的译码精确度、安全性及时间消耗。因此,本文提出的信息隐藏方法优于DCGANS算法和HiDDeN算法。

3 结束语

在生成对抗网络的基础上,本文利用SE-ResNet块提出了适用于电网的信息隐藏方法,进而优化图像隐写领域的译码精确度、安全性及时间消耗。根据实际仿真实验结果可知,在安全性方面,由于XuNet模型和YeNet模型具有强大的隐写检测能力,与经典算法相比,本文提出的信息隐藏方法将隐写检测准确率降低约5%,其安全性有所提升,这表明当前信息隐写模型的研究进展和水平仍然远落后于隐写分析检测算法。换言之,信息隐藏方法的安全性水平较低,难以抵抗XuNet模型和YeNet模型的隐写检测。因此,如何改进信息隐藏方法的计算结构,从而提升其抵抗隐写检测的能力,已成为信息隐藏研究领域的关键问题,这也是下一步的重要研究方向。

猜你喜欢

机密信息译码器损失
胖胖损失了多少元
国际海底区域内矿产资源开发中承包者的机密信息保护研究
纠错模式可配置的NAND Flash BCH译码器设计
玉米抽穗前倒伏怎么办?怎么减少损失?
跟踪导练(一)5
一般自由碰撞的最大动能损失
损失
试论环境信息公开中“机密信息”的保护
HINOC2.0系统中高速LDPC译码器结构设计
电力线通信中LDPC译码器的优化设计与实现