基于压缩感知的混沌图像加密研究综述
2022-10-19梁钰婷罗玉玲张顺生
梁钰婷, 罗玉玲, 张顺生
(广西师范大学 电子工程学院, 广西 桂林 541004)
互联网的高速发展极大便利了人类的生活,不同类型的数据通过网络可以被迅速传输和扩散。智能化信息技术越来越深入地渗透到人们日常生活的方方面面,信息安全问题也变得日益严峻。数据共享过程中存在信息被攻击、窃取等隐患,网络上个人信息的泄露将导致人们的隐私权得不到保障,而对于国家或企业的机密信息,一旦被窃取则极有可能造成巨大损失。因此,信息安全的研究对维持网络乃至现实社会的秩序是十分必要的。图像是一种携带丰富信息的载体,不仅在科技、军事、医疗等行业发挥重要作用,在人们的日常生活中也随处可见。在愈发开放的网络世界中,图像信息的安全问题不容忽视。混沌图像加密作为保护图像的重要手段,是信息安全领域的研究重点,专家学者们提出许多有效的加密算法来保障图像信息在存储和传输过程中免受攻击和窃取[1-4],但是传统的图像加密技术并没有降低图像信息的冗余量。为了降低图像数据量,减少硬件设备传输负担,结合压缩技术的图像加密成为近年来新型的研究方向并受到大量关注[5-7]。压缩感知(compressed sensing, CS)理论[8]的提出给图像压缩提供了新思路,并且凭借高效、精确等优势对图像加密领域产生了重要影响,基于压缩感知的混沌图像加密算法展现出优良的性能和广阔的发展前景。
本综述首先对所涉及到的基础知识即混沌图像加密和压缩感知做简要介绍;然后按照方法的不同,将基于压缩感知的混沌图像加密分为基于传统压缩感知的混沌图像加密、基于分块压缩感知的混沌图像加密、基于二维压缩感知的混沌图像加密以及基于视觉安全的图像压缩加密等4个类别进行深入论述和分析;最后,对部分文献进行对比以此总结出尚存问题,并展望未来的研究方向。
1 混沌图像加密与压缩感知
1.1 混沌图像加密算法
图像加密的主要思想是通过设计算法改变原始图像的像素信息,破坏图像像素间的相关性,将携带有信息的明文图像转换为无法被识别的密文图像,再进行后续的传输以及存储,从而降低信息被泄露或篡改的可能。数字图像具有数据量大、信息冗余度高、相邻像素间相关性强等特点,这使得传统的数据加密算法,如:高级加密标准(advanced encryption standard, AES)、数据加密标准(data encryption standard, DES)、国际数据加密算法(international data encryption algorithm, IDEA)等对其信息的保护效果不理想,因此需要针对图像特点去设计更为有效的加密方案。根据加密域的不同可以将图像加密分为2个主要类别:空间域的加密以及变换域的加密。空间域加密是指将图像看作空间上的二维矩阵,直接对图像各个坐标上的像素点进行可逆运算,通常包括对像素位置重排以破坏相邻像素间的相关性(置乱)和对像素灰度值进行更改以掩盖图像的原始像素信息(扩散)。变换域加密需要先对数字图像进行离散小波变换(discrete wavelet transform, DWT)、离散余弦变换(discrete cosine transform, DCT)或傅里叶变换(Fourier transform, FT)等变换操作,在变换域上进行加密处理。
1963年,著名气象学家Lorenz发现了混沌现象并提出混沌理论[9],在此后的几十年中混沌科学得到了充分研究和广泛应用,同时推动了其他相关学科的发展。混沌系统是确定性的非线性动力系统,它的运动具有不可预测性、有界性、遍历性、对初始条件非常敏感等特性,研究人员发现这些特性十分符合通信密码学的需求,并开始逐步尝试将混沌系统应用于密码学中。1989年,Matthews[10]首次提出将混沌应用于密码学;1991年,Habutsu等[11]基于Matthews的研究提出更完善的混沌加密方案;1997年,Fridrich[12]首次将混沌引入到图像加密中,开辟了混沌图像加密的先河。此后,大量的混沌图像加密算法相继涌现,基于混沌的图像加密成为了图像信息安全领域的研究热点。
混沌图像加密和解密的主要流程如图1所示,混沌图像加密方法通常将混沌系统作为伪随机序列发生器,生成的伪随机序列作为密钥序列与明文进行加密运算从而得到随机密文。研究表明,借助混沌系统产生密钥序列在安全性和简便性等方面都有较好的表现。许多一维混沌系统被广泛地提出并应用在图像加密中[13-16],它们通常分别作用于置乱和扩散2个阶段。但是一维混沌系统可能导致密钥空间薄弱,使得加密算法无法抵御已知和选择明文攻击以及暴力攻击。随着混沌密码学的发展,许多具备更复杂的动力学特性、更强随机性的高维混沌系统也被应用到图像加密中[17-26]。高维混沌系统可以帮助加密算法获得更大的密钥空间,提高防暴力攻击的能力。
图1 混沌图像加密和解密流程Fig.1 Process of image encryption and decryption based on chaos
1.2 压缩感知简介
压缩感知是2007年由Donoho[8]提出的一种高效的信号采样技术,该技术根据信号的稀疏特性,通过求解欠定线性系统对信号进行采样和重构。压缩感知理论的提出在信号处理界引起了轰动,受到该领域研究者的广泛关注。经过国内外学者十几年来的深入研究,压缩感知如今已被广泛应用于图像处理、模式识别、无线通信、医学成像等各个科技领域。它突破了奈奎斯特理论的限制,可以在远小于奈奎斯特采样率的情况下获得信号的离散样本,在采样的同时实现对信号的压缩,有效地节约了存储和传输成本。这种方法虽然减少了采样点,但是其重构信号仍然保持了较高的准确率。
为了去除图像的冗余信息,提高图像的传输和存储效率,传统的图像加密结合压缩感知技术,形成一种新型的能在保护图像安全的同时压缩数据量的联合算法。图像压缩感知的过程如图2所示,包括3个核心部分:图像信号的稀疏化、测量矩阵的构造以及图像重构,其中稀疏的信号是进行压缩感知的前提条件,测量矩阵用于对图像进行采集和压缩,重构是压缩的逆过程。
图2 图像压缩感知流程
Fig.2 Process of compressed sensing of image
假设存在一个长度为N的信号x,为了使其稀疏化,需要将它投影到一个稀疏基上。
(1)
式中ψ是一个N×N的稀疏基矩阵或稀疏字典,常用的稀疏表示方式有DCT、DWT等,s为N×1的稀疏系数向量。如果s只有K个系数是非零值,则说明x在稀疏基ψ中K稀疏。
然后,需要构造一个型为M×N(M y=φx=φψs=Θs, (2) 式中Θ为传感矩阵且Θ=φψ,y是采样后得到的长度为M的测量值。为确保能够正确地采样和重构信号,压缩感知的前提条件除了要满足原始信号x在某个变换域稀疏之外,还要求传感矩阵符合约束等距性质(restricted isometric property, RIP)。即对于任意的稀疏信号s,满足 (3) 式中δk∈(0,1),表示约束等距常数。测量矩阵的构造是压缩感知的关键技术,信号恢复的精确性一定程度上取决于测量矩阵的优劣。适用的测量矩阵有高斯随机矩阵、部分Hadamard矩阵、部分傅里叶矩阵等。 压缩感知的重构问题本质上是通过非凸优化算法将低维的观测值重新构建高维原始信号。在RIP前提下,可以将该l0范数最小化问题转换成l1范数问题,从而简化算法的复杂度。常用的重构算法有匹配追踪算法、正交匹配追踪算法等。 因为压缩感知的编码和解码需要用到相同的测量矩阵,故可以将压缩感知当作一个对称加密系统,其中测量矩阵作为加密系统的密钥,原始信号和测量结果分别是明文和密文,即压缩感知本身就具备保护信息的能力。但是仅凭借压缩感知来对图像进行加密其安全性是不够的[27],尤其是在已知明文攻击和选择明文攻击下的抵抗力较弱[28],需要结合其他加密算法对图像信息进行更进一步的保护。基于压缩感知的混沌图像加密框图如图3所示,可以看出原始图像经过压缩加密算法后数据量明显减少,此外在实际算法设计过程中可以根据需要设置不同的压缩比率。 图3 基于压缩感知的混沌图像加密Fig.3 Process of chaotic image encryption based on compressed sensing 基于压缩感知的混沌图像加密技术是通过在压缩感知前后加入图像加密手段来实现的,它同时满足“数据压缩”和“信息保护”两大需求。近年来有多种不同的基于压缩感知的混沌图像加密算法已经被提出,首先从压缩与加密的组合方式看,文献[29]对比了“压缩—扩散—置乱”和“置乱—压缩—扩散”2种加密框架,发现前者的重构效果更好,并根据这个框架结合Sine-Logistic调制映射设计了一种图像压缩加密方案。文献[7]使用先压缩再进行多轮“置乱—扩散”的图像安全机制,三维Cat映射贯穿整个压缩和加密过程。文献[30]论证了对图像的稀疏系数矩阵进行置乱可以有效地放松RIP进而增强压缩性能,基于这一规律,对明文图像“稀疏化—置乱—测量—扩散”的结构逐渐被广为应用[31-33]。另外,现有的许多方案中混沌初始值都由明文图像的哈希值决定[34-35],算法与明文图像建立了紧密的关联,对于不同的图像有不同的混沌序列,实现了“一次一密”。 其次,从测量矩阵的生成方式来看,考虑到将整个测量矩阵作为密钥会令密钥过大,需要占据大量传输带宽和存储空间[36]。为了消除这一弊端,可以利用混沌系统来参与测量矩阵的生成,解码端只需要少量的密钥为混沌系统提供初始状态值,通过混沌系统迭代产生的混沌序列即可构造出一个与编码过程相同的测量矩阵。如文献[37]中的测量矩阵通过Logistic混沌序列控制循环矩阵获得,并且对压缩后的图像进行置乱处理。为了获得更优的安全性能,研究者们越来越倾向于使用高维混沌系统。文献[29]利用二维Sine-Logistic调制映射产生不同的混沌序列,这些序列一部分被用于进行扩散和置乱,另一部分被用于从部分Hadamard矩阵中构造测量矩阵。文献[38]使用李萨如映射和Logistic混沌来共同构造测量矩阵,并通过蔡氏电路扩散明文图像的DWT低频分量,是一种具有强鲁棒性的方案。文献[7]中测量矩阵由基于三维Cat映射的结构随机矩阵生成。文献[39]使用Lorenz超混沌系统的伪随机序列构造测量矩阵,结合DNA编码技术实现多图像的压缩加密。此外,无限折叠调制映射[31]、Logistic-Tent系统[32]、切比雪夫映射[40]等混沌系统也被运用到图像压缩感知中。 当图像尺寸较大时,直接对完整的图像进行压缩感知意味着需要较大的测量矩阵,且在信号重构时复杂度高,需要花费过多的时间及内存。于是在2007年压缩感知的分块思想被提出[41],假设有大小为N×N原始图像,将其分为大小为B×B的图像块,构造测量矩阵 (4) 式中ΦB的型为nB×B2(nB=CR×B2),CR表示图像压缩率。分块压缩感知的优势包括:测量矩阵的数据量大幅度减小,易于产生和存储;复杂度降低,节约了信号重构的时间和空间成本;实时性更强[41]。基于分块压缩感知的混沌图像加密首先需要将一张图像分成若干个相同大小的图像块,再以图像块为单位进行测量和其他加密步骤。 文献[37]将原始图像分成4块进行压缩感知,并对相邻2个图像块进行像素随机交换,取得了良好的压缩性和安全性。但是对不同图像块使用相同强度的采样会导致某些块中重要信息丢失,而一些不重要的信息被保留。为了解决这一问题,文献[42]利用索贝尔边缘检测器对各图像块检测其携带信息的重要程度,然后对于重要等级不同的图像块采取不同强度的压缩和加密,以此来更精确地保护图像的重要区域。文献[43]用Zigzag扫描图像块的DCT系数以提取不同的频率分量,然后采用不同维数的测量矩阵对它们进行非均匀采样。除了直接在空间域进行分块,还有基于频域的分块方式。文献[44]使用DWT将明文图像分成4个不同的分量,将这4个分量看作是4个块,然后结合元胞自动机对图像块进行置乱,以提高稀疏度。其次,根据每个块的重要性不同使用2个不同的测量矩阵测量。实验结果表明该方法安全性和鲁棒性较强,但是因为没有引入扩散操作,所以信息熵的表现不太理想。文献[45]结合分块压缩感知与奇异值分解嵌入,将分块压缩加密后的密码图像嵌入到一张宿主图像中,有较高的鲁棒性和效率。 当一维压缩感知应用于二维图像时,需要将图像转化为一个较大的列向量,这会不可避免地破坏图像的原有空间结构,并使计算过程变得繁琐[46]。为了解决这一问题,研究者提出二维压缩感知理论[47]。二维压缩感知是指从行和列2个方向同时进行压缩,对于大小为N×N的原始信号X,其测量过程可以表示为 (5) 式中:Φ1和Φ2是2个型为M×N(M 当前,二维压缩感知已经逐渐被大量运用于混沌图像加密中。文献[48]用Logistic混沌控制部分Hadamard矩阵产生的2个测量矩阵对图像进行二维压缩感知,再采用分数梅林变换二次加密图像。文献[49]先对图像进行二维压缩感知,然后通过Chen超混沌系统对测量值进行循环移位。上述方法都有较大的密钥空间,压缩性能和安全性能良好。但是它们的密钥与原始图像不相关,文献[35]采用明文图像的哈希值计算密钥来提高抵抗已知明文攻击和选择明文攻击的能力,将测量矩阵构造为2个圆形矩阵,圆形矩阵具有构造速度更快、占用存储空间更小的优势,降低了算法的时间复杂度。文献[50]利用明文图像的信息熵和外部密钥计算混沌初始值,信息熵和计数器共同参与测量矩阵的构造,然后对彩色图像的3个分量分别进行二维压缩感知,在压缩性能和安全性上均表现良好。此外,多数算法都只能单一地加密灰度图像或彩色图像。针对这一问题,文献[51]实现了一种具有视觉意义的双彩色图像加密算法,其测量矩阵由Kronecker积对混沌矩阵进行扩展,并用奇异值分解优化后得到。Kronecker积可以轻松实现小矩阵到大矩阵的变换,减少测量矩阵的生成时间,对测量矩阵的优化则使重构图像的质量有了明显提升。 为了抵御各种密码分析攻击,传统的图像加密通常需要将明文图像加密为无序的类噪声图像,当图像以这样的形式在信道中传输时非常容易引起攻击者的注意,反而会受到更多安全威胁[52]。因此,基于视觉安全的图像加密概念被提出[53]。此后,文献[54]弥补了文献[53]在安全性和图像质量上的不足,文献[55]将视觉安全引入到图像的选择性加密中。然而,文献[53-54]的方法使密文图像的数据量膨胀到明文图像的4倍,对传输、存储和计算都带来不便。近年来,有研究者将上述思想结合压缩感知,提出基于视觉安全的图像压缩加密,它包含压缩加密和嵌入2部分。基于视觉安全的图像压缩加密框图如图4所示,即采用图像隐藏技术将加密后的图像嵌入到另一张宿主图像中,以获取有视觉意义的密文图像。对宿主图像而言仅做微小改动,密文图像与自然图像有相似的视觉特征,攻击者无法直接判断图像中是否隐藏着重要信息,减少了密文被攻击和修改的几率。 图4 基于视觉安全的图像压缩加密Fig.4 Process of image compression and encryption based on visual security 文献[56]首先把原始图像转化为小波系数,进行Zigzag置乱后利用压缩感知进行编码得到加密图像,接着将加密图像嵌入到宿主图像的DWT系数中,并对被改动后的DWT系数进行离散小波逆变换来得到最终的加密图像。该算法加密前后的数据量一致,保留了视觉安全图像加密的优点,同时并没有带来额外的传输压力。文献[57]指出,文献[56]的方法需要将明文图像的哈希值发送给接收端,并且恢复后图像的质量受到宿主图像的影响。针对这些问题,文献[57]采用并行压缩感知计数方式进行列采样来抵抗选择明文攻击,用混沌序列控制嵌入信息的顺序,提高了算法的安全性。另外,利用整数离散小波变换分解宿主图像,提高了重构图像的性能。文献[58]利用动态最低有效位嵌入将密码图像随机嵌入到宿主图像中。为了提高效率,文献[6,51,59]提出具有视觉意义的双图像加密方案,可以同时有效保护2张图像,文献[60]实现了将3张图像同时压缩加密并隐藏到同一张宿主图像中,获得了良好的安全性能和重构质量。文献[61]采用在密码图像插入随机数的加密方式,此外还对宿主图像进行DWT和奇异值分解相结合的变换以提高算法的鲁棒性。文献[62]使用基于半张量积的压缩感知改进了测量矩阵占用内存过大的问题。基于前面的研究,文献[63]提出一种基于自适应阈值稀疏化和并行压缩感知的图像加密算法,采用可分离小波变换对原始图像稀疏化,在嵌入阶段引入矩阵编码技术,具有较高的效率和重构质量。 表1对近几年的部分文献从主要方法、主要优点和不足3个方面进行对比。由表1及第1~2章的论述可以推断出,在基于压缩感知的混沌图像加密中,还存在一些问题尚待解决: 1)图像压缩即去除冗余信息,要在保证重建图像质量的前提下尽量减少图像中的比特数。图像加密致力于破坏像素之间的相关性,这对图像压缩而言是不利的,因此在基于压缩感知的混沌图像加密算法的设计中,需要充分考虑加密效果和压缩性能的相互制衡和影响,将图像加密与压缩感知进行有效结合,从而达到一个最优的平衡点。 2)在基于分块压缩感知的混沌图像加密系统中,图像分块规则的制定对于重构图像的视觉效果影响较大,设计合理的分块方式才能确保信号的精确恢复。若图像块过大,则分块压缩感知对系统运行效率的提升效果不明显;图像块过小或者压缩比率较低时则有可能使重构图像出现伪影。 表1 不同算法的对比 3)对于基于视觉安全的图像压缩加密系统,宿主图像为类噪声密码图像提供了视觉掩护,提高了密文图像的隐蔽性。然而,在系统中新增的嵌入过程将对图像的压缩比率提出更高的要求。在不影响密文图像视觉效果的条件下,宿主图像可容纳的数据量有限,一旦密码图像的数据量过大,将其嵌入到宿主图像后可能会导致最终的密文图像出现较差的不可感知性。另外,虽然现有的方案能取得较好的性能,但在密文图像以及重构图像的质量上仍有较大的优化空间[63]。 4)对于压缩感知理论而言,提高待采样信号的稀疏性、设计更为易于实现的测量矩阵、对重构算法进行优化等都是增强压缩性能的有效手段,同时也是目前有待于深入探究的问题。 5)加密系统的安全性和复杂性也是一个需要权衡的问题,越安全的系统往往有越高的计算复杂度,而算法的复杂度过高通常需要大量时间和成本开销,将难以在实际中得到广泛应用,因此这2个方面需要被同时兼顾。 总而言之,综合算法的安全性、鲁棒性、计算复杂度、图像重构质量等性能,且在现有的硬件设备上实现是基于压缩感知的混沌图像加密要解决的重要问题。 本文就基于压缩感知的混沌图像加密进行简要综述,介绍了混沌图像加密和压缩感知理论的基本概念,并分析了该领域的发展现状和一些具有代表性的算法的优缺点。目前来说,基于压缩感知的混沌图像加密已经得到逐步深入且多元化发展,无论是为了提高压缩加密效率采用的分块、并行压缩感知技术,还是降低计算复杂度的二维压缩感知,以及近几年来开始流行的基于视觉安全的图像压缩加密等技术,都从不同方面为图像的安全问题提供了解决方案。 在未来的研究中,一方面可以从压缩感知的优化问题入手,设法提高信号的稀疏性,并设计高质量的测量矩阵和重构算法来提高图像采样和恢复的效率。另一方面还可以考虑结合云平台来达到更高效的传输和存储。2 基于压缩感知的混沌图像加密技术
2.1 基于传统压缩感知的混沌图像加密技术
2.2 基于分块压缩感知的混沌图像加密技术
2.3 基于二维压缩感知的混沌图像加密技术
2.4 基于视觉安全的图像压缩加密技术
3 算法对比与未来发展
4 结语