APP下载

基于量子生成对抗网络的数据重构

2024-03-12江奕达王明明

计算机工程与应用 2024年5期
关键词:量子重构混合

江奕达,王明明

西安工程大学计算机科学学院,西安 710048

生成对抗网络(GAN)[1]自提出起就引起了各界人士的广泛关注,成为经典网络中用于完成生成任务的典型模型之一,其通过对生成网络(生成器)和判别网络(判别器)同步进行训练进而实现数据生成的工作。在GAN中,生成器尽可能生成可以欺骗判别器的假数据,而判别器通过区分真实数据与生成的假数据得到训练。GAN已被广泛应用在图像生成[2]、图像修复[3]、风格迁移[4]、图像编辑[5]和自然语言处理[6]等一系列任务之中。

图像的数据重构,又称超分辨率重建[7-9],是指将给定的低分辨率图像通过一定的算法或者深度学习网络恢复成相应的高分辨率图像,是从给定的低分辨率图像中重建出高分辨率图像的过程。对于单幅图像的超分辨率最早是由SRCNN 网络[10]来实现的:输入一幅低分辨率图像,仅利用一幅图像来重建得到高分辨率图像;其是一种基于监督学习的图像超分辨率算法。经典超分辨率重建方法包括:SRCNN[10]、FSRCNN[11]、ESPCN[12]、VDSR[13]、EDSR[14]、TTSR[15]、ETTN[16]等,以及拓展到三维数据的超分辨率重建[17]。SRGAN[18],是使用生成对抗网络实现的超分辨率的网络,其基本流程如下:生成器模型根据输入的低分辨率图像生成其对应的高分辨率图像,而鉴别器用于判断图像属于生成的高分辨率图还是真实的高分辨率图像。两者相互迭代训练,直到鉴别器无法分辨输入图像是假图像还是真实图像。训练完成后,生成器模型能够重构出以假乱真的高分辨率图像。

量子计算是基于量子力学演化过程,利用量子叠加性和纠缠性等特性来达到加速经典计算一种新型计算模式。著名的量子算法有:Shor 算法[19]、Grover 算法[20]、HHL算法[21]。随着人工智能的发展,已经有多种经典算法与量子计算相结合的量子人工智能算法,如:量子支持向量机(quantum support vector machine,QSVM[22])、量子主成分分析(quantum principal component analysis,QPCA[23])、量子玻尔兹曼机器[24]和量子聚类算法[25]等。近年来,量子机器学习(quantum machine learning,QML)也在快速发展[26],其中参数化量子电路(quantum parameterized circuits,QPC[27])为QML 在嘈杂的中等规模量子(noisy intermediate scale quantum,NⅠSQ)时代[28]实现量子优势提供了另一条途径,包括量子卷积神经网络[29]、量子对抗神经网络[30]、量子强化学习[31]等模型被提出和发展。

量子神经网络被用于数据分类[32]和图像生成[33]等任务[34-35]中。例如,参考文献[32]是多分类任务,其使用的是MNⅠST数据集;而参考文献[36]是利用量子神经网络做图像的分割任务;参考文献[37]使用量子线路构造新的参数化门实现了图像的插值算法;参考文献[38]提出量子生成对抗网络EQ-GAN 用于创建近似量子随机存取机(quantum random access machine,QRAM),提高了分类任务的量子神经网络性能;参考文献[39]中利用量子对抗网络实现使用经典噪声对手写数据集进行模仿生成;参考文献[40]是利用离子阱的方式产生量子噪声来对手写数据集的模拟生成,参考文献[33]利用多个网络拼接出一个手写数字。

本文在文献[41]中研究了基于量子神经网络的低维数据重构问题,分别提出了基于参数化量子线路和基于量子自编码器的数据重构模型。为了验证模型的效果,在MNⅠST 数据集上对量子模型的重构效果进行了模拟仿真,并将结果与经典网络进行了对比,结果显示量子神经网络具有很好的数据重构效果。本文研究是基于QGAN的数据重构问题。与先前的工作[41]相比,本文使用了不同类型的重构网络实现数据重构模型。且本文还对比了使用相同量子编码方案和相同判别器情况下,纯量子生成器与量子-经典混合生成器实现图片重构任务。同时,对比了在不同量子编码方案下,Q-CGAN对图片数据重构的效果,以及,在使用较少的参数下,略好于同等放大尺寸的经典网络。

本文的贡献:(1)使用纯量子生成器构建量子对抗生成网络来重构数据;(2)使用混合量子生成器构建量子对抗生成网络来重构数据;(3)缩小了与经典网络的重构效果的差距。

1 量子生成对抗网络

1.1 振幅编码

若使用量子计算解决经典问题,首先要考虑如何将信息编码到量子态的问题。振幅编码是一种将经典信息编为量子信息的常用方式。对经典信息先按照如下方式完成归一化:

然后,再将其编码到n个量子比特上生成量子态,形式如下:

1.2 角度编码

将经典数据转变成量子态的另外一种形式是角度编码,其中构成量子线路中的部分量子门中的角度由经典信息所决定,编码形式如下:

其中,Rθ为旋转门Rx,Rz,Ry中任意一种形式。

1.3 损失函数和保真度

在生成对抗网络中传统的损失函数Loss 为生成对抗损失,但是对于成对的数据进行重构,需要多添加一项像素级的MSE Loss[18]来进行加强细节特征。

1.3.1 MSE Loss

MSE Loss 也就是均方差误差,被广泛运用于各种深度学习的模型的损失函数,其公式可写成:

其中,n为图像数量,Ti为目标数据,G(L)i为重构数据。

1.3.2 对抗损失

生成对抗损失是生成对抗网络的显著性损失,由两个网络互相牵制,促使生成器产生的图像欺骗鉴别器。生成损失Lossg1是根据训练样本上的判别器D(x)的概率定义的,GAN 由参数化生成网络G(θg,z1)和鉴别器网络D(θd,z2)组成,其中zi为输入数据(数据为随机噪声或者为输入网络的任意数值),θg和θd是网络的参数。

鉴别器获取输入样本,并给出样本真实(来自数据)或虚假(来自生成网络)的概率。训练对应于一个极值优化问题,训练在提高鉴别器区分真假样本的能力和提高生成器欺骗鉴别器的能力之间交替进行。具体来说,求解成本函数V(D,G)的最小ln(1-D(G(z)))和最大lnD(x)。总的损失函数可写为:

其中,x为真实样本数据。量子生成器G(z)可写为:

其中,z是输入生成器中的数据,为z编码的量子态。此时,生成器损失化简可得出Lossg1:

式中U(θ) 为参数化量子线路的酉矩阵。

为了加强细节,对应再加入MSE Loss,则损失Lossg1则转换为Lossg2[18]:

1.3.3 保真度

量子保真度是衡量信息在传输过程中保持原来状态的程度,并广泛应用于量子通信和量子计算理论研究中。对于两个纯态,保真度定义为[42]:

1.4 量子混合网络模型

参数化量子线路模型中,使用可训练的参数化量子门表示量子网络。不同的参数化量子门组成的线路,可以实现不同的功能或对量子态施加不同的旋转操作,用来完成特定的量子操作[32]。本文使用参数化酉矩阵构建可训练的量子线路。例如,由Ry(θ),Rz(θ),Rx(θ)构成的单量子比特旋转门或组合的多量子旋转门,其中θ为可训练门旋转参数,为了提高量子比特间的相互关联而使用的两量子比特纠缠门,包括受控非门(controlled-not,CNOT)或者受控Z 门(controlled-z,CZ)等。由于每个旋转组合可以单独构成一个酉矩阵,那参数化的量子线路的酉矩阵可以写成:

经典神经网络在数据处理和拟合过程中,为了使网络更加能接近训练目标,演化出了各种强大的非线性的处理操作。所以由可训练的参数化量子线路加经典层同构成一个混合型生成网络。本文使用了三种QGAN网络模型:纯量子生成器模型以及两种编码的混合生成器网络模型,即:振幅编码的混合生成网络模型和角度编码的混合生成网络模型,如图1所示。为了对比模型的效果,本文也是用了经典GAN模型,如图1(d)所示。

图1 四种生成器模型结构图Fig.1 Structure diagram of four generator models

(1)图1(a)为纯量子生成器模型:由可训练参数化的量子线路构成。例如:由一组N个Ry(θ)和CNOT构成量子线路的其中一个酉矩阵,由M个酉矩阵共同组合成一个生成器。

(2)图1(b)为振幅编码的混合生成模型:其中参数化量子线路由K个Ry( )θ和CNOT构成或者为CZ控制门,经典网络由线性层构成。

(3)图1(c)为角度编码的混合生成模型:先由经典层提取小维度图片的特征图,再由量子旋转门把信息编码为量子信息,放入振幅编码同样的混合生成模型里。

(4)图1(d)为经典生成器模型:由多层线性层构成,从小维度数据重构出大维度数据。

所有网路中均采用相同的鉴别网络,即统一由多个经典的线性层构成,用于分辨生成器输出的是数据重构还是原数据,如图2所示。

图2 判别器结构图Fig.2 Discriminator structure diagram

本文中,量子网络模型基于参数化量子线路实现。经过反复测试,选用了图3中的两种量子线路[43]。文献[43]指出这两种参数化线路具有较高的纠缠性,并且具有较好的数据表达能力。由此,当使用辅助量子比特时可以把相关的数据进行纠缠,使其具有相对较好的数据表达能力。

图3 量子线路图Fig.3 Quantum circuit diagram

数据重构的流程如图4 所示。图4 的模块可以分为:生成器、鉴别器以及数据编码模块。首先,经典数据经过量子态的编码线路成为包含经典信息的量子态。然后,量子态经过不同的生成器重构出对应的数据,输出数据由经典神经网络构成的鉴别器来进行判别。最后,再由目标数值进行比较得出对应的损失函数数值,再并行反向传播,交替优化鉴别器与生成器。经过反复的迭代运算使得网络可以优化到使得Loss 值达到相对一定的小数值的范围区间内。

图4 数据重构网络流程图Fig.4 Data reconstruction network flow chart

2 模拟实验

本文使用了MNⅠST 手写数据集[44]作为实验数据对所提出的框架进行了模拟仿真。为避免数据维度过高影响实验效果,对数据集进行了统一的降维处理。首先,使用64 维的MNⅠST 数据集,将其降到16 维。然后通过振幅编码或角度编码,将数据编码到量子态上。接着,使用生成器重构数据到指定维度,并将其输入判别器判别数据的真假。

实验中,纯量子模型的量子生成器由40 层量子线路构成,适当的增加纠缠层可以增强网络的表达能力[45],如图1(a);振幅编码的混合生成器模型,由10层量子线路加1 层经典线路构成,如图1(b);角度编码的混合生成器模型,由1层经典线路、10层量子线路与1层经典线路构成,如图1(c);经典生成器由3 层线性层[46]构成,如图1(d)。所有模型中,判别器使用的是同一结构的经典判别器。

2.1 使用量子线路1构造量子生成器网络

这里展示了使用量子线路1,如图4(a),构造纯量子模型、振幅混合模型、角度混合模型,以及使用经典生成器在不同数据下的训练和测试效果对比。

图5 为训练情况下的生成器Loss 值和测试情况下的保真度情况。其中,第一列是图像0的训练图与测试图,第二列是图像1的训练图与测试图,第三列是0、1混合图像的训练图与测试图。

图5 线路1下各模型的训练和测试比较图Fig.5 Comparison of training and testing of each model under line 1

由图5中的对比数值可以看出,训练Loss图为生成器训练150次后的数值,其整体趋势是随训练次数向下减少。对于测试保真度的图,测试图是测试了30 张或60张图片,增加经典层与不增加经典层产生的结果和数据会发生变化,其中混合生成器模型下重构出的保真度会比纯量子生成器线路高一些。适当增加经典层后,网络生成效果会相对有所提高。与经典网络模型相比,重构出的效果也会相对较高。具体平均数值见表1。

表1 各网络数据重构的测试保真度值Table 1 Fidelities of test data for reconstruction by using different networks

2.2 量子线路1的重构效果图

这里展示了重构数据图像0、图像1、混合图像的情况。图6 为每组重构图像,从左到右的图像分别为:低维小图、纯量子模型生成图、振幅混合模型生成图、角度混合模型生成图、经典生成器模型生成图以及目标参考图。

图6 线路1下各结构的重构数据图Fig.6 Reconstruction data diagram of each structure under line 1

由图6 与图5 数据可以看出,当使用混合模型时量子线路仅使用10 层的规模,再加上部分经典结构生成器,可以使生成效果以及对应的保真度数值提高。

2.3 使用量子线路2构造量子生成器网络

这里展示了使用量子线路2,如图4(b),构造纯量子模型、振幅混合模型、角度混合模型,以及使用经典生成器在不同数据下的训练和测试效果对比。

图7 为训练情况下的各生成器Loss 值和测试情况下的保真度情况。第一列是图像0的训练图与测试图,第二列是图像1的训练图与测试图,第三列是混合图的训练图与测试图。

图7 线路2下各模型的训练和测试比较图Fig.7 Comparison of training and testing of each model under line 2

由图7中的对比数值可以看出,训练Loss图为生成器训练了150次后的数值,其整体趋势同样是随训练次数向下减少。同样对于测试了30张或60张图片来看测试保真度的图,可以看出混合生成器模型下重构出的保真度会比纯量子生成器线路和经典网络高一些。具体平均数值见表1。

2.4 量子线路2的重构效果图

这里展示了重构数据图像0、图像1、混合图像的情况。图8为每组重构图像,从左到右的图像分别为:低维小图、纯量子模型生成图、振幅混合模型生成图、角度混合模型生成图、经典生成器模型生成图以及目标参考图。

图8 线路2下各结构的重构数据图Fig.8 Reconstruction data diagram of each structure under line 2

由图7与图8数据以及对照线路1的各项参数图与重构图,可以看出,使用混合模型时生成效果以及对应的保真度数值较高。

2.5 实验结果分析

从损失函数来看,单独使用对抗损失不能够完成任务需求(等式(7)),测试时会出现重构出相似的图片,如图9 所示。图9 中的三个图片从左到右分别为:单个训练数据0测试图、单个训练数据1测试图、混合训练测试图。可以看出,它们是在拟合图像0的大概特点,1的大概特点,以及0与1的共同特点。

图9 单独使用对抗损失时的重构数据图Fig.9 Reconstructed data plot under adversarial loss

上述只使用对抗损失的情况下,会拟合出共同特征。此时判别器的任务是使得生成器生成的数据更加符合目标的整体特征。加入MSE Loss(等式(8))之后,加强了不同类型生成数据的细节,可以较好地生成不同的数据特征。

从模型对比来看,混合模型相对于经典网络优势。首先,混合模型相对于经典网络则使用量子资源作为输入数据,进而可以使用更少的数据的输入。其次,混合模型结合量子纠缠与并行的量子特性可以表现出较好的拟合能力,而量子参数化网络具有更少的参数,使得构造混合线路可以相对经典网络使训练的参数更少,网络规模也相对较小。

从线路1 与线路2 的重构图来看,在纯量子生成器的框架中,重构出的数据具有较好的效果。例如,使用线路1 的纯量子生成器可以达到经典网络相近的结果。在四个混合模型中,重构出的数据相比经典网络具有更高的保真度。

从整体模型来看,纯量子模型方面:(1)对于量子层来说由于量子的特殊性,输入的数据可以指数级地减少,进一步使得数据的存储空间大大减少;(2)量子数据的处理是并行处理的,理论上是可以减少数据处理的时长。混合模型方面:在选择合适的网络构造之后,数据经过编码输入参数化量子层,接着使用纠缠门进行数据间的强相互关联,增加信息间的关联性,在量子的线性空间寻找位置并且使用少量的处理资源后,再结合经典层的后续处理与表达,其效果好于对应纯量子模型以及构造的经典模型。

表1 为使用不同参数量的各种网络下的保真度的数值。可以看出,少量参数下拟合效果总体相对不高,当两种网络参数在4 000 左右时,可以得到较好的效果。对于在图像0的数据重构中,经过加入经典层的量子神经网络可以使得重构的数值普遍升高,大多达到0.95以上,比纯量子线路以及经典网络的数值略高。对于图像1的数据重构中数值可以普遍达到0.93往上,同样比纯量子线路以及经典网络的数值相对高一些。对于混合图像的数据重构,数值与图像0 和图像1 相比会下降一些,但还是高于纯量子线路以及经典网络。其中,量子线路1 的效果普遍好于线路2。通过单一数据和混合数据的训练和测试结果可以看出,在混合训练或者是相对较为复杂的图像重构恢复时,重构数据的保真度会有所下降。保真度下降的原因包括以下方面:(1)网络的结构简单或深度不够;(2)数据的转换方式需要进一步调整;(3)损失函数选取可能不合理,需进一步改造;(4)网络中可能需引入预训练模型。等等其他原因。拟对应改进措施:(1)由表1可知,相对复杂和相对较深的网络的保真度是相对较好的。可以构造合适的深度或复杂的网络来改善复杂数据的重构。(2)由文献[45],可知把初始数据转换成另一种特征数据(如:重映射方法),提高了网络表达效果。进行有效的数据转换可以提高网络的拟合能力。(3)由实验可知对损失函数的合理改造可以提升网络的性能。(4)由参考文献[18]可知,当引入预训练网络,可以有效抽取出数据特征,并对其后续处理,进一步提高网络的拟合能力。对综上原因和一些其他原因进行合理改善,可以进一步提高网络的表达能力,进而相对提高重构效果。

3 讨论和总结

文献[39]中提出了基于量子生成对抗网络(QGAN)使用噪声生成图片,其图片内容相对较为模糊,且QGAN由于在非线性表达中存在拟合能力不足的问题,使得该模型不能很好的适配成对数据,达到较好的生成效果。本文中,为了重构出特定数据且使得重构效果更加完善,引入了像素级损失来增强适配图片的重构效果。提出了一种使用经典网络非线性能力的PQC,搭建混合对抗生成网络(Q-CGAN),实现图片数据的重构。

本文分别使用纯量子生成器模型、振幅编码混合生成器模型和角度编码混合生成网络模型,考虑了使用不同类型PQC 的情况下,对于不同类别图像数据的重构生成效果。结果显示,纯量子生成器的重构效果和经典生成器效果相近,混合生成器的重构效果优于经典生成器。文献[47]中指出,在使用量子线路与经典的混合网络时可以产生更好的效果。(1)使用量子层是为了使得特征图能够在指数级大的线性空间中探索相邻数据点的相关性,加强数据间的关联性。(2)使用经典层是为了非线性、以及对深度结构的可扩展性。量子线路是一个维度指数巨大的线性网络,对于各种复杂的非线性任务来说线性网络是满足不了任务需求。从而利用量子性质结合经典层的非线性,可以使得网络更加适配任务。本文结果进一步验证了该结论。

与本文相关的一些研究的对比如表2所示,相同之处在于所列文献与本文一样都使用GAN的整体模型框架,采用手写数据集作为验证数据集。与之不同的是,本文提出了一种将量子与经典相混合的Q-CGAN 生成器网络,用于图像的重构任务。与纯量子生成器相比,其在图像重建任务中也展现出了一定优势。

表2 本文与已有文献的对比Table 2 Comparison with previous references

更进一步,从本文的数据来看,将经典数据合理编码成量子态是一个比较重要的研究。文献[48]指出,这影响着经典数据的有效转换以及量子线路的有效表达和处理。本文的混合生成器模型相对于纯量子网络生成器扩大了训练参数。接下来的研究工作以轻量化的网络为方向。对应的轻量化主要研究想法由以下几点展开。(1)设计参数化量子门:参数化量子线路拥有各种个性化的量子门,而量子门对于量子比特在空间中旋转操作以及寻找到目标空间起着重要作用。设计参数化的量子门就显得尤为重要。(2)编码方式:编码决定着经典信息是否可以高效转换成量子信息,这样使得训练量子参数化线路可以更容易,进一步提高网络表达能力从而可以减少网络复杂度。

猜你喜欢

量子重构混合
2022年诺贝尔物理学奖 从量子纠缠到量子通信
混合宅
长城叙事的重构
一起来学习“混合运算”
决定未来的量子计算
新量子通信线路保障网络安全
北方大陆 重构未来
北京的重构与再造
油水混合
一种简便的超声分散法制备碳量子点及表征