基于卷积神经网络的拓扑量子码译码研究

2021-07-13姚璐阳王云江

无线电通信技术 2021年4期

马钟，魏璐，姚璐阳,王云江

(1.西安微电子技术研究所，陕西西安710065；2.西安电子科技大学ISN国家重点实验室，陕西西安710071)

0 引言

量子纠错编码是保障量子通信传输与量子信息处理可靠性的关键手段。目前，关于量子纠错编码的研究主要集中在量子稳定子码领域，特别是拓扑量子纠错码更是近年来量子纠错编码领域的热点问题。拓扑量子码不仅具有容错阈值高、纠错能力强的特点，更因为其仅仅需要相邻量子比特间的关联操控，使其成为未来最有望硬件实现的量子纠错编码方案。然而，除了具有理论较优的性能，是否具有高效的译码算法也是量子纠错码能否真正落地实现的关键。这是因为，相比经典纠错码，量子纠错码更容易受到外界的干扰，造成信息的塌缩。而高效快速的译码策略可以有效缩短译码时间，从而极大地降低译码过程中的错误引入，这对于量子信息的快速处理与可靠存储至关重要。

目前，对于拓扑量子码而言，其应用最广泛的译码算法是基于图论的最小权重最佳匹配译码算法(Minimum Weight Perfect Matching，MWPM)[1]。其基本思想是将拓扑量子纠错码上的最有可能错误映射作为该码所对应拓扑图中与错误图样相对应的最短距离。然而,由于量子纠错码独特的简并错误以及MWPM在错误相关性上探测的局限性，其译码效果性能仍未能达到人们的期望。

近年来，机器学习正逐步被引入到量子信息与量子计算中来。已有的研究成果表明，借助机器学习可以有效地解决量子信息处理中的若干难题。考虑到量子译码算法的重要性，基于神经网络的译码技术正逐步引起人们的关注[2-3]。例如，对于拓扑量子码而言，文献[4]提出了一种基于全连接神经网络的拓扑量子码的译码策略。在该策略中，通过给定训练样本与标签，可以探测错误之间的相关性，明显缓解MWPM算法所固有的译码缺陷。

然而，全连接网络在应用于拓扑量子码的译码时，存在译码复杂度高、耗时相对较长的问题，这对拓扑量子码在实际中的应用十分不利。一方面，卷积神经网络由于所需的参数相对较少，在图像分析和处理领域有广泛应用；另一方面，拓扑量子码是一种基于拓扑结构的量子纠错码，其在平面上的展开就是一个个的二维结构，有着图的结构特点，这给了我们将卷积神经网络应用在拓扑码译码器上的新思路。

为此，在本文中，考虑基于卷积神经网络开展拓扑量子译码算法的设计，并通过实验仿真对构造的卷积神经网络译码器进行测试与验证。实验表明，本文所提的译码器同样可以克服MWPM所存在的不能有效识别量子错误的相关性这一问题，译码性能获得明显提升。并且由于相对全连接神经网络所需的参数更少，因而译码时效性也更强。

1 相关背景知识

1.1 量子稳定子码与拓扑量子码

量子稳定子码(Quantum Stabilizer Code)也称加性量子码，是目前量子纠错码的研究主流[5-9]，其结构类似于经典线性码，其码字空间是由所有稳定子生成子的本征值为1的共同本征态所构成[5-8]。这里所谓的稳定子是由Pauli算子的乘积构成，对于量子稳定子码而言，要求所有的生成子彼此间相互对易，其角色相当于经典线性码的校验矩阵[8]。

量子纠错码中的错误种类很多，但Shor和Steane将复杂的量子态错误简化为单个量子位上的比特翻转错误、相位翻转错误和比特翻转加相位翻转错误，分别对应X、Y、Z三个Pauli矩阵[5]。随后，Preskill指出单量子比特上发生的任意错误，都可能被视为以上三种错误的线性组合。这样对量子比特上错误的纠正，演变成对其上发生的X、Y、Z这三种错误的识别。

拓扑量子码(Topological Quantum Code)是具有良好抵抗噪声能力的一类稳定子码[9-10]，区别于其他稳定子码的显著特点是其稳定子生成子的几何局部性。换句话说，该码的物理比特以规则的拓扑结构相互关联构成，且在某个几何区域内，每个稳定子的生成子都由恒定数量的量子比特支撑，例如Toric码。一般而言，该稳定子的非零元素个数相对物理量子比特的个数要小很多，因此也属于量子低密度奇偶校验(Low Density Parity Check)码的一种，常见的拓扑稳定子码包括Toric码、Surface码、Color码以及它们的高维形式。

1.2 拓扑码的最佳匹配算法

拓扑码最佳匹配算法的基本思想是在图中求最短路径和[11]。以Toric码为例，该算法的匹配过程如图1所示。

(a) 上下、左右两个syndrome 之间的最短路径

图1(a)和图1(d)是5×5的Toric码，其中蓝色标识是稳定子测量后得到的错误图样(Syndrome)为-1的位置。依据编码理论可知，一个码字中发生少量错误的概率大于发生多个错误的概率，同样的结论也适用于量子纠错码。Toric码里，经过一个量子比特(图1(a)中的空心圆圈)计为一个单位长度，图1(a)中任意两个错误之间的最短距离可以表示成图的形式，如图1(b)所示。MWPM算法就是找到图1(b)中包含所有错误的最短路径，如图1(c)所示，最后再映射回Toric码上如图1(d)所示，其中绿色标识就是找到的最短错误链。从这个匹配过程中可以看出，MWPM算法就是找到能将所有的错误图样串联起来的最短路径。

2 基于卷积神经网络的拓扑量子码的译码设计

对于量子稳定子码，之前提到的MWPM译码算法并非是最佳的译码算法，原因在于其无法最佳地检测Y错误，即同一量子比特上的比特翻转错误和相位翻转错误的结合，MWPM译码算法将其视为两个独立的错误[4,9]，忽略了两者之间的相关性。虽然可以对该算法进行改进，用来解释错误之间的相关性。但因为在时间开销上较大，它们并不利于实际应用。

幸运的是，这些错误相关性可以用神经网络的模式匹配能力来识别。在文献[4]中，蒋良教授课题组提出一种基于神经网络的量子稳定子码译码器，其中神经网络用的是全连接前馈神经网络，隐藏层中的每个神经元都与前后面层中的神经元相连，且有多个隐藏层。该译码器在纠错能力上要优于经典的最小权重最佳匹配译码器。但相应的，因为全连接的前馈神经网络层与层之间是完全关联的，一旦网络深度增加，参数量会非常多，整个网络的计算量将会变得非常大，从而给梯度下降法训练全连接网络带来极大困难。

考虑到卷积神经网络所需的参数相对较少，在图像分析和处理领域广泛应用，而拓扑量子码在平面上的展开恰是一个个二维结构，具有图的显著特征。为此，本文基于卷积神经网络设计实现拓扑量子码的译码器，用于识别量子比特上的错误关联，在提高译码性能表现的同时，降低译码时延。基本思路是：以Toric码的X和Z稳定子的测量结果及其对应的错误作为训练数据训练网络，使其具备预测Toric码中的每个量子比特上发生X和Z错误的概率分布的能力，再通过采样和硬判决取出一个预测的错误，验证该错误是否能产生同样的错误图样。如果不能，就重复采样，同时设置最大迭代次数。如果超过最大迭代次数还找不到真正的错误，就放弃迭代，认为此次译码失败。如果成功找到了对应的错误，则认为此次译码是成功的。具体的译码流程如图2所示。

图2 基于神经网络的译码流程图Fig.2 Flowchart of a neural network based decoding

这里的卷积神经网络，需要有有多个卷积层，这是因为单个卷积层学到的特征一般比较局限。其中的下采样层(池化层)用来完成对特征的筛选，以进一步减少参数量。而Softmax层的作用是对全连接层的输出做归一化处理，转换为概率输出。卷积网络的输入是测量所得的错误图样，输出节点数量(输出层的神经元数量)取为Toric码量子比特数的两倍。

3 仿真实验

此次仿真实验，考虑不同码距的Toric码在所设计的卷积神经网络译码器下的表现。对于每个码距的Toric码，通过在译码器中输入数量相同的测量错误图样，判断并计算能够成功找到对应错误的比例。训练数据的生成是采用去极化信道，得到相应的错误图样和训练数据。每个噪声下最好的译码性能可能出现在不同的参数设置下，通过网络搜索法进行迭代，并把相应的译码结果和MWPM译码器进行对比，如图3所示。

图3中横坐标表示信道错误概率，纵坐标表示给定大小相同的验证集，译码器成功译码的比例，d表示对应Toric码的码距。由图3可知，CNN译码器的阈值门限约为0.162，较MWPM译码器有所上升。译码器阈值的提高，也表明CNN译码器对噪声的抵抗能力得到相对提升，能够容纳更高的噪声。

图3 不同码长下，CNN和MWPM译码器性能对比Fig.3 Decoding comparison between CNN and MWPM under different coding length

当信道错误概率低于阈值门限时，噪声小、影响弱，如果扩大码距，虽然译码器的译码能力是增加的，但是增加的程度会越来越小。因为随着码距的扩大，会使码字的错误空间迅速增长。而当信道错误概率高于阈值门限时，噪声的影响过大，严重干扰译码器的工作，如果再增加码距，反而降低译码器的译码能力。

在相同的噪声环境下，CNN译码器能够获得更高的译码性能，原因主要是CNN译码器在错误相关性上带来的改善。为了说明这一点，图4中给出在码距为7时，只用Z稳定子和同时用X和Z稳定子的测量结果分别训练卷积神经网络所得到的译码性能图。

图4 d=7时CNN译码器探测错误相关性对比Fig.4 Comparison of CNN decoders on correlated errors under coding length being 7

在去极化信道下，发生X错误和Z错误是等概的，Y错误等价于同时发生X错误和Z错误；如果X和Z错误之间没有相关性，则两种错误就可以看作是独立的，图中的2条曲线应该重合。图4表明，通过卷积神经网络借助其特有的学习能力，能探测出来以上2种错误的相关性，改善了译码器性能，提高了纠错能力。

卷积神经网络比起全连接神经网络，一个显著特点就是参数量少，并由于卷积层中的参数可以共享，同时池化也降低了计算量。因此，训练速度相对较快，消耗时间少。表1为bitch_size=512、d=5时，全连接神经网络和卷积神经网络在相同大小的训练集下训练一轮(epoch)平均所需的时间，从表中清楚地看出，卷积神经网络的训练速度明显快于全连接神经网络。

表1 两种神经网络训练时间对比

4 结论

本文工作进一步表明，神经网络译码器相比于传统MWPM译码器在探测错误相关性上具备更强的能力，有助于提升译码器的纠错能力。卷积神经网络译码器相对于全连接神经网络，参数量更少，在保证译码性能的同时，时间复杂度更低。未来的研究可以注重多元化的神经网络与量子纠错码的编译策略相结合。另外，目前的研究大多假设稳定子的测量过程是准确的，而实际中测量结果本身错误也难以避免，以上问题都将作为我们未来的研究工作。