基于机器学习的轨道角动量光束模式探测技术研究进展

1 引言

然而，大气是一种不稳定的随机介质，光波在大气中传播时，会受到分子吸收、大气气体和气溶胶散射、湍流扰动等影响。大气中湍流会对光束的复振幅造成破坏，干扰OAM态的正交性，进而降低空间光通信系统的误码率性能[20-21]。因此，如何提高OAM通信系统的抗干扰能力成为了迫切需要解决的问题。

OAM光束用于复用或者编码时，由于不同叠加态的OAM光束有着不同的物理表现(如强度图样)，故可将OAM模式识别问题转换为图像分类的问题。此类问题通常使用识别率(即对图像正确分类的比例)和误码率(即传输信息比特的错误率)来表示。2014年，维也纳大学Krenn等人首次使用人工神经网络(artificial neural network，ANN)作为OAM模式分类器。该研究在3 km的城市环境大气中对16个OAM模式进行识别，平均误码率接近1%[22]。2016年，Krenn等在143 km的海面上空(海洋性大气信道)进行了类似的实验。该实验利用4种OAM模式对文字进行编码，误码率为8.33%。尽管误码率偏高，但该研究验证了机器学习作为OAM识别器可以在长达数百公里的传输距离中使用的可能性[23]。但ANN在图像分类上存在无法学习相邻像素点关联性等问题，并且部分ANN需要人工设置特征函数，故基于ANN的OAM模式识别器在系统实现上具有一定的局限性。2017年，基于卷积神经网络(convolutional neural network, CNN)在处理图像分类问题上的优势，美国海军实验室和北京邮电大学等先后提出使用AlexNet、LeNet等框架的CNN对受大气湍流影响的OAM光束强度图样进行分类识别，在实验室通过实验和仿真的方式取得了大于99%的识别率，从此开启了CNN-OAM模式分类器的研究热潮[24-25]。

本文将对基于机器学习的OAM模式分类研究进行综述，分类器包括常见的ANN、支持向量机(support vector machine, SVM)、CNN以及近一年受到广泛关注的全光神经网络——衍射深度神经网络(diffractive deep neural networks，D2NN)等。

2 OAM叠加态光束强度分布特点

对于=0，

3 大气湍流信道

在温度梯度的作用下，大气的湍流运动会导致大气折射率紊乱，称为大气的光学湍流。Kolmogorov早期的研究表明，所有光学湍流的一个亚类具有一定程度的统计一致性，便于进行有意义的理论分析和建模处理。折射率在时空上随机地重新分布会造成与其相关的光束闪烁现象和相位波动等各种影响[27]。

对于光波传播，折射率的变化几乎都是因温度微弱变化引起的，湿度变化、压力变化通常可以忽略不计。因此，折射率的空间功率谱函数形式与温度空间功率谱函数类似，温度起伏功率谱也类似于风速起伏功率谱，符合相同的次方规律。大气湍流的折射率功率谱模型已有Kolmogorov谱，Tatarskii谱，修正型von Karman谱，以及修正型Kolmogorov大气谱等[28]。其中表述最简洁并且运用十分广泛的是Kolmogorov功率谱：

图1 拓扑荷数为±l0的叠加态光束在发送端的光场强度分布图。(a)~(h) 对应的拓扑荷l0分别对应1 至8

由Tatarskii谱可以得到如下的修正型von Karman谱：

在Kolmogorov谱基础上可以得到修正型Kolmogorov大气谱：

OAM光束经湍流信道的传输可以利用分步传输法进行数值仿真，也可以通过空间光调制器产生满足Kolmogrov湍流理论的随机相位屏进行模拟[29]。OAM光束经海洋信道的仿真传输与大气信道类似，需要采用相应的折光率谱模型。

4 基于ANN的OAM模式识别技术

机器学习通常是指计算机根据“学习算法”从经验数据中产生模型，再利用模型对新的情况提供相应的判断[30]。早期的神经网络需要人类设计特征函数，特征设计的好坏直接决定了神经网络的性能，因此又被称作“特征工程”。但对于图像识别而言，仅仅图像角度的变化就会导致原有特征发生改变，识别率无法得到提升。到了二十一世纪，“深度学习”的提出让连接主义再次成为热潮。狭义地说，深度学习就是使用很多层的神经网络进行机器学习。使用深度学习进行图像分类处理，无需人工设计特征，网络通过多层学习可以自动提取特征。随着计算机技术的发展，可以使用的数据样本越来越大，避免了“过拟合”的局限；计算能力越来越强，能够使用更复杂的神经网络和更多数据，这两个原因让深度学习走向了工程实践，在各个领域获得了广泛应用[31]。

4.1 BP神经网络

误差反向传播(Back propagation, BP)神经网络结构较为简单，一般是具有三层或三层以上的多层神经网络。其按功能可分为输入层、隐含层和输出层。其各层神经元之间实现全连接，但上下各神经元之间无连接，其结构如图2所示[32]。在进行有导师训练时，神经元的激活值从输入层经过各隐含层传递至输出层，输出信号的误差经各隐含层回传到输入层修正各节点权值，因此称为“误差反向传播”。经过多次迭代更新后，神经网络的输出最大值点即为分类的结果。

图2 BP神经网络结构示意图[32]

由于BP神经网络在处理图像分类问题时效果不好，故在OAM模式探测相关文章中多作为比较组，在此不单独进行BP-OAM探测器的综述。

4.2 自组织竞争神经网络(SOM)

BP神经网络这一类有导师的神经网络需要提前已知大量数据并进行标记，然而在对外界未知环境进行学习时，则需要无导师的学习模型。自组织竞争神经网络(self-organizing feature map，SOM)便是无导师学习的一种典型模型，其本质为划分聚类。该神经网络模仿生物学中的“侧抑制”现象(即一个神经细胞兴奋后会对周围神经细胞产生抑制作用)，竞争层中各神经元竞争对输入模式的相应机会，最终产生一个获胜者；与获胜者相连的各个连接权值会朝向有利于竞争的方向调整。再经多次迭代后，获胜的结点对将来出现的相似向量更加容易赢得该结点的胜利，从而归为一类。其网络结构如图3所示[32]。

2014年起，维也纳大学Krenn等人提出使用SOM对单OAM态和叠加OAM态进行分类[22]。该团队在维也纳市区进行了大气信道的OAM光束传输实验。其实验架构与场景图如图4(a)所示。由于长距离传输光束尺寸发生展宽，实验采用面板对接收光束进行漫反射并用CCD记录。在经过3 km的大气信道传输后，OAM光斑受到了城市环境中大气湍流及大气颗粒物的干扰并发生畸变，但OAM强度图样仍然可以辨别。接收端使用自组织神经网络识别16个OAM叠加态，错误率约为1.7%。实验还利用OAM编码传输了两幅图片，如图4(b)、4(c)所示，可以看出，相较于小OAM态而言，较大的OAM态出现了较大的串扰。该实验首次证明了机器学习作为非相干解码器在FSO-OAM系统中的可行性。

图3 SOM神经网络结构示意图[32]

2016年，Krenn团队在Canary岛屿间的海面上进行了海洋性大气信道OAM光束传输研究[23]。图5(a)为实验的示意图与外场照片。海洋性大气信道存在大气湍流、海雾、云层等因素，信道质量较差。图5(b)显示光束受到了较为严重的湍流干扰。实验使用60 mW、波长为532 nm的绿光激光器作为光源。OAM叠加光束在经过143 km的传输后光束尺寸扩展较为严重，实验中将光束打在一个灯塔墙面上再拍照。图6展示了CCD采集的灯塔漫反射出来的光斑。可以看出，即使经过了长距离传输，光束“花瓣”仍清晰可见。该实验为目前通信距离最长的OAM外场实验，在较强的海洋性大气干扰下，识别错误率为8.33%。

总体而言，使用ANN对OAM强度图样进行识别可以得到一定的准确率，但由于ANN网络架构不擅长处理多维图像问题，无法取得较高的识别率与较低的误码率。

图4 (a) 维也纳市区OAM光束传输外场实验图[22]；(b) OAM模式串扰矩阵；(c) 传输及接收的两幅图片

图5 Canary岛屿间海洋性大气信道OAM光束传输实验示意图与外场照片[23]

图6 灯塔上的接收光斑[23]

5 基于SVM的OAM模式识别技术

作为解决分类问题的又一代表，SVM早在1995年便在文本分类任务中显示了卓越的性能。SVM分类的核心思想为寻找具有样本“最大间隔”的超平面。其理论基础为：如果原始空间是有限维的，那么一定存在一个高维特征空间使样本可分，其求解通常基于凸优化技术。分类过程可由图7形象表示[32]。

图7 SVM分类的输入空间和特征空间原理图[32]

将SVM思想应用于OAM模式分类问题是一个崭新的思路。在拥有出色分类能力的同时，该方案也存在一定的弊端，例如需要人工设计特征。2019年，西安电子科技大学的Sun等人将OAM光束受到大气湍流干扰的程度与其模式数的关系作为OAM光束的人工特征，提出了基于SVM的单态OAM模式识别方案，其系统结构如图8所示[33]。该方案使用OAM光束作为信号光，同时使用一束高斯光束作为探针光。由于SVM在处理小样本数、非线性等方面性能优异，该方案使用SVM去识别光束的闪烁指数、光束展宽、光束漂移等参数，使用遗传算法来优化SVM参数设置，通过探针光来判断信道条件，并根据信号光各个参数的受干扰程度反推出OAM模式。如图8所示，即使在较强湍流长距离传输信道中，该方案也可达到较高的识别准确率。

6 基于CNN的OAM模式识别技术

利用ANN对图像进行识别、分类的研究在十年前较为缓慢。传统的机器学习需要通过人类“经验”为神经网络设计“特征”。“特征”设计的好坏直接影响了整体的性能。而深度学习则是将原始数据作为输入，由机器逐层抽象生成最终的“特征”。近些年来，随着硬件层面图形处理单元(graphics processing unit, GPU)的迅速发展以及CNN的研究热潮，图像识别的准确率和训练速度有了极大的提升。1998年，Yann等人发明的LeNet型CNN在当时的计算条件下就能取得低于1%的手写数字识别错误率，成为了第一个产生商业价值的CNN[34]。2012年，Geoffrey等人凭借AlexNet型CNN以超过第二名12%的准确率夺得了ImageNet图像分类竞赛的冠军，奠定了CNN在图像领域的霸主地位[35]。2015年，CNN在ImageNet数据集上的识别错误率(4.94%)首次低于了人类判断错误率(5.1%)。此后，深度CNN成为了计算机视觉、自然语言处理等领域的主要研究技术，并获得了大量的商用价值。

由于具有共享卷积核、局部感受野等特点，CNN在处理网格结构数据(时间序列、图像等)时具有显著的优势，并且对一定程度的数据扭曲、平移等具有较强鲁棒性。该网络模型采用梯度下降法(stochastic gradient descent, SGD)最小化损失函数，对网络中的权重参数逐层反向调节，通过频繁的迭代训练提高网络的精度。在CNN中多采用批处理随机梯度下降法(mini-batch SGD)，训练阶段选取若干个小样本作为一“批”(batch)训练，并进行多次重复；当遍历完全部训练样本后便成为一“轮”(epoch)。这样的方法可以兼顾训练集过大和处理器硬件资源有限的问题。

图9(a)为CNN的工作流程，即前馈运算(feed- forward)过程。典型的CNN主要包含输入层、卷积层、池化层和全连接层。图像作为网络输入依次经过每一层操作。输入层与原始数据相连接，一般为输入图片的像素矩阵。若输入为黑白图片则为一维矩阵，若输入为彩色图片则为三维矩阵。通过卷积层时，图像与卷积核做卷积。图9(b)为典型的二维卷积操作示意图。卷积是一种局部操作，通过一定大小的卷积核(convolution kernel)作用于局部图像区域可获得图像的局部信息。卷积核一般为3´3或5´5的矩阵，其通过一定的步长(stride)从输入数据的左上角移至右下角并计算相对应的矩阵；通过一系列简单的卷积核(滤波器)将输入信息抽象为具有高层寓意的概念表示。这样学习到的权重对于不同位置的所有输入都是相同的，成为“权值共享(weight sharing)”特性。图9(c)为两种典型池化(pooling)方式的示意图，其典型方式为最大值池化(max-pooling)和平均值池化(average-pooling)。平均值(最大值)池化操作将池化核覆盖的区域内所有值的平均值(最大值)作为汇合结果。池化操作可以描述为通过一定的方式将高分辨率图片降为低分辨率，相当于进行“降采样”(down-sampling)操作。该操作不仅可以使计算维度大大减少，还会使神经网络对一定范围内的偏移有所容忍，同时可以抽取更广范围的特征。举例而言，对于最大值池化方法，可以理解为是在询问某一范围内是否存在这样一个特征而不关心特征具体出现的位置。在经过多个卷积层和池化层后，数据进入全连接层(fully connected layers)。全连接层可视为分类器，将前面学习到的特征表示映射到样本的标记空间上。该层采用柔性最大值传输函数(softmax)全连接，得到的激活值即卷积神经网络提取到的图片特征。

图9 (a) CNN的工作流程(前馈运算)过程；(b) 卷积操作示意图；(c) 池化操作示意图

6.1 对光强分布进行识别

2017年，美国海军研究实验室Doster等人使用叠加贝塞尔高斯光束进行OAM编码，他们在CCD前加一面傅里叶透镜以得到贝塞尔高斯光束在焦点的强度分布[24]。该实验结构示意图如图12所示。实验使用空间光调制器同时产生OAM的叉形光栅和模拟大气湍流的相位扰动。解码器选用的神经网络为层数较深的AlexNet形式并在GPU上进行训练，其中包含5个卷积层大约两千万个训练权重。由于采用了较深的神经网络，在很强的大气湍流下5 bit OAM编码得到了大于99%的识别率。实验同时证明了在大气湍流信道中使用CNN识别OAM模式的正确率要远高于传统的共轭解法。该工作证明了使用深度神经网络和高分辨率图片，在以计算复杂度和时间复杂度为代价的情况下，在强湍流信道下也可得到极高(大于99%)的识别率。

图10 不同网络结构的OAM模式识别效果图[25]

图11 CNN-OAM解码和大气湍流识别系统结构示意图[36]

图12 CNN-OAM模式识别系统方案图[24]

图13 View-pooling层CNN系统示意图[37]

图14 m取不同值时±l叠加光束光斑图样的锐利度曲线[40]

6.2 基于光束变换的识别技术

上述研究工作均是对CCD采集的OAM强度图样直接进行训练和识别，其大多是基于OAM叠加态强度图样会呈现不同的“花瓣”图样特征的。当OAM态较大时，“花瓣”特征细节较多，低像素、层数较少的神经网络难以收敛。因此，一些研究工作提出在进行训练前对光束进行某些变换以突出其OAM模式特点。

2018年，美国海军研究实验室Park等人利用Radon累积分布变换(Radon-cumulative distribution transform, R-CDT)对OAM强度图样进行预处理以提高其特征区分度[43]。R-CDT在特定条件下，可以将非线性不易区分的分类转换成线性可分的，其示意图如图16(a)所示。图16(b)为CCD采集到的贝塞尔高斯叠加光束的强度图，图16(c)为经过R-CDT变换后的对应输出图片。可以看到，R-CDT变换将集中在圆环上的“花瓣”变化转换成分布更广的“鱼鳞”状特征，但其变化细节较多，需要更高的分辨率才能提供足够的信息(使用的R-CDT分辨率高达217´90)。对比研究表明，经过R-CDT变换后在获得相同的识别率情况下耗费的计算代价约为原来的1/90。

图15 (a) 水下信道传输CNN-OAM系统示意图；(b) 水下信道传输CNN-OAM系统实验装置图[42]

2019年，浙江大学Jiang等人，将相干光干涉探测方法引入CNN-OAM探测系统，其系统结构如图17(a)所示[44]。其特点为在接收端加入相干光源，使得CCD探测OAM叠加光束的干涉条纹，结果如图17(b)，17(c)所示。可以看出，相较于OAM强度图样，干涉条纹特征更为明显。研究结果表明，在传输距离为1500 m的仿真强湍流大气信道中，对16个OAM编码的识别率可以大于99%。本方案可以较大地提高识别率，但对光束与接收光束对准要求较高。

根据上述研究可知，光束在经过一些特定变换后，拥有不同OAM模式的特征差异会更加明显，因此更有利于神经网络进行识别。

7 全光神经网络

由于使用神经网络进行识别需要CCD采集图片并送入计算机进行运算，硬件的刷新速率和神经网络的计算时间均会对高速通信产生较大影响。

2018年，加利福尼亚大学的Lin等人在上发表论文介绍了一种新型的全光神经网络，称为D2NN，其系统结构图如图18所示[45]。该网络结构与传统CNN类似，输入为携带图像的光波或太赫兹波，经多层相位调制板衍射后，在对应的不同位置出现相应的光点，所出现的位置即为分类结果。其训练过程与CNN类似，采用BP算法；训练成功的模型可由3D打印制作。全光神经网络中信号以光速进行传播，可视为以光速进行并行计算，有望解决使用电域神经网络的计算复杂度和时间复杂度问题。

图16 (a) 将非线性不易区分分类转换成线性可分分类示意图；(b) CCD采集到的贝塞尔高斯叠加光束在焦点处的强度图；(c) 经过R-CDT变换后的输出图片[43]

图17 (a) 基于相干光干涉探测的CNN-OAM模式识别系统结构图；(b) OAM叠加光束的干涉条纹； (c) 受到大气湍流干扰的OAM叠加光束的干涉条纹[44]

图18 (a) D2NN结构示意图；(b) 识别数字示例[45]

图19 D2NN-OAM模式识别系统示意图[46]

8 结论

本文对近年基于机器学习的OAM模式分类器的研究进行了综述。ANN网络最早提供了机器学习进行OAM模式分类识别的可能，CNN将识别率进行了有效提高。随着适应于图像分类的神经网络架构的不断改进以及计算硬件(如GPU)性能不断提升，神经网络OAM分类器的识别率稳步提升，并表现出了对抗复杂信道(如强大气湍流、海洋湍流等)的高鲁棒性。然而，类似方案还存在着许多的问题有待攻克。例如，CCD只能探测到光强信息而忽略了相位信息，因此用作OAM复用时该系统只可对各信道的OOK编码格式进行探测，而不能探测MPSK、MQAM等高阶相位调制格式。其次，空间光调制器调制速率低(大多数仅为几十Hz)以及CCD采集图像速率过低(仅为数十到几百张每秒)等硬件缺陷，导致通信速率还不够理想。全光D2NN具有传输快的特点，有望克服传统神经网络时延大的问题从而显著提高OAM模式解码系统的速率。

[1] Zhai X H, Zhang H T, Jiang W Y. The development of space laser link communications technique[J]., 2004, 28(1): 42–45.

翟旭华, 张洪涛, 姜威远. 国外空间激光链路通信技术进展[J]. 无线光通信, 2004, 28(1): 42–45.

[2] Chan V. Space coherent optical communication systems--An introduction[J]., 1987, 5(4): 633–637.

[3] Chan V W S. Free-space optical communications[J]., 2006, 24(12): 4750–4762.

[4] Allen L, Beijersbergen M W, Spreeuw R J C,. Orbital angular momentum of light and the transformation of Laguerre-Gaussian Laser modes[J]., 1992, 45(11): 8185–8189.

[5] Gibson G, Courtial J, Padgett M J,. Free-space information transfer using light beams carrying orbital angular momentum[J]., 2004, 12(22): 5448–5456.

[6] Mandel L, Wolf E, Shapiro J H. Optical coherence and quantum optics[J]., 1996, 49(5): 172.

[7] Xi R, Zhu B. Experimental study on short-distance free-space transmission characteristics of OAM beam[J]., 2019, 46(6): 180386.

席瑞, 朱冰. OAM光束短距离自由空间传输特性的实验研究[J]. 光电工程, 2019, 46(6): 180386.

[8] Wang J, Yang J Y, Fazal I M,. 25.6-bit/s/Hz spectral efficiency using 16-QAM signals over pol-muxed multiple orbital-angular-momentum modes[C]//, 2011: 587–588.

[9] Bozinovic N, Yue Y, Ren Y X,. Terabit-scale orbital angular momentum mode division multiplexing in fibers[J]., 2013, 340(6140): 1545–1548.

[10] Fazal I M, Ahmed N, Wang J,. 2 Tbit/s free-space data transmission on two orthogonal orbital-angular-momentum beams each carrying 25 WDM channels[J]., 2012, 37(22): 4753–4755.

[11] Huang H, Xie G D, Yan Y,. 100 Tbit/s free-space data link using orbital angular momentum mode division multiplexing combined with wavelength division multiplexing[C]//, 2013: 1–3.

[12] Wei S B, Wang D P, Lin J,. Demonstration of orbital angular momentum channel healing using a Fabry-Pérot cavity[J]., 2018, 1(5): 180006.

[13] Awaji Y, Wada N, Toda Y. Demonstration of Spatial Mode Division Multiplexing using Laguerre-Gaussian Mode Beam in telecom-wavelength[C]//, 2010: 551–552.

[14] Wang J, Yang J Y, Fazal I M,. Terabit free-space data transmission employing orbital angular momentum multiplexing[J]., 2012, 6(7): 488–496.

[15] Huang H, Ren Y X, Yan Y,. Performance analysis of spectrally efficient free-space data link using spatially multiplexed orbital angular momentum beams[J]., 2013, 8647: 864706.

[16] Huang H, Xie G D, Yan Y,. 100 Tbit/s free-space data link enabled by three-dimensional multiplexing of orbital angular momentum, polarization, and wavelength[J]., 2014, 39(2): 197–200.

[17] Wang J, Li S H, Luo M,. N-dimentional multiplexing link with 1.036-Pbit/s transmission capacity and 112.6-bit/s/Hz spectral efficiency using OFDM-8QAM signals over 368 WDM pol-muxed 26 OAM modes[C]//, 2014: 1–3.

[18] Ren Y X, Wang Z, Liao P C,. Experimental characterization of a 400 Gbit/s orbital angular momentum multiplexed free-space optical link over 120 m[J]., 2016, 41(3): 622–625.

[19] Li L, Zhang R Z, Liao P C,. Limited-size aperture effects in an orbital-angular-momentum-multiplexed free-space optical data link between a ground station and a retro-reflecting UAV[J]., 2019, 450: 241–245.

[20] Jiang H L, Tong S F, Zhang L Z,.[M]. Beijing: National Defense Industry Press, 2010.

姜会林, 佟首峰, 张立中, 等. 空间激光通信技术与系统[M]. 北京: 国防工业出版社, 2010.

[21] Wang D F, Chu Z F, Ren Z L,. Influence of atmospheric turbulence on BER of laser communication system[J]., 2011, 41(4): 390–393.

王德飞, 楚振峰, 任正雷, 等. 大气湍流对激光通信系统误码率影响的研究[J]. 激光与红外, 2011, 41(4): 390–393.

[22] Krenn M, Fickler R, Fink M,. Communication with spatially modulated light through turbulent air across Vienna[J]., 2014, 16(11): 113028.

[23] Krenn M, Handsteiner J, Fink M,. Twisted light transmission over 143 km[J]., 2016, doi: 10.1073/pnas.1612023113.

[24] Doster T, Watnik A T. Machine learning approach to OAM beam demultiplexing via convolutional neural networks[J]., 2017, 56(12): 3386–3396.

[25] Li J, Zhang M, Wang D S. Adaptive demodulator using machine learning for orbital angular momentum shift keying[J]., 2017, 29(17): 1455–1458.

[26] Yao A M, Padgett M J. Orbital angular momentum: Origins, behavior and applications[J]., 2011, 3(2): 161–204.

[27] Rao R Z, Wang H Y.[M]. Shanghai: Shanghai Jiaotong University Press, 2013.

饶瑞中, 王海燕. 光学涡旋在湍流大气中的传播[M]. 上海: 上海交通大学出版社, 2013.

[28] Andrews L C, Phillips R L.[M]. 2nd ed. Bellingham: SPIE Press, 2005.

[29] Lane R G, Glindemann A, Dainty J C. Simulation of a Kolmogorov phase screen[J]., 1992, 2(3): 209–224.

[30] Zhou Z H.[M]. Beijing: Tsinghua University Press, 2016.

周志华. 机器学习[M]. 北京: 清华大学出版社, 2016.

[31] Sun Z J, Xue L, Xu M Y,. Overview of deep learning[J]., 2012, 29(8): 2806–2810.

孙志军, 薛磊, 许阳明, 等. 深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806–2810.

[32] 杨杰, 占君, 张继传. MATLAB神经网络30例[M]. 北京: 电子工业出版社, 2014.

[33] Sun R D, Guo L X, Cheng M J,. Identifying orbital angular momentum modes in turbulence with high accuracy via machine learning[J]., 2019, 21(7): 075703.

[34] Lecun Y, Bottou L, Bengio Y,. Gradient-based learning applied to document recognition[J]., 1998, 86(11): 2278–2324.

[35] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]//, 2012: 1097–1105.

[36] Jin L, Min Z, Wang D S,. Joint atmospheric turbulence detection and adaptive demodulation technique using the CNN for the OAM-FSO communication[J]., 2018, 26(8): 10494–10508.

[37] Zhao Q S, Hao S Q, Wang Y,. Mode detection of misaligned orbital angular momentum beams based on convolutional neural network[J]., 2018, 57(35): 10152–10158.

[38] Tian Q H, Li Z, Hu K,. Turbo-coded 16-ary OAM shift keying FSO communication system combining the CNN-based adaptive demodulator[J]., 2018, 26(21): 27849–27864.

[39] Wang Z K, Dedo M I, Guo K,. Efficient Recognition of the Propagated Orbital Angular Momentum Modes in Turbulences With the Convolutional Neural Network[J]., 2019, 11(3): 7903614.

[40] Yin X L, Guo Y L, Cui X Z,Method of mode recognition for multi-OAM multiplexing based on convolutional neural network[J]., 2019, 42(1): 47–52.

尹霄丽, 郭翊麟, 崔小舟, 等. 基于卷积神经网络的多OAM态识别方法[J]. 北京邮电大学学报, 2019, 42(1): 47–52.

[41] Cui X Z, Yin X L, Chang H,. Analysis of an adaptive orbital angular momentum shift keying decoder based on machine learning under oceanic turbulence channels[J]., 2018, 429: 138–143.

[42] Cui X Z, Yin X L, Chang H,. Experimental study of machine-learning-based orbital angular momentum shift keying decoders in optical underwater channels[J]., 2019, 452: 116–123.

[43] Park S R, Cattell L, Nichols J M,. De-multiplexing vortex modes in optical communications using transport-based pattern recognition[J]., 2018, 26(4): 4004–4022.

[44] Jiang S Q, Chi H, Yu X B,. Coherently demodulated orbital angular momentum shift keying system using a CNN-based image identifier as demodulator[J]., 2019, 435: 367–373.

[45] Lin X, Rivenson Y, Yardimci N T,. All-optical machine learning using diffractive deep neural networks[J]., 2018, 361(6406): 1004–1008.

[46] Zhao Q S, Hao S Q, Wang Y,. Orbital angular momentum detection based on diffractive deep neural network[J]., 2019, 443: 245–249.

Research progress of orbital angular momentum modes detecting technology based on machine learning

Yin Xiaoli*, Cui Xiaozhou, Chang Huan, Zhang Zhaoyuan, Su Yuanzhi, Zheng Tong

Beijing Key Laboratory of Space-Ground Interconnection and Convergence, School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China

Schematic of underwater CNN-OAM systems and the experimental setup of the underwater CNN-OAM detection system

Overview:The orbital angular momentum (OAM) modes have orthogonality in theory, thus using OAM multiplexing and encoding technologies can effectively increase the channel capacity of the optical communication systems. However, the phase distributions of OAM modes are sensitive to the channel distribution. The particles and turbulence in atmospheric and underwater channels would lead to the absorptions, scatterings and phase distortions of the beams and decrease the performance of the OAM optical communication system. In recent years, some researchers focus on using machine learning (ML) technology to detect OAM modes to improve the performance of OAM optical communication system. ML technologies have advantages in self-studying and are more tolerant to noise compared to the traditional image recognition technology. In this paper, the OAM modes detecting schemes based on ML technology are reviewed, including error back-propagating (BP) neural networks, self-organizing feature map (SOM), support vector machine (SVM), convolutional neural network (CNN), mode recognition techniques base on beam transformations and diffractive deep neural networks (D2NN). In general, artificial neural networks (ANN), such as BP-ANN, are the earliest ML methods to detecting OAM modes although the detecting accuracies are not high (with 8.33% error ratio in 143 km transmissions); while researches using SVM are not identifying the intensity distributions of OAM beams but the parameters of the beams. The CNN is mainly designed for image classifications thus it has natural advantages in detecting intensity images of OAM beams. The convolutional and pooling operating can make CNNs not sensitive to small offset and extract features by themselves. The research results show that with OAM intensity as the input images, decoding accuracies of LeNet and AlexNet structures can reach more than 99% in even strong atmospheric turbulence no matter with simulations and in lab environments, which are higher than the ANNs. Some improvements of the CNN structures are also made to increase the accuracies. Some researches focus on image transformation of the input pictures, such as angular spectrum transforming, R-CDT transforming, which can efficiently raise the accuracies. While one of the disadvantages of the all-electrical neural networks is the high time delay. In 2018, researchers proposed a kind of all-optical neural network called D2NN and used it as OAM detector, which can realize relative high accuracies without time delay. All in all, the OAM detectors using ML can achieve high detecting accuracies compared to traditional OAM sorting methods.

Citation: Yin X L, Cui X Z, Chang H,Research progress of orbital angular momentum modes detecting technology based on machine learning[J]., 2020, 47(3): 190584

Research progress of orbital angular momentum modes detecting technology based on machine learning

Yin Xiaoli*, Cui Xiaozhou, Chang Huan, Zhang Zhaoyuan, Su Yuanzhi, Zheng Tong

Beijing Key Laboratory of Space-Ground Interconnection and Convergence, School of Electronic Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China

The orbital angular momentum (OAM) multiplexing and encoding technologies can effectively increase the channel capacity of the optical communication systems. In recent years, some researchers focus on using machine learning (ML) technology to detect OAM modes to improve the performance of OAM optical communication system. In this paper, the OAM modes detecting schemes based on ML technology are reviewed, including error back-propagating (BP) neural networks, self-organizing feature map (SOM), support vector machine (SVM), convolutional neural network (CNN), mode recognition techniques base on beam transformations and all-optics diffractive deep neural networks (D2NN). The performance, advantages and obstacles of each kind of the neural networks in atmosphere and underwater channels are analyzed.

orbital angular momentum; machine learning; neural network

TN929.1

10.12086/oee.2020.190584

: Yin X L, Cui X Z, Chang H,. Research progress of orbital angular momentum modes detecting technology based on machine learning[J]., 2020,47(3): 190584

2019-09-27；

2019-11-04

国家自然科学基金资助项目(61575027)；北京市自然科学基金资助项目(4192041)

尹霄丽(1970-)，女，博士，教授，主要从事光通信与信号处理技术的研究。E-mail: yinxl@bupt.edu.cn

尹霄丽，崔小舟，常欢，等. 基于机器学习的轨道角动量光束模式探测技术研究进展[J]. 光电工程，2020，47(3): 190584

Supported by National Natural Science Foundation of China (61575027) and the Natural Science Foundation of Beijing Municipality(4192041)

* E-mail: yinxl@bupt.edu.cn