APP下载

光子学逆向设计研究进展(特邀)

2023-07-12洪鹏胡珑夏雨周子昕秦浩然陈佳乐范烨殷同宇寇君龙陆延青

光子学报 2023年6期
关键词:光子逆向光学

洪鹏 ,胡珑夏雨 ,周子昕 ,秦浩然 ,陈佳乐 ,范烨 ,殷同宇 ,寇君龙 ,,陆延青 ,7

(1 南京大学 集成电路学院,苏州 215163)

(2 南京大学 电子科学与工程学院,南京 210093)

(3 西北大学 化学与材料科学学院,西安 710069)

(4 四川大学 物理学院,成都 610065)

(5 中山大学 微电子科学与技术学院,珠海 519082)

(6 西安交通大学 电子科学与工程学院,西安 710049)

(7 南京大学 现代工程与应用科学学院,南京 210093)

0 引言

光子学器件通过物体与光的相互作用可以实现对光场多维度的调控,在现代光学的各个领域都有广阔的应用前景[1-3]。传统光子学器件的设计主要是基于已知的物理原理,然后通过对个别特征参数的微调以实现对光子学结构的优化。在优化的过程中,结构的几何形状及材料参数通常是由先验模型所给定的,所以传统参数优化的维度是有限的。而随着对高性能、多功能的纳米光子学器件需求的日益增长,更高效、具有更高设计自由度的逆向设计方法得到了快速发展。

目前,应用最广泛的逆向设计方法便是梯度下降算法,梯度下降算法利用目标函数对变量的梯度信息,可以实现对目标的快速迭代逼近[4,5]。其中基于梯度的拓扑优化算法已经广泛应用于各种光子学器件的设计,例如光子晶体[6,7]、光纤[8]、非线性光开关[9]等。而对于梯度难以求解或不确定的问题,一般可采用遗传算法或粒子群算法,这两种算法分别通过模拟生物的进化进程和种群的觅食来寻找全局最优解,所以无需梯度信息[10,11]。近些年,随着人工智能的快速发展,基于神经网络的机器学习算法在各个科学领域备受关注。在光子学器件逆向设计中,神经网络模型已经成功应用于各种器件的优化设计,例如介质超表面[12]、滤波器[13]、发光二极管[14]等。与传统的参数设计方法相比,逆向设计方法的设计参数更多,设计的自由度更大,因此逆向设计方法可以得到更加复杂多样的器件结构,且所获得的器件性能上也更优越[15-18]。

本文对光子学器件的逆向设计方法和应用进行了分类汇总,分别介绍了基于梯度下降算法、遗传算法、粒子群算法和神经网络模型的逆向设计方法,并且总结了逆向设计方法在各个光学领域中的新兴应用,包括非线性光学[19,20]、拓扑光子学[21,22]、平面光学[23,24]和纳米光子学[25,26]等。

1 逆向设计方法

基于智能算法的光子学逆向设计是当前光学领域的研究热点,对于不同的物理模型,需要选择合适的逆向设计方法。本节将介绍各种逆向设计方法以及具体应用。其中1.1节将介绍遗传算法和粒子群算法的基本思路,并通过一个典型的逆向设计实例展示了改良遗传算法的可行性。在1.2节将详细介绍基于梯度下降的逆向设计方法,其中重点介绍拓扑优化方法,并给出了一个具体的实例来说明拓扑优化高自由度的优点。在1.3节将介绍基于神经网络的逆向设计方法。

1.1 基于遗传算法和粒子群算法的逆向设计

遗传算法是一种通过模拟自然界生物种群进化过程来搜索最优解的计算方法,其基本原则是“优胜劣汰”,即适应度高的个体将会获得更高的存活率和繁衍机会,从而在迭代中被保留下来[10]。遗传算法不依赖初始值的给定,所以遗传算法通常被用于设计初始形态未知的光子器件。例如对于给定的设计域,可将设计区域分为若干个网格,改变网格的材料分布以实现目标函数的迭代优化。遗传算法主要分为四个基本步骤。第一步:编码并生成初始种群,其中每个个体对应着一种材料分布。第二步:个体适应度评估,即计算每个个体所对应的目标函数,更新最优解及对应的材料分布。第三步:选择,将适应度高的个体赋予更高的遗传概率。第四步:交换基因,随机交换不同个体对应的材料分布。将上述四个步骤迭代足够的次数,便可实现对设计域的优化。

遗传算法的更新规则主要有两种:一种是在迭代过程中用子代将父代全部取代,即认为父代在交换基因后全部死亡;另一种是在父代交换基因产生子代后,从父代和子代的总体中选择适应度较好的个体作为下一代。这两种更新规则各有利弊,其中第二种规则的收敛速度更快,但容易收敛到局部最优解。为了平衡这两种更新规则,更好地模拟出种群在自然条件下的进化情况,人们提出了种群规模可变的遗传算法(Variable Population-size Genetic Algorithm,VPGA)[27]。其中一种较为成熟的思路是引入个体自然死亡机制,即定义个体在每一代的自然死亡概率,每次迭代后会判定个体是否死亡,去除已死亡的个体后再重新计算个体数。这种方法能够使种群规模增大,进而使个体的多样性增加,从而使算法陷入危险的可能性减小,因此大大提高了其全局搜索的能力。同时引入的个体自然死亡机制可以在保证多样性的同时,控制种群的规模,以降低计算资源的消耗。

为了验证不同遗传算法的可行性,我们给出了如下两个设计实例。第一个设计实例是Y型分束器,目标是两个输出波导的透射率尽可能接近0.5。我们分别使用三种不同更新规则的遗传算法,所得的最优解如表1所示,其中使用VPGA计算的最优解对应的电场和材料分布如图1(a)所示。作为第二个实例,利用VPGA实现波分复用器的逆向设计。左端输入波长为1 310 nm和1 550 nm的电磁波,使其分别从波导1和波导2中输出。所优化的波分复用器的透射率和反射率如表2和图1(b)所示,其中T1和T2分别为两个输出波导的透射率,R为反射率。

图1 遗传算法的应用实例Fig. 1 Application examples of genetic algorithm

表1 三种遗传算法计算Y型分束器的迭代次数和最优解Table 1 Iterations and optimal solution of Y splitter by three genetic algorithms

表2 波分复用器的透射率与反射率Table 2 Transmittance and reflectance of wavelength division multiplexer

和遗传算法类似,粒子群算法也常用于光子学器件的逆向设计。粒子群算法(Particle Swarm Optimization,PSO)是模拟鸟群觅食的一种全局搜索算法[11]。在粒子群算法中,每个粒子在优化空间中会单独搜寻最优解。每个粒子会根据目标函数计算当前所在位置的适应值,并根据粒子速度决定迭代过程中如何移动。粒子群算法的核心是粒子之间信息共享,相比于遗传算法,粒子群算法除了可以解决二值优化问题,对于简单的连续设计问题也有较好的优化效果。MILLER O D等[28]利用粒子群算法和伴随方法实现了基于液晶的可调超表面的优化设计。该可调超表面主要由三重光栅和液晶层所组成,其中三重光栅的图案是通过伴随灵敏度分析逆向设计得到,三重光栅和液晶层的厚度是利用PSO优化实现。在单光栅的优化过程中,利用PSO实现了53%的开关效率。目前,粒子群算法已经广泛应用于各种光子学器件设计中,但粒子群算法的局限性与遗传算法是类似的,只适用于自由变量较小的参数优化问题,而对于高自由度的优化问题仍然需要更高效的优化算法。

1.2 基于梯度下降的逆向设计方法

1.2.1 梯度伴随法

1.1节中介绍的经典优化方法为自由度相对较小的设计问题提供了令人满意的结果。然而,随着设计问题越来越复杂,自由度也越来越多时,无梯度算法的计算效率便大打折扣。在这种情况下,将基于梯度的方法应用于高自由度的设计问题可以大大提高计算效率。过去通常利用有限差分法来计算目标函数的梯度,但由于有限差分方法只能逐个计算设计参数的梯度,因此净计算时间与设计参数的数量成比例[29]。

为了高效计算梯度,BENDSOE M P等[30]在2003年提出了一种伴随方法,随后广泛应用于各种光子器件的优化,包括光束偏转器[31,32]、衍射光学元件[33]、金属透镜[16,34,35]、功率分配器[18,36]和解复用器[37]。与有限差分法不同,伴随方法可以在两次模拟中获得所有设计参数的目标函数梯度,而不考虑设计参数的数量。本质上来讲,伴随方法通过利用洛伦兹互易性实现了计算量的大幅度降低[38]。最近,伴随方法以反向传播的形式也被用于深度学习技术,具体基于伴随方法的公式在下面有更严格的讨论[39]。

假设考虑的系统由线性材料构成,则麦克斯韦方程可表示为

式中,A是M维的麦克斯韦算符,x是状态变量(电场或磁场),b是源项。系统的目标函数定义为状态变量x和设计参数p的函数F(x(p),p)。根据链式法则,可以得到目标函数对设计参数p的导数

为了得到目标函数的梯度,将式(1)两边对设计参数p求微分,可得

然后引入系统的伴随问题方程

因为式(4)的右边是已知的,所以式(4)的解v可以解析求得。随后在式(3)的两边同乘以vT,可得

将伴随问题方程(4)代入等式(5),可得

最后将式(6)代入式(2)中,即可实现对目标函数梯度的求解。利用伴随法求解梯度,只需要求解系统方程(1)与伴随方程(4),而不需考虑设计参数的数量,因此伴随法在大规模变量的优化中有十分广泛的应用。如今,基于伴随的方法已经与多种优化方法相结合,广泛应用于光子器件的逆向设计中,其中基于密度和水平集的拓扑优化方法将在后面进行详细讨论。

1.2.2 形状优化

在光子学逆向设计中,一般的优化问题可以看作是在V0的体积约束和M个条件约束下,找到使目标函数最小或最大的材料分布[40]。其中材料分布由密度变量ρ(x)表示,密度变量取0和1分别代表着两种材料的材料属性。这样,优化问题就可以表示为

其中状态场u(ρ)满足系统的状态方程。上述的优化问题一般可利用形状优化或拓扑优化方法求解。其中相比于形状优化,拓扑优化方法设计自由度更高,但会受到网格固定的限制。对于一般的形状优化问题,首先需要确定初始的设计形状,然后通过迭代演变,得到最优的形状结构。其中为了实现形状的迭代优化,一般采用两种方法跟踪其演变过程。

第一种方法是拉格朗日法。首先通过相对密集和均匀的方式对形状边界进行采样,即考虑足够多的点以获得准确的形状轮廓,然后通过逐渐移动边界点来演变形状。这本质上是一种动网格方法,也被称为动态网格自适应方法[41]。其中移动网格的数值求解基于动网格偏微分方程。网格拓扑始终保持不变,但网格节点在整个区域移动,以实现结构边界的更新优化。

另一种方法是欧拉法。欧拉法首先会在形状边界的矩形框上定义函数,令该函数在形状内部为正,在形状边界上为零,在形状外部为负。然后通过改进该函数实现对形状的迭代优化。其中随着形状的演变,网格点不会发生变化,只有网格点处的函数值会更改。相比于拉格朗日法,欧拉法始终保持网格固定,其中利用函数来表示形状的思想也是水平集法的基础。

利用拉格朗日增广算法进行迭代优化。

首先一般的形状优化问题可以表示为

即在一定的边界约束下,找到目标函数最优的形状边界。其中Ω为形状的边界,J(Ω)为目标函数,C(Ω)为约束条件,Uad为可接受形状的集合。然后利用拉格朗日增广算法可将问题转换为一个无约束的问题,即

式中,l代表约束C(Ω)的一阶惩罚参数,b代表约束C(Ω)的二阶惩罚参数,上标n代表迭代次数,且l∈R,b≥0。其迭代过程可描述为:

1)初始化形状Ω0,初始化参数l0,b0;

2)找到函数L(Ω,ln,bn)在边界Ω的下降方向θn;

3)得到新的形状边界Ωn+1=Ωn+θnτn,其中τn是足够小的步长;

4)计算新的参数ln+1,bn+1,其中ln+1=ln+bnC(Ωn),bn+1=αbn,α> 1。

这里bn是C(Ω)的二阶惩罚因子,随着bn的逐渐增大,约束将执行得越来越严格;ln是C(Ω)一阶拉格朗日乘子的估计值,随着迭代,也将越来越精确。循环步骤2)~4)直至收敛,然后输出最终的形状Ωn。

图2为形状优化的边界变化示意图[42]。

图2 形状优化的边界变化Fig. 2 Boundary changes in shape optimization

图中θ即为梯度下降方向,蓝色区域为膨胀区域,红色为收缩区域。

1.2.3 拓扑优化

如果使用密度方法,上述的优化问题通常是使用离散域的方法来解决,并归为拓扑优化。可以将设计域分解为大量的有限单元,用N元或节点设计变量来描述密度分布。这样拓扑优化问题可以写为

式中,ρ表示长度为N的设计变量向量。

一般来说,用拓扑优化方法来解决问题(7)和(10)通常缺乏解决方案[43]。对于优化问题(7),其生成越来越多的孔洞会降低目标函数,导致设计空间的封闭性不足。同样,对于离散化问题(10),随着N的增加,会出现更多的孔,这种现象被称为网格依赖。为了避免网格依赖,人们可以采用放松或者限制的方式。前者指的是KIKUCHI N等[44]提出的拓扑优化的均匀化方法,但也包括所谓的自由材料方法[45]以及自由物质方法[46]。限制则是指防止密度分布快速振荡的方法。但离散化优化问题(10)还有的另一个问题是,设计变量只能取离散值0或1。这个问题的离散性使它难以被高效解决。于是人们提出了连续密度设计变量的方法,这样就可以使用高效的梯度算法来求解。连续拓扑优化问题可以写成

这个公式现在成为了大部分拓扑优化文献的基础。大多数在固定网格上使用替代材料方法的水平集方法也可以写成(11)的形式。且密度和水平集方法之间的区别主要在于梯度的计算方式和形状的更新方式。

在均匀化方法引入拓扑优化后不久,BENDSOE M P[47]和后来的 ZHOU M、MLEJNEK H P[48,49]提出了所谓的带惩罚的简化各向同性材料方法(Simplified Isotropic Material With Penalization,SIMP)或幂律方法,它最初是作为一种简单但人为的方法来降低均匀化方法的复杂性,并提高0-1解的收敛性。BENDSOE M P和SIGMUND O[50]在1999年给出了SIMP的物理证明。下面给出了幂律约束的SIMP的具体形式

式中,p是惩罚因子,当p=3时收敛到0-1的效果较好[48]。上述方法的目的都是提供固体和空隙之间的连续插值,并对中间密度值进行惩罚,使其收敛到0-1,以便有物理意义。为了避免优化结果棋盘化[51]以及为了得到良好的和网格无关的解,需要对SIMP增加限制。SIMP问题的限制方法已经发展了多年,一般来说可以分为单场、双场和三场三种方法。单场一般是使用灵敏度滤波器进行限制,灵敏度滤波器修改元素的灵敏度值,使其成为网格无关半径rmin内相邻元素的加权平均值[52]。灵敏度滤波器的缺点主要是它在固体和空隙区域之间留下了宽度为rmin的灰色区域。双场一般定义为使用密度滤波的方法,因为它使用两个独立的场:设计变量场ρ和物理密度场。这里一般是将灵敏滤波器用密度滤波器来代替,它将元素的物理密度定义为半径rmin附近设计变量的加权平均值。这个过滤器也可以写成亥姆霍兹扩散算子

式中,r是一个长度参数,与密度滤波器的rmin相关。同样,密度滤波器也存在在固体和空隙区域之间产生灰色过渡区域的问题。解决灰度区域的一种方法是在延拓方法中减小梯度约束或减小滤波半径。如果惩罚得当,最终会获得离散的方案。但是这样做最好的情况是结果违反当初最小长度r的限制,最坏的结果就是出现棋盘状。三场[53-55]则是在双场的基础上增加了一个投影场,它对物理密度场ρˉ进行投影,使其灰度区域减少,向0-1收敛。现在拓扑优化中用的较多的平滑的Heaviside投影函数是双曲正切函数,其形式为

式中,θβ是投影阈值,当密度小于θβ时,投影函数将该单元的密度向0方向投影;当密度大于θβ时,投影函数将该单元的密度向1方向投影。β则控制则投影函数在阈值θβ附近的陡峭程度,β越大,其向0-1收敛的效果就越好。所有基于密度的方法的共同之处在于它们表示平滑的、可微的问题,并且可以通过经过充分验证的、基于梯度的优化方法有效地解决,例如最优性标准方法(例如,利用 Matlab)[56,57]、移动渐近线法[58]和基于数学规划的优化算法。

基于密度[6,59]和水平集[60,61]的拓扑优化方法的提出大大提高了逆向设计的计算效率和适用范围。其中基于密度的拓扑优化方法上一节已经详细讨论过。利用基于密度的拓扑优化方法,我们实现了给定散射矩阵的介质超结构的逆向设计,如图3所示。首先利用两种介质的介电常数的连续插值,并对中间密度值施加惩罚,以实现设计的二值化。然后引入密度滤波器和Heaviside投影函数,以提高数值模拟的质量和最终设计的稳定性。其中图3(a)是逆向设计的超结构,蓝色区域是给定的介质材料,红色区域是空气。图3(b)和图3(c)分别是给定的和优化设计的散射矩阵,可以看到优化设计的误差非常小。此外,基于密度的拓扑优化也广泛应用于各种场和结构的逆向设计问题中,这里不做过多的讨论。

图3 基于拓扑优化逆向设计的介质超结构Fig. 3 Dielectric metastructure based on topology optimization inverse design

水平集方法是利用在计算单元或网格上的连续变化的水平集函数Φ(x),将设计域D分成水平集来描述给定的设计[62]。分成的两个区域是由两种材料所组成的平滑结构,定义为设计域的一个划分

式中,Φ(x)通过运动方程或梯度进行演化,使其停留在局部最小值,以实现对器件的优化设计。利用水平集方法划分设计域无需提供显式的参数化,就可以实现结构边界的拓扑变化,这也是水平集方法区分于其他方法的最重要特征[63]。

利用基于水平集的拓扑优化方法实现逆向设计,首先要创建初始水平集函数,并根据初始水平集函数确定的水平集范围,确定材料的初始分布。然后根据逆向设计的设计目标和约束条件构建拉格朗日函数,并计算拉格朗日函数的拓扑敏感度和元素敏感度。随后根据拓扑敏感度和元素敏感度进行水平集函数的更新,并根据新的水平集函数确定新的材料分布和拉格朗日函数。最后进行收敛性判别,如果收敛则优化结束,若不收敛则继续迭代。

1.3 基于神经网络的逆向设计方法

随着计算机技术的快速发展,深度学习在计算机视觉和语音识别等许多领域取得了突破性进展。同样,深度学习在预测纳米光子学结构的电磁响应方面也有较强的能力,建立正向神经网络快速预测已知结构对应的电磁响应,来替代传统的全波电磁仿真方法,可以大大缩短生成电磁响应所需的时间。因此,利用神经网络作为代理模型,进行重复迭代尝试,可以作为逆向设计的一个思路。2018年,PEURIFOY J[64]设计了一种神经网络,预测了多层纳米粒子的散射特性,与仿真软件相比,神经网络的速度有数量级的提升。然而,神经网络在训练集和测试集上有很好的预测效果,但在训练集和测试集之外的参数空间并不能很好地预测。增大训练集数据量可以改善这一问题,但会影响神经网络的训练速度。MA W等[65]通过向主网络添加辅助网络,以捕捉共振频率附近精细的光谱特征。主网络利用了超材料的反射光谱,辅助网络利用超材料的圆二色性。两个网络都具有双向配置,数据在两个方向的路径中传递,两个网络通过堆叠策略组合,不仅提高了预测准确性,还扩展了网络的功能。BLANCHARD A P[66]将洛伦兹谐振子引入到神经网络中,计算光栅的光学响应,将输入参数和洛伦兹振子的总和相联系,该洛伦兹振子的总和对应结构的输出谱。与传统神经网络相比,在训练集和测试集之外的预测效果提高了一个数量级。

正向网络可以替代传统仿真软件对电磁响应的模拟计算,实现从结构到响应的正向预测,如图4。利用正向神经网络能够大大缩短仿真计算的时间,但这不是最有效的方法,因为没有直接实现从电磁响应到结构的逆向设计。若想获得能产生目标电磁响应的几何结构,仍需要大量的试错方法。近年来,基于深度神经网络逆向设计纳米光子结构的电磁响应逐渐成为热门的研究方向。在逆向设计中,需要考虑“一对多”问题,即不同的微纳结构对应相似的输出光谱,逆向设计的输入对应多个解[13]。训练深度神经网络的过程中,当存在多个解时,应用于其中一个解的权重可能会被另一个解改变,导致训练难以收敛,可以通过优化神经网络结构来解决一对多问题。典型的结构是串联神经网络、条件生成对抗网络和变分自动编码器。

图4 正向神经网络对结构的光学响应进行预测Fig. 4 The forward neural network predicts the optical response of the structure

串联神经网络由一个正向的预测网络和一个逆向的几何生成网络串联而成。正向预测网络可以通过输入几何结构预测对应的电磁响应,逆向几何生成网络则根据电磁响应推测对应的几何结构。首先利用数据集训练正向的光谱预测网络,将预测网络的权重固定,再设计逆向的几何生成网络[13]。逆向生成网络在训练过程中是用正向预测网络来评估逆向设计的输出,损失函数比较的并非几何设计参数,而是产生的电磁响应,从而避免了不稳定的训练损失,使逆网络收敛到一个解,解决了不同设计参数产生相似电磁响应影响神经网络训练的问题。图5(b)是一种金属材料的“H”形几何结构,利用串联神经网络对该超表面结构的透射光谱进行预测,实现不同偏振和不同共振峰光谱对应几何结构参数的逆向设计[67]。图5(c)展示了一种堆叠结构,逆向设计了在规定波长处具有手性光学响应的三维手性超材料[65]。

图5 利用神经网络直接进行逆向设计Fig. 5 Direct reverse design using neural network

生成对抗网络(Generative Adversarial Nets,GANs)由一个生成器和一个判别器组成。生成器目的是通过学习训练集数据,使生成的例子尽量与真实数据相似;判别器的目的则是判断输入的数据是真实的训练数据还是由生成器伪造的。因此,生成器和判别器相互博弈,二者交替训练,性能同时得到提升,最终生成器所生成的分布与真实情况极其相似[68]。条件生成对抗网络(Conditional Generative Adversarial Nets,cGANs)则是在GANs的基础上,对生成器和判别器的输入添加一个辅助信息,该辅助信息可以是辅助进行分类的标签[69]。利用cGANs向设计的网络输入正态分布噪声矢量,以生成多个可能存在的解,所需的电磁响应作为约束条件进行训练,即可预测出可能存在的多个解,避免了传统神经网络中的权重难以收敛的问题。在调整网络参数使学习收敛时,生成器和判别器的训练需要相对平衡地进行,如每次生成器更新时多次训练判别器,以使对抗损失函数能够更有效地工作。cGANs可以不限于固定的几何结构,生成多种同类的结构,使其满足相似的光谱响应[70,71]。

变分自编码器(Variational Autoencoders,VAE)由 KINGMA D P 与 WELLING M 在 2013年提出[72]。该模型分为推理网络和生成网络两部分。推理网络又叫做编码器,对每个输入生成一个潜在分布,一般为高斯分布,用均值μ和标准差σ来描述,再从分布中进行随机采样一个特征进行编码,这样可以得到一个完整且连续的潜在空间。生成网络又叫做解码器,对采样的特征进行解码重构。VAE损失函数由重构误差和KL散度组成,KL散度用来度量潜在分布和单位高斯分布之间的差异,防止模型退化为普通自编码器。与cGAN相似,可以通过不同的潜在向量生成多个存在的解。对于逆向设计问题,引入潜在变量,对结构及其光谱响应进行编码。从潜在空间中采样潜在编码,再重构出几何结构和其对应的光谱响应的过程可以作为逆向设计的生成过程。MA W等[73]设计了一种体系结构,该结构由三个子模型组成,识别模型将超材料的图案及其光学响应编码到低维潜在空间中,预测模型预测给定超材料图案的光学响应,生成模型以光学响应和采样的潜在变量作为输入,输出满足目标响应的超材料图案。这种预测将超原子结构划分为64×64的区域,每个区域采用二进制来表示金属和空气,允许生成多样化的几何图案。

2 逆向设计方法的应用

与传统的参数优化方法相比,上节所介绍的智能逆向设计算法具有更高的自由度。逆向设计方法可以同时实现多个光学参量的设计,从而获得特定调控性能的光学器件。近年来逆向设计已经在拓扑光子学、非线性光学、平面光学和量子光学等各个光学领域中取得了卓越的成就,因此本节将总结介绍逆向设计方法在这些领域中的主要应用。

2.1 拓扑光子学

拓扑光子学揭示了不同拓扑材料的非常规光学性质,目前利用这些光学性质已经设计实现了多种具有稳定特性的光子器件[74,75]。但是由于光子拓扑态高度依赖于复杂的光学响应和材料的几何结构,设计具有目标拓扑态的光学结构仍然是当前研究的一个巨大挑战[76]。过去,各种光子拓扑态结构主要通过经验方法来设计,其几何参数需通过反复试验来确定,所设计的结构性能受限制较大。为了实现最佳性能的设计,近年来逆向设计方法广泛应用于光子系统的拓扑性质和拓扑态结构中,例如奇异点[77,78]、拓扑绝缘体[79,80]和拓扑光子晶体波导[81,82]等。

当两个或多个相关的复特征值简并时,在非厄米问题中会出现奇异点(Exceptional Points,EP点)。利用EP点附近的特征响应,可以实现一系列的光学应用,例如定向传输[83]、增强自发辐射和频率转换的效率[84]等。过去,设计EP点主要是利用耦合谐振器的增益损耗结构[77]以及无源的光子晶体[85]来实现,其几何参数需要人工进行调控。图6(a)展示了利用基于密度的拓扑优化方法设计EP点的二维光子晶体,其在布里渊区的Γ点处产生了一个EP点[86]。利用逆向设计方法,不仅可以实现EP点的高效设计,还可以实现复杂目标拓扑态的光学结构。

图6 逆向设计在拓扑光子学中的应用Fig. 6 Inverse design in topological photonics

拓扑绝缘体的最重要特征是在两种不同拓扑不变量的材料界面上存在拓扑保护的边缘态。目前逆向设计方法已经用来设计具有宽带宽的拓扑边缘态的光学结构。基于拓扑边缘态的传输特性,CHRISTIANSEN R E等[80]利用拓扑优化方法实现了基于量子自旋霍尔效应的光子拓扑绝缘体,如图6(c)所示。通过设计排列波导中不同端口的传输,实现了相对带宽6%的光子拓扑绝缘体。但是这种方法需要优化由大量晶胞组成的波导,计算效率较低。为提高计算效率,NANTHAKUMAR S S等[87]利用基于水平集的拓扑优化方法,在光子晶体的K点构建了一个双重简并的狄拉克锥,在拓扑平凡结构和拓扑非平凡结构的界面上形成了带宽为4.08%的拓扑边缘态,如图6(d)所示。随后LUO J等[88]开发了基于可变形组件的逆向设计方法,通过最大化超晶胞的拓扑边缘态的工作带宽,设计了一对拓扑平凡态和非平凡态的光子晶体,其拓扑边缘态带宽的相对大小为12.2%,如图6(e)所示。上述逆向设计都是利用传统的拓扑优化方法所实现。HE L等[89]利用深度学习技术逆向设计了基于量子霍尔自旋效应的拓扑金属板,其带隙的大小和拓扑性质由金属板谐振器的排列半径所控制,如图6(f)所示。利用智能逆向设计技术所设计的拓扑绝缘体的性能要远远高于由物理先验方法所设计的传统拓扑绝缘体。例如,拓扑边缘态的工作带宽和拓扑角态的品质因子都得到了显著提高。更重要的是,利用逆向设计方法可以实现更加复杂的拓扑结构,有望实现前所未有的光学应用。

2.2 非线性光学

工程共振在非线性现象中的应用有着广泛的应用前景。与传统的体介质相比,谐振腔提供了更长的相互作用时间尺度和更高的场限制,因此非线性相互作用更加显著。从20世纪60年代中期最初提出的大型标准腔,到毫米级、微米级回音壁模式谐振器,再到最近提出的波长级谐振腔[90],这些实现高次谐波的谐振器不断向实现更高的转化效率、更低的泵浦功率、更小的体积、更快的操作响应时间、更宽的带宽以及更大的品质因数的方向发展。在更细节的层面上,波长尺度结构中的非线性过程中的物理信息可以通过一组必须同时调谐的参数来很好地描述:每个共振的频率和衰减率,以及一组描述组成电场之间相互作用的非线性重叠积分。虽然这个必要条件听起来十分简单,但是想要寻找到一个合适的结构依旧是一个技术和概念上的挑战,因为没有现成的标准原则可以套用。在优化某些参数的过程中,可能会导致其他参数的弱化,使我们难以权衡。比如利用周期性极化的铌酸锂(Periodically Poled Lithium Niobate,PPLN)与压电力显微镜(Piezo-Force-Microscopy,PFM)下尖端的制造工艺允许我们在任何模式之间实现准相位匹配条件,以确保高效的转换效率,但是器件体积太大[91];如果想要降低微环谐振器的功率,可以通过增大品质因子(quality factor,Q值)来实现,但代价是带宽和灵敏度,同时需要增加环半径R以防止辐射损失增加。此外还要做好模态体积V和辐射或弯曲损失之间的权衡[92]。虽然等离子体激元极化子共振可以提供人们需要的约束和场强,但材料损耗的问题依旧难以解决[93],这限制了最终转换效率的上限。此外,产生三次谐波或高阶谐波的器件需要与振幅相关的频率校正,但这被证明很难在少参数设计中独立调谐。

因此逆向设计技术对于获得同时实现这些不同设计目标的结构非常有效,已经有许多人使用逆向方法得到了很好的结果。LIN Z等[90]利用逆向设计方法不仅实现了频率匹配和较大的辐射寿命,而且还优化了同样重要的非线性耦合性能系数,以及涉及模式之间复杂的空间重叠积分。他们将此方法应用于优化微柱和栅板腔(一维多层结构)的特定问题,证明了方法的普适性。图7(a)左侧为拓扑优化得到的AlGaAs/Al2O3层非周期性交替组成的微柱腔结构,其作用是提高二次谐波产生的效率。其中hx×hy×hz=8.4×3.5×0.84(λ)3,λ=1.5 μm。右侧为波长λ和λ/2的波在x-z截面的局域模y方向分量。图7(b)为不同结构(Q1rad)2Q2rad的乘积与非线性模式重叠系数|β|2的散点图,其中包括了回音壁模式谐振器、微环和纳米环谐振器、光子晶体板和纳米光束腔,λ表示基频的波长,V表示器件的体积,R表示半径。随着结构变得越来越小,可以观察到Q值的减少和模态重叠增加的趋势。同时,发现具有高Q,小体积V,高模态重叠系数|β|2(黄色区域)的结构仍然是一个尚未解决的问题。他们还设计了复杂的波长尺度谐振器[94],以增强各种非线性的变频过程。最后演示了非周期的多轨道环形谐振器和二维平板微腔结构,并且展示出了高Q值,小体积的优良性质。图7(c)为基于密度的拓扑优化的砷化镓多径道环形谐振器在二氧化硅包层下产生差频谐波。其频率关系为ωs=ω0-2ωb,ω0=2.35ωs和ωb=0.68ωs,图中,ωo、ωs和ωb分别代表发射频率、信号频率和泵浦频率,构成腔体的三种模态。SANDER A M等[95]将拓扑优化应用于支持带间跃迁的金属-多量子阱-金属结构。拓扑优化产生的新颖设计超越了迄今为止最先进的基于L型和T型谐振器的极其高效的超薄二次谐波产生超表面。图7(d)为以25 nm×25 nm为尺寸的像素单元在面积为2 200×2 200 nm的区域内拓扑优化超表面的结果。其中第一张是目标函数的迭代图,其在22步后引入了高斯滤波,第二张为初始猜测结构,第三张为高斯滤波前的中间结果,显示出分散但二值化的轮廓,最后一张是使用高斯滤波后的最终结果。CHRISTIANSEN R E等[96]对金属谐振器进行拓扑优化,它能同时优化入射波的聚焦和拉曼偶极子的发射,可以导致表面增强拉曼散射(Surface-Enhanced Raman Scattering,SERS)效率提高102倍。图7(e)左侧是拉曼散射设计问题的简图,灰色区域为设计域,材料为金属银,中心为拉曼分子,右侧为位于拓扑优化银结构中心的分子通过拉曼散射发射的E2电场,其入射波长为532 nm。对于所考虑的非线性过程,可以发现之前的直观设计过于简单,没有充分利用干涉来匹配相互作用模式的轮廓。因此从图7所示的最新结果可以发现逆向设计在非线性光学中具有实用性。

2.3 平面光学和纳米光子学

超表面的设计是一个涉及数千个甚至数百万个设计参数的大规模优化问题,设计自由度的增加为具有更好的性能或新功能的设备解决方案带来了更多的可能性。逆向设计的方法更适合非已知的解析相位轮廓的光学函数的设计。另外,在实际应用中大面积的超表面的设计具有重要意义,因为器件的实际尺寸往往比周期单元尺寸大一个数量级,如一个毫米尺度的超表面可以包含具有数百纳米周期性的单元[97]。2019年ZHAN A等[98]利用离散介电散射体阵列控制三维光场的传播,演示了一种将波长为1.55 μm的光聚焦成深度变化的离散螺旋模式的装置(图8(a)),面积可以达到144 μm×144 μm。PHAN T等[99]利用拓扑优化设计将所需的相位轮廓划分为波长尺度、线性截面(图8(b)),并实验演示了大面积、聚焦效率超过90%的超表面高数值孔径硅透镜。BAYATI E等[100]采用基于伴随优化的逆电磁设计,设计了一种在625 nm下工作的圆柱形超表面透镜,实现了远超一般透镜的焦距。BACKER A S等[101]基于梯度伴随法逆向设计了一个消色差的双态超表面透镜,一个光谱多路复用全息元件,和一个用于手写数字分类的超紧凑光学神经网络(图8(c))。SAJEDIAN I等[102]用深度学习为全介电反射彩色滤光器寻找设计结构的最佳参数。与之前的工作相比,该模型能够找到更多的优化尺寸来设计结构,以实现更纯净的红色、绿色和蓝色。2020年CHUNG H等[103]展示了一种基于液晶的逆向设计超表面,实现了宽偏转角和高开关效率。SOUMYASHREE S P等[104]提出了硅超表面滤波器鲁棒性逆向设计(图8(d)),其显示出更好的色域、颜色纯度和像素内颜色均匀性。2021年LI Z等[105]展示了逆向设计元光学器件在VR和AR领域的潜力,通过逆向设计将不同波长的局部和非局域光干涉,实现正光色差聚焦,从而解决了传统透镜光学元件和色差很难同时减少的问题。通过元光学和微型光纤扫描显示器的结合,展示了下一代VR平台。2022年LI Z等[106]展示了逆向设计的大直径三维元光学,设计了2 mm直径的多色金属,并搭建了基于元目镜和激光照明微液晶显示器的未来VR平台。大孔径元光学器件与激光背光微液晶显示器的结合大大提高了虚拟现实显示技术的分辨率。

图8 逆向设计在超表面设计中的应用实例Fig. 8 Application example of inverse design in metasurface design

同时,大面积的超表面也带来了更大的运算量,需要很小的模拟网格尺寸和强大的内存需求。因此出现了其他近似求解方法来代替暴力求解麦克斯韦方程,评估多尺度器件在许多优化迭代中的性能[107]。

硅太阳能电池是一种很有前途的传统光伏器件,因为它们具有降低能源消耗成本的潜力。减少太阳能电池表面的光学反射是许多光学应用导致的基本挑战之一,特别是提高硅太阳能电池的效率。2019年JALALI T等[108]采用遗传算法和传递矩阵方法分析了硅基板反射的最小化问题,低氮纳米孔二氧化硅和高氮纳米孔ITO组成的周期性六层薄膜防反射涂层的角度和波长平均反射系数降低到30%(图9(a)),并被报道为硅太阳能电池的理想结构。2021年YOLALMAZ A等[109]用深度学习模型和局部搜索优化算法优化衍射光学元件对太阳能电池进行光谱分裂和宽带光的空间集中(图9(b)),既加快了衍射光学元件的优化,又提供了具有光谱分裂的至少57%的过量光浓度。非相干光是普遍存在的,但设计能够处理其随机性质的光学器件是非常具有挑战性的,因为直接平均许多非相干入射光束可能需要大量的散射计算。2022年PESTOURIE R等[110]实现了对光准直器和聚光器等应用程序进行高效的逆向设计和大规模的超表面优化(图 9(c))。

图9 逆向设计在太阳能电池和光刻中的应用实例Fig. 9 Application examples of inverse design in solar cells and lithography

逆向设计的超表面在光纤和光学光刻中的应用同样带来了更高的仪器制作精度。2021年HADIBRATA W等[111]在自制的双光子激光写入装置中利用三维直接激光写入技术在光纤尖端上制备了一种逆向设计的金属作为物镜,实现了大约200 nm的特征写入尺寸。ROQUES C等[112]通过拓扑优化对体积三维元光学进行逆向设计,并将结构的自由度体现在低折射率聚合物的多个紧密间隔的图案层中,最后用逆向设计的3D打印聚光器在五个不同的非近轴入射角下实验演示验证(图9(d)),为实现多功能超紧凑3D纳米光子器件铺平了道路。

对传感器而言,通过算法技术来寻找具有设定功能目标的光学结构,找到具有最大品质因数的传感器阵列配置可以显著提高传感器的检出限。2021年,WU Q等[113]证明了DNN在学习由纳米结构的微观几何变化引起的多种复杂电磁响应方面具有强大的能力,一个简单的多层感知器深度神经网络可以捕获等离子体几何与其近场和远场属性之间的高度非线性复杂关系,并用于精确逆向设计,实现了多功能光学传感器。随后利用深度神经网络来设计一个蝴蝶结纳米天线[114],只投入3024组数据来训练网络,就可以准确、快速地设计出数百万种不同的蝴蝶结纳米天线(图10(a))。整个光谱设计结果的相对误差小于12%,该工具对于基于SERS的化学和生物传感以及集成纳米光子学器件的设计很有意义。2022年,NUGROHO F A 等[115]通过逆向设计一个基于钯纳米粒子周期阵列的等离子体超表面来克服等离子体传感器的宽光谱特征的限制,在粒子群优化算法的指导下,通过数值识别和实验实现在窄谱线宽和大场增强之间的最佳平衡(图10(b)),使测量的氢检测极限达到250 ppb。片上集成生物传感器发达的表面化学和简单的可扩展制造工艺使它们特别适合于低成本的实时传感诊断,CHUNG H等[116]将逆向设计引入生物传感器的设计,同时用高对比度探针切割检测技术来设计和优化基于波导的生物传感器(图10(c)),该传感器对目标分子具有高灵敏度,而对噪声的敏感性较低。所提出的生物传感器只需要一个单频源和一个强度探测器,这大大简化了检测系统。

图10 逆向设计在传感中的应用实例Fig. 10 Application examples of inverse design in sensing

在模态多路复用问题上逆向设计也取得了重大进展。对于密集的芯片规模集成,显然需要通过处理单个波导上的多个频率,同时还需要独立地访问存储在不同频带上的信息。为了实现这两个目标,需要能够进行高保真波分复用的设备[86]。2019年YU Z[117]提出了一种在250 nm硅绝缘子平台上的极化不敏感波导交叉方法,可以广泛应用于光子集成电路中(图11(a))。DORY C等[118]采用逆向设计方法克服尖端金刚石纳米制造的限制,通过实验实现了光子晶体腔和逆向设计的波导分束器的可拓展集成,并开发出金刚石纳米光子电路的高效构建(图11(b)),在光学自由空间耦合器和小型金刚石光子电路中获得了紧凑和鲁棒性的关键突破,使得未来更复杂的量子电路成为可能。2020年PIGGOTT A Y等[119]基于伴随优化法在一个商业硅光子学铸造厂成功制造了空间模式多路复用器、波长解复用器、方向耦合器和路功率分配器(图11(c)),使得光子逆向设计过程与工业标准的光子学铸造厂兼容,消除了无法用光刻技术解决的微小结构特征的问题。2022年YUAN M等[120]提出了一个预训练的组合神经网络作为一个集成光子电路的逆向设计的综合解决方案,在神经网络中创建逆和正模型的联合训练过程,这种方法成功地解决了传统串联结构中的域移位问题。YANG K Y等[121]在一个硅光子电路上结合了波长和模式多路复用实现了集成的多维通信,利用光子逆向设计和光梳,实现了通过硅纳米光子波导1.12 Tb/s的无错误数据传输(图11(d))。同时逆设计表面法向耦合器,实现了光纤在独立硅芯片之间的多模传输。

图11 逆向设计在波导和模态复用中的应用实例Fig. 11 Application examples of inverse design in waveguide and modal multiplexing

2.4 量子光学

集成量子光路技术也是目前研究的热点,其中心目标是利用量子光学促进量子信息处理、量子通信、传感、量子计算、量子隐形传态、量子光源和存储器等前沿应用的发展,提供一个可扩展、更紧凑、可大规模集成的平台。系统复杂度的增加伴随着更多的量子比特数、多种光学编码方式、更大的带宽范围等,逆向设计的方法为实现复杂混合光子系统提供了帮助,能够显著提高效率,并将为实现高度多功能的量子光子超结构开辟道路。最近的一些工作展示了逆向设计用于集成量子光路的最新成果。拓扑优化可以有效地应用于金刚石基量子光子电路的发展,DORY C等[117]开发出金刚石纳米光子电路的高效构建模块,集成了光子晶体腔的自由空间耦合器和逆向设计的波导倍增器(图12(a)),使基于此的金刚石色心量子集成光路兼具高效性、紧凑性和鲁棒性。LIU D N等[122]在硅光子芯片上,采用逆向设计的方法设计并制作了超紧凑型通用量子逻辑门,其中CNOT量子门和Hadamard量子门的截面尺寸只有8.32 μm2和1.69 μm2,尺寸约为一个真空波长量级,是世界上被验证过的最小的光学量子门,并能够使基于此的集成量子光路的尺寸减小四个数量级(图12(b))。BOLTASSEVA A等[123]利用生成对抗网络和拓扑优化结合的逆向设计方法得到了效率为98%的高效量子发射器(图12(c)),能很好地与量子集成光路兼容,且能用于实现对单光子发射的确定性控制,如发射的方向性和速率。QI H X等[124]利用改进的伴随算法逆向设计了一种超快、超低能耗全光XOR逻辑门和高密度、高性能的光子集成电路(图12(d,e)),其控制光的阈值能量为10 fJ/bit,逻辑门的响应时间仅为20 fs。总之,逆向设计方法为大规模集成量子光路芯片的开发提供了新的方向,使更复杂的量子光路成为可能,能更好的适用于未来芯片的微型、低成本、高性能需求,推进其实用化进程,并对量子通信和量子计算等关键领域的发展起到至关重要的作用。

图12 逆向设计方法用于集成量子光路的应用实例Fig. 12 Inverse design of hybrid integration of quantum photonic circuits

3 总结与展望

本文总结了遗传算法、基于梯度下降算法和深度神经网络的光子学逆向设计方法,并给出了逆向设计方法在各个光子学领域中的具体应用。传统的设计方法是基于物理规律和先验方法的人为参数调控,其所需要的计算时间通常较长,只适用于优化参数较少的情况。而对于大规模的参数优化问题,开发更高效、设计自由度更高的智能优化算法尤为重要。不同的逆向设计方法所适用的问题场景不同,针对特定的问题需要进行评估选择。其中基于梯度下降的拓扑优化方法收敛速度快,设计变量数目不影响计算规模,但是容易收敛到局部最优解;遗传算法和粒子群算法具有全局搜索能力,但计算量较大,优化的变量数目有限;神经网络算法调控方式灵活多变,可以与多种算法相结合,但是模型缺乏普适性,对于不同的物理模型需要建立对应的数据集。可以看到,不同的逆向设计方法具有不同的优点和局限性,所以对于不同的设计问题,需要对物理模型进行评估从而选择合适的逆向设计方法。

逆向设计方法打破了传统方法的设计局限性,可以在全参数空间中实现高效的参数优化,因此更有可能得到极限性能的设计结构。然而为了释放逆向设计的全部潜力,需要提高模型电磁模拟的计算速度和智能算法的计算效率。由于全波电磁模拟中的一些代数计算可以在大规模图形处理单元(Graphic Processing Unit,GPU)环境下高效并行计算,所以目前主要采用GPU来实现麦克斯韦方程的加速求解。另一方面,为了减少与电磁模拟相关的计算负荷,可以考虑使用物理信息神经网络(Physics Informed Neural Network,PINN)作为近似模拟器来预测电磁波分布。相比于传统的全波模拟器,PINN不会受到存储器的限制约束,因此在三维模拟中更具有计算优势。此外,在纳米光子学中,PINN还可以通过物理剩余和洛伦兹互易的伴随模拟来共同调节,以实现加速训练。除了采用单一的逆向设计方法外,多种方法的结合也有利于提高计算效率,例如将深度学习与遗传算法相结合,不仅可以提高遗传算法的计算速度,还可以利用遗传算法无需梯度的特点寻找全局最优解。

随着计算机科学的不断发展,光子学器件的逆向设计展现出无与伦比的潜力。相比于传统的设计方法,更高效、具有更高自由度的智能逆向设计方法为实现高性能的光子学器件提供了新的解决方案。在光子学的各个领域,通过逆向设计方法都可以实现更高自由度的光场调控,实现从需求出发设计各种高性能的光子学器件。

猜你喜欢

光子逆向光学
《光子学报》征稿简则
滑轮组的装配
逆向而行
光学常见考题逐个击破
在光子带隙中原子的自发衰减
光学遥感压缩成像技术
光子晶体在兼容隐身中的应用概述
Endress+Hauser 光学分析仪WA系列
多光子Jaynes-Cummings模型中与Glauber-Lachs态相互作用原子的熵压缩
逆向工程技术及应用