APP下载

格点量子色动力学数据的虚部分布与信号改进*

2023-11-16洪浩艺高美琪桂龙成华俊梁剑史君邹锦涛

物理学报 2023年20期
关键词:虚部实部格点

洪浩艺 高美琪 桂龙成 华俊 梁剑‡ 史君†† 邹锦涛

1)(华南师范大学,原子亚原子结构与量子调控教育部重点实验室,广州 510006)

2)(华南师范大学量子物质研究院,广东省核物质科学与技术重点实验室,广州 510006)

3)(华南师范大学南方核科学计算中心,粤港量子物质联合实验室,广州 510006)

4)(湖南师范大学物理与电子科学学院,长沙 410000)

通过分析淬火近似下高统计量格点两点关联函数实部与虚部对规范场采样的分布,给出了一种可能的实、虚部分布间的定量关系,并通过计算实部与虚部的非平庸统计相关性对该关系加以验证.利用该实、虚部的统计相关性,格点关联函数的方差可以得到约40%的改进.这些结果为进一步理解格点计算中统计误差的物理来源以及发展信号改进方案提供了全新的思路.

1 引言

在标准模型框架下,量子色动力学(QCD)是描述强相互作用的基本理论.然而,QCD 在强子能区具有非微扰特性,传统量子场论中的微扰解法失效,需要非微扰求解方案.格点QCD 是目前最重要的、从第一性原理出发非微扰求解强相互作用的理论方法,通过将连续的闵氏时空转换到离散的欧氏时空,使强相互作用问题可以通过大规模数值模拟求解.目前,在高能核物理与强子物理领域,格点QCD 计算已逐步成为除实验、理论之外的第三种不可或缺的研究手段[1],取得了一系列重要的研究成果,如文献[2-4]中的工作等.随着格点QCD计算精度的不断提升,其所需计算资源也快速增长,大型的格点研究项目所需算力超过千万CPU小时,使得格点QCD 成为基础研究中消耗计算资源最大的研究方向之一.这促使格点研究一直积极采用如并行计算、GPU 加速、量子计算等新的硬件技术[5];同时,格点QCD也在不断地探索新的数值算法及数据分析方案,从算法和理论角度改进计算效率和信噪比.如近年来χQCD 合作组通过分析算符间有限关联长度对格点数值结果信噪比的影响,提出了集团展开噪声减除方案(CDER)[6],解决了格点计算非连通关联函数的困难,获得了广泛的应用[7-9].

格点计算的统计误差本质上来自于对SU(3)规范场的有限采样,反映了物理可观测量对规范场的依赖,不同可观测量在同一组态样本上的涨落区别很大.理解格点计算结果在组态采样上的分布,并进而发展提升信噪比的格点新方法,是格点研究的基本需求.此外,由于格点QCD 定义于欧氏时空,在使用格点方法研究有限化学势下的物理问题或者重核问题时,会遇到著名的“符号问题”.符号问题的本质也是信噪比问题[10].对格点误差的研究,是理解格点计算中符号问题物理根源的重要途径.格点研究中最常见的计算量为场算符的欧氏时间多点关联函数.由于QCD 中的夸克场和胶子场均为复数场,因而得到的直接计算结果同样为复数,具有实部和虚部两部分.容易证明,若所计算的关联函数在CH 变换下[11]的因子为正,则计算结果的信号只存在于实部中,虚部完全为噪声,在无穷大统计量极限下虚部为零①若CH 宇称为负,则结果在虚部中;若关联函数不是CH 变换的本征态,则实部虚部均有信号.本文只考虑CH 为正的情况,这包括了绝大部分的实际格点计算.,所以在大部分格点计算中,数据的虚部被直接丢弃.然而,近年来有研究发现,在有限统计下,虚部对规范场采样的分布与实部(信号)的误差分布相关.文献[10,12]强调了格点关联函数的分布是对数正态(log-normal)的,并以此为出发点,提出了一种全新的抽取基态能量的统计方法,并使用玩具模型以及真实格点QCD 数据对该方法进行了初步验证.之后,美国华盛顿大学的格点合作组发展了这一想法[13,14],开始同时关注格点数据的虚部与实部分布,并指出相应的复相位对规范场组态采样的分布与格点计算的误差密切相关.在此基础上,提出了在格点关联函数的分析中使用相位重加权的思路提高信噪比.实际上,虚部分布与实部分布的相关性是可以理解的,这是因为它们共同来自于对复值规范场的随机采样.这样的相关性可以帮助理解信号误差的物理来源,进而帮助改进计算结果的信噪比.但是,已有研究尚未能给出相关性的确切形式以及完整有效的信号改进方案.本文通过分析具有非零动量的格点两点关联函数实部和虚部对组态采样的分布,针对实、虚部分布的关系,给出了一种可以合理解释格点数据的数学描述,并由此给出了自洽的信噪比改进方案.

2 两点函数的实部与虚部

在格点研究中,介子两点关联函数是最基本的计算量之一,形式上可以表达为

其中O†(0) 代表粒子的产生算符,O代表粒子的湮灭算符,等式最右边是关联函数的谱分解形式,求和范围是所有与算符O具有相同量子数的哈密顿量的本征态.为精确抽取实、虚部的分布,本文使用由4000 个纯规范组态构成的统计系综,格点大小为 163×192.价夸克作用量为clover 类型[15],有效夸克质量取作奇异夸克质量.为更好地确定采样上的分布随虚时t的变换,在计算中使用了非对称的格子[16],空间方向格距约为0.138 fm,时间方向格距为空间格距的1/5,图1 中横坐标t/at对应格点间距.

图1 纵坐标为对数坐标情况下,不同量子数和不同动量的两点关联函数Fig.1.Two-point correlations function with different quantum numbers and momenta when the vertical axis is in log scale.

本文主要关心标量S,赝标P以及矢量V三种量子数.容易证明,产生、湮灭算符相同的两点函数的CH 宇称恒为正,信号在实部上,两点函数实部的具体行为如图1 所示.可以看到,标量道的值衰减最快,对应质量(能量)最高,赝标道的衰减最慢,对应质量(能量)最低.同时,带一个单位动量(2π/L,L为格子空间长度)的情况比零动量情况衰减更快.这些都是符合物理实际的.

从图1 还可以看到,对于标量情况,实部的相对误差随时间增大而变大.尽管图中其他两种量子数的误差由于绝对值太小而不可见,但可以证明(Lepage 规则[17,18]),除了零动量的赝标道之外,其他量子数或动量的两点函数的误差都是随时间指数增大的[6].这是一个重要的事实,一方面给实际格点计算带来了极大的障碍,但另一方面也给理解误差提供了线索,这一点之后会讨论.现在,同时考虑虚部,重点关注在不同t下p21 的赝标两点函数其实部虚部在规范组态上的分布(图2).通过观察这些分布,可以总结出如下规律.

图2 p2 1 的赝标两点函数其实部(上半部分)虚部(下半部分)在规范组态上的分布,从左至右分别对应 t/at 1,30 和90 的情况Fig.2.The real-part(upper panel) and imaginary-part(lower panel) distributions of the pseudoscalar two-point functions with p2 1 over gauge configurations.From left to right,the figures are for t/at 1,30 and 90,respectively.

i)实部的分布在小t,尤其是在中间t时是不对称的,类似于对数正态分布.这一点可以通过(1)式给出解释:在信号主导关联函数的情况下,由于关联函数恒正,其分布是以零为下限的.小t时两点函数数值较大,下限对分布形状影响不显著;中间t时两点函数数值接近零,下限显著影响了分布函数的形状.

ii)实部的分布在大t时趋向于对称的正态分布,且其统计涨落已经包含了负值.这说明,由于相对误差在不断增加,此时的两点函数已经不再是信号占主导地位了.

iii)虚部的分布一直都接近对称的、以零为中心的正态分布.这符合信号在实部上、虚部在无穷大统计量极限下为零的理论要求.

iv)实部和虚部的分布随时间增大都在变窄(绝对误差在变小).但虚部分布变窄的速度比实部慢.具体而言,在t0处,实部分布的宽度近似为0.1,而虚部分布的宽度小于0.01,相比之下虚部宽度可忽略不计.而在t90处,实部分布与虚部分布的宽度均近似为 1×10-6,二者可比拟.

上述是针对单位动量赝标情形总结的规律,实际上,对其他量子数也同样适用.为了解释以上关于实部、虚部在组态采样上的分布行为,本文提出如下的理论假设:

即实部分布函数R(x) 是虚部分布I(x) 与真实物理信号分布S(x) 的卷积,其中x和y代表规范组态采样,K(Ux) 是一个与规范场Ux相关的核函数.虽然是理论假设,但由于没有限定核函数的性质,(2)式具有理论意义上的普适性.考虑到所有的分布函数均起源于规范组态的采样,理论上分布之间的关系可以通过具体考虑规范场采样得到.为虚部分布增加与规范组态直接相关的核函数修正K(Ux),相当于把规范场采样的涨落显式包含在公式中.

如果进而假设核函数是平庸的,则有

其中⊗表示卷积,即实部分布是信号分布与虚部分布的直接叠加.物理上,这里的虚部分布可以理解为(某种)误差分布,因为我们知道虚部的真值为零,虚部的统计涨落反映了组态采样的随机性.从(2)式或(3)式出发,可以解释所有上述的数值结果.例如,在小t和中间t时,虚部分布的宽度与实部相比小很多,那么就有R(x)~S(x),信号是恒正的,信号分布是对数正态的,所以实部也是一样.而在大t时,信号的值指数衰减到非常趋近于零,分布接近狄拉克δ函数,虚部相对于信号而言更重要(虚部/信号衰减更慢),这时有R(x)~I(x),所以实部的分布趋向于对称,且出现了负值.

实际上,还有更多证据支持(3)式.前面讨论过,根据Lepage 规则,仅有零动量的赝标两点函数的误差不随时间增加而变大.但同时,零动量的赝标两点函数还有一个非常重要的性质:即便是在有限统计下,其虚部也是严格为零的.这是一个很有意思的事实,这说明,对于零动量赝标情形,I(x)是以零为中心的δ函数,R(x)S(x).也就是说,赝标没有虚部,其信噪比也不随时间衰减.这为我们提供了一个自洽的极限例子.如果考虑信噪比改进的话,零动量赝标情况就是我们的目标.当然,(2)式及其特例(3)式的正确性很难从QCD 第一性原理直接导出.本文下一部分将进一步通过考虑实、虚部数据的统计相关性具体验证上述公式.

3 实部与虚部分布的统计相关性

两个分布叠加而成的新分布的均值和方差与原始分布的均值和方差具有确定的关系.如(3)式可以给出

其中E表示分布的均值,V表示分布的方差.类似地,如果把核函数与虚部分布的整体视作一个新的“虚部分布”,则上述关系对于非平庸核函数的情况依旧成立.可以看到,由于方差为非负,所以V(S)≤V(R),虚部分布的宽度越大,信号的方差比实部方差减小得越多.这直接提示我们,不直接使用实部的结果,而是通过(2)式或(3)式抽取信号分布,可以减小格点计算的统计误差.但是,(4)式告诉我们,信号分布S(x) 的均值也同时相对于实部分布R(x) 发生了变换.数值上,既可以直接通过(5)式计算信号分布的方差,也可以利用如Jackknife 重采样方法,在每个重采样样本中根据(4)式计算S(x) 的均值并由此估计S(x) 的分布方差.这是一个非常重要的验证.由重采样方法得到的方差直接反映了信号S在样本上的分布,是更准确的估计,如果两种方法得到的方差不一致,则说明本文的理论出发点是不合理的.物理上,这对应于一个直观的要求:即如果抽取的新分布S(x) 的方差相对R(x) 减小,那S(x) 的均值就需要更接近真值.后文信号部分的所有方差计算均采用重采样方法.

要通过重采样方法得到减小的误差,就需要在每个重采样点上得到的S(x) 的均值都更接近于真值.考虑到Jackknife 重采样的具体形式,即在不考虑组态自相关的情况下,每个重采样样本是样本总体去掉某一个原始样本所得,于是重采样样本的统计涨落与原样本的涨落是同步的.进而可以推知,上述一致性的必要条件是,作为随机变量,虚部和实部是统计正相关的.即如果在某个组态采样上实部大于或小于实部的均值,那么虚部也同时会倾向于大于或小于虚部的均值.考虑到虚部的均值非常接近零,这样在每个采样点上,实部减去虚部之后都会更接近于实部的均值,那么实部的方差就会相应地减小.

实际上,一般地,假设有两个相关的随机变量,O1,O2,满足

其中C表示协方差:

则总会有

即如果O1,O2的协方差大于O2方差的1/2,那 么新随机变量(O1-O2) 的方差减小.进一步考虑O1,O2的统计相关性

具体到关于关联函数实、虚部相关性的讨论取实部为O1,虚部为O2,以上公式可直接用于理解和估计误差改进.例如,之前讨论过,在t较大时,虚部的方差与实部相近,此时有

即误差改进的程度取决于实部和虚部的相关性.当相关性为1时,实部减虚部不再具有误差,当相关性为70%时,方差减为原方差的60%,当相关性小于50%时,方差不再有改进.

以上讨论详细论述了(2)式和(3)式的自洽性,要求关联函数的实部与虚部具有相当的相关性.为了具体验证(3)式,计算了单位动量赝标关联函数在每个t上实部和虚部之间的统计相关性(如图3中蓝色虚线所示).可以明显看到,蓝线在零上下涨落,即在平庸核函数的假设性下,实部和虚部之间并没有表现出具有统计意义的相关性.这直接说明,即便可以解释很多数据现象,(3)式也不足以反映真实的物理.

图3 赝标单位动量两点关联函数实部与虚部的统计相关性.蓝色虚线表示原始数据,橙色实线表示符号修正过的数据Fig.3.Statistical correlations between the real and imaginary parts of the pseudoscalar two-point correlation function with unit momentum,where the blue dashed line represents the original data,and the orange solid one is for the data after sign-correction.

那让我们退回到(2)式.前面已经讨论过,考虑到实、虚部的分布均来自于规范场的采样,加入跟规范场相关的修正核函数K(Ux) 之后,(2)式是具有普适性的.(3)式作为(2)式的简化,相当于取了完全平庸的核函数,这目前看来是不够的.可以进而假设核函数不是完全平庸的,但仅是符号函数,只可能改变虚部的符号.这一点假设实际上是来自于上面对实部虚部相关性的讨论.相关性要求实部虚部在各自均值上下同步涨落,又考虑到虚部的均值非常接近零,那么相关性就要求虚部的正负与实部的涨落方向是倾向于一致的.据此,我们对数据进行修正,改变虚部的符号使其与实部减实部均值的符号相同.所得结果如图3 中橙色实线所示.可以看到,这样修正之后,实部与虚部表现出了较强的关联性(约 70%).

这里需要着重说明的是,由于修正虚部符号的准则是使其与实部的涨落方向同步,图3 的结果似乎陷入了循环论证.但实际上,这里只是修正了虚部涨落的方向,并没有修正虚部涨落的幅度.作为对比,图4 给出了在修正符号的基础上,同时对虚部的值进行随机扰动后的关联性结果.可以看到,即便是1%量级的扰动,也会使相关性降到50%以下.仅有当扰动弱到0.1%量级,相关性才能恢复到没有扰动的情况.这说明,实部和虚部的相关性不仅依赖虚部的符号(涨落的方向),也强烈依赖虚部的大小(涨落的幅度).换言之,如果原本实部和虚部之间没有任何联系的话,仅修正符号是远不足以得到图3 所示的相关性的,图3 展现出的强的关联性是高度非平庸的.这同时也说明,假定核函数K(Ux) 仅是一个符号函数是一个相当经济且有效的假设.修正符号之后,实部和虚部之间的相关性(部分)显现了.此外,值得额外说明的是,在符号修正过程中,约23%的虚部符号由正改为负,约26%的虚部符号由负改为正,修正之后的虚部依旧近似为以零为中心的对称分布,这一点也是一个非常重要的检验.当然将核函数近似为符号函数的有效性还有待通过分析更多更精确的格点数据进一步验证.同时,后续的分析也将对确定核函数的具体形式提供更多的线索及限制.

图4 在修正符号的基础上,考虑对虚部的值进行扰动后的赝标单位动量两点关联函数实部与虚部的统计相关性Fig.4.On the basis of sign-correction,the statistical correlations between the real and imaginary parts of the pseudoscalar two-point correlation function with unit momentum after distortions on the absolute values of the imaginary parts.

4 方差改进结果

在修正虚部符号的情况下,得到实部与虚部具有大约70%的统计相关性.根据前文的讨论,我们期望可以由此改进两点关联函数的信号.利用Jackknife 重采样方法,可以在每次重采样时利用(4)式计算信号分布S(x) 的均值,在得到N(N4000)个重采样均值后,可给出抽取的S(x) 在原始采样数据上的分布方差.得到的数值结果如图5 所示,方差的改进为60%—70%,这与(12)式给出的结果一致.值得注意的是,不同量子数的情况是基本相同的,也就是说,实部与虚部之间的关联是与观测量的具体形式无关的.

图5 不同量子数两点关联函数的方差改进Fig.5.The variance improvements of two-point correlation functions with different quantum numbers.

目前为止,本文关注的主要是动量为一个格点单位动量的情况.一个直接的原因是零动量的赝标两点函数是纯实的,无法从虚部入手改进.实际在物理上,非零动量的两点关联函数的虚部可以看作是 规范场采样在空间方向上的涨落导致的.具体地,动量投影可分为实部虚部两部分.这里余弦是偶函数,正弦是奇函数,所以如果关联函数在空间上是对称的,则仅有实部留存.但在有限统计下,规范场在空间正反方向上有涨落,关联函数在空间的正反方向上就不完全对称,导致有限的虚部.从这个角度出发,我们还计算了不同动量情况下关联函数实部虚部的相关性以及方差改进,矢量道的数值结果如图6 所示.可以看到,与动量为1 的情况类似,对高动量的两点函数也可以获得类似的改进.限于目前的数据精度,不同动量情况下方差改进的区别和规律还不明晰.

图6 不同动量矢量两点关联函数的方差改进Fig.6.The variance improvements of two-point correlation functions with different momenta.

5 总结与展望

本文通过分析非零动量格点两点关联函数实部与虚部对组态采样的分布,提出了R(x)S(x)⊗[I(y)K(Uy)] 的理论猜想.并在假设核函数K(Uy)仅体现符号修正的前提下,数值验证了实部与虚部的统计相关性,同时说明了该统计相关性是高度非平庸的,体现了实部与虚部的内在关联.由此,通过抽取真实信号分布S(x),给出了利用虚部分布改进格点信号的一种可能,数值结果显示,两点关联函数的方差可以降到改进前的约60%.

虽然目前得到的改进并不十分显著,但原则上,如果可以全知核函数K(Ux) 的形式,或者对核函数有更强的约束,则可以进一步得到更强的相关性和更有效的误差改进.这需要更精确的格点数值结果与先进的算法技术.本质上,通过分析有限的实部与虚部分布完全确定积分中的信号分布和核函数属于求逆问题,是没有唯一解的.但近年来格点领域出现了很多新的算法(如文献[19-21]等),可以在考虑先验条件的情况下给出求逆问题的最可能的解.利用这些算法进一步探索格点数据实部虚部的关系,帮助理解格点计算的误差,为解决符号问题提供新的思路,是我们正在进行中的工作.

感谢美国肯塔基大学刘克非教授和中国科学院理论物理研究所杨一玻研究员的早期工作和讨论.本工作的数据产生和数据分析分别在湖南师范大学湘江一号计算机群以及华南师范大学南方核科学计算中心完成.

猜你喜欢

虚部实部格点
带有超二次位势无限格点上的基态行波解
复数知识核心考点综合演练
一种电离层TEC格点预测模型
两类特殊多项式的复根虚部估计
例谈复数应用中的计算两次方法
带可加噪声的非自治随机Boussinesq格点方程的随机吸引子
浅谈正Γ型匹配网络的设计
格点和面积
一种基于电涡流和实部互阻抗检测的金属温度监测方法