APP下载

自监督非等距三维模型簇对应关系计算方法

2024-04-26张思洋

模式识别与人工智能 2024年3期
关键词:等距集上文献

吴 衍 杨 军 张思洋

计算三维模型之间的密集对应是几何处理、计算机视觉及相关领域中的一个经典问题,是统计形状分析[1]、配准[2]、目标跟踪[3]和3D重建[4]等诸多应用的核心技术.

尽管三维模型对应关系计算已被研究多年,但非等距模型的匹配问题仍面临诸多挑战.等距模型的对应关系计算可遵循一个目标准则,即保证模型间对应两点的测地距离相同,这相对容易实现.非等距模型的对应关系计算无明确的准则可遵守,在这种情况下,大多数非等距模型对应关系算法的主要做法有:1)在两个模型上提前加入语义上有意义的对应点(标志点),利用这些真实值对应点指导算法进行计算[5];2)在计算过程中追求尽量少的局部度量失真,以此逼近最优解[6].这些传统做法需要人工制作标志点,算法效率较低,并且在不同数据集上效果各异,导致泛化能力较差.

大量的实际应用需要处理非等距三维模型,因此研究者提出一些经典的非等距三维模型对应关系算法.由于非等距模型的对应关系计算不能使用保持测地距离相同这一准则,因此,Mandad等[7]提出一种直接优化两个不同形状表面之间最小化方差的最优传输方案,规定区域变形的界限,计算出的映射遵守的规则是尽可能保持角度不变,但随着模型顶点数的增加,算法的收敛速度呈指数下降.Ezuz等[8]最小化前向和后向映射的狄利克雷能量,实现非等距三维模型对应关系计算,利用可逆性约束,生成具有双射性的非等距模型映射,但算法需要进行欧几里得空间的高维嵌入,并且使用半二次方分裂(Half-Quadratic Splitting)进行目标问题优化,因此计算过程繁琐.Edelstein等[9]提出ENIGMA(Evolu-tionary Non-Isometric Geometry Matching),将遗传进化算法结合到对应关系算法中,设计几何引导遗传算子,实验证实算法对非等距模型的对应关系计算是有效的,然而算法的初始化需要使用标志点,效率不高,容易引入噪声.Eisenberger等[10]提出Smooth Shells,是一种全自动的非等距三维模型对应关系算法,利用模型的拉普拉斯特征函数与三维坐标信息对齐,并且使用马尔科夫链蒙特卡罗(Markov Chain Monte Carlo, MCMC)计算优化问题,算法的不足在于拉普拉斯特征函数过于强调模型的全局信息,容易忽略局部信息.Panine等[11]提出一种基于Func- tional Maps(FM)并结合标志点辅助计算的非等距三维模型对应关系算法,利用固有斯捷克洛夫算子特征分解,引入一种自适应标志点基,在此基础上实现共性映射的函数分解,效果较优,然而,算法需要标志点辅助,无法完全自动构建非等距三维模型对应关系.

在三维模型簇对应关系计算上也存在诸多难点,算法需要同时处理多个模型匹配计算.原则上,任何三维模型对的对应关系算法都可用于三维模型簇对应关系计算,这是因为一部分传统的三维模型簇对应关系算法都使用参考的模板模型,解决其它模型与模板模型的匹配问题.然而这类方法的计算误差很大,多个模型间的映射难以满足“循环一致性”的准则.

随着深度学习技术的快速发展,研究人员尝试引入深度学习以解决三维模型簇对应关系的计算问题,杨军等[18]结合三维点云模型包含的特征信息,优化FM矩阵,协同计算三维模型簇对应关系,提出无监督三维模型簇对应关系协同计算的方法,提高非刚性变换的三维模型簇对应关系计算的准确率,然而算法难以处理非等距三维模型簇.Cao等[19]提出基于FM的无监督三维模型簇对应关系算法,不依赖明确的模板模型,使用全局分类器预测多模型之间的匹配,结合循环一致性,可得到最优结果.

在残缺的三维模型簇对应关系计算领域,为了解决多个非刚性的残缺模型与完整模型的对应关系问题,Litany等[20]以联合优化的方式构建残缺模型簇算法,在算法框架中加入空间域和谱域的正则化项,提高计算精度,但是算法需要在空间域和谱域中交替优化,加大运算的复杂度.残缺三维模型簇对应关系计算容易受到部分模型残缺度增大以及拓扑噪声的影响从而导致准确率下降,Wu等[21]针对上述问题,提出可同步计算多个部分模型和完整模型对应关系的算法,然而算法仍存在一些待改进之处,如全谱域特征值对齐算法需要较大特征值的个数以处理高频的本征信息、算法难以处理非等距残缺模型等.

综上所述,非等距的三维模型簇对应关系计算依然处在理论研究的初步探索阶段,存在算法严重依赖FM理论、非等距三维模型对应关系计算准确率较低且难以实现自动计算、大部分三维模型簇对应关系计算需要模板模型作为参考、算法泛化能力较差等问题.

针对上述问题,本文提出采用深度内外特征对齐算法的自监督非等距三维模型簇对应关系计算方法.方法不依赖FM,而是使用内外特征对齐算法计算非等距三维模型对应关系,将LMH(Localized Manifold Harmonics)基[6]作为本征信息,结合笛卡尔坐标等外部信息,同时将这种非等距模型的匹配流程构建为无监督的深度神经网络,以端到端的方式训练.方法不需要使用模板模型作为三维模型簇对应关系计算的参考依据,而是将多模型表示为加权无向完全图,以自监督的方式对模型图的最短路径执行循环一致性优化,在相似的几何模型上寻找内在相关性,提高非等距模型簇对应的准确性,消除拓扑噪声对对应关系结果的影响.

1 自监督非等距三维模型簇对应关系计算方法

1.1 方法步骤

为了解决现有非等距三维模型簇对应关系计算算法准确率较低、泛化能力较差的问题,本文提出采用深度内外特征对齐算法的自监督非等距三维模型簇对应关系计算方法,总体框架如图1所示.

图1 本文方法总体框图

本文方法主要由深度内外特征对齐算法和自监督多模型匹配算法(Self-Supervised Multi-shape Ma-tching, SSMM)组成.具体实现步骤如下.

1.2 深度内外特征对齐算法

1.2.1 特征提取网络

三维模型对应关系计算的前提是将原始形状的几何模型生成有意义的特征,特别对于大尺度变形的三维模型,更需要准确稳定的特征提取算法.本文采用DiffusionNet构建特征提取网络,不仅可以较好地处理非刚性变换的三维模型,还对使用离散化表示的三维模型具有较强的鲁棒性.

DiffusionNet主要依靠简单的可学习扩散层(Diffusion Layer, DL),取代模型表面上复杂且昂贵的卷积和池化操作,基本原理如下.

首先,在连续的前提下,将三维模型上的标量场信息u(t)的特征传播建模为热扩散模型,使用热方程表示如下:

其中ΔM为M的LBO(Laplace-Beltrami Operator).该扩散行为可通过热运算符ht表示,定义为

ht(u(0))=etΔMu(0),

其中u(0)为初始分布.

然后,在实际情况下,考虑模型离散状态,将模型的LBO表示为一个稀疏矩阵:

L=A-1O=ΦΛΦTA,

Ht(U)=Φ[e-λ1te-λ2t…]T⊙(ΦTAU)

,

(1)

其中,⊙为矩阵点乘,根据[e-λ1te-λ2t…]T对谱系数ΦTAU的逐元素缩放调整可方便表示为时间t的热扩散.式(1)使用稠密线性代数运算(经典的向量和矩阵运算)以求解.

最后,计算模型曲面上每个点的切平面特征信息的空间梯度内积,与式(1)的结果馈送到每个点的多层感知机(Multilayer Perceptron, MLP)中,获得模型特征Finit.

1.2.2 内外特征一致性对齐算法

传统算法大多简单利用笛卡尔坐标等外部特征描述三维模型,或像FM一样依赖模型谱域本征信息进行计算,难以保证计算准确率,因此在不同数据集上效果各异.

本文结合深度学习与内外特征一致性对齐算法[25],融合基于局部刚性变换准则[26]的形变算法,利用LMH基表示模型的本征特征,将其与外部信息嵌入内外积空间中,描述模型对齐过程,以此计算非等距模型对的对应关系.算法过程如下.

中.LMH基比LBO基更适合描述模型本征特征的原因在于它既能捕获LBO特征基的全局信息,也保留模型的局部细节.

定义新的内外积空间,将模型M和N嵌入该空间中,特征分别表示为

结合模型外部特征和本征特征,将模型的外部坐标矩阵投射到前k个LMH基上,在谱域上重建光滑曲面,是一种可替代外部坐标的模型算子.由于LMH的特征基也是按频率排序的,所以随着k值的增大,可获得模型从粗到细的谱表示.

2)对模型M进行变换.根据局部刚性变换准则的形变算法,采用线性位移和本征函数变换描述内外融合特征形变,定义为

其中,DKL为连续高斯混合模型分布和狄拉克分布之间的KL散度,‖Γ‖2为洁洪诺夫正则化,Γ为促进平滑的低通运算符,ρ>0为控制正则化的权重.在能量函数Ealign中,将点对点映射还原问题看作求解概率密度估计问题,这样保证是可微的,使算法的标准梯度优化可行.

4)采用基于交替方向乘子算法[27]的优化策略求解优化问题

具体步骤如下.

(1)求解

(2)分别求解

k值初始化为0.

(3)重复(2),k值加1,直到k值到达设定的阈值K为止.

5)定义深度内外特征对齐算法网络的损失函数:

1.3 自监督多模型匹配算法

因为G为无向图,而Si到Sj与Sj到Si的对齐程度是不一样的,因此取两者的最小值(即两者最相似度量值)作为权重ωij,最大程度减少误差.ωij定义如下:

ωij=

(2)

γ1i=(S1,S2,…,Si),

根据循环一致性,可得其匹配组合映射结果

在加权无向图中,可求解这个匹配组合的最短路径,通过最短路径匹配组合计算的映射结果比两个模型直接对应的结果更精确.本文采用SPFA计算最短路径.SPFA的原理是通过对图进行多次松弛操作,得到所有可能的最短路径,再筛选后得到最优解.图G中顶点Si和Sj之间最短路径γij定义如下:

(γij)shortest=(Si,Sq,…,Sz,Sj)shortest=SPFA(G,Si,Sj).

在最短路径γij下三维模型簇映射结果定义为

(3)

定义SSMM的损失函数:

(4)

损失函数Lcoll对深度内外特征对齐算法网络产生的映射结果与最短路径下三维模型簇映射结果的不一致进行惩罚,修正三维模型簇对应关系计算的循环一致性.

区别于有监督算法,SSMM未使用先验知识,式(2)~式(4)中的模型间映射结果与模型的内外融合特征完全由深度内外特征对齐算法计算而成,三维模型簇对应关系计算的训练依据完全由自身算法计算而来,因此SSMM是一种自监督的方式.

定义总的损失函数:

L=Lpair+αLcoll,

其中,α为加权超参数,用于平衡正则化项的权重.通过反向传播更新网络模型参数以不断优化损失函数L,迭代此过程直至网络收敛.

2 实验及结果分析

2.1 实验环境及参数设置

本文方法的编程语言为Python 3.8.8,运算平台为CUDA-Toolkit 11.3版本,采用Cudnn8.8.0作为CUDA上深度学习相关的工具库,深度学习框架为Pytorch-GPU,版本号为1.11,硬件支撑为Core i7处理器和NVIDIA GeForce RTX 3080 GPU(12 GB显存)处理器.

实验中设置批处理尺寸大小为53,使用Adam(Adaptive Moment Estimation)优化器以端到端的方式训练,训练过程迭代10 000次.k值的阈值K设为30,这是因为随着k值从0逐渐增至30,模型对之间的对应关系质量逐步提高,而超过30的k值不再影响计算结果的优劣.加权超参数α设为0.6,原因在于模型簇损失函数Lcoll是根据模型对的结果进行自监督启发构建的,理论上应确保模型对的对应优于模型簇的对应,因此给予模型对损失函数Lpair更高的权重,经过优化实验,发现Lcoll权重值设为0.6时效果最优.

本文选择CONSISTENT ZOOMOUT[14]、ISOMU- SH[17]、文献[19]算法、文献[28]算法和文献[29]算法进行非等距模型簇对应关系计算的定性对比.CONSISTENT ZOOMOUT将ZOOMOUT与三维模型簇算法结合,效果显著.ISOMUSH是基于模板的三维模型簇对应关系算法,和FM也有密切的联系.文献[19]算法是一种基于FM的深度学习算法,使用Adam优化器训练10 000个迭代周期,学习率为0.001.文献[28]算法也是基于深度函数映射的非等距三维模型簇对应关系算法,同样使用Adam优化器训练10 000个迭代周期,学习率为0.000 2.文献[29]算法是非刚性模型对(两个模型)的对应关系算法,虽然并不是针对模型簇的算法,但是采用近似基函数和可扩展上采样算法,生成的对应关系结果质量较高,是具有代表性的非刚性模型对应关系算法.

为了和上述模型簇对应关系算法公平对比,使用算法依次计算模型簇中每个模型对的对应关系结果.

在定量实验中,为了进一步验证本文方法的有效性,除了使用上述5种对应关系算法,还加入经典的对应关系算法ENIGMA[9]、Smooth Shells[10]、文献[11]算法、FM[5]、ZOOMOUT[15]进行定量对比.

2.2 实验数据集

本文选择SMAL[30]、DEFORM THINGS4D-MA- TCHING(简记为DTM)[31]、SHERC′16 Topology(简记为SHERC′16T)[32]、SHERC′19[33]、FAUST[34]、SCA- PE[35]这6个三维模型数据集进行定性实验和定量实验.

SMAL数据集包含13类动物,共50幅三维图像,这些图像都是通过扫描动物雕像得到.DTM数据集是一个基于DEFORM THINGS4D数据集[36]的合成图像数据集,包含56个动物类别和8个类人类别,每个类别包含15~50个不同姿态的三维图像.SHERC′16T数据集由25个非刚性变换的三维模型组成,这些模型中有大量拓扑伪影噪声.SHERC′19数据集由430个具有不同连通性和网格分辨率的人体模型组成,使用11个不同数据库的44个人类模型.FAUST数据集包括10个不同人体模型,每个人体以30个不同的动作进行扫描,得到300个高分辨率三角网格模型.SCAPE数据集由72个具有不同连通性和网格分辨率的人体模型组成,每个人体模型的动作各异.

2.3 定性实验

本文方法与CONSISTENT ZOOMOUT、ISOMUSH、文献[19]算法、文献[28]算法和文献[29]算法在SMAL数据集上构建的非等距模型簇对应关系结果对比如表1所示,使用颜色迁移方式(对应点使用相同的颜色)定性评估算法对应关系结果的准确性.图中源模型为马,目标模型分别为狐狸、狼、牛和狗.由表可见,CONSISTENT ZOOMOUT虽然不是传统的依靠模板模型的三维模型簇对应关系算法,但依然需要其它的模型间对应关系算法提供初始化模型对的映射矩阵,容易引入噪声,因此在4个目标模型的四肢上均出现不连续的斑块,牛背部的左右对应关系也是错误的.ISOMUSH利用模型簇构造虚拟的公共模型作为模板模型,但是构造非等距模型簇的公共模板模型是有难度的,由第3列可看出,狐狸的可视化效果不平滑,呈现斑点状且大面积对应失真,这说明模板模型在狐狸上的匹配是失效的,同时算法也受模型自身对称性的影响,其它3个目标模型的左右对应关系结果都是错误的.

表1 SMAL数据集上6种算法构建的非等距模型簇对应关系结果

文献[19]算法是基于FM的深度学习方法,从结果可看出,模型整体对应结果大致正确,只是狐狸的匹配质量不高,尾巴、背部等无法正确辨识,在其它目标模型上也出现一些局部的错误映射,视觉上呈现局部的不平滑.

文献[28]算法分别从谱域和空间域的角度上计算模型簇的循环一致性,并融合结果以提高非等距模型对应关系计算准确率.算法总体对应关系较平滑,但最大的问题在于牛、狗时存在因模型自身对称性导致的错误匹配.与此类似,文献[29]算法也存在无法区分对称区域的问题,细节处理不够精细,模型颜色的“断层”现象更明显,如狐狸的头部与牛的四肢,这是因为一旦模型对应关系结果中出现大量噪声,模型对的对应关系算法就无法像模型簇对应关系算法那样利用多模型的循环一致性消除单个模型对的噪声.

本文方法也存在一些瑕疵,如狐狸的腹部和狼的脖颈处有些不平滑,然而相比其它算法,本文方法对应关系准确率最高,语义颜色信息也相对最平滑自然,能有效区分模型对称特性,解决模型自身对称性影响对应关系计算的问题,计算出高质量的非等距模型簇的对应关系结果.

各对比算法在DTM数据集上构建的非等距模型簇对应关系结果对比如表2所示,源模型和目标模型都是类人的合成模型,源模型为Crypto,目标模型分别为Drake、Prisoner、Skeletonzombie、Ortiz.

表2 DTM数据集上6种算法构建的非等距模型簇对应关系结果

由表2可看出,CONSISTENT ZOOMOUT在DTM数据集上受模型自身对称性的影响较小,算法的更多问题在于对应失真,初始化参数噪声对算法的影响是致命的.ISOMUSH的4个目标模型的结果都出现模型左右对应错误的现象,有严重的总体误差,算法很难处理非等距模型.文献[19]算法的结果局部是平滑的,但全局并不平滑,视觉上呈现斑点状,同时部分模型在全身各个区域也都无法产生正确的对应结果.文献[28]算法的计算结果质量较低,可视化效果不够平滑,算法容易受到模型自身对称性的影响,在第2个模型的左右对应关系和第4个模型的上下对应关系中都存在错误.在文献[29]算法的结果中,只有第1个模型的匹配质量较高,其它模型都出现严重失真,这表明模型对的对应关系算法无法像模型簇算法那样将高质量的对应关系结果用于辅助其它模型的协同一致计算.

本文方法在多模型匹配上,利用最短路径的循环一致性,以尽可能多的上下文信息(包括所有训练模型的共同特征和显著几何特性等)实现模型簇对应关系计算,越多的模型训练可学到越多的形状拓扑结构.即使在一些特殊模型上,如第2个目标模型,其右边的断手和左边的完整手都可正确映射到源模型上,说明本文方法的计算结果在保持良好局部细节的同时总体误差最小.

各对比算法在SHERC′16T数据集上构建的非等距模型簇对应关系结果对比如表3所示.SHERC′16T数据集上的三维模型含有大量的拓扑伪影噪声,这些噪声是由三维模型的部分重叠造成拓扑合并与变形产生的,如第1个与第2个目标模型的小腿弯曲造成的表面区域的重叠、第3个和第4个目标模型的手与脚的接触处等.表3中源模型编号为kid00,目标模型编号分别为kid05、kid09、kid16、kid22.

表3 SHERC′16T数据集上6种算法构建的非等距模型簇对应关系结果

由表3可看出,CONSISTENT ZOOMOUT在第3个和第4个模型全身各个区域上都无法产生正确的对应结果.ISOMUSH可处理第3个模型的拓扑伪影噪声,但在第4个模型的区域重叠处对应计算错误,而且其它模型的局部细节处理不够平滑,如第1个与第2个模型的两个手掌、手臂处.文献[19]算法结果中大部分模型的对应关系可视化效果较平滑,但第4个模型的拓扑伪影噪声处理失败,模型手掌与脚映射到同一个位置.文献[28]算法在处理拓扑伪影噪声方面表现较成功,但在局部细节方面仍不够平滑,对应关系的质量也不高.文献[29]算法无法有效处理模型的拓扑伪影噪声,甚至在第4个模型的各个区域都无法产生正确的对应结果.本文方法虽然也存在一些问题,如第2个模型和第4个模型大腿处对应效果不平滑,但对所有模型拓扑伪影噪声处的对应计算大致正确,整体对应误差最小,由此说明本文方法可较好地解决拓扑伪影噪声问题.

本节通过纹理迁移展示各对比算法在SHERC′19、DTM数据集上构建的对应关系,具体如表4所示.纹理迁移可直观展示算法双射性的优劣,反映映射结果的质量.

表4 各算法在SHERC′19、DTM数据集上通过纹理迁移得到的对应关系结果

在SHERC′19数据集上,源模型为男人模型,编号为33;目标模型为女人模型,编号为41.在表4局部的放大框上可看出,受模型自身对称性结构的影响,CONSISTENT ZOOMOUT和文献[28]算法出现左右颠倒映射的问题,ISOMUSH和文献[19]算法出现大面积的对应失真,文献[29]算法的结果有严重的总体误差,而本文方法较好地处理模型自身对称性影响对应关系计算的问题,目标模型的其它位置也基本没有对应失真.

在DTM数据集上,源模型为ravenOL,目标模型为duck.CONSISTENT ZOOMOUT依然出现左右颠倒对应,ISOMUSH、文献[19]算法和文献[28]算法总体误差很大,特别是文献[19]算法,在不同数据集上的表现良莠不齐,说明算法在不同数据集上的泛化能力不足,文献[29]算法的失真也很严重,说明该算法并不能处理非等距模型.本文方法映射的连续性最好,总体映射误差最小,纹理迁移的结果最接近真实值,说明双射性优于其它算法.

各对比算法在FAUST、SCAPE数据集上构建的模型簇对应关系结果对比如表5所示.FAUST、SCAPE数据集上存在扫描噪声和模型自身对称性歧义等挑战,可有效测试算法的性能和准确度.在FAUST数据集上,源模型编号为tr_reg_083,目标模型编号为tr_reg_097.在SCAPE数据集上,源模型编号为mesh007,目标模型编号为mesh032.

表5 各算法在FAUST、SCAPE数据集上构建模型簇对应关系结果

由表5可见,CONSISTENT ZOOMOUT、ISOMU- SH和文献[29]算法在2个数据集上都出现模型左右或前后对应错误的情况.虽然文献[19]算法和文献[28]算法在两个数据集上的整体对应关系大致正确,但是对应关系质量不高,细节上也不够平滑,手臂和大腿处存在与周围颜色不连接的区域.本文方法也存在一些瑕疵,如在SCAPE数据集上右肩膀出现不平滑的颜色断层,表明出现一些错误的映射分布,然而本文方法总体准确率最高,语义颜色信息最平滑自然,由此说明本文方法具有最强的泛化能力.

2.4 定量实验

本节在SMAL、DTM、SHERC′16T、SHERC′19、FAUST、SCAPE这6个数据集上定量评估各算法计算非等距三维模型簇对应关系的能力.

本文方法与CONSISTENT ZOOMOUT、ISOMU-SH、文献[19]算法、文献[28]算法和文献[29]算法在不同数据集上的测地误差曲线如图2所示.测地误差曲线是一种累积分布曲线,用于指示算法对应关系的性能.

(a)SMAL (b)DTM (c)SHREC′16T

由图2可见,在SMAL数据集上,本文方法在测地误差为0时对应关系准确率就超过其它5种算法,并且在测地误差为0.1时达到100%的对应关系准确率,比效果次优的文献[19]算法准确率提升约10%.在DTM数据集上,6种算法在测地误差为0.25之前都未达到100%的准确率,这是因为该数据集是合成图像数据集,含有大量的拓扑伪影噪声,而且非等距模型的变形程度很大,即使测地误差很大时也难以达到完全的正确对应.在SHREC′16T数据集上,本文方法与文献[19]算法、文献[28]算法的曲线很接近,在测地误差为0.1时都达到100%的准确率,然而在测地误差小于0.1时还是有一定的优势,而且匹配精度也远高于其它3种算法.在SHERC′19数据集上,本文方法取得最优结果,准确率比其它3种算法都有较大提升,比排名次优的文献[19]算法准确率提升约50%.FAUST、SCAPE数据集包含对真实人体的扫描数据,数据采集过程中可能受到伪影噪声的影响,本文方法、文献[19]算法和文献[28]算法都能有效处理伪影噪声,然而,相比文献[19]算法和文献[28]算法,本文方法更早达到100%的准确率,因此,本文方法的结果更接近于真实情况.

从上述的定量结果可看出,在非等距三维模型簇对应关系计算上,本文方法比其它5种算法更精确,在不同数据集上的计算结果差异更小,说明泛化能力更强.

为了进一步验证本文方法的性能,在6个数据集上使用文献[38]提出的度量算法进行定量对比,指标采用准确度和双射性.算法包括非等距模型簇对应关系算法CONSISTENT ZOOMOUT、ISOMUSH、文献[19]算法、文献[28]算法,以及模型对的对应关系算法ENIGMA、Smooth Shells、文献[11]算法、FM、ZOOMOUT和文献[29]算法.使用平均测地误差衡量每种算法的准确度,并通过模型之间复合映射的平均测地误差评估双射性.源模型X与目标模型Y之间的复合映射记为

ΠXX=ΠXYΠYX.

各算法在6个数据集上的准确度和双射性对比如表6所示,表中黑体数字表示最优值.由表可见,本文方法在所有数据集的测试中都表现出最佳的准确度和双射性,说明本文方法逐点映射的质量也是最优的.与本文方法最接近的是文献[11]算法和ZOOMOUT,然而,文献[11]算法需要标志点的辅助计算,ZOOMOUT的计算结果受初始化参数质量的影响.本文方法能在自动化计算的同时,实现最优的对应结果.

表6 各算法在6个数据集上的准确度和双射性对比

2.5 消融实验

首先定义如下4种设置:不包含LMH基、不包含SSMM、不包含LMH基和SSMM、包含LMH基和SSMM.在SMAL、DTM、SHREC′16T、SHERC′19数据集上的消融实验结果如表7所示,表中数据为平均测地误差,黑体数字表示最优值.

表7 本文方法消融实验结果

由表7可见,在不包含LMH基的设置下,本文方法使用LBO基,平均测地误差明显提高,这是因为LMH基可结合模型的局部细节和拉普拉斯特征函数获得全局信息,相比LBO基,可提高算法对应关系计算的准确率.在不包含SSMM的设置下,本文方法仅使用深度内外特征对齐算法计算模型对的对应关系,准确率也有所降低.如果LMH基和SSMM都不使用,平均测地误差是最高的,说明算法的不同组成部分相辅相成,都删除的话会大幅增加平均测地误差.如果同时使用LMH基和SSMM,平均测地误差最低,这说明本文方法可有效提高非等距模型簇对应关系计算的准确性.

4.6 运行时间

本节对比本文方法与CONSISTENT ZOOMOUT、ISOMUSH、文献[19]算法、文献[28]算法在SMAL、SHERC′16T、SHERC′19、DTM、FAUST、SCAPE这6个数据集上计算一组非等距模型簇(包含5个非等距模型)对应关系所需的平均运行时间.由于模型对的对应关系算法需要手动依次计算模型簇中每个模型对的对应关系,因此没有参与模型簇算法对比.CONSISTENT ZOOMOUT和ISOMUSH需要其它算法提供初始化模型对的映射矩阵,在实验中采用最简单快速的FM生成初始化参数,因此两种算法实际运行时间要加上FM计算的时间.

各算法运行时间对比如表8所示.由表可见,CONSISTENT ZOOMOUT受模型点数增加的影响较小,在4种顶点数不同的数据模型上运行时间差不多.ISOMUSH基于模板模型进行计算,运行时间与模型顶点数呈正比.本文方法、文献[19]算法和文献[28]算法都是基于深度学习的算法,不需要使用模型对初始化参数,运行时间不考虑初始化和训练时间,只计算网络模型的计算测试时间.文献[19]算法通过分类器预测模型到模板的匹配结果,运行时间是4种算法中最短的.文献[28]算法采用双分支的网络结构,需要在空间域和谱域上交替优化计算,运行过程十分耗时.本文方法的运行时间与模型顶点数相关,实际运行时间仅次于文献[19]算法.由此可看出在计算高质量的非等距三维模型簇对应关系结果的同时,本文方法在运行时间上也具有优势.

表8 各算法在6个数据集上的运行时间对比

3 结 束 语

非刚性的三维模型对应关系计算是计算机视觉和图形学中的一个核心问题,而非等距三维模型簇对应关系计算更是该问题中的难点.本文提出一种采用深度内外特征对齐算法的自监督非等距三维模型簇对应关系计算方法,主要由深度内外特征对齐算法和自监督多模型匹配算法(SSMM)组成.深度内外特征对齐算法采用DiffusionNet构建特征提取网络,获取模型初始特征,使用LMH基描述模型本征信息,结合笛卡尔坐标等外部信息实现内外特征对齐,计算模型对(两个模型)的对应关系结果,为后续的自监督模型簇算法提供训练标签数据.SSMM将非等距模型簇构建为加权无向完全图,采用SPFA计算模型图最短路径,使用已知的模型对对应关系结果,不断优化最短路径的循环一致性,计算最优非等距模型簇映射结果.实验表明,相比现有三维模型簇对应关系算法,本文方法计算的非等距三维模型簇对应关系结果更准确,在不同数据集上的泛化能力更强.

然而,本文方法仍存在一些需要改进之处.例如:LMH基与LBO基一样,适用于三角网格表示的近等距模型,对点云模型效果不佳,处理非等距模型也很费时.此外,SSMM对模型数量有具体要求,需要至少4个以上模型传递潜在的拓扑结构信息才有较优的计算结果.这些问题都是今后需要继续研究和改进的方向.

猜你喜欢

等距集上文献
平面等距变换及其矩阵表示
Hostile takeovers in China and Japan
拟凸Hartogs域到复空间形式的全纯等距嵌入映射的存在性
Cookie-Cutter集上的Gibbs测度
链完备偏序集上广义向量均衡问题解映射的保序性
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
复扇形指标集上的分布混沌
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
保持算子束部分等距的映射