基于多掩膜技术的无监督深度与光流估计方法
2024-06-01张旭东赵柏淦吴国庆姚建南
上海理工大学学报 2024年2期
关键词:三维重建
张旭东 赵柏淦 吴国庆 姚建南
摘要:针对自动驾驶领域现有方法在处理动态、遮挡等复杂实际场景时存在的估计不准确问题,提出了一种以多掩膜技术为基础的无监督深度与光流估计方法,通过无监督学习从单目视频序列中提取目标深度、相机运动位姿和光流信息。根据不同外点类型设计了多种特定掩膜,以有效抑制外点对光照一致性损失函数的干扰,并在位姿估计和光流估计任务中起到剔除外点的作用。引入预训练的光流估计网络,协助深度和位姿估计网络更好地利用三维场景的几何约束,从而增强联合训练性能。最后,借助训练得到的深度和位姿信息,以及计算得到的掩膜,对光流估计网络进行了优化训练。在KITTI 数据集上的实验结果表明,该策略能够显著提升模型的性能,并优于其他同类型方法。
关键词:無监督学习;深度估计;位姿估计;三维重建
中图分类号:TP 391 文献标志码:A