MonoSLAM

第一个实时的单目SLAM系统[1]。以EKF为后端,追踪前端稀疏的特征点。状态由相机运动参数和所有三维点构成,每个特征点的位置服从高斯分布,其概率偏差可以用一个椭球表示。

PTAM

PTAM[2]首次提出跟踪与建图的并行化;不同于[1]中使用的传统滤波器,PTAM首次在后端使用了非线性优化;引入了关键帧机制,不精细处理每一张输入图像,而是优化几个连续keyframe的轨迹和地图。

KinectFusion

RGB-D实时稠密重建的开山之作[3],掀起了基于消费级深度相机三维重建的研究热潮。以TSDF模型更新表面,tracking部分使用frame-to-model的策略进行ICP配准,抛弃了传统RGB重建中的核心--特征点。

VoxelHashing

用Volumetric fusion的方式重建时,空间被划分成voxel,重建范围大小收到显存大小限制。[4]提出只在场景表面划分voxel,并将其用哈希表存储,从而使大规模重建成为可能。

InfiniTAM

VoxelHashing的改进版本[5],速度更快并且可以在移动端实时运行。代码跨平台,各模块分离,易读且方便扩展,但是重建结果不带color。理论创新不是很大,更像是一个框架性的系统工程。

BundleFusion

为了解决大规模重建时相机轨迹的漂移,[6]引入了特征点,对输入的每一帧都会进行全局优化,修正过去已有帧的相机位姿,类似于Structure from Motion里的bundle adjustment,而不进行显式的loop closure检测。相应地,重建部分除了integration也有deintegration,根据优化后的历史帧相机位姿修正重建结果。其relocalization效果也十分惊艳。代码由VoxelHashing一脉相承,需要两块GPU才能实时,并且需要记录每一帧的信息,内存需求会随重建时间增长而增大。对比ICP为tracking的方法,其对于弱纹理场景无能为力。

To be continued...

参考文献

[1] Davison A J, Reid I D, Molton N D, et al. MonoSLAM: real-time single camera SLAM[J]. IEEE Trans Pattern Anal Mach Intell, 2007, 29(6):1052-1067.
[2] Klein G . Parallel tracking and mapping for small AR workspaces[C]// Proc. Sixth IEEE and ACM International Symposium on Mixed and Augmented Reality (ISMAR 2007), Nara, Japan, Nov. IEEE, 2007.
[3] Newcombe R A, Izadi S, Hilliges O, et al. KinectFusion: Real-time dense surface mapping and tracking[C]// IEEE International Symposium on Mixed & Augmented Reality. 2012.
[4] Nie?Ner M , Zollh?Fer M , Izadi S , et al. Real-time 3D reconstruction at scale using voxel hashing[J]. ACM Transactions on Graphics, 2013, 32(6):1-11.
[5] Prisacariu V A, Kähler O, Golodetz S, et al. InfiniTAM v3: A Framework for Large-Scale 3D Reconstruction with Loop Closure[J]. 2017.
[6] Dai A, Nießner M, Zollhöfer M, et al. BundleFusion: real-time globally consistent 3D reconstruction using on-the-fly surface re-integration[J]. Acm Transactions on Graphics, 2017, 36(4):76a.