Structure from Motion

本文最后更新于：2024年10月15日下午

SFM，即Structure from Motion，中文常称为“运动恢复结构”，是一种计算机视觉技术，本文记录简要流程。

一般采用SIFT算子,因其具有尺度和旋转不变性

匹配

图像对两两匹配,一般采用欧式距离.有两种方法：

当距离小于一定阈值的时候就认为匹配成功,但是误匹配也比较多,需要采取多种手段剔除:

track 列表

当匹配关系建立后,需要生成track列表，指同名点的相片集合，比如第一幅图的13号点和第二幅的14号点及第五幅的115号点是同名点，则(1,13)、（2,14)、(5,115）是属于一个track,据此可以生成一个track集合,同时生成track的时候也需要剔除无用匹配：

目的是找到相机基线最大的像对,采用RANSC算法四点法计算单应矩阵,满足单应矩阵的匹配点称为内点,不满足单应矩阵的称为外点, 根据单应矩阵公式可知当T越小时,内点占比越高,也就是低视差现象越明显。

因此找到一个内点占比最小的像对就是初始化像对，当然它前提必须满足可重建,这个可以通过匹配点个数保证

根据RANSC八点法计算本征矩阵,可通过对本征矩阵SVD分解得到第二个图像的R、T,在这一步需要进行畸变校正，然后根据R、T和矫正后的像点坐标三角计算出三维点,这里用到的方法是直接线性变换DLT，可以理解为测绘中的前方交会

光束法平差Bundle Adjustment，是一个非线性优化的过程，目的是使重建误差降低到最小，通过调整POSE和三维点使反向投影差最小，如果相机没有标定,还应该将焦距也参与平差。

Bundle Adjustment是一个迭代的过程，在一次迭代过后，将所有三维点反向投影到各自相片的像素坐标并分别与初始坐标比对，如果大于某个阈值，则应将其从track中去掉，如果track中已经小于2个了，则整个track也去掉，一直优化到没有点可去为止

加入更多图像,以第三副图为例，根据第四步生成的三维点和第三副图与前两图的track关系，可以反算第三副图的R、T，然后继续三角化计算出更多的三维点，采用的同样是DLT，这样反复重复第5步，最后就会把所有像片的POSE（R、T）和三维点，这就是稀疏重建SFM的成果了

目前,sfm开源库主要有:

不过，还有个小型库非常适合学习，用opencv实现的，地址是:

文章链接：
https://www.zywvvd.com/notes/3d/sfm/sfm/

“觉得不错的话，给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信支付

支付宝支付

#3D

Structure from Motion

https://www.zywvvd.com/notes/3d/sfm/sfm/

作者

Yiwei Zhang

发布于

2024年10月15日

许可协议