词袋模型 BoW 与 SLAM 回环检测 回环检测是 SLAM 区别于纯里程计的关键——只有识别出"我以前来过这里",才能消除累积漂移、得到全局一致的地图。词袋(Bag-of-Words, BoW)是它事实上的标配前端。这篇记下我啃 BoW 时的推导过程,以及那些实打实卡过我的疑问。 2026-07-03 SLAM #SLAM
SLAM 全景:定位与建图的联合估计 SLAM(Simultaneous Localization And Mapping,同时定位与建图)要求移动平台在未知环境、无先验地图的前提下,一边估计自身位姿、一边构建环境地图。这篇梳理 SLAM 的整体框架、数学本质与关键脉络,把前端跟踪、后端优化、回环检测、建图四个模块拧成一个整体来看。 2026-06-30 SLAM #SLAM
FoundationPose:渲染对比式 6D 位姿估计 FoundationPose(CVPR 2024 Highlight,NVIDIA)把 6D 物体位姿估计做成了"一个模型零样本泛化到新物体"——给定 CAD 模型或几张参考照片即可,不重新训练。它的核心是 render-and-compare(渲染对比),把位姿估计从端到端回归转成带监督的图像判别问题。这篇记录它的算法原理和源码架构要点(不含具体代码)。 2026-06-25 Pose_Estimation > Deep_Learning #Deep_Learning #Pose_Estimation
回环检测:候选之后(几何验证、Sim3 与全局校正) 词袋模型(DBoW2)给出了回环的"候选"——当前帧可能和某个历史关键帧拍的是同一个地方。但候选只是开始:单帧命中不可靠,真假回环必须经过几何验证、尺度校正、全局优化三步才能确认并消除漂移。这篇接在词袋模型之后,记录"候选之后"的完整流程。 2026-06-18 SLAM #SLAM
PnP 算法的本质:射线交汇与 EPnP 推导 PnP(Perspective-n-Point)是已知 3D 点位置、它们的 2D 像素投影、相机内参,反推相机位姿的问题。它是相机定位、SLAM 重定位、AR 追踪的核心。这篇不重复 DLT/P3P 的力学推导和 OpenCV 接口(另见 PnP 算法),而是讲 PnP 的本质——射线交汇——以及最常用方法 EPnP 的完整推导。 2026-06-18 Camera > SLAM #SLAM #Camera
误差工程方法论:视觉测量系统的精度预算 视觉测量系统(相机 + PnP + 手眼 + 机械臂)落地提精,难点往往不在算法——PnP、ICP、BA 的数学是标准的——而在于系统化地拆解误差、逐级量化验证、定位瓶颈、迭代逼近极限。这篇记录一套"误差预算驱动"的工程方法论,以一个 1m 工作距离、10cm 工件、目标 2mm 精度的场景为线索展开。 2026-06-18 Camera #Camera
焦距、传感器与 FOV:物理到像素的完整关系链 焦距、传感器尺寸、像素、视场角这些概念经常被串在一起:标定输出的 fx 是什么单位、物理焦距怎么反推、工作距离下每像素代表多少毫米。这篇把它们串成一条从物理到数字的关系链。相机成像几何(投影矩阵)和相机模型(畸变)另文记录,这里专讲物理成像面。 2026-06-18 Camera #Camera
COLMAP PatchMatch Stereo 算法详解 COLMAP 的 PatchMatch Stereo 是 MVS 稠密重建的核心算法,通过随机初始化深度和法线、NCC 代价评估、空间传播与随机扰动迭代优化,估计每个像素的最优深度。本文记录算法原理与实现细节。 2026-05-16 Study > Computer_Vision #3D #Computer_Vision #COLMAP
事件驱动的状态机框架:从理论到工程实践 深入理解事件驱动的有限状态机(FSM)与状态图(Statecharts)的设计原理,涵盖核心概念、架构模式、主流框架对比以及工程实践中的最佳实践。 2026-04-21 Coding > Design Pattern #Coding #Design Pattern #State Machine #Event-Driven #Architecture
Git 在国内网络环境下无法 Push 的排查与修复 —— 配置 Clash 代理 在国内服务器上开发时,git push 突然超时,SSH/HTTPS 全部连不上 GitHub。本文记录从诊断到修复的完整过程,核心原因是本地有 Clash 代理但 Git 和 SSH 没有配置使用它。 2026-04-17 Tools > Git #Tools #Git