通过投影统计计算灰度图像朝向

本文最后更新于：2024年5月7日下午

图像处理中会遇到需要计算物体朝向的情况，前文计算了二值图物体朝向，本文进一步放宽条件，计算灰度图像朝向。

问题描述

对于一个灰度图像，需要求解图像的朝向

解决思路

按照根据投影计算二值图朝向的思路，在二值图中默认密度为1，因此在计算中忽略了图像的像素值，对于灰度图相当于薄板密度不再为1
于是可以通过计算加权距离，求解灰度图像体朝向
我们可以将该带密度的薄板理解为平面上的二维概率分布，即将整个图像每个像素值除以总质量，即得到了总和为1的 $x,y$ 的联合分布

当图中物体部分密度相同（非零），背景部分密度为 0 时，灰度图像朝向即坍缩为二值图的朝向计算问题
那么我们的目标是找到某个方向，使得该联合分布投影到这个方向得到的边缘分布方差最小，我们认为这个方向为与物体朝向垂直的方向。

计算方法

考虑单通道非零灰度图像$I$，假设其中的点有 $N$ 个
第$i$个点坐标为 $(x_i, y_i), 0 <i<N+1$，合并为列向量

$$
\textbf{x}=[x_1,x_2, …,x_N]^T, \textbf{y}=[y_1,y_2, …,y_N]^T
$$

合并为维度 $N \times 2$ 的矩阵 $\textbf{M} = [\textbf{x}, \textbf{y}]$
对应 $N$ 个点的密度 $[\rho_1,\rho_2, …,\rho_N]^T $
总质量为 $S=\sum_{n=1}^N\rho_n$
将原始图像转义为二维分布，$N$ 个点的概率密度为 $\textbf{p} =[p_1,p_2, …,p_N]^T $，其中 $p_i=\rho_i/S$
给定一条直线，直线过点 $(x_t, y_t)$，直线的法向量 $\textbf{v} = [a, b]^T$，该法向量为单位向量，有：

$$
a^ 2 + b ^2=1
$$

则直线可表示为：

$$
[x-x_t,y-y_t]\textbf{v} = 0
$$

二值图上的点 $(x,y)$ 到直线的有向距离为：点到$(x_t, y_t)$ 的向量到直线法向量 $\textbf{v}$ 的投影:

$$
d =[x-x_t,y-y_t]\textbf{v}
$$

所有点的有向距离组成向量：

$$ \begin{array}{c} \textbf{d} &= [\textbf{M}-[x_t,y_t]]\textbf{v}\\ &= \textbf{M}\textbf{v}- [x_t,y_t]\textbf{v} \end{array} $$

设 $[x_t,y_t]\textbf{v}$ 为常数 $c$，有：

$$
d =[x,y]\textbf{v}-c，\textbf{d} = \textbf{M}\textbf{v}- c
$$

我们的目标是找到所有点的有向距离组成的样本集合的方差统计量最小，有向距离的均值为：

$$ \overline{d} = \sum_{i=1}^Np_i\textbf{m}_i\textbf{v}- c\\ =[\overline{x},\overline{y}]\textbf{v}- c $$

其中 $[\overline{x},\overline{y}]$ 为 $x,y$ 的期望向量

灰度图像，有向距离的方差可表示为：

$$ \begin{array}{c} Var&=&\frac{1}{N} \sum_{i=1}^N (d_i-\overline{d})^2p_i\\ &=&\frac{1}{N} \sum_{i=1}^N ([x_i,y_i]\textbf{v}-c-[\overline{x},\overline{y}]\textbf{v}+c)^2p_i\\ &=&\frac{1}{N} \sum_{i=1}^N ([x_i-\overline{x},y_i-\overline{y}]\textbf{v})^2p_i \end{array} $$

可见二值图到直线的有向距离的方差与直线的偏置无关，仅与法向量有关，设 $\textbf{M}’=\textbf{M}-[\overline{x}, \overline{y}]$，有：

$$ \begin{array}{c} Var&=&\frac{1}{N} \sum_{i=1}^N ([x_i-\overline{x},y_i-\overline{y}]\textbf{v})^2p_i\\ &=&\frac{1}{N} (\sqrt{\textbf{p}}^T\textbf{M}’\textbf{v})^T(\sqrt{\textbf{p}}^T\textbf{M}’\textbf{v})\\ &=& \frac{1}{N} \textbf{v}^T\textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’\textbf{v} \end{array} $$

可以看做 $Var$ 是关于 $\textbf{v}$ 的二次型，系数矩阵为 $\frac{1}{N}\textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’ $
注意：我们需要该方差最小，但不能直接对 $\textbf{v}$ 求导，令其取值为零：

$$ \begin{array}{c} \frac{{\partial Var}}{{\partial {\bf{v}}}} = \frac{2}{N}\textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’\bf{v}= 0\\ \textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’\bf{v}= 0 \end{array} $$

因为这样做会得到 $\bf{v}$ 为零向量的平凡解，但是事实上 $\bf{v}$ 是有模长为 1 的约束的，因此我们需要解的是带约束的优化方程：
$$ \begin{array}{c} minimize \quad Var= \frac{1}{N} \textbf{v}^T\textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’\textbf{v}\\ subject \ to \quad \bf{v}^T\bf{v}-1=0 \end{array} $$

解方程

拉格朗日

至此之后的方程解法和之前完全相同，只是矩阵数值根据密度发生了一些变化
之后解该方程需要在 $|\bf{v}|= 1$ 的约束下进行，因此可以引入拉格朗日乘数法
可以参考拉格朗日解该方程的流程

特征向量

我们用 $\bf{A}$ 表示上述系数矩阵 $\frac{1}{N}\textbf{M}’^T\sqrt{\textbf{p}}\sqrt{\textbf{p}}^T\textbf{M}’ $ (此处为 $2\times 2$ 的矩阵)
因此我们的优化目标变为: $\bf{v}^TA\bf{v}$
拉格朗日方程为：

$$ L =\bf{v}^TA\bf{v}+\lambda(\bf{v}^T\bf{v}-1) $$

对 $\bf{v}$ 求导，令其为 0：

$$ \begin{array}{c} 2A\bf{v}+2\lambda\bf{v}=0\\ A\bf{v}+\lambda\bf{v}=0\\ (A+\lambda I)\bf{v}=0 \end{array} $$

哈，这不就是在求 $\bf{A}$ 的特征向量吗？
求就完了，会得到两个特征向量，特征值小的对应的特征向量为方差最小的投影方向。

参考资料

文章链接：
https://www.zywvvd.com/notes/study/image-processing/robot-vision/chapter-3/obj-orientation/gray-obj-orientation/

“觉得不错的话，给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信支付

支付宝支付

Image_Processing > Robot_vision

#Image_Processing #Robot_vision

通过投影统计计算灰度图像朝向

https://www.zywvvd.com/notes/study/image-processing/robot-vision/chapter-3/obj-orientation/gray-obj-orientation/

作者

Yiwei Zhang

发布于

2022年9月14日

许可协议

Jekyll 搭建静态网站上一篇

Hexo -37- 加入“十年之约” 下一篇