矩 / Hu 矩

本文最后更新于:2022年7月4日 上午

在数学和统计学中,矩(moment)是对变量分布和形态特点的一组度量。本文记录相关概念。

简介

在数学和统计学中,矩(moment)是对变量分布和形态特点的一组度量。n阶矩被定义为一变量的n次方与其概率密度函数(Probability Density Function, PDF)之积的积分。在文献中n阶矩通常用符号μn表示,直接使用变量计算的矩被称为原始矩(raw moment),移除均值后计算的矩被称为中心矩(central moment)。变量的一阶原始矩等价于数学期望(expectation)、二至四阶中心矩被定义为方差(variance)、偏度(skewness)和峰度(kurtosis)。

  • 随后介绍 数学变量概率论图像处理中的定义。

数学变量

数学上

  • 对连续变量 $ x $ 和其单变量概率密度函数 $ P(x) $ 或积累分布函数(Cumulative Distribution Function, CDF) $ C(x) $ ,其 $ n $ 阶矩$ \mu_{n}^{\prime} $ 被定义为:

$$
\mu_{n}^{\prime}=\int x^{n} d C(x)=\int x^{n} P(x) d x
$$

  • 若变量 $ x $ 为离散变量,则 $ \mu_{1}^{\prime} $ 也可以表示为:

$$
\mu_{n}^{\prime}=\sum x^{n} P(x)
$$

  • 当 $n=1$ 时,$ \mu_{1}^{\prime} $ 等价于 $ x $的数学期望:

$$
\mu_{1}^{\prime}=E(x) = \int x P(x) d x
$$

  • 当 $n=2,3,4$ 时,其中心矩被定义为方差、偏度和峰度:

    $$ \begin{aligned} \mu_{2}^{\prime} &=\int\left(x-\mu_{1}^{\prime}\right)^{2} P(x) d x \\ \mu_{3}^{\prime} &=\int\left(x-\mu_{1}^{\prime}\right)^{3} P(x) d x \\ \mu_{4}^{\prime} &=\int\left(x-\mu_{1}^{\prime}\right)^{4} P(x) d x \end{aligned} $$

随机变量

在概率论中

  • 设$X$和$Y$是随机变量:
    • 若$\mathbb{E}\left[X^{k}\right], k=1,2, \cdots$存在,则称它为$X$的$k$阶原点矩,简称$k$阶矩。
    • 若$\mathbb{E}\left[(X-\mathbb{E}[X])^{k}\right], k=2,3, \cdots$存在,则称它为$X$的$k$阶中心矩。
    • 若$\mathbb{E}\left[X^{k} Y^{l}\right], k, l=1,2, \cdots$存在,则称它为$X$的$Y$的$k+l$阶混合矩。
    • 若$\mathbb{E}\left[(X-\mathbb{E}[X])^{k}(Y-\mathbb{E}[Y])^{l}\right], k, l=1,2, \cdots$ 存在,则称它为$X$的$Y$的$k+l$阶混合中心矩。
  • 期望是一阶原点矩
  • 方差是二阶中心矩
  • 协方差是二阶混合中心矩

图像处理

在图像处理中

矩函数在图像分析中有着广泛的应用,如模式识别、目标分类、图像编码与重构等。从一幅数字图形中计算出来的矩集,通常描述了该图像形状的全局特征,并提供了大量的关于该图像不同类型的几何特性信息,比如大小、位置、方向及形状等。图像矩的这种特性描述能力被广泛的应用在各种图像处理、计算机视觉和机器人技术领域的目标识别与方位估计中。

  • 在图像矩中有零阶矩、一阶矩、二阶矩、三阶矩…其中零阶矩与物体的质量有关,一阶矩与形状有关,零阶矩与一阶矩可以求出重心,二阶矩显示曲线围绕直线平均值的扩展程度,三阶矩则是关于平均值的对称性的测量。

  • 针对于一幅图像,我们把像素的坐标看成是一个二维随机变量(X,Y),那么一幅灰度图像可以用二维灰度密度函数来表示,因此可以用矩来描述灰度图像的特征。

原点矩

$$
m_{m}=\sum_{x=1}^{M} \sum_{j=1}^{N} x^{p} y^{q} f(x, y)
$$

矩名称 矩定义
零阶矩 $ M_{00}=\sum_{l} \sum_{J} V(i, j) $
一阶矩 $ M_{10}=\sum_{l} \sum_{J} i · V(i, j) $
$ M_{01}=\sum_{I} \sum_{J} j · V(i, j) $
二阶矩 $ M_{20}=\sum_{I} \sum_{J} i^{2} · V(i, j) $
$ M_{02}=\sum_{I} \sum_{J} j^{2} \cdot V(i, j) $
$ M_{11}=\sum_{I} \sum_{J} i · j · V(i, j) $
  • 应用:

    • 面积:
      $$
      S = M_{00}
      $$

    • 物体重心坐标:

    $$
    x_{c}=\frac{M_{10}}{M_{00}}, \quad y_{c}=\frac{M_{01}}{M_{00}}
    $$

    • 物体形状方向:
      $$
      \theta=\frac{1}{2} \arctan \left(\frac{2 b}{a-c}\right), \theta \in\left[-90^{\circ}, 90^{\circ}\right]
      $$

      其中:

      $$ \mathrm{a}=\frac{M_{20}}{M_{00}}-x_{c}^{2}, b=\frac{M_{11}}{M_{00}}-x_{c} \mathrm{y}_{\mathrm{c}}, c=\frac{M_{02}}{M_{00}}-y_{c}^{2} $$

中心距

原点矩(除零阶矩)会随着图形位置变化而变化,为了解决平移不变性的问题,可以使用中心距

  • 中心距
$$ \mu_{p q}=\sum_{x=1}^{M} \sum_{y=1}^{N}\left(x-\bar{x}\right)^{p}\left(y-\bar{y}\right)^{q} f(x, y) $$

其中:

$$
\bar{x}=\frac{M_{10}}{M_{00}} , \bar{y}=\frac{M_{01}}{M_{00}}
$$

  • 由于中心矩是相对质心得到的,所以他们的值不会随物体平移而变化

归一化中心距

归一化中心矩作用在于消除图像比例变化带来的影响。

  • 中心矩通过减去均值而获得平移不变性,类似的,归一化中心矩通过除以物体的总尺寸而获得缩放不变性。定义如下:

$$
y_{p q}=\frac{\mu_{p q}}{\mu_{00}^{r}}
$$

其中

$$
r=\frac{p+q+2}{2}, p+q=2,3, \ldots
$$

  • 这个略显复杂的公式表明,归一化中心矩就是中心矩加上一个归一化因子,这个因子是物体面积的幂(对于更高阶的矩,这个幂会更大)。

Hu 不变矩

HU 矩是由 Hu(Visual pattern recognition by moment invariants)在 1962 年提出的

  • H不变矩是归一化中心矩的线性组合。通过组合不同的归一化中心矩,我们可以得到一个反应图像不同特征的不变函数,这个函数不随尺度、旋转、镜面映射(除了 $h_1$) 变化而变化;
  • Hu 矩在归一化中心距基础上增加了旋转不变性
  • Hu利用二阶和三阶归一化中心矩构造了7个不变矩,不变矩是一处高度浓缩的图像特征,在连续图像下具有平移、灰度、尺度、旋转不变性。其具体定义如下:
$ \begin{aligned} M 1=& y_{20}+y_{02} \\ M 2=&\left(y_{20}-y_{02}\right)^{2}+4 y_{11}^{2} \\ M 3=&\left(y_{30}-3 y_{12}\right)^{2}+\left(3 y_{21}-y_{03}\right)^{2} \\ M 4=&\left(y_{30}+y_{12}\right)^{2}+\left(y_{21}+y_{03}\right)^{2} \\ M 5=&\left(y_{30}-3 y_{12}\right)\left(y_{30}+y_{12}\right)\left(\left(y_{30}+y_{12}\right)^{2}-3\left(y_{21}+y_{03}\right)^{2}\right) \\ &+\left(3 y_{21}-y_{03}\right)\left(y_{21}+y_{03}\right)\left(3\left(y_{30}+y_{12}\right)^{2}-\left(y_{21}+y_{03}\right)^{2}\right) \\ M 6=&\left(y_{20}-y_{02}\right)\left(\left(y_{30}+y_{12}\right)^{2}-\left(y_{21}+y_{03}\right)^{2}\right) \\ &+4 y_{11}\left(y_{30}+y_{12}\right)\left(y_{21}+y_{03}\right) \\ M 7=&\left(3 y_{21}-y_{03}\right)\left(y_{30}+y_{12}\right)\left(\left(y_{30}+y_{12}\right)^{2}-3\left(y_{21}+y_{03}\right)^{2}\right) \\ &-\left(y_{30}-3 y_{12}\right)\left(y_{21}+y_{03}\right)\left(3\left(y_{30}+y_{12}\right)^{2}-\left(y_{21}+y_{03}\right)^{2}\right) \end{aligned} $
  • 这7个不变矩构成一组特征量,实际上,在对图片中物体的识别过程中,只有M1和M2不变性保持的比较好,其他的几个不变矩带来的误差比较大,有学者认为只有基于二阶矩的不变矩对二维物体的描述才是真正的具有旋转、缩放和平移不变性(M1和M2刚好都是由二阶矩组成的)。
  • 由Hu矩组成的特征量对图片进行识别,优点就是速度很快,缺点是识别率比较低。Hu不变矩一般用来识别图像中大的物体,对于物体的形状描述得比较好,图像的纹理特征不能太复杂,像识别水果的形状,或者对于车牌中的简单字符的识别效果会相对好一些。
不变矩的物理含义

如果把图像看成是一块质量密度不均匀的薄板,其图像的灰度分布函数$f(x,y)$就是薄板的密度分布函数,则其各阶矩有着不同的含义,如零阶矩表示它的总质量;一阶矩表示它的质心;二阶矩又叫惯性矩,表示图像的大小和方向。

  • 如果仅考虑阶次为2的矩集,则原始图像等同于一个具有确定的大小、方向和离心率,以图像质心为中心且具有恒定辐射率的椭圆。**当密度分布函数发生改变时,图像的实质没有改变,仍然可以看做一个薄板,只是密度分布有所改变。虽然此时各阶矩的值可能发生变化,但由各阶矩计算出的不变矩仍具有平移、旋转和尺度不变性。**通过这个思想,可对图像进行简化处理,保留最能反映目标特性的信息,再用简化后的图像计算不变矩特征,可减少计算量。

参考文档


矩 / Hu 矩
https://www.zywvvd.com/notes/study/image-processing/moments/moments/
作者
Yiwei Zhang
发布于
2022年4月26日
许可协议