本文最后更新于：2024年5月7日下午

异常检测在工业检测等场景有重要应用，PatchCore 在 MVTec 数据集中霸榜了很久，本文介绍相关内容。

异常检测

异常检测是无监督学习的一种应用场景
通过对正常数据建模，获取对正常数据的表示模型
该模型在表示异常数据时会有异常的表现，以此描述异常数据

PatchCore

在异常检测算法 MVTec 数据集的排名：

算法流程

提取特征

特征级别

用预训练模型 Backbone 提取图像特征
以 Resnet50 为例，原文放弃了局部正常特征数据较少、偏向于分类任务的深层特征，采用第 [2, 3] 层特征作为图像特征

Patch 特征

将图像分为 $p\times p$ 的小块提取图像的 patch特征，这个特征带有周围数据的信息
以每个 patch 中间位置 $h,w$ 为中心，取边长为 $p$ 的正方形区域
$$ \begin{aligned} \mathcal{N}_{p}^{(h, w)}=\{(a, b) \mid a& \in[h-\lfloor p / 2\rfloor, \ldots, h+\lfloor p / 2\rfloor] \\ b &\in[w-\lfloor p / 2\rfloor, \ldots, w+\lfloor p / 2\rfloor]\} \end{aligned} $$
围绕这些点计算的特征图上的点为

$$ \phi_{i, j}\left(\mathcal{N}_{p}^{(h, w)}\right)=f_{\mathrm{agg}}\left(\left\{\phi_{i, j}(a, b) \mid(a, b) \in \mathcal{N}_{p}^{(h, w)}\right\}\right) $$

一幅图像的 Patch 特征集合为：

$$ \mathcal{P} _ {s, p} \left (\phi _ {i, j} \right) = \left\{\phi _ {i, j} \left(\mathcal{N} _ {p} ^ {(h, w)}\right) | h, w \bmod s=0, h < h ^ { *}, w< w^{ *}, h, w \in \mathbb{N}\right\} $$