SIFT(Scale-Invariant Feature Transform)

文章目录

sift基础知识

尺度为$\sigma$ 的高斯尺度空间为 $L(x, y, \sigma) =G(x, y, \sigma) I(x, y, \sigma) $, $$ 是卷积符号
尺度为 $ t$ 的高斯差分为 $D(x, y, t) = L(x, y, kt) - L(x, y, t)$, $k$是乘数常因子。

论文中推荐的参数 $\sigma=1.6$ $k=2^{\frac {1} {3}}$

$高斯空间 Img \mapsto L(\sigma) \mapsto L(k\sigma) \mapsto L(k^2\sigma)\mapsto L(k^3\sigma)$

DoG空间每一个维度图片的生成由相邻高斯空间图片相减构成。$L(\sigma) - Img$这一个高斯差分属于尺度为多少的高斯差分，对应于高斯尺度空间中哪一个尺度？

$D(\sigma) \iff L(\sigma )$

将关键点周围的区域分块，分别计算块内的直方图，将所有块的梯度直方图组合成一个大的向量

将坐标轴旋转为关键点的方向。（旋转不变性）
确定描述子所对应的区域，将区域分成分成小块。
将关键点附件的像素分配到对应的子区域上，统计每个子区域的梯度值及方向，并分配到8个方向上。得到一个 8 (4 4) = 128维的向量。在对这个向量进行归一化。得到该关键点的descriptor.

Scale-space Extrema Detection

(x, y, \sigma)
定位关键点

step1找到的可能关键点还需要经过更加准确的定位，使用的是尺度空间的泰勒展开。如果该极值点的强度低于阈值（论文中0.03）就拒绝它作为关键点。（OpenCV里面这个参数是contrastThreshold)

如果该点属于边缘，也拒绝它。Hessian矩阵可以通过确定特征值的大小来判断。如果特征值比率大于某个阈值(edgeThreshold)，则认为他是边缘，也拒绝他。排除了低对比度以及边缘上的关键点。
确定主方向

为每个关键点分配一个主方向。计算关键点附近区域每一个像素点梯度大小和方向，把梯度方向分配到36bins里面，其大小进行高斯加权。直方图最高峰就是该关键点的主方向，任何peak高于80%都作为辅助方向。
关键点描述子

在关键点附近1616区域分成 $44$的块，每个块内的像素梯度大小方向分成8bins，一共构成$8 4 * 4=128$维的向量。再针对这个向量进行其他处理以达到光照，旋转不变性。