摘要

尺度空间、数据中心化等

前言

本文内容大体都为摘录,且都注明了来源(个别错漏获悉便纠正)。另外,有些存在文字表述的修改。

1. 为何要讨论尺度空间?

尺度空间理论[1]

自然界中的物体随着观测尺度不同有不同的表现形态。例如我们形容建筑物用“米”,观测分子、原子等用“纳米”。更形的例子比如Google地图,滑动鼠标轮可以改变观测地图的尺度,看到的地图绘制也不同;还有电影中的拉伸镜头等等…… 尺度空间中各尺度图像的模糊程度逐渐变大,能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。 尺度越大图像越模糊。

为什么要讨论尺度空间?

用机器视觉系统分析未知场景时,计算机并不预先知道图像中物体的尺度。我们需要同时考虑图像在多尺度下的描述,获知感兴趣物体的最佳尺度。另外如果不同的尺度下都有同样的关键点,那么在不同的尺度的输入图像下就都可以检测出来关键点匹配,也就是尺度不变性。 图像的尺度空间表达就是图像在所有尺度下的描述。

多尺度问题

对于多尺度问题,会涉及到很多数学上的东西,然而目前并不需要这些,我们只需要了解基本的概念 如果有兴趣,这篇文章介绍了尺度空间理论[1],之所以引入尺度这个概念,其实是为了更贴近人类的视觉系统。在某些特征检测提取算法中(如sift等),用到的某些算子会对图像的某些信息作出反应,例如图像当中像素点快速变化的一些区域(一般就是图像当中的一些边缘信息),然后记录下来,形成该图的一组特征。但是某些时候我们的图往往是不能确定大小的(这个大小,也可以理解为相同大小时候,图像的模糊程度),需要做的就是在图像不同大小时,算法都能有效的提出相同的关键点。

cat_1 cat_4 cat_3 cat_4

由此,我们需要对一张图,生成一组由清晰逐渐变模糊的一组图像,这就是图像的多尺度。总的来说,多尺度模拟了不同远近的物体在视网膜上的形成。而尺度不变性保证不同远近物体可以对视觉神经有相同的刺激。


链接地址:

  1. 尺度空间理论
  2. 多尺度问题