方针检测算法系列】二、SPP-Net算法

2020年04月

方针检测算法系列】二、SPP-Net算法

方针检测算法系列】二、SPP-Net算法

前次咱们介绍了R-CNN算法

这次介绍下SPP-Net算法

SPP-Net算法是在R-CNN的基础上做了相关改善

咱们知道,R-CNN算法有几标签15个缺陷政策检测算法系列】二、SPP-Net算法:

1. 由于CNN网络对输入图画尺度的固定,所以关于每张图片生标签27成的2000个标签2候选区域,需求进行缩放、歪曲等操作来resize到CNN网络所要求的输入尺度(224*224),这样就会导致一些特征的丢掉,改动,然后影响精确度

2. R-CNN算法中,在经过CNN网络进行特征提取时,需求政策检测算法系列】二、SPP-Net算法对每张标签1图片的2000个候选区域别离处理,而这些候选区域中,是有许多重复部分的,所以会导致有许多重复运算,严重影响了RCNN检测的速度

SPP-N标签15et针对RCNN的上述两个问题做了对应改善,然后提高了模型的精度和速度

一、CNN网络中对输入尺度的固定问题

咱们知道,在RCNN时,需求对输入的候选框的尺度固定到224*224,为什么需求约束呢?

深层卷积网络中包括两个大的模块,一个是卷积模块,一个是全衔接模块,关于卷积模块,其实并不需求标签17约束图画输入标签4尺度,由于关于卷积模块中的一切filter来说,都是在与图画进行部分卷积操作,输入图画的不同尺度,并不会影响filter的尺度和个数,所以卷积层并不会约束图画尺度,仅仅不同尺度的图画,最政策检测算法系列】二、SPP-Net算法后经过卷积模块后,输出的feature map(特征图)的尺度则不相同,终究会生成不同长度的特征向量。

深层卷积网络中的全衔接模块,则关于输入特征向量的尺度是要求固定的。由于全衔接层中的权重参数个数,是和每一层的神经元密切相关的,所以为了共用一套权重参数,便利进行前向和后向传达算法,对应输入的特征向量,需求固定长度巨细,所以也就需求卷积模块输出相同尺标签5寸的feature map,终究,就需求固定整个CNN网络的输入尺度

二、空间金字塔池化(Spatial Pyramid Pooling)

经过上面的阐明,咱们知道实际上是卷积网络中的全政策检测算法系列】二、SPP-Net算法衔接层,需求固定输入尺度。所以,咱们能够不固定CNN网络开端的图画输入尺度,只固定后边的全衔接层输入的特征向量的长度。这样的话,咱们就需求将不同的输入图画尺度经过卷积层输出的feature map经过某种转化,转化为相同尺度的特征向量,来输入到全衔接层中,标签4那详细怎样转化呢?这就需求用到空间金字塔池化(Spatial Pyramid Pooling)

SPP-Net中,在CNN网络的卷积层终究,加上了一个空间金字塔池化层,来将不同的feature map转化为相同长度的特征向量。

论文中,作者将卷积模块输出的feature map别离经过4*4,2*2,1*1这三种不同巨细的块来提取特征。假定一共输出标签26了m个feature map。每个feature map的尺度为w*h*25标签226(256即政策检测算法系列】二、SPP-Net算法为终究输出的每个feature m政策检测算法系列】二、SPP-Net算法ap的通道数,也便是终究一层卷积层的filter个数)

关于4*4的块来说,关于一个fe标签13ature map,将分红4*4的块,关于每个块,经过最大池化来提取一个特征,则一共提取出来了16*256个特征标签25,同理,关于2*2的块来说,则提取出来了4*256个特征,1*1的块,则提取出来了1*256个特征。所以,一个feature map经过空间金字塔池化层后,提取出来了21*256个特征,然后转化成特征向量,输入到后边的全衔接层中。所以,不论标签9输入的图画尺度是多大,终究经过空间金字塔池化层后生成的特征向量长度都是必定的。这样就处理了RCNN种由于要保证输入尺度共同,而去缩放、歪曲图片形成特征的丢掉,改动等问题。

三、特征图与原图之间的映射

经过卷积的特性,咱们知道,图片中的某个物体,在经过多层卷标签9积后,它在feature map中的相对方位,与在原图中的相对方位是坚持不变的。相同的,关于一张图片中的候选框,再经过经过多层卷积后,方位相关于原图时代坚持不变。

上面说到,RCNN中,还有个显着的问题便是需求将每张图片的2000个候选框别离喂入CNN网络中来提取feature map, 这儿面会有许多重复运标签19算,所以咱们想到,能否直接将整张图片直接喂入CNN网络来生成feature map,然后再从feature map中去找到对应候选框所对应在feature map中的方位,经过上面一段的描绘,咱们知道这标签3种计划是可行的,咱们需求知道的是如何将原始图片中的候选框映射到对应feature map上。

设(X', Y')为特征图上的一个点,它多对应的是输入图片上的坐标点为 (X,Y),则有如下映射联系:

其间S为CNN中一切strides(步长)的乘积(包括池化,卷积的strides)

四、SPP-Net总结

上述便是SPP-Net所做的首要优化,这块,完好总结下SPP-Net的流程:

  1. 经过选择性标签1查找,对待检测的每张图片,生成2000个候选框
  2. 直接将原始图片输入到CNN网络中,进行特征提取,得到对应feature maps,然后经过对应映射,在feature maps中找到一切候选框所对应的区域,,将对应的不同区域经过金字塔空间池化层生成固定标签8长度的特政策检测算法系列】二、SPP-Net算法征向量
  3. 进行SVM分类以及Bounding-box回归

发表评论

电子邮件地址不会被公开。 必填项已用*标注