CVPR2014中R-CNN在目标检测中的应用以及CVPR2015中SPP-Net针对R-CNN进行的改进

新知榜官方账号

2023-07-20 02:49:00

R-CNN

这是一篇CVPR2014的文章,由于Alex-Net和VGG等深度网络在分类任务的成功应用,大家逐渐发现,深度网络自主提取的特征要比传统的手工方式提取的特征更加丰富,于是开始尝试在检测任务中使用深度网络来提取特征。其中R-CNN(RegionswithCNNfeature)就是一个比较好的例子。

算法总览

Regionproposals:候选区域,也就是预先找到的目标可能存在的区域。输入测试图片利用selectivesearch算法从图像中提取2k左右个regionproposals将每一个regionproposals缩放成227x227的大小并输入CNN网络,在最后一层全连接输出图像特征把每个regionproposal的CNN特征输入到SVM进行分类处理对SVM分类好的regionproposal进行边框回归处理,使得预测框和真实框更加吻合

网络结构

每个regionproposal在输入CNN网络之前都会缩放至227x227,这是因为R-CNN的网络结构中存在有全连接层(fc),需要输入图像的尺寸保持一致。

类别判断

类别判断过程中使用SVM分类器进行分类,一个regionproposal经过CNN网络输出4096维的特征,然后用SVM进行二分类,判断是否属于此类。

BoundingBoxRegression(边框回归)

虽然已经使用了selectivesearch来最大限度地提取目标的候选框,但有些候选框与真实框依旧有很大差距,因此使用一个线性方程来实现位置的精确定位。

算法总结

优点:精度显著提高,PASCALVOC2010从35.1%到53.7%将CNN网络应用于目标检测领域并实现了图像特征自动提取缺点:训练分阶段,步骤繁琐:微调网络+训练SVM+边框回归每个regionproposal都需要经过CNN网络进行提取特征,产生大量特征文件,占用过多物理内存由于每个regionproposal都需要需要经过CNN网络进行提取特征,导致运行速度慢(GPU条件下,测试一张图片需要47s)由于使用SVM进行分类,无法实现端到端的训练

SPP-Net(改进R-CNN)

SPP-Net给出了解决R-CNN存在问题的解决方案,其通过共享卷积运算提高了整个网络的速度,在达到R-CNN精度的同时,其速度是R-CNN的24-102倍。

算法总览

SPP-Net解决尺度统一的问题,同时加速运算速度,并提出了权重共享的策略。

网络结构

作者使用的ZF-5包含5个卷积层,经过空间金字塔池化层后变成固定特征,然后连接两个全连接层。

映射问题

在SPP-Net中,作者将整张图片输入到CNN网络中进行提取特征,但是如何在最后的featuremap中对应regionproposals的区域呢?

算法总结

优点:引入了空间金字塔,适应各种不同尺寸的特征图对整张图进行一次特征提取,加速运算速度,并提出了权重共享的策略缺点:分类器使用SVM,不能端到端训练进行分阶段训练,训练步骤复杂

本页网址:https://www.xinzhibang.net/article_detail-8377.html

寻求报道,请 点击这里 微信扫码咨询

关键词

CVPR2014 R-CNN 目标检测 CVPR2015 SPP-Net 深度网络

分享至微信: 微信扫码阅读

相关工具

相关文章