新知榜官方账号
2023-07-20 02:49:00
这是一篇CVPR2014的文章,由于Alex-Net和VGG等深度网络在分类任务的成功应用,大家逐渐发现,深度网络自主提取的特征要比传统的手工方式提取的特征更加丰富,于是开始尝试在检测任务中使用深度网络来提取特征。其中R-CNN(RegionswithCNNfeature)就是一个比较好的例子。
Regionproposals:候选区域,也就是预先找到的目标可能存在的区域。输入测试图片利用selectivesearch算法从图像中提取2k左右个regionproposals将每一个regionproposals缩放成227x227的大小并输入CNN网络,在最后一层全连接输出图像特征把每个regionproposal的CNN特征输入到SVM进行分类处理对SVM分类好的regionproposal进行边框回归处理,使得预测框和真实框更加吻合
每个regionproposal在输入CNN网络之前都会缩放至227x227,这是因为R-CNN的网络结构中存在有全连接层(fc),需要输入图像的尺寸保持一致。
类别判断过程中使用SVM分类器进行分类,一个regionproposal经过CNN网络输出4096维的特征,然后用SVM进行二分类,判断是否属于此类。
虽然已经使用了selectivesearch来最大限度地提取目标的候选框,但有些候选框与真实框依旧有很大差距,因此使用一个线性方程来实现位置的精确定位。
优点:精度显著提高,PASCALVOC2010从35.1%到53.7%将CNN网络应用于目标检测领域并实现了图像特征自动提取缺点:训练分阶段,步骤繁琐:微调网络+训练SVM+边框回归每个regionproposal都需要经过CNN网络进行提取特征,产生大量特征文件,占用过多物理内存由于每个regionproposal都需要需要经过CNN网络进行提取特征,导致运行速度慢(GPU条件下,测试一张图片需要47s)由于使用SVM进行分类,无法实现端到端的训练
SPP-Net给出了解决R-CNN存在问题的解决方案,其通过共享卷积运算提高了整个网络的速度,在达到R-CNN精度的同时,其速度是R-CNN的24-102倍。
SPP-Net解决尺度统一的问题,同时加速运算速度,并提出了权重共享的策略。
作者使用的ZF-5包含5个卷积层,经过空间金字塔池化层后变成固定特征,然后连接两个全连接层。
在SPP-Net中,作者将整张图片输入到CNN网络中进行提取特征,但是如何在最后的featuremap中对应regionproposals的区域呢?
优点:引入了空间金字塔,适应各种不同尺寸的特征图对整张图进行一次特征提取,加速运算速度,并提出了权重共享的策略缺点:分类器使用SVM,不能端到端训练进行分阶段训练,训练步骤复杂
相关工具
相关文章
推荐
中国首款3A游戏上线,《黑神话:悟空》出圈!
2024-08-21 13:46
盘点15款AI配音工具,短视频配音有救了!
2024-08-12 17:11
短视频文案没创意?10大AI写作工具来帮你!
2024-08-05 16:23
Midjourney发布V6.1版本,我已分不清AI和现实了!
2024-08-01 15:03
我发现了一款国产AI绘画神器,免费易上手!
2024-07-25 16:40
7位AI考生做今年高考题,能过一本线吗?
2024-07-19 17:17
世界上第一所AI学校来了,80亿人只需要1位老师?
2024-07-18 17:12
Sora首部AI广告片上线,广告从业者危险了!
2024-06-27 13:44
OpenAI与中国说拜拜,国产AI如何接棒?
2024-06-26 15:18
人与AI会产生爱情吗,专家发话了!
2024-06-17 17:28