新知榜官方账号
2023-07-20 02:49:00
这是一篇CVPR2014的文章,由于Alex-Net和VGG等深度网络在分类任务的成功应用,大家逐渐发现,深度网络自主提取的特征要比传统的手工方式提取的特征更加丰富,于是开始尝试在检测任务中使用深度网络来提取特征。其中R-CNN(RegionswithCNNfeature)就是一个比较好的例子。
Regionproposals:候选区域,也就是预先找到的目标可能存在的区域。输入测试图片利用selectivesearch算法从图像中提取2k左右个regionproposals将每一个regionproposals缩放成227x227的大小并输入CNN网络,在最后一层全连接输出图像特征把每个regionproposal的CNN特征输入到SVM进行分类处理对SVM分类好的regionproposal进行边框回归处理,使得预测框和真实框更加吻合
每个regionproposal在输入CNN网络之前都会缩放至227x227,这是因为R-CNN的网络结构中存在有全连接层(fc),需要输入图像的尺寸保持一致。
类别判断过程中使用SVM分类器进行分类,一个regionproposal经过CNN网络输出4096维的特征,然后用SVM进行二分类,判断是否属于此类。
虽然已经使用了selectivesearch来最大限度地提取目标的候选框,但有些候选框与真实框依旧有很大差距,因此使用一个线性方程来实现位置的精确定位。
优点:精度显著提高,PASCALVOC2010从35.1%到53.7%将CNN网络应用于目标检测领域并实现了图像特征自动提取缺点:训练分阶段,步骤繁琐:微调网络+训练SVM+边框回归每个regionproposal都需要经过CNN网络进行提取特征,产生大量特征文件,占用过多物理内存由于每个regionproposal都需要需要经过CNN网络进行提取特征,导致运行速度慢(GPU条件下,测试一张图片需要47s)由于使用SVM进行分类,无法实现端到端的训练
SPP-Net给出了解决R-CNN存在问题的解决方案,其通过共享卷积运算提高了整个网络的速度,在达到R-CNN精度的同时,其速度是R-CNN的24-102倍。
SPP-Net解决尺度统一的问题,同时加速运算速度,并提出了权重共享的策略。
作者使用的ZF-5包含5个卷积层,经过空间金字塔池化层后变成固定特征,然后连接两个全连接层。
在SPP-Net中,作者将整张图片输入到CNN网络中进行提取特征,但是如何在最后的featuremap中对应regionproposals的区域呢?
优点:引入了空间金字塔,适应各种不同尺寸的特征图对整张图进行一次特征提取,加速运算速度,并提出了权重共享的策略缺点:分类器使用SVM,不能端到端训练进行分阶段训练,训练步骤复杂
相关工具
相关文章
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16