新知榜官方账号
2023-07-20 02:49:00
这是一篇CVPR2014的文章,由于Alex-Net和VGG等深度网络在分类任务的成功应用,大家逐渐发现,深度网络自主提取的特征要比传统的手工方式提取的特征更加丰富,于是开始尝试在检测任务中使用深度网络来提取特征。其中R-CNN(RegionswithCNNfeature)就是一个比较好的例子。
Regionproposals:候选区域,也就是预先找到的目标可能存在的区域。输入测试图片利用selectivesearch算法从图像中提取2k左右个regionproposals将每一个regionproposals缩放成227x227的大小并输入CNN网络,在最后一层全连接输出图像特征把每个regionproposal的CNN特征输入到SVM进行分类处理对SVM分类好的regionproposal进行边框回归处理,使得预测框和真实框更加吻合
每个regionproposal在输入CNN网络之前都会缩放至227x227,这是因为R-CNN的网络结构中存在有全连接层(fc),需要输入图像的尺寸保持一致。
类别判断过程中使用SVM分类器进行分类,一个regionproposal经过CNN网络输出4096维的特征,然后用SVM进行二分类,判断是否属于此类。
虽然已经使用了selectivesearch来最大限度地提取目标的候选框,但有些候选框与真实框依旧有很大差距,因此使用一个线性方程来实现位置的精确定位。
优点:精度显著提高,PASCALVOC2010从35.1%到53.7%将CNN网络应用于目标检测领域并实现了图像特征自动提取缺点:训练分阶段,步骤繁琐:微调网络+训练SVM+边框回归每个regionproposal都需要经过CNN网络进行提取特征,产生大量特征文件,占用过多物理内存由于每个regionproposal都需要需要经过CNN网络进行提取特征,导致运行速度慢(GPU条件下,测试一张图片需要47s)由于使用SVM进行分类,无法实现端到端的训练
SPP-Net给出了解决R-CNN存在问题的解决方案,其通过共享卷积运算提高了整个网络的速度,在达到R-CNN精度的同时,其速度是R-CNN的24-102倍。
SPP-Net解决尺度统一的问题,同时加速运算速度,并提出了权重共享的策略。
作者使用的ZF-5包含5个卷积层,经过空间金字塔池化层后变成固定特征,然后连接两个全连接层。
在SPP-Net中,作者将整张图片输入到CNN网络中进行提取特征,但是如何在最后的featuremap中对应regionproposals的区域呢?
优点:引入了空间金字塔,适应各种不同尺寸的特征图对整张图进行一次特征提取,加速运算速度,并提出了权重共享的策略缺点:分类器使用SVM,不能端到端训练进行分阶段训练,训练步骤复杂
相关工具
相关文章
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49