新闻资讯

新闻资讯 行业动态

深入了解RCNN

编辑:008     时间:2020-02-11
一、RCNN的特点与性能
1.RCNN是双阶段的目标检测网络。
2.RCNN有预训练过程。
3.RCNN在VOC2012数据集上mAP达到了53.3%.
二、RCNN的创新点
1.RCNN在region proposals自下而上使用高性能的CNN提取特征。
2.在带标注的数据集不充足时,先针对辅助任务进行有监督的预训练,再进行特定任务的优化训练,可以提升模型性能。
三、传统目标检测思路
 传统的目标检测是先进行区域推荐,然后在推荐的区域上特征提取,提取完特征后分类,最后去除多余的边界框。
1.区域推荐的常用方法:滑动窗口,穷举法。
2.常用特征提取:SIFT和HOG。
3.分类方法:SVM。
4.去掉冗余的方法:NMS.
四、RCNN的整体思路
(1)区域推荐(region proposal)即候选区域:RCNN中用selective search实现区域推荐。给定一张图片,通过选择性搜索算法产生2000个候选边框,候选框的形状和大小是不相同的,这些框之间是可以互相重叠互相包含的;
(2)特征提取:用CNN对每一个候选框提取深层特征;
(3)分类:用SVM对卷积神经网络提取的深层特征进行分类;
(4)去除冗余框:用NMS去除冗余框,挑选出SVM得分较高的边框;
五、RCNN中的CNN
 R-CNN算法采用的是8层卷积神经网络对图像进行特征提取,其中前5层是卷积层,其中第一层、第二层、第五层之后跟有最大池化层,后3层是全连接层。在图像输入网络前需要把图像归一化为227*227的固定大小。即输入层为候选区域缩放得到,输出为该候选区域边框的分类结果。
六、RCNN训练步骤
1.下载或训练预训练模型。
2.对预训练模型迁移。
3.提取候选区域。
4.将候选区域resize成227*227.
5.训练CNN。
6.训练SVM.
7.使用回归器精细修正候选框位置:对于每一个类,训练一个线性回归模型去判定这个框是否框的完美。
七、RCNN的缺点
1.操作步骤繁琐:整个训练过程分为多个步骤,步骤繁琐不易操作。
2.不易取得最优解:每个阶段单独训练,容易取得每个阶段的最优解,但不易取得整体最优解。
3.时间开销大:(1)每张图片的每个region proposal都要做卷积;(2)在训练SVM和回归的时候需要用网络训练的特征作为输入,特征保存在磁盘上再读入的时间开销较大。
4…空间开销大:在训练SVM和回归的时候需要用网络训练的特征作为输入,特征需要保存在磁盘上。
5.CNN输入的图像有畸变:每个region proposals 大小不一,但CNN的输入尺寸是227*227,因此,在图像的region proposal输入CNN前需要resize,图像会发生畸变。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

回复列表

相关推荐