周周 (@xianrenzhou) 在 论文阅读记录:RCNN 中发帖
RCNN
首个把CNN引入目标检测的论文。
论文地址
特点:在大数据集上训练特征提取器,然后再小数据集上微调
[image-20241028205650055]
RCNN步骤
候选区域生成(Selective Search)
Selective Search: 一张图片按照颜色/纹路之类的特征先分成小块,然后类似聚类算法合成大块。
RCNN生成了大约2000个候选框用来目标检测,这也是它速度慢的原因之一
候选框全reshape为227*227为了适应CNN的输入,reshape的方法:把候选框和周围的16个像素全缩放,不管长宽比例。
特征提取(Alexnet/VGG16)
Alexnet/VGG16:区别就是卷积核和步长,VGG计算量大精度高66%,Alexnet(58.5%)
在pascal voc数据集上微调作者把最后一层的1000类换成了...