周周 (@xianrenzhou) 在论文阅读记录：RCNN 中发帖RCNN首个把CNN引入目标检测的论文

周周 (@xianrenzhou) 在论文阅读记录：RCNN 中发帖

RCNN
首个把CNN引入目标检测的论文。 
论文地址 
特点：在大数据集上训练特征提取器，然后再小数据集上微调 
 [image-20241028205650055] 
RCNN步骤


候选区域生成(Selective Search) 


Selective Search: 一张图片按照颜色/纹路之类的特征先分成小块，然后类似聚类算法合成大块。 


RCNN生成了大约2000个候选框用来目标检测，这也是它速度慢的原因之一 


候选框全reshape为227*227为了适应CNN的输入，reshape的方法：把候选框和周围的16个像素全缩放，不管长宽比例。 




特征提取(Alexnet/VGG16) 

Alexnet/VGG16：区别就是卷积核和步长，VGG计算量大精度高66%，Alexnet(58.5%)
在pascal voc数据集上微调作者把最后一层的1000类换成了...