翻开下载!从RCNN到SSD,这应该是最全的一份方针检测算法盘点

导读:从简略的图画分类到3D姿态辨认,计算机视觉从来不缺少诙谐的问题和应战。经过肉眼咱们咱们咱们能够检测出一张宠物照中的猫和狗,能够辨认出梵高著作《星夜》中的星星和月亮,那怎样经过算法赋予机器“看”的智能,便是咱们接下来要讲的。

本文首要会介绍方针检测的概念,然后介绍一种简化了的方针检测问题——定位 + 分类以及它存在的问题,究竟由浅入深逐渐进入到方针检测常用的模型及办法,如 Faster R-CNN、SSD 等。这样的一个进程中 会触及许多细节的概念和知识点,详细的技能阐明请下载下方电子书详阅。

戳此处当即下载电子书
翻开下载!从RCNN到SSD,这应该是最全的一份方针检测算法盘点

书中精彩干货集结

**1、方针检测常用的模型及办法
1.1R-CNN**
学者们在这个方向做了许多研讨,比较有名的是 selective search 办法,详细办法这儿不做详细阐明,感兴趣的读者能够看关于 selective search 的论文。咱们只需知道这是一种从图片中选出潜在物体候选框(Regions of Interest,ROI)的方 法即可。有了获取 ROI 的办法,接下来就能够究竟靠分类和吞并的办法来获取究竟的 方针检测作用。根据这个思路有了下面的 R-CNN 办法。

  • 选出潜在方针候选框(ROI)
  • 练习一个好的特征提取器
  • 练习究竟的分类器
  • 为每个类练习一个回归模型,用来微调 ROI 与实在矩形框方位和巨细的过失

1.2Fast R-CNN
针对 R-CNN 的 3 个首要问题,咱们考虑一下是否有更好的处理方案。首要是速度,2000 个 ROI 的 CNN 特征提取占用了许多的时刻,是否能够用更好的办法,比方同享卷积层来一起处理悉数 2000 个 ROI ? 
其次是 CNN 的特征不会因 SVM 和回归的调整而更新。 

R-CNN 的操作流程很杂乱,能否有更好的办法使得练习进程成为端到端的? 接下来咱们将介绍 Firshick 等人于 2015 年提出的 Fast R-CNN[2],它十分巧 妙地处理了 R-CNN 首要的几个问题。

1.3 Faster R-CNN
Faster R-CNN[3] 作为方针检测的经典办法在现在许多实战项目和竞赛中一再呈现。其实,Faster R-CNN 便是在 Fast R-CNN 的基础上构建一个小的网络,直接发生 region proposal 来代替经过其他办法(如 selective search)得到 ROI。这 个小型的网络被称为区域猜测网络(Region Proposal Network,RPN)。Faster R-CNN 的练习流程其间的 RPN 是要害,其他流程根柢和 Fast R-CNN一起。
接下来咱们看下 Faster R-CNN 的练习进程:

  • 运用 ImageNet 预练习好的模型练习一个 RPN 网络。
  • 运用 ImageNet 预练习好的模型,以及第(1)步里发生的主张区域练习 Fast R-CNN 网络,得到物体实践类别以及微调的矩形框方位。
  • 运用(2)中的网络初始化 RPN,固定前面卷积层,只需调整 RPN 层的参数。
  • 固定前面的卷积层,只练习并调整 Fast R-CNN 的 FC 层。

1.4YOLO
因为在 R-CNN 的系列算法中都需求首要获取许多 proposal,但 proposal 之 间有很大的堆叠,会带来许多重复的作业。YOLO[5] 一改根据 proposal 的猜测思路, 将输入图片划分红 S*S 个小格子,在每个小格子中做猜测,究竟将作用吞并。

接下来咱们看一下 YOLO 学习的要害进程:
YOLO 关于网络输入图片的标准有要求,首要需求将图片缩放到指定标准 (448448),再将图片划分红 SS 的小格。
每个小格里边做这几个猜测:该小格是否包括物体、包括物体对应的矩形框 方位以及该小格对应 C 个类别的分数是多少。

1.5 SSD
SSD[4] 一起学习了 YOLO 网格的思维和 Faster R-CNN 的 anchor 机制,使 得 SSD 能够快速进行猜测的一起又能够相对精确地获取方针的方位。接下来介绍SSD 的一些特征:

  • 运用多标准特征层进行细心的检测。在 Faster Rcnn 的 RPN 中,anchor 是在骨干 网络的究竟一个特征层上生成的,而在 SSD 中,anchor 不只仅在究竟一个 特征层上发生,在几个高层特征层处一起也在发生 anchor。
  • SSD 中悉数特征层发生的 anchor 都将经过正负样本的挑选后直接进行分类分数以及 bbox 方位的学习。

2、方针检测的工业运用实践
前面详细阐明晰方针检测的技能运用,技能怎样和工业相结合,发挥出最大的价值,也是咱们最为重视的。
在经济稳预期的局势下,国内制作业企业正在加速转型晋级的脚步。阿里作为一家有情怀和使命感的科技公司,咱们咱们都期望经过技能方法来帮助传统企业结束转型晋级。

在光伏作业,质检环节长时间面对专业度高、招工难、人力不足等问题。工业主动化水平较高的德国曾推出过组件 EL 质检技能,但只针对典型缺点,仅能做到辅佐人工(无法代替人工)。在国内,光伏企业在智能 AI 辨认技能范畴做了近 10 年的查验,但多晶电池和组件的主动质检远未抵达工业生产水平。

本文将要害介绍阿里推出的单晶、多晶组件 EL 质检功用,现在已在产线作业且精度稳定在 95% 以上。AI检测在工业视觉“降本增效”范畴上已经有了很明显的优势。阿里云未来将与更多的企业联合,书写智能制作新篇章。

翻开下载!从RCNN到SSD,这应该是最全的一份方针检测算法盘点