深層学習に基づく物体検出アルゴリズムの詳細(2.2.2節)
左の本文を選ぶと、右側の官報原文画像で該当箇所を照合できます。
### 2.2.2.1 两阶段检测算法
两阶段检测算法(Two-stage Detection Algorithms)首先通过区域提议网络(Region Proposal Network, RPN)生成候选区域,然后对这些候选区域进行分类和边界框回归。典型的代表包括R-CNN系列算法(如Fast R-CNN、Faster R-CNN等)。
### 2.2.2.2 单阶段检测算法
单阶段检测算法(One-stage Detection Algorithms)直接在输入图像上进行密集采样,同时完成目标分类和位置回归。这类算法通常具有更快的推理速度,代表性的方法有YOLO系列、SSD等。
图2-1 不同目标检测算法的对比示意图
随着深度学习的发展,基于深度学习的目标检测算法逐渐取代了传统方法。
根据是否使用候选区域,可以将基于深度学习的目标检测算法分为两类:一类是基于候选区域的 Two-stage 目标检测算法,另一类是不使用候选区域的 One-stage 目标检测算法。
Two-stage 目标检测算法
Two-stage 目标检测算法首先通过选择性搜索(Selective Search)或边缘框(Edge Boxes)等方法生成一系列候选区域,然后利用卷积神经网络(CNN)对这些候选区域进行分类和回归,最终得到目标的类别和位置信息。
典型的 Two-stage 目标检测算法包括 R-CNN、Fast R-CNN、Faster R-CNN 等。R-CNN 是最早提出的基于深度学习的目标检测算法之一,它通过选择性搜索生成候选区域,然后利用 CNN 对每个候选区域进行特征提取和分类。Fast R-CNN 在 R-CNN 的基础上进行了改进,它将整个图像输入到 CNN 中,然后通过 ROI Pooling 层将候选区域映射到固定大小的特征图上,最后利用全连接层对每个候选区域进行分类和回归。Faster R-CNN 进一步改进了 Fast R-CNN,它引入了区域提议网络(Region Proposal Network, RPN),可以直接从 CNN 的特征图中生成候选区域,从而大大提高了检测速度。
One-stage 目标检测算法
One-stage 目标检测算法不需要生成候选区域,而是直接在图像上进行密集采样,然后利用 CNN 对每个采样点进行分类和回归,最终得到目标的类别和位置信息。
典型的 One-stage 目标检测算法包括 YOLO(You Only Look Once)、SSD(Single Shot MultiBox Detector)等。YOLO 将图像划分为 S×S 的网格,每个网格负责预测 B 个边界框及其对应的类别概率。SSD 则在不同尺度的特征图上进行密集采样,然后利用 CNN 对每个采样点进行分类和回归。