基于深度学习的目标检测算法
令和8年1月5日|p.18
左の本文を選ぶと、右側の官報原文画像で該当箇所を照合できます。
### 2.2.2.1 Two-stage 目标检测算法
Two-stage 目标检测算法首先通过选择性搜索 (Selective Search) 或边缘框 (Edge Boxes) 等方法生成一系列候选区域, 然后利用卷积神经网络对每个候选区域进行分类和回归, 得到最终的检测结果。典型的 Two-stage 目标检测算法包括 R-CNN、Fast R-CNN、Faster R-CNN 等。
图 2-2 Faster R-CNN 网络结构
R-CNN (Region-based Convolutional Neural Networks) 是最早提出的基于深度学习的目标检测算法之一。它首先利用选择性搜索生成约 2000 个候选区域, 然后将这些候选区域缩放到固定大小并输入到卷积神经网络中提取特征, 最后利用支持向量机 (SVM) 对特征进行分类, 并利用边界框回归器对候选区域进行微调。
Fast R-CNN 在 R-CNN 的基础上进行了改进, 它将整个图像输入到卷积神经网络中提取特征, 然后利用 ROI Pooling 层将候选区域映射到特征图上, 并提取固定大小的特征向量, 最后利用全连接层对特征进行分类和回归。Fast R-CNN 相比 R-CNN 大大提高了检测速度。
Faster R-CNN 在 Fast R-CNN 的基础上进一步改进, 它引入了区域提议网络 (Region Proposal Network, RPN) 来生成候选区域, 从而实现了端到端的训练和检测。Faster R-CNN 的检测速度和精度都得到了显著提升, 成为当时最先进的目标检测算法之一。