首先介绍一下深度学习主流目标检测网络模型,如下:
R-CNN (Rich feature hierarchies for accurate object detection and semantic segmentation)
利用selective search提取候选框,然后利用CNN进行特征提取,最后SVM分类
训练和预测都非常慢。论文链接:https://arxiv.org/abs/1311.2524
Fast R-CNN
利用ROI pooling对特征图进行提取
- 可以端到端训练,但仍然比较慢。论文链接:https://arxiv.org/abs/1504.08083
Faster R-CNN:
- 论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
- 描述:Faster R-CNN引入了区域提议网络(RPN),它结合了深度卷积神经网络(CNN)和候选目标区域的生成,然后使用RoI池化来进行目标分类和边界框回归。这个方法在速度和精度上取得了显著的改进。
YOLO (You Only Look Once):
- 论文:YOLO: You Only Look Once
- 描述:YOLO是一种实时目标检测模型,它通过将目标检测问题转化为回归问题,一次性预测目标的类别和边界框坐标。YOLO的关键特点是快速检测速度。
SSD (Single Shot MultiBox Detector):- 论文:SSD: Single Shot MultiBox Detector
- 描述:SSD是一种单次前向传播的目标检测模型,通过在多个不同尺度的特征图上执行检测,可以检测多个不同大小的目标。它具有较快的检测速度和良好的性能。
- 论文:Focal Loss for Dense Object Detection
-
描述:RetinaNet引入了Focal Loss来解决类别不平衡问题,提高了对小目标的检测性能。它具有高效的训练和良好的性能。
- 描述:Mask R-CNN扩展了Faster R-CNN,不仅可以进行目标检测,还可以生成目标实例的分割掩码。这对于实例分割任务非常有用。
- 论文:EfficientDet: Scalable and Efficient Object Detection
- 描述:EfficientDet结合了EfficientNet的网络结构和一种复合尺度的目标检测策略,以在速度和精度之间取得良好的平衡。它在资源利用效率方面表现出色。
以下是一些常用的数据集,适用于测试和训练目标检测模型:
DOTA (Dataset for Object Detection in Aerial Images): DOTA是一种大规模的航拍图像数据集,包含多个类别的目标,如飞机、船只和车辆。
NWPU-RESISC45: 这个数据集包含45个遥感场景类别,可用于遥感图像分类和检测任务。
SpaceNet: SpaceNet是由DigitalGlobe和CosmiQ Works提供的一系列高分辨率卫星图像数据集,包括建筑物和道路检测等任务。
UCAS-AOD: UCAS-AOD是一种用于飞机目标检测的遥感图像数据集,适用于航空领域的目标检测研究。
Inria Aerial Image Labeling Dataset: 这个数据集包含空中图像,可用于建筑物检测任务。
本学习室创建了3个学习交流群,来自各地高校和研究所,涵盖本科、硕士和博士群体,交流群每天活跃度非常高。
想加入交流的加小编微信邀请进群(扫描下方二维码咨询报名或菜单栏“联系我们”选项框都可以找到小编哟)。注意,咨询加群验证信息请备注为“研究方向-加群”格式,如“LULC-加群”。