社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

利用先进技术保家卫国:深度学习进行小目标检测(适合初学者入门)

计算机视觉研究院 • 10 月前 • 274 次点击  

关注并星标

从此不迷路

计算机视觉研究院


公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

论文地址:https://arxiv.org/pdf/2201.03243v1.pdf

计算机视觉研究院专栏

作者:Edison_G

一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。
   整体的介绍都比较基础简单,初学者可以简单了解!


一、前言

如今,无人机等被广泛用于各种用途,例如从航空图像中捕获和目标检测等。这些小型ariel车辆轻松进入公众可能会造成严重的安全威胁。例如,关键地点可能会被混入公共场所的间谍使用无人机监控。

Study in hand提出了一种改进且高效的基于深度学习的自主系统,该系统可以高精度地检测和跟踪非常小的无人机。所提出的系统由一个定制的深度学习模型“Tiny YOLOv3”组成,这是一种非常快速的目标检测模型“You Look Only Once”(YOLO)被构建并用于检测。目标检测算法将有效地检测无人机。与之前的YOLO版本相比,所提出的架构显示出明显更好的性能。 在资源使用和时间复杂度方面得到了改进。

二、背景

随着世界在融合最新技术的同时不断进步,安全系统也在快速发展,以利用创新的力量来应对可能出现的任何安全威胁。在过去的几年里,无人机的使用量急剧增加,包括对公众的可及性,这进一步增加了其使用量。随着无人机使用量的增加,安全威胁也随之增加。我们已经看到了一些无人机飞越不同建筑物的事件,包括一些需要安全的敏感区域。

无人机还提出了许多威胁,包括无人机被用作毒品走私工具、入侵无人机导致它们爆炸或使用它们窃取敏感信息,无人机还被用于进行非法监视,造成安全和隐私威胁。这些事件对安全和隐私构成了巨大威胁。因此,解决这些安全问题的方法是检测和跟踪这些无人机,以便采取反制技术来阻止这些无人机,以确保安全和隐私。

此外,大多数安全或防御系统都具有检测可能发生的威胁程度的能力,但是,很少有人能够深入分析威胁。随着机器学习和人工智能的进步,通过减少人为干预使此类系统变得智能化,有效的目标检测可以帮助提高安全系统的效率并执行更好的分析。

三、新框架分析

前期主要介绍了深度学习的一些基础知识:

Image matrix convolution operation with multiplies filter matrix

Convolution with 3 x3 filter using Stride 2

ReLU operation

Max-Pooling

Fully Connected Layer


如上展示,尽管Tiny YOLOv3比YOLOv3快得多,但它因为它在2个尺度上执行检测,并没有提供更好的准确度。

为了更好地实现准确性,研究者引入了一个修改后的Tiny YOLOv3架构。该架构总共包括31层:16个卷积层,3个检测层,其余是用最大池化和ReLU层。以前的YOLOV3微型架构由总共24层组成,其中包括13个卷积层、3个检测层。

研究者修改了Tiny YOLOv3架构,通过使用前几层的ReLU层提取特征,将在三个尺度上进行检测。这意味着3个yolo层将负责检测对象。锚框用于计算预测边界框的宽度和高度。通常,YOLOv3为每个单元使用3个锚点,这些锚点预测三个边界框,总共9个锚点框。对于研究者的自定义目标检测器,总共使用了6个锚框。

预测特征图将分别为3个尺度上的13x13、26x26和52x52。随着网络向前传播图像,在第一个yolo层,得到一个13x13的输出特征图。在放置第一个yolo层之后,对下一层进行了两倍的采样,然后将具有相似大小的前一层的特征图连接起来。对于第二个yolo层,得到26x26的输出特征图,在第三个yolo层,得到一个52x52的特征图。这种架构比原始的yolov3架构更简洁、更小,后者在3个尺度上进行检测。此外,研究者的小而轻的架构可以检测具有高置信度分数的小物体。

四、实验



Results Evaluated


AVG FPS

© THE END 

转载请联系本公众号获得授权


计算机视觉研究院学习群等你加入!


ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


 往期推荐 

🔗

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/166896
 
274 次点击