在理论基础部分,本文对人工智能技术做了详细的介绍。机器学习技术是人工智能的一个分支,而本文使用的深度学习属于机器学习的一个分支。机器学习算法分为传统算法和神经网络两大类,传统算法主要包括:k近邻、决策树分类器、随机森林分类器等;而神经网络使用感知器来模拟人类的大脑,感知机可以接收输入(数据)和输出。在一个网络中使用多个感知器,可以实现更快、更准确的输出。图1显示了感知机的结构,其中x为输入,w为权重,Σ为和,f为激活函数,y为输出。
在某些复杂任务上,传统机器学习效果较差,深度学习技术应运而生。深度神经网络是具有更多神经元、更复杂拓扑中的隐藏层和特定神经元连接的深度学习神经网络架构。其中的循环神经网络(Recurrent Neural Networks,RNN)和卷积神经网络(Convolutional Neural Networks,CNN)与自然语言处理和图像识别与解释相关。卷积神经网络的典型结构如2所示。
在本文研究中,主要使用开源的机器学习平台Tensorflow中的目标检测模块。