首先根据官网先走一篇tutorial:https://pytorch.org/tutorials/beginner/basics/intro.html
学习教程中给出这样的提示:如果您熟悉其他深度学习框架,请首先查看“0. 快速入门”部分,以快速熟悉PyTorch的API。如果您对深度学习框架不熟悉,请直接进入我们逐步指南的第一部分:张量(Tensors)。
这是入门学习所以先熟悉一下张量,张量是一种数学和计算机科学领域的概念,用于表示多维数据。在机器学习和深度学习中,张量是一个非常重要的概念,用于存储和处理多维数据,例如图像、文本、声音等。在数学上,标量是零维数据(单个值),向量是一维数据(有序值列表),矩阵是二维数据(表格形式的值集合),而张量则可以看作是多维数据,可以有任意数量的维度。例如,一个三维张量可以看作是一个立方体状的数据集,其中每个元素由三个坐标索引来唯一确定。在深度学习框架如PyTorch和TensorFlow中,张量是数据的基本单位,用于构建神经网络模型并执行计算。张量不仅可以存储数据,还可以进行各种数学运算,如加法、乘法、卷积等。此外,这些框架为张量提供了在GPU等硬件上进行高效计算的功能,从而加速模型训练和推断过程。实际上,张量和NumPy数组通常可以共享相同的底层内存,消除了复制数据的需要。张量还经过优化,用于自动微分。
这里B站上有课程,可以自行搜索,这里我不再推荐了。
为了防止在听课疲劳,我在在一边听课学习张量,一边按照步骤实现yolo v5,网上关于深度学习的教程是真的太多了,每个人都有自己的看法和理解,这里我仅仅记录我的操作步骤,具体理论等待我学习完张量后再回头学习,可以尝试安装官网教程:
https://docs.ultralytics.com/yolov5/quickstart_tutorial/
我的PC是安装了Anaconda并且安装了pycharm,首先下载yolo V5源码:https://github.com/ultralytics/yolov5.git