欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下:
第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用。
第2层:掌握CV算法最底层的能力,包括模型设计基础,图像分类,模型分析。
第3层:掌握CV算法最核心的方向,包括图像分割,目标检测,图像生成,目标跟踪。
第4层:掌握CV算法最核心的应用,包括人脸图像,图像质量,视频分析,图像编辑。
第5层:掌握算法落地的关键技术,包括模型优化,模型部署。
2023年开始,每周都会有一门课程在当周有9折特惠,本周特惠课程是《深度学习视频分类:理论实践篇》,目标是帮助大家掌握好基于深度学习模型的视频分类与行为识别问题。
随着图像识别相关领域的研究与应用逐渐成熟,当下视频分析相关的研究和应用所占比例越来越大,其技术也更加复杂。视频分类和行为识别在视频监控与检索、网络直播、推荐系统等行业中有着广泛的应用,是深度学习在视频分析领域中最底层的问题之一,非常值得关注和学习。


为了帮助大家系统性解决所有视频分类与行为识别领域知识的学习,我们推出了《深度学习之视频分类-理论实践篇》专栏课程。
课程的第一期的主体部分已经更新完毕,本课程结合实际项目,将所学理论应用于实践。
本课程内容包括视频分类与行为识别的各个领域的算法与实践,当前的时长超过8个小时,分为3大模块,3个实践案例。包括视频分类核心的理论知识和实践内容,内容详细,案例丰富,下面是当前课程的大纲脑图:
(1) 理论部分内容包括:涵盖了深度学习之视频分类的主要模型,如3D卷积模型,双流模型,RNN时序模型等,既有足够的宽度,也具备有足够的深度。我们会非常详细地讲解算法中的细节,帮助彻底消化算法原理;本部分内容并未全部更新完毕,我们后续还会更新基于人体关键点的动作识别模型等内容。
(2) 实践非常丰富。本次课程中一共已经包含了3个实践案例,分别为
基于3D卷积模型的视频分类实战,基于双流模型的视频分类实战,基于时序模型的视频分类实战,1个案例结果图如下:
3大模块分为3D卷积模型,双流模型,以及时序模型,这是视频分类的3个大的子领域。
(1) 3D卷积模型,包括基本的3DCNN,以及各类针对3DCNN模型的精简与改进方法。
(2) 双流模型,包括基于时间序列与空间序列模型,以及不同时空采样频率的典型模型。
(3) 时序模型,包括CNN与RNN、LSTM结合使用的模型。
下面简单了解一下课程各部分的大体内容:
(0) 课程简介,包括视频分类的课程介绍。
(1) 视频分类基础讲解,包括视频分类的基本概念,常见数据集介绍,约20分钟,本部分内容可以免费收听。
(2) 3D卷积模型理论讲解,包括3D卷积原理,基础3D卷积模型与深度3D卷积模型,卷积拆分原理,经典的3D卷积分解模型及其探索,约70分钟。
(3) 双流模型理论讲解,包括基本的双流模型,双流模型融合策略,3D双流模型,时序分段采样模型,时序分频采样模型,约70分钟。(4) 时序模型理论讲解,主要包括CNN,LSTM,Conv-LSTM模型的原理,时长约30分钟。

(5) 3D卷积模型实战,包括项目简介,数据处理,模型定义,模型训练,模型测试,约100分钟。
(6) 双流模型实战,包括项目简介,数据处理,模型定义,模型训练,模型测试,约60分钟。
(7) Conv-LSTM模型实战。介绍的内容主要包括原理简介,数据处理,模型搭建,模型训练,模型测试,时长约100分钟。
本课程适合人群:
(1) 所有学习人工智能/深度学习算法,并有志于从事该领域的人员。
(2) 掌握了Python,深度学习基础概念等预备知识的技术人员。
(3) 学习与从事计算机视觉领域的技术人员。
学习完本课程你将掌握:
(1) 视频分类与行为识别的主流算法。
(2) 熟悉Pytorch项目实践。
(3) 掌握计算机视觉项目的完整流程。
龙鹏,笔名言有三,技术社区《有三AI》创始人。
先后就读于华中科技大学(2008-2012),中国科学院半导体研究所神经网络实验室(2012-2015),先后就职于奇虎360人工智能研究院(2015.7-2017.5),陌陌科技深度学习实验室(2017.5-2019.3),深度学习算法专家,阿里云MVP,华为云MVP。
拥有超过7年的计算机视觉从业经验,拥有丰富的传统图像算法和深度学习计算机视觉项目经验,著有书籍《深度学习之图像识别:核心技术与案例实战》(机械工业出版社2019.4),《深度学习之模型设计:核心算法与案例实践》(电子工业出版社2020.6),《深度学习之人脸图像处理:核心算法与案例实战》(机械工业出版社2020.7),《深度学习之摄影图像处理:核心算法与案例精粹》(人民邮电出版社2021.4),《生成对抗网络GAN:原理与实践》(机械工业出版社2022.10),拥有10余项发明技术专利与学术论文。
擅长领域:Caffe,Tensorflow,Pytorch等主流深度学习平台。神经网络与深度学习理论,深度学习模型设计与优化,计算机视觉的基础领域,AI美学,2D与3D人脸算法,生成对抗网络GAN等领域。
本课程是视频分析课程的其中一部分,属于有三AI整个课程体系中的中阶课程,对大家的能力有一些要求,包括:
(1) 掌握计算机视觉基础方法。包括CV基础方向中的图像分类,目标检测。
(2) 熟练使用深度学习框架与基础模型。包括Pytorch,常用的2D/3D/时序模型。
扫码下面的课程海报即可订阅《深度学习之视频分类-理论实践篇》专栏课程,本专栏定价为249,随着后续内容增加可能会进行价格调整,感兴趣的请提前订阅:
课程设有交流群,大家在订阅课程后可以添加小助手入群:同时欢迎在深度学习领域有沉淀积累的同学加入有三AI生态,让更多人受益!