社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【赠书】新手速递!深度学习视频理解!

有三AI • 3 年前 • 578 次点击  

视频理解是当前计算机视觉研究领域中备受学术界和工业界关注的方向,随着视频行业的高速发展,如何利用 AI 技术更好地对视频内容进行理解变得越来越重要。今天要给大家介绍的书是深度学习视频理解》。


本书内容


本书对视频理解的3个重要领域进行介绍,对于每个领域,本书不仅解释了相关算法的原理,还梳理了算法演进的脉络。



全书共分6章


第1章:绪论,简要介绍视频行业的发展历程,动作识别,时序动作定位,视频Embedding技术



第2章:经典网络结构回顾,回顾经典图像分类模型和RNN。



第3章,基于2D卷积的动作识别,包括基本的平均汇合法,RNN模型,双流法,时序稀疏采样。


第4章:基于3D卷积的动作识别,包括基本模型C3D,双流Infalted 3D模型,3D卷积的低秩近似,时序位移模型TSM等。



第5章:时序动作定位,介绍时序动作检测相关的重要算法,包括基于滑动窗的方法,基于候选时序区间的算法,自底向上与时序结构信息建模的方法等



第6章:视频Embedding,介绍视频Embedding另一的重要算法,包括Word2Vec,Item2Vec等。



附录:总结了常用的一些视频处理工具,包括FFmpeg,OpenCV,Decord,Lintel。


本书作者张皓,毕业于南京大学计算机系周志华教授领导的机器学习与数据挖掘研究所(LAMDA),导师为吴建鑫教授,研究方向为深度学习和计算机视觉,曾获国家奖学金、江苏省三好学生等荣誉


本书是一本综合介绍新的基于深度学习的视频理解算法的参考书,通过理论与实践相结合的形式详细介绍了视频理解中的识别、定位、特征表示等诸多重点任务和方法。对该领域的研究者和从业者都非常实用。

赠书


接下来是福利时间,本次我们赠送出3本书籍(前3次获得赠书的朋友不能再参与本次赠书活动),想要获得书籍的同学,在本公众号下方留言,根据点赞数的高低,11月9日晚上22:00统计出获奖读者并进行公示,届时联系有三微信Longlongtogo即可。


如果没有获得赠书,也可以在京东和当当购买,链接如下:




往期相关


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/122623
 
578 次点击