
解锁强化学习(RL)全部潜力:本综合指南将深入探索人工智能的一个关键子领域。这本书深入介绍了强化学习的核心概念、数学原理和实用算法,帮助您全面理解这项前沿技术。
从马尔可夫决策过程、动态规划、蒙特卡洛方法和时差学习等基本概念概述开始,本书使用清晰、简洁的示例解释了RL理论的基础知识。接下来的部分涵盖了价值函数近似这一强化学习中的关键技术,并探索了各种策略近似方法,如策略梯度方法和像近端策略优化(PPO)这样的高级算法。
本书还深入探讨了分布式强化学习、好奇心驱动的探索以及著名的AlphaZero算法等高级主题,为读者提供了这些前沿技术的详细介绍。
注重解释算法及其背后的直觉,《强化学习的艺术》包括了您可以用来实现RL算法的实用源代码示例。完成本书后,您将深入理解强化学习背后的概念、数学和算法,成为人工智能从业者、研究人员和学生的必备资源。
您将学到什么:
掌握强化学习的基本概念和特点,包括它与其他AI和非交互式机器学习方法的区别
将问题建模为马尔可夫决策过程,以及如何使用动态规划、蒙特卡洛方法和时差学习评估和优化策略
利用近似价值函数和策略的技术,包括线性和非线性价值函数近似以及策略梯度方法
了解分布式强化学习的架构和优势
掌握好奇心驱动探索的概念,以及如何利用它来改进强化学习代理
探索AlphaZero算法以及它如何能够击败职业围棋选手
本书适合谁阅读:

专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)

点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料