社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

【新书】Python中的深度强化学习:用于聊天机器人和大型语言模型的RLHF,650页pdf

专知 • 5 月前 • 202 次点击  

简介

通过理论理解深度强化学习(deep RL)中最流行的库,本新版专注于深度RL的最新进展,采用代码学习的方法,使读者能够理解并复现该领域的最新研究。

深度强化学习的最新进展

本书介绍了从游戏、机器人到金融的新代理环境,帮助读者尝试将强化学习应用于不同领域。多智能体强化学习章节涵盖了多个智能体的竞争方式,另一章节则专注于广泛使用的深度RL算法——近端策略优化(Proximal Policy Optimization, PPO)。读者将了解如何通过大型语言模型(如ChatGPT)使用人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)来提升对话能力。

实践与部署

本书还将介绍在多个云系统上使用代码和在Hugging Face Hub等平台上部署模型的步骤。代码采用Jupyter Notebook格式,可以在Google Colab等深度学习云平台上运行,允许读者根据自己的需求调整代码。
无论是在游戏、机器人还是生成AI应用中,《Deep Reinforcement Learning with Python》都将帮助您保持技术前沿。

学习内容

  • 探索基于Python的RL库,包括StableBaselines3和CleanRL
  • 使用多样化的RL环境,如Gymnasium、Pybullet和Unity ML
  • 理解使用RLHF和PPO进行大型语言模型的指令微调
  • 学习使用Hugging Face、Weights and Biases和Optuna的训练和优化技术

适合人群

本书适合希望提升对深度RL理解并获取实际实现RL算法技能的软件工程师和机器学习开发者。通过本书,您将能够从头开始实现并优化RL算法,掌握前沿技术应用于实际项目。

专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复或发消息“P650” 就可以获取《【新书】Python中的深度强化学习:用于聊天机器人和大型语言模型的RLHF,650页pdf》专知下载链接

点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172426
 
202 次点击