Py学习  »  机器学习算法

【弹性深度学习:Horovod 在 Ray 上的应用】- Ube-20240504083657

爱可可-爱生活 • 2 周前 • 35 次点击  

2024-05-04 08:36

【弹性深度学习:Horovod 在 Ray 上的应用】
- Uber 在其机器学习平台中越来越多地使用深度学习模型,这带来了弹性扩展和容错等新需求。
- Uber 开发了 Elastic Horovod,可以动态调整分布式训练中的工作节点数量,实现自动扩缩容和容错。
- Uber 将 Elastic Horovod 与 Ray 结合,通过 Ray 提供的资源发现和请求机制简化了多云环境下的分布式训练。
- 实验结果表明,适当调整工作节点数量不会对模型收敛产生负面影响,甚至可以通过模拟退火的效果改善模型性能。
- Ray Tune 可以并行调优不同的超参数配置。结合 Elastic Horovod,可以实现嵌套的分布式训练和并行超参调优。
- Horovod on Ray 统一了机器学习和深度学习的计算基础设施,为端到端的工作流提供了灵活性,降低了维护成本。
- Uber 正在其 AutoML 框架 Ludwig 中应用 Horovod on Ray,支持分布式数据预处理、训练和超参调优。
- Horovod on Ray 为 Uber 提供了一个弹性、易于使用和维护的深度学习平台,有助于把更多深度学习模型从研究带到生产中。
《Elastic Deep Learning with Horovod on Ray | Uber Blog》 网页链接 #机器学习# #人工智能#
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/169686
 
35 次点击