《Python分布式机器学习:加速模型训练和分布式系统服务(Distributed Machine Learning with Python: Accelerating model training and serving with distributed systems)》

作者:

日期:2023-01-26

出版:

  • 131
  • 0
  • 0

作品总结

Python分布式机器学习:加速模型训练和分布式系统服务(Distributed Machine Learning with Python: Accelerating model training and serving with distributed systems)》

构建和部署高效的数据处理管道,以便在弹性、并行模型训练或多租户集群和云中进行机器学习模型训练

主要特点

  • 加速模型训练和干扰,时间缩短数量级
  • 学习用于模型训练和服务的最新并行方案
  • 分布式模型训练和服务阶段瓶颈的详细研究

书籍简介

减少机器学习的时间成本可以缩短模型训练的等待时间,并加快模型更新周期。分布式机器学习使机器学习从业者能够将模型训练和推理时间缩短几个数量级。借助本实用指南,您将能够立即将您的 Python 开发知识用于启动并运行分布式机器学习(包括多节点机器学习系统)的实施。首先,您将探索分布式系统在机器学习领域的工作方式,以及如何将分布式机器学习应用于最先进的深度学习模型。随着您的进步,你将了解如何使用分布式系统来增强机器学习模型训练和服务速度。您还将掌握在本地集群或云环境中优化并行模型训练和服务管道之前应用数据并行和模型并行方法。在本书结束时,你将获得构建和部署高效的数据处理管道所需的知识和技能,以分布式方式进行机器学习模型训练和推理。

你将学到什么

  • 部署分布式模型训练和服务管道
  • 掌握TensorFlow和PyTorch中的高级功能
  • 缓解并行模型训练和服务期间的系统瓶颈
  • 在经典并行范式之上发现最新技术
  • 探索威震天-LM和网格-张量流中的高级功能
  • 使用最先进的硬件,如 NVLink、NVSwitch 和 GPU

这本书是为谁写的:

本书面向学术界和工业界的数据科学家、机器学习工程师和机器学习从业者。假设对机器学习概念和Python编程的工作知识有基本的了解。以前使用TensorFlow或PyTorch实现ML / DL模型的经验将是有益的。如果你有兴趣使用分布式系统来提高机器学习模型训练和服务速度,你会发现这本书很有用。



0条评论