快速了解 Apache Spark,这是用于大规模数据处理(包括机器学习和分析)的流行引擎。如果您希望使用 MLlib、分布式 PyTorch 和分布式 TensorFlow 扩展您的技能组合或在可扩展机器学习方面推进您的职业生涯,那么本实用指南适合您。
使用 Spark 作为主要数据处理平台,您将发现几种为丰富 Spark 的 ML 功能而设计和构建的开源技术。《Scaling Machine Learning with Spark(使用Spark扩展机器学习)》 研究了基于 Apache Spark 生态系统构建端到端分布式 ML 工作流的各种技术,包括 Spark MLlib、MLFlow、TensorFlow、PyTorch 和 Petastorm。
本书向您展示了何时使用每种技术以及为什么使用。如果你是一名使用机器学习的数据科学家,你将学习到如何:
0条评论