作者简介: 彭特里思,如果你是一名Scala、Java或Python开发人员,对机器学习和数据分析饶有兴趣,并热衷于学习如何使用spa rk框架将常见机器学习技术运用干大规模应用,那么这本书就是写给你的。如果对spark有基本的理解自然会有益处,但这并不是必需的。 内容简介: 你可以从书中学到使用Scala、Java和Python创建你的靠前个Spark程序;在你自己的计算机以及Amazon EC2上建立、配置Spark开发环境;访问公共机器学习数据集,使用Spark载入、处理、清理、转换数据;使用Spark的机器学习库来实现能够利用各种熟知的机器学习模型的程序;等等。 目录: Preface Chapter 1: Getting Up and Running with Spark Installing and setting up Spark locally Spark clusters The Spark programming model Spark Context and Spark Conf The Spark shell Resilient Distributed Datasets Creating RDDs Spark operations Caching RDDs Broadcast variables and accumulators The first step to a Spark program in Scala The first step to a Spark program in Java The first step to a Spark program in Python Getting Spark running on Ama ...
以下为对购买帮助不大的评价