Spark大数据算法
正版保障 假一赔十 电子发票
¥
81.4
5.5折
¥
148
全新
库存59件
作者(美) 马哈默德·帕瑞斯安著
出版社中国电力出版社
ISBN9787519887728
出版时间2024-05
装帧平装
开本其他
定价148元
货号4612899
上书时间2024-09-12
商品详情
- 品相描述:全新
- 商品描述
-
目录
本书内容讲述: Apache Spark不仅速度快, 易于使用, 还提供了丰富的分析能力和多语言支持, 这使得掌握这个集群计算框架的实用知识已经成为数据工程师和数据科学家的必备技能。利用这本实用指南, 想要了解Spark的人能从中学习实用的PySpark算法和示例。利用这本书, 你将学习以下内容: 了解如何选择Spark转换实现优化的解决方案。
内容摘要
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames API分析图数据。对临床医学和基因组数据应用PySpark算法。学习如何在ML算法中使用和应用特征工程。了解并使用实用的数据设计模式。
— 没有更多了 —
以下为对购买帮助不大的评价