• 深入大型数据集:并行与分布化Python代码
21年品牌 40万+商家 超1.5亿件商品

深入大型数据集:并行与分布化Python代码

正版图书保证质量 七天无理由退货让您购物无忧

61.4 6.2折 99 全新

库存4件

北京朝阳
认证卖家担保交易快速发货售后保障

作者(美)John T. Wolohan著

出版社电子工业出版社

ISBN9787121403682

出版时间2021-02

版次1

装帧平装

开本16开

定价99元

货号R_10931207

上书时间2024-04-09

阿莱书屋

十三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版
商品描述
本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学。第3部分介绍云计算和云存储的基础知识括如何通过boto3的Python库将文件上传到AWS S3服务,以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。本书适合有一定Python编程基础,且希望掌握大型数据集处理能力的开发人员和数据科学家阅读。

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP