消息首页搜索举报

Hadoop数据分析/图灵程序设计丛书9787115479648

正版图书，可开发票，请放心购买。

53.97 7.8折 69 全新

库存2件

广东广州

认证卖家担保交易快速发货售后保障

作者(美)本杰明·班福特//珍妮·基姆|译者:王纯超

出版社人民邮电

ISBN9787115479648

出版时间2018-04

装帧其他

开本其他

定价69元

货号30146481

上书时间2024-07-30

淘书宝店

九年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 8小时
好评率暂无

店主推荐
最新上架

基因Ⅻ9787040486896 ¥498.00

美国陆军·装甲旅战斗队目标编制与装备 20179787547613573 ¥200.00

精神分析研究第二辑9787100126359 ¥252.00

直击二战：钢铁的碰撞·库尔斯克战役9787548424161 ¥50.00

DARPA创新计划Ⅱ9787118116304 ¥350.00

军事系统建模与仿真9787118105056 ¥228.00

超声相控阵原理9787118111545 ¥242.00

机载雷达多目标跟踪技术9787118088311 ¥130.00

联合作战计划时空推演理论与技术9787118117851 ¥260.00

平安小猪9787513340694 ¥49.44

中国岩画的文献学研究9787558078743 ¥34.00

小学生图解英汉词典(多功能彩图版)(精)9787572200861 ¥25.33

幼儿师范经典儿童钢琴曲集9787540445546 ¥14.30

双碳化学(陈建)9787122447388 ¥35.69

中国儿童文学阅读计划：教室里的名著阅读59787571121518 ¥16.31

中国儿童文学阅读计划：教室里的名著阅读49787571121464 ¥11.82

不凌乱!小学生的整理收纳锦囊9787573623423 ¥24.06

六年级课外阅读推荐全套19册9787544847223 ¥439.04

商品详情

品相描述：全新

商品描述: 作者简介
本杰明·班福特（Benjamin Bengfort），数据科学家，目前正在马里兰大学攻读博士学位，方向为机器学习和分布式计算；熟悉自然语言处理、Python数据科学、Hadoop和Spark分析等。
珍妮·基姆（Jenny Kim），经验丰富的大数据工程师，不仅进行商业软件的开发，在学术界也有所建树，在海量数据、机器学习以及生产和研究环境的Hadoop实施方面有深入研究。目前任职于Cloudera的Hue团队。

目录
前言
第一部分  分布式计算入门
  第1章  数据产品时代
    1.1 什么是数据产品
    1.2 使用Hadoop构建大规模数据产品
      1.2.1 利用大型数据集
      1.2.2 数据产品中的Hadoop
    1.3 数据科学流水线和Hadoop生态系统
    1.4 小结
  第2章  大数据操作系统
    2.1 基本概念
    2.2 Hadoop架构
      2.2.1 Hadoop集群
      2.2.2 HDFS
      2.2.3 YARN
    2.3 使用分布式文件系统
      2.3.1 基本的文件系统操作
      2.3.2 HDFS文件权限
      2.3.3 其他HDFS接口
    2.4 使用分布式计算
      2.4.1 MapReduce：函数式编程模型
      2.4.2 MapReduce：集群上的实现
      2.4.3 不止一个MapReduce：作业链
    2.5 向YARN提交MapReduce作业
    2.6 小结
  第3章  Python框架和Hadoop Streaming
    3.1 Hadoop Streaming
      3.1.1 使用Streaming在CSV数据上运行计算
      3.1.2 执行Streaming作业
    3.2 Python的MapReduce框架
      3.2.1 短语计数
      3.2.2 其他框架
    3.3 MapReduce进阶
      3.3.1 combiner
      3.3.2 partitioner
      3.3.3 作业链
    3.4 小结
  第4章  Spark内存计算
    4.1 Spark基础
      4.1.1 Spark栈
      4.1.2 RDD
      4.1.3 使用RDD编程
    4.2 基于PySpark的交互性Spark
    4.3 编写Spark应用程序
    4.4 小结
  第5章  分布式分析和模式
    5.1 键计算
      5.1.1 复合键
      5.1.2 键空间模式
      5.1.3 pair与stripe

内容摘要
通过提供分布式数据存储和并行计算框架，Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本杰明·班福特、珍妮·基姆著的《Hadoop数据分析》旨在通过以可读且直观的方式提供集群计算和分析的概览，为数据科学家深入了解特定主题领域铺平道路，从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分，第一部分从非常高的层次介绍分布式计算，讨论如何在集群上运行计算；第二部分则重点关注数据科学家应该了解的工具和技术，意在为各种分析和大规模数据管理提供动力。
本书适合数据科学领域的从业人员，以及对数据分析感兴趣的研究人员。

— 没有更多了 —