• 大数据猩球:海量数据处理实践指南
21年品牌 40万+商家 超1.5亿件商品

大数据猩球:海量数据处理实践指南

全新正版现货

54.5 7.9折 69 全新

仅1件

江苏无锡
认证卖家担保交易快速发货售后保障

作者(美)Philip Kromer(菲利普·克罗默),Russell Jurney(拉塞尔·贾米) 著,唐李洋 译

出版社电子工业出版社

ISBN9787121294181

出版时间2016-08

装帧平装

开本16开

纸张胶版纸

定价69元

货号24009353

上书时间2024-07-19

乐淘正品书城

五年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版全新
商品描述

编辑推荐】:
从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用Apache Hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合Hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,*部分解释了Hadoop和MapReduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用Apache Pig进行数据处理。
■ 学习使用Hadoop的必要原理,包括数据和计算在集群中的移动行为
■ 深入理解MapReduce机制,用Python创建你的*个MapReduce作业
■ 理解如何以Pig脚本的形式运行MapReduce作业链
■ 全书使用真实数据集,即棒球统计数据集
■ 提供分析模式的示例,并学习何时何地使用这些分析模式

内容简介】:
本书以实用的、可操作的视角解释了大数据——采用黑猩猩和大象的隐喻,基于棒球统计数据集,使用Apache Hadoop和Pig等工具展示了如何处理大规模数据。此外,通过处理真实数据、解决现实问题,作者还以实例的形式总结了一些实践分析模式,为有创造力的分析人员提供了强大、有价值的方法。本书特别适合那些需要大数据工具箱来解决实际问题的人们。

作者简介】:

目录】:
前言 ..................................................................................................XI
部分 入门 :理论和工具
第 1 章 Hadoop 基础 ........................................................................3
黑猩猩和大象创业 .................................................................................................................4
Map-Only 作业 :逐个处理记录 ...........................................................................................5
Pig Latin Map-Only 作业........................................................................................................6
创建 Docker Hadoop 集群 ......................................................................................................8
运行作业 .......................................................................................................................12
小结 .......................................................................................................................................15
第 2 章 MapReduce........................................................................17
黑猩猩和大象拯救圣诞节 ...................................................................................................17
玩具岛上的麻烦 ...........................................................................................................17
黑猩猩把信件变成带标签的玩具表 ...........................................................................19
小象将玩具表送到适当的工作台 .......................................................................................21
示例 :驯鹿游戏 ...................................................................................................................23
UFO 数据 ......................................................................................................................24
根据报道延迟对 UFO 目击分组 .................................................................................24
Mapper ..........................................................................................................................24
Reducer .........................................................................................................................26
数据可视化 ...................................................................................................................29
驯鹿小结 .......................................................................................................................30
Hadoop 与传统数据库 .........................................................................................................30
MapReduce 俳句 ...................................................................................................................31
Map 阶段简述 ..............................................................................................................32
Group-Sort 阶段简述 ...................................................................................................32
Reduce 阶段简述 ..........................................................................................................32
小结 .......................................................................................................................................33
第 3 章 棒球数据集速览 ..................................................................35
数据 .......................................................................................................................................35
缩略词和术语 .......................................................................................................................36
规则和目标 ...........................................................................................................................37
评价指标 ...............................................................................................................................37
小结 .......................................................................................................................................38
第 4 章 Pig 入门 ..............................................................................39
Pig 帮助 Hadoop 处理数据表,而不是记录 ......................................................................39
维基百科访问数统计 ....................

—  没有更多了  —

以下为对购买帮助不大的评价

正版全新
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP