消息首页搜索举报

【现货速发】Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统

全新正版书籍，24小时发货，可开发票。

47.9 8.0折 59.8 全新

库存4件

天津津南

认证卖家担保交易快速发货售后保障

作者[美] Kerry Koitzsch 著王建峰王瑛琦于金峰译

出版社清华大学出版社

ISBN9787302487302

出版时间2018-01

装帧平装

开本16开

定价59.8元

货号25203126

上书时间2024-12-19

易安居书舍

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 14小时
好评率暂无

最新上架

【现货速发】中学英汉双解多功能学习词典(便携本)/李法敏 ¥46.60

【现货速发】从对话机器人到医疗图像处理/深度学习商业应用开发指南 ¥46.00

【现货速发】大败局I（纪念版）（财经作家吴晓波经典之作，影响中国商业界的二十本图书”之一，关于中国企业失败的MBA式教案） ¥40.30

【现货速发】弦乐四重奏经典名曲库·巴洛克作品集 ¥16.10

【现货速发】文化哲学(第2辑)/黑龙江大学文化哲学研究中心文库 ¥46.10

【现货速发】少年维特之烦恼/著名翻译家关惠文插图全译本(精装) ¥13.50

【现货速发】用思维导图速记小学生英语单词 ¥23.40

【现货速发】小升初家长手册：欢迎来到六年级 ¥27.20

【现货速发】初中生英语作文 ¥11.00

商品详情

品相描述：全新

商品描述

前言

Apache Hadoop软件库逐渐受到重视。它是许多公司、政府机构、科研设施进行高级分布式开发的基础。Hadoop生态系统现在包含几十个组件用于搜索引擎、数据库和数据仓库进行图像处理、深度学习及自然语言处理。随着Hadoop2的出现，不同的资源管理器可用于提供更高级别的复杂性和控制力。竞争对手、替代品以及Hadoop技术和架构的继承/变种比比皆是，包括Apache Flink、Apache Spark等。软件专家和评论员多次宣布“Hadoop的死亡”。

我们必须正视一个问题：Hadoop死了吗？这取决于Hadoop本身的感知界限。我们是否认为Apache Spark是Hadoop批处理文件方法的内存继承者，是Hadoop家族的一部分，仅仅因为Apache Spark也使用了Hadoop文件系统HDFS？存在很多“灰色区域”的其他例子，其中较新的技术取代或增强了原有的“Hadoop经典”功能。分布式计算是一个不断移动的目标，是Hadoop和Hadoop生态系统的分界线，在短短几年间已经发生了显著变化。在本书中，我们试图展示Hadoop及其相关生态系统的一些多样的、动态的方面，并试图说服你，尽管Hadoop发生变化，但它依然非常活跃、与当前的软件开发相关并且使数据分析程序员特别感兴趣。

导语摘要
掌握Hadoop高级数据分析技术　　学习高级分析技术，并利用现有工具包使分析应用更加强大、精确和高效！《Hadoop高级数据分析　使用Hadoop生态系统设计和构建大数据系统》将架构、设计及实现信息恰当地融为一体，将指导你创建超越基础方法(SF分类、聚类、推荐)的分析系统。　　在《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》中，*实践强调“确保连贯、高效的开发”。将使用包含工具箱、库、可视化组件和报表代码在内的标准第三方组件，借助集成“组合件”开发一个可运行的、可扩展的、端到端的完整示例系统。《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》强调以下四点：● 具有分析组件及合理可视化结果的完整、灵活、可配置、高性能数据管道系统的重要性。深入探讨的主题包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache Mahout，以及其他适用的工具包、库和插件。● *实践和结构化设计原则。包括重要主题及示例部分。● 用混合搭配或混合系统实现应用目标的重要性。你在学习深度示例时可体会到混合方法的重要性。● 使用现有第三方库是有效开发的关键。在开发示例系统时，深度示例将展示一些第三方工具包的功能。

商品简介

掌握Hadoop高级数据分析技术　　学习高级分析技术，并利用现有工具包使分析应用更加强大、精确和高效！《Hadoop高级数据分析　使用Hadoop生态系统设计和构建大数据系统》将架构、设计及实现信息恰当地融为一体，将指导你创建超越基础方法(SF分类、聚类、推荐)的分析系统。　　在《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》中，*实践强调“确保连贯、高效的开发”。将使用包含工具箱、库、可视化组件和报表代码在内的标准第三方组件，借助集成“组合件”开发一个可运行的、可扩展的、端到端的完整示例系统。《Hadoop 高级数据分析使用Hadoop 生态系统设计和构建大数据系统》强调以下四点： ● 具有分析组件及合理可视化结果的完整、灵活、可配置、高性能数据管道系统的重要性。深入探讨的主题包括Spark、H2O、Vopal Wabbit(NLP)、Stanford NLP、Apache Mahout，以及其他适用的工具包、库和插件。 ● *实践和结构化设计原则。包括重要主题及示例部分。 ● 用混合搭配或混合系统实现应用目标的重要性。你在学习深度示例时可体会到混合方法的重要性。 ● 使用现有第三方库是有效开发的关键。在开发示例系统时，深度示例将展示一些第三方工具包的功能。

作者简介
Kerry Koitzsch在计算机科学、图像处理和软件工程等领域拥有超过二十年的工作经验，致力于研究Apache Hadoop和Apache Spark技术。Kerry擅长软件咨询，精通一些定制的大数据应用，包括分布式搜索、图像分析、立体视觉和智能图像检索系统。Kerry目前就职于Kildane软件技术股份有限公司，该公司是加州桑尼维尔市的一个机器人系统和图像分析软件提供商。

目录

第Ⅰ部分　概念

第1章　概述：用Hadoop构建数据分析

系统
3

1.1　构建DAS的必要性 4

1.2　Hadoop Core及其简史 4

1.3　Hadoop生态系统概述 5

1.4　AI技术、认知计算、深度学习

以及BDA 6

1.5　自然语言处理与BDAS 6

1.6　SQL与NoSQL查询处理 6

1.7　必要的数学知识 7

1.8　设计及构建BDAS的循环过程 7

1.9　如何利用Hadoop生态系统

实现BDA 10

1.10　“图像大数据”(IABD)基本

思想 10

1.10.1　使用的编程语言 12

1.10.2　Hadoop生态系统的多语言

组件 12

1.10.3　Hadoop生态系统架构 13

1.11　有关软件组合件与框架的

注意事项 13

1.12　Apache Lucene、Solr及其他：

开源搜索组件 14

1.13　建立BDAS的架构 15

1.14　你需要了解的事情 15

1.15　数据可视化与报表 17

1.15.1　使用Eclipse IDE作为开发

环境 18

1.15.2　本书未讲解的内容 19

1.16　本章小结 21

第2章　Scala及Python进阶 23

2.1　动机：选择正确的语言定义

应用 23

2.2　Scala概览 24

2.3　Python概览 29

2.4　错误诊断、调试、配置文件及

文档 31

2.4.1　Python的调试资源 32

2.4.2　Python文档 33

2.4.3　Scala的调试资源 33

2.5　编程应用与示例 33

2.6　本章小结 34

2.7　参考文献 34

第3章　Hadoop及分析的标准工具集 35

3.1　库、组件及工具集：概览 35

3.2　在评估系统中使用深度学习方法 38

3.3　使用Spring框架及Spring
Data 44

3.4　数字与统计库：R、Weka及

其他 44

3.5　分布式系统的OLAP技术 44

3.6　用于分析的Hadoop工具集：

Apache Mahout及相关工具 45

3.7　Apache
Mahout的可视化 46

3.8　Apache
Spark库与组件 46

3.8.1　可供选择的不同类型的shell 46

3.8.2　Apache Spark数据流 47

3.8.3　Sparkling Water与H2O

机器学习 48

3.9　组件使用与系统建立示例 48

3.10　封包、测试和文档化示例

系统 50

3.11　本章小结 51

3.12　参考文献 51

第4章　关系、NoSQL及图数据库 53

4.1　图查询语言：Cypher及

Gremlin 55

4.2　Cypher示例 55

4.3　Gremlin示例 56

4.4　图数据库：Apache
Neo4J 58

4.5　关系数据库及Hadoop生态

系统 59

4.6　Hadoop以及UA组件 59

4.7　本章小结 63

4.8　参考文献 64

第5章　数据管道及其构建方法 65

5.1　基本数据管道 66

5.2　Apache Beam简介 67

5.3　Apache Falcon简介 68

5.4　数据源与数据接收：使用

Apache Tika构建数据管道 68

5.5　计算与转换 70

5.6　结果可视化及报告 71

5.7　本章小结 74

5.8　参考文献 74

第6章　Hadoop、Lucene、Solr与

高级搜索技术 75

6.1　Lucene/Solr生态系统简介 75

6.2　Lucene查询语法 76

6.3　使用Solr的编程示例 79

6.4　使用ELK栈(Elasticsearch、

Logstash、Kibana)
85

6.5　Solr与Elasticsearch：特点与

逻辑 93

6.6　应用于Elasticsearch和Solr的

Spring
Data组件 95

6.7　使用LingPipe和GATE实现定制

搜索 99

6.8　本章小结 108

6.9　参考文献 108

【现货速发】Hadoop高级数据分析 使用Hadoop生态系统设计和构建大数据系统

易安居书舍

商品详情

【现货速发】Hadoop高级数据分析使用Hadoop生态系统设计和构建大数据系统