Hadoop实战手册
正版新书 新华官方库房直发 可开电子发票
¥
41.89
7.1折
¥
59
全新
仅1件
作者 Jonathan R. Owens
出版社 人民邮电出版社
ISBN 9787115337955
出版时间 2014-03
版次 1
装帧 平装
开本 16开
纸张 胶版纸
页数 242页
字数 318千字
定价 59元
货号 SC:9787115337955
上书时间 2024-10-30
商品详情
品相描述:全新
全新正版 提供发票
商品描述
作者简介: Jonathan R.Owens:软件工程师,拥有Java和C++技术背景,最近主要从事Hadoop及相关分布式处理技术工作。目前就职于comScore公司,为核心数据处理团队成员。comScore是一家知名的从事数字测量与分析的公司,公司使用Hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 Jon Lentz:comScore核心数据处理团队软件工程师。他更倾向于使用Pig脚本来解决问题。在加入comScore之前,他主要开发优化供应链和分配固定收益证券的软件。 Brian Femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用Hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于Potomac Fusion公司,这家公司主要从事可扩展算法的开发,并致力于学习并改进政府领域中最优选和最复杂的数据集。他通过教授课程和会议培训在公司内部普及Hadoop和云计算相关的技术。 主编推荐: 超级实用的技术手册,给出有助于快速解决诸多Hadoop相关技术问题的实际解决方案。书中包含丰富的简单、实用的代码示例。 《Hadoop实战手册》特色是: 文字简洁,易于读者理解。 精挑细选,关注最重要的任务和问题。 细心组织,提供高效的问题解决方案。 讲解透彻,清晰解读每个操作步骤。 举一反三,将解决方案应用到其他场景中。 内容简介: 这是一本Hadoop实用手册,主要针对实际问题给出相应的解决方案。欧文斯等编著的《Hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS的概述、Pig与Hive的使用、ETL和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍Hadoop的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。 《Hadoop实战手册》适合各个层次的Hadoop技术人员阅读。通过阅读《Hadoop实战手册》,Hadoop初学者可以使用Hadoop来进行数据处理,Hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,Hadoop系统管理员可以更好地进行日常运维。《Hadoop实战手册》也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。 目录: 第1章Hadoop分布式文件系统——导入和导出数据 1.1介绍 1.2使用Hadoopshell命令导入和导出数据到HDFS 1.3使用distcp实现集群间数据复制 1.4使用Sqoop从MySQL数据库导入数据到HDFS 1.5使用Sqoop从HDFS导出数据到MySQL 1.6配置Sqoop以支持SQLServer 1.7从HDFS导出数据到MongoDB 1.8从MongoDB导入数据到HDFS 1.9使用Pig从HDFS导出数据到MongoDB 1.10在Greenplum外部表中使用HDFS 1.11利用Flume加载数据到HDFS中 第2章HDFS 2.1介绍 2.2读写HDFS数据 2.3使用LZO压缩数据 2.4读写序列化文件数据 2.5使用Avro序列化数据 2.6使用Thrift序列化数据 2.7使用ProtocolBuffers序列化数据 2.8设置HDFS备份因子 2.9设置HDFS块大小 第3章抽取和转换数据 3.1介绍 3.2使用MapReduce将Apache日志转换为TSV格式 3.3使用ApachePig过滤网络服务器日志中的爬虫访问量 3.4使用ApachePig根据时间戳对网络服务器日志数据排序 3.5使用ApachePig对网络服务器日志进行会话分析 3.6通过Python扩展ApachePig的功能 3.7使用MapReduce及二 ...
— 没有更多了 —
本店暂时无法向该地区发货
全新正版 提供发票
以下为对购买帮助不大的评价