• Hadoop与Spark入门
21年品牌 40万+商家 超1.5亿件商品

Hadoop与Spark入门

42.53 7.2折 59 九五品

仅1件

天津武清
认证卖家担保交易快速发货售后保障

作者覃雄派,陈跃国

出版社清华大学出版社

ISBN9787302613633

出版时间2022-11

版次1

装帧平装

开本16开

纸张胶版纸

定价59元

上书时间2024-05-07

鲁是特

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九五品
商品描述
基本信息
书名:Hadoop与Spark入门
定价:59.00元
作者:覃雄派,陈跃国
出版社:清华大学出版社
出版日期:2022-11-01
ISBN:9787302613633
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要

目录
章VMware与虚拟机11.1VMware简介11.2VMware的安装21.3VMware的网络配置21.3.1VMnet0网卡配置21.3.2VMnet1网卡配置31.3.3VMnet8网卡配置31.4Windows环境下对VMnet8的DNS进行配置61.5利用管理员权限编辑网卡71.6总结71.7思考题8参考文献8第2章CentOS操作系统安装92.1新建VMware虚拟机92.2安装CentOS142.3配置Yum182.4为CentOS安装图形用户界面202.5CentOS的网络配置202.5.1虚拟机的网络配置202.5.2在CentOS操作系统里对网卡进行设置212.6Samba配置232.7配置SSHD262.8重新启动虚拟机需要执行的命令272.9思考题28第3章Hadoop入门293.1Hadoop简介293.2HDFS303.2.1写文件313.2.2读文件323.2.3Secondary NameNode介绍333.3MapReduce工作原理343.3.1MapReduce执行引擎353.3.2MapReduce计算模型373.3.3Hadoop 1.0的应用383.4Hadoop生态系统383.5Hadoop 2.0403.5.1Hadoop 1.0的优势和局限403.5.2从Hadoop 1.0到Hadoop 2.0413.5.3YARN原理413.5.4YARN的优势433.6思考题44〖3〗Hadoop与Spark入门目录〖3〗第4章Hadoop安装与HDFS、MapReduce实验454.1安装K454.2新建虚拟机集群474.2.1网络配置小结474.2.2配置各个虚拟机别名484.2.3配置各个虚拟机的/etc/hosts文件484.3无密码SSH登录494.4Hadoop安装、配置和启动524.4.1coresite.xml配置文件544.4.2hdfssite.xml配置文件544.4.3mapredsite.xml配置文件554.4.4yarnsite.xml配置文件564.4.5配置hadoopenv.sh脚本文件594.4.6配置yarnenv.sh脚本文件594.4.7主机配置594.5格式化HDFS604.6启动Hadoop604.7报告HDFS的基本信息624.8使用日志624.9Hadoop管理界面634.10Hadoop测试634.10.1HDFS常用文件操作命令634.10.2测试WordCount程序644.11配置History Server644.12若干问题解决654.13HDFS Java程序分析694.14WordCount程序代码简单分析734.15MapReduce Sort764.16MapReduce Java开发环境配置764.17思考题79参考文献80第5章HBase简介、部署与开发815.1HBase简介815.2HBase访问接口815.3HBase的数据模型825.4HBase系统架构835.5HBase存储格式855.6在HBase系统上运行MapReduce875.7HBase安装、配置与运行875.8启动HBase并且测试905.9使用HBase Shell925.10HBase Java实例分析935.11若干问题解决975.12思考题99参考文献99第6章Hive数据仓库1006.1Hive简介1006.2Hive数据模型1026.3Hive安装、配置和运行1036.3.1使用MySQL进行元信息管理1046.3.2安装和配置Hive1056.3.3启动Hive1086.4若干问题解决1106.5hiveserver2与beeline1126.6Hive安装问题1156.7HWI服务1156.8Metastore服务1166.9Hive的Java开发1166.10Tez简介1196.10.1Hadoop 2.0上的交互式查询引擎Hive oTez1196.10.2把数据处理逻辑建模成一个DAG连接起来的任务1216.11Hadoop平台上的列存储技术1216.11.1列存储的优势1216.11.2Parquet列存储格式1216.12思考题126参考文献126第7章Spark及其生态系统1277.1Spark简介1277.1.1Spark软件架构1277.1.2Spark的主要优势1287.2Hadoop的局限和Spark的诞生1297.3Spark的特07.4Spark生态系统1317.5RDD及其处理1327.5.1DAG、宽依赖与窄依赖1337.5.2DAG的调度执行1347.6Spark的部署1357.7Spark SQL1367.8Spark的应用案例1377.9总结1387.10思考题138参考文献138第8章Spark的安装、部署与运行1398.1Spark的安装、配置与运行1398.2启动Spark1428.2.1启动sparksql shell运行SQL1448.2.2启动pyspark shell运行SQL1448.2.3用pyspark shell进行数据处理1458.2.4启动scala shell运行WordCount1458.2.5启动scala shell运行SQL(本地文件)1468.2.6启动scala shell运行SQL(HDFS文件)1478.2.7配置和启动Thrift Server1478.2.8错误分析1508.3在Windows上用Eclipse调试Spark Java程序1518.4在Windows上安装Maven和配置Eclipse1578.5思考题160参考文献160第9章Spark SQL1629.1Spark SQL简介1629.2查询本地文件、HDFS文件以及HDFS Parquet列存储格式文件1639.3内置实例分析与Java开发1669.3.1通过SQL Explorer插件存取Spark SQL1669.3.2BC Java编程1679.4思考题170参考文献1700章Spark MLlib17110.1MLlib简介17110.2启动平台软件17210.3分类实例17310.4聚类实例17810.5线性回归18010.6协同过滤推荐18110.7思考题184参考文献1851章Spark GraphX18611.1GraphX简介18611.2PageRank18811.3思考题190参考文献1902章Flume入门19112.1Flume简介19112.2Flume的特性19212.3Flume的系统架构和运行机制19212.4Flume的安装、配置和运行19512.5使用netcat完成数据注入的实例19712.6以HBase为目标数据库的实例19812.7以Hive为目标数据库的实例20012.8Java开发20412.9如何安装netcat20412.10思考题204参考文献2043章Kafka入门20613.1Kafka简介20613.1.1话题和分区20713.1.2数据分布与存储20813.1.3代理20913.1.4生产者20913.1.5消费者20913.1.6消息的顺序21013.1.7Kafka的应用场景21113.1.8小结21313.2Zookeeper与Kafka21313.3Kafka的流数据处理组件Kafka Streams21413.4Kafka在系统中的位置21413.5Kafka的安装、配置和运行21513.5.1单Broker部署21513.5.2多Broker部署21713.5.3测试容错性21913.6安装问题22013.7Kafka的Java编程22013.8Kafka的综合实例22713.9Kafka与Flume的配合22813.10流处理与批处理的结合23113.11思考题232参考文献232
作者介绍

序言

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP