• 大数据原理与技术
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

大数据原理与技术

43.97 6.3折 69.8 全新

库存4件

山东泰安
认证卖家担保交易快速发货售后保障

作者黄史浩

出版社人民邮电出版社

出版时间2022-12

版次1

装帧平装

货号607 9-3

上书时间2024-09-03

邹鲁文化书店

十一年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
图书标准信息
  • 作者 黄史浩
  • 出版社 人民邮电出版社
  • 出版时间 2022-12
  • 版次 1
  • ISBN 9787115597366
  • 定价 69.80元
  • 装帧 平装
  • 开本 其他
  • 纸张 胶版纸
  • 页数 288页
  • 字数 372千字
【内容简介】
本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;然后结合大数据平台的各个模块,详细介绍了大数据的存储、处理、分析、可视化等方面的原理和操作;最后介绍了大数据在各行业中的应用,让读者更加充分地感受到大数据技术的优势,以及大数据应用的价值。 本书适合高等院校相关专业的学生使用,也适合参加大数据技术培训课程的人员使用,还可以作为从事ICT行业相关工作的人员和大数据技术爱好者的参考书。
【作者简介】
黄史浩 

多年的Hadoop大数据平台企业业务应用实践,具有丰富的Hadoop平台运维,开发与分析实战经验 2. 主导过多个大型大数据项目的开发,如维达国际大数据平台、中国商品进出口交易中心ETL日志分析大数据平台 3、多年大数据与数据挖掘等IT领域技术培训经验,丰富的课程设计和授课经验。
【目录】
第 1 章 大数据概述  0 

11 大数据的概念与价值  2 

111 大数据的基本概念  2 

112 大数据的来源  4 

113 大数据的价值  5 

114 挖掘企业大数据价值的方式  7 

12 大数据的关键技术  7 

121 大数据采集、预处理、存储与管理  8 

122 大数据分析与挖掘  8 

123 大数据可视化  9 

13 大数据产业  9 

131 数据提供  9 

132 技术提供  10 

133 服务提供  10 

14 大数据应用场景  11 

15 本章总结  11 

练习题 12 

第 2 章 Hadoop 大数据处理平台  14 

21 Hadoop 平台概述  16 

211 Hadoop 起源及发展  16 

212 Hadoop 特性 17 

213 Hadoop 应用现状  17 

214 Hadoop 版本及相关平台  18 

22 Hadoop 生态系统  18 

221 HDFS 和 HBase  18 

222 MapReduce 和 YARN  19 

223 Hive  20 

224 Sqoop 和 Flume  20 

225 ZooKeeper 和 Oozie  20 

226 Kerberos 和 LDAP  21 

227 Impala 和 Solr  21 

228 Kafka  21 

23 Hadoop 安装部署  22 

231 Hadoop 规划部署  22 

232 Hadoop 的安装方式  23 

24 华为 FusionInsight HD 安装部署  27 

241 FusionInsight HD 简介  27 

242 FusionInsight HD 集成设计  29 

243 FusionInsight HD 安装部署  35 

244 FusionInsight HD 重要参数配置  44 

25 本章总结  45 

练习题  45 

第 3 章 HDFS  48 

31 概述  50 

311 DFS 的概念与作用  51 

312 HDFS 概述  51 

32 HDFS 的相关概念  52 

321 HDFS 块  52 

322 NameNode  53 

323 Secondary NameNode  54 

324 DataNode  55 

33 HDFS 体系架构与原理  56 

331 HDFS 体系架构  56 

332 HDFS 的高可用机制  56 

333 HDFS 的目录结构  58 

334 HDFS 的数据读写过程  61 

34 HDFS 接口及其在 FusionInsight HD 编程中的实践  63 

341 HDFS 常用的 Shell 命令  63 

342 HDFS 的 Web 界面  65 

343 HDFS 的 Java API 及应用实例  66 

35 本章总结  72 

练习题 73 

第 4 章 MapReduce 和 YARN  76 

41 MapReduce 技术原理  78 

411 MapReduce 概述  79 

412 Map 函数与 Reduce 函数  79 

42 YARN 技术原理  80 

421 YARN 的概述与应用  80 

422 YARN 的架构  81 

423 MapReduce 的计算过程  82 

424 YARN 的资源调度  84 

43 FusionInsight HD 中 MapReduce 的应用  85 

431 WordCount 实例分析  85 

432 MapReduce 编程实践  86 

44 本章总结  93 

练习题 93 

第 5 章 HBase  96 

51 HBase 概述与应用  98 

511 HBase 简介 98 

512 HBase 的特性  99 

513 HBase 与关系数据库的区别  100 

514 HBase 的应用场景  100 

52 HBase 的架构原理  101 

521 HBase 的数据模型  101 

522 表和 Region  102 

523 HBase 的系统架构与功能组件  103 

524 HBase 的读写流程  104 

525 HBase 的 Compaction 过程  106 

53 FusionInsight HD 中 HBase 的编程实践  107 

531 FusionInsight HD 中 HBase 的常用参数配置  107 

532 HBase 常用的 Shell 命令  109 

533 HBase 常用的 Java API 及应用实例  112 

54 本章总结  131 

练习题  131 

第 6 章 Hive  134 

61 Hive 概述  136 

611 Hive 的基本概念及应用  136 

612 Hive 的特性  137 

613 Hive 与传统数据仓库的区别  138 

62 Hive 的架构和数据存储  138 

621 Hive 的架构原理  139 

622 Hive 的数据存储模型  141 

623 HiveQL 编程  142 

63 FusionInsight HD 中 Hive 的应用实践  148 

631 FusionInsight HD 中 Hive 的常用参数配置  148 

632 加载数据到 Hive  149 

633 使用 HiveQL 进行数据分析  151 

64 本章总结  156 

练习题  156 

第 7 章 Sqoop 和 Loader  158 

71 Sqoop 概述  160 

711 Sqoop 简介与应用  161 

712 Sqoop 的功能与特性  161 

713 Sqoop 与传统 ETL 的区别  162 

72 FusionInsight HD 中 Loader 的应用实践  162 

721 FusionInsight HD 中 Loader 与 Sqoop 的对比  163 

722 FusionInsight HD 中 Loader 的参数配置  164 

723 使用 Loader 进行数据转换  165 

724 Loader 常用的 Shell 命令  166 

725 Loader 应用实践  168  

73 本章总结  170 

练习题  170 

第 8 章 Flume  172 

81 Flume 概述  174 

811 Flume 简介  174 

812 Flume 的功能与特性  177 

813 Flume 与其他主流开源日志收集系统的区别  178 

82 FusionInsight HD 中 Flume 的应用实践  178 

821 FusionInsight HD 中 Flume 的常用参数配置  179 

822 Flume 常用的 Shell 命令  180 

823 Flume 与 Kafka 结合进行日志处理  181 

83 本章总结  184 

练习题  185 

第 9 章 Spark  186 

91 Spark 概述  188 

911 Spark 的概述与应用  189 

912 Scala 语言介绍  190 

913 Spark 生态系统组件  190 

914 Spark 与 Hadoop 的对比  191 

92 Spark 技术架构  192 

921 Spark 的运行原理  192 

922 RDD 概念与原理  194 

923 Spark 的 3 种部署方式  196 

924 使用开发工具测试 Spark  198 

93 FusionInsight HD 中 Spark 的应用实践  199 

931 运行 Spark Shell  199 

932 进行 Spark RDD 操作  200 

933 使用 Spark 客户端工具运行 Spark 程序  202 

94 Spark Streaming  206 

941 Spark Streaming 的设计思想  206 

942 Spark Streaming 的应用实例  206 

95 Spark SQL  210 

951 Spark SQL 的功能  210 

952 FusionInsight HD 中 Spark SQL 的应用实例  210 

96 Spark MLlib  212 

961 机器学习简介  212 

962 Spark MLlib 的功能  213 

97 Spark GraphX  213 

971 图计算简介  213 

972 Spark GraphX 功能简介 214 

98 本章总结  214 

练习题  215 

第 10 章 大数据流计算  216 

101 流计算概述  218 

1011 静态数据和流数据的概念  219 

1012 流计算的概念  219 

1013 MapReduce 和流计算  220 

1014 流计算框架  220 

102 流计算的处理流程  221 

1021 数据实时采集  221 

1022 数据实时计算  221 

1023 数据实时查询  222 

103 Streaming 流计算  222 

1031 Streaming 简介  222 

1032 Streaming 的特点  225 

1033 Streaming 中 FusionInsight HD 的应用实践  226 

1034 Spark Streaming 与 Streaming 的差异  231 

104 本章总结  232 

练习题  233 

第 11 章 数据可视化  234 

111 可视化概述  236 

1111 数据可视化简介  237  

1112 数据可视化的重要性  237 

1113 可视化的发展历程  238 

1114 数据可视化的实现过程  239 

112 可视化工具  240 

1121 入门级工具(Excel)  240 

1122 普通工具(R 语言)  240 

1123 高级工具(Tableau 和 QlikView)  241 

113 可视化的典型应用  241 

1131 可视化在医学上的应用  241 

1132 可视化在工程中的应用  242 

1133 可视化在互联网中的应用  243 

114 本章总结  243 

练习题  244 

第 12 章 大数据行业应用  246 

121 大数据在金融行业中的应用  248 

122 大数据在电信行业中的应用  250 

123 大数据在互联网行业中的应用  253 

124 本章总结  254 

练习题  255 

术语表  256 

参考文献  268
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP