微瑕大数据技术基础
¥
24.9
5.0折
¥
49.8
全新
仅1件
作者张成文
出版社人民邮电出版社
ISBN9787115636492
出版时间2024-08
版次1
装帧平装
开本16开
纸张胶版纸
定价49.8元
货号2170-9787115636492
上书时间2024-11-02
商品详情
- 品相描述:全新
- 商品描述
-
基本信息
书名:大数据技术基础
定价:49.8元
作者:张成文
出版社:人民邮电出版社
出版日期:2024-08-01
ISBN:9787115636492
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
1. 实用性:书中详细介绍了大数据技术的实际应用,提供了实用的案例分析和实战经验分享。2. 前沿内容:涵盖了新的大数据技术和工具,让读者能够紧跟技术发展的脚步。3. 适用人群广泛:内容既适合大数据初学者,也适合已有经验的专家。每一章节都有深入浅出的讲解。4. 实际问题解决:书中深入探讨了大数据在各个行业中的应用,提供了实际问题的解决方案。
内容提要
大数据技术作为处理海量数据的关键工具,在数据分析、数据计算、资源管理等领域得到广泛应用。本书从初学者的角度出发,全面系统地介绍了Python大数据分析、数据存储、离线计算与实时计算等基本概念与方法,并以大量案例帮助读者理解大数据技术的方方面面。此外,本书还介绍了Kafka、图数据处理、OLAP数据分析、分布式资源管理和大数据处理架构等知识,以帮助读者快速熟悉大数据技术,并应用大数据技术解决现实生活中的问题。本书内容新颖,案例丰富,既可作为高等院校计算机、数据分析等相关专业的教学用书,也可供对大数据技术感兴趣的初学者,以及从事数据科学、大数据技术研究和应用开发的人员参考。
目录
章 大数据概述 11.1 基本概念 11.1.1 5V特征 11.1.2 数据类型 21.1.3 大数据平台 31.1.4 大数据的处理流程 41.2 相关技术 51.2.1 数据采集 51.2.2 数据预处理 61.2.3 数据存储 61.2.4 数据挖掘与数据分析 61.2.5 数据可视化 81.3 应用领域 91.4 课后习题 9第 2章 Python大数据分析 102.1 Python介绍 102.1.1 Python的应用场景 102.1.2 Python的优点与缺点 102.2 NumPy介绍 112.2.1 NumPy的应用场景 112.2.2 NumPy的数组对象与用法 112.3 pandas介绍 152.3.1 pandas的应用场景 152.3.2 pandas的数据结构与用法 152.4 Matplotlib介绍 202.4.1 Matplotlib库的应用场景 202.4.2 图表绘制 202.5 实践操作 282.6 小结 332.7 课后习题 33第3章 Kafka 343.1 Kafka介绍 343.1.1 Kafka的基本架构 343.1.2 Kafka的作用 363.2 Kafka的重要特性 373.2.1 高吞吐 373.2.2 高可用 383.3 安装与配置 393.3.1 ZooKeeper的安装与配置 393.3.2 Kafka的安装与配置 403.4 实践操作 413.5 小结 443.6 课后习题 44第4章 数据存储 454.1 HDFS 454.1.1 Hadoop介绍 454.1.2 HDFS介绍 464.1.3 安装与配置 514.1.4 实践操作 614.1.5 小结 664.1.6 课后习题 664.2 HBase 664.2.1 HBase介绍 664.2.2 技术对比 704.2.3 安装与配置 714.2.4 实践操作 734.2.5 小结 754.2.6 课后习题 764.3 Redis 764.3.1 Redis介绍 764.3.2 安装与配置 804.3.3 实践操作 824.3.4 小结 854.3.5 课后习题 85第5章 图数据处理 865.1 Neo4j 865.1.1 Neo4j介绍 865.1.2 安装与配置 895.1.3 实践操作 905.1.4 小结 965.1.5 课后习题 975.2 Spark GraphX 975.2.1 图计算基础知识 975.2.2 Spark GraphX介绍 995.2.3 实践操作 1015.2.4 小结 1065.2.5 课后习题 106第6章 离线计算 1076.1 MapReduce 1076.1.1 MapReduce介绍 1086.1.2 安装与配置 1106.1.3 实践操作 1126.1.4 小结 1336.1.5 课后习题 1346.2 Spark 1346.2.1 Spark介绍 1346.2.2 RDD 1386.2.3 安装与配置 1436.2.4 实践操作 1456.2.5 小结 1516.2.6 课后习题 151第7章 实时计算 1527.1 Storm 1527.1.1 流计算介绍 1527.1.2 Storm介绍 1537.1.3 实践操作 1567.1.4 小结 1647.1.5 课后习题 1647.2 Spark Streaming 1657.2.1 Spark Streaming介绍 1657.2.2 DStream操作 1687.2.3 实践操作 1727.2.4 小结 1747.2.5 课后习题 1757.3 Flink 1757.3.1 Flink介绍 1757.3.2 技术对比 1797.3.3 实践操作 1807.3.4 小结 1867.3.5 课后习题 186第8章 OLAP数据分析 1878.1 Pig 1878.1.1 Pig介绍 1878.1.2 Pig Latin语言介绍 1898.1.3 Pig的安装与配置 1918.1.4 实践操作 1928.1.5 小结 1958.1.6 课后习题 1968.2 Hive 1968.2.1 数据仓库介绍 1968.2.2 Hive介绍 1978.2.3 技术对比 2018.2.4 安装与配置 2028.2.5 实践操作 2058.2.6 小结 2118.2.7 课后习题 2118.3 Spark SQL 2118.3.1 Spark SQL介绍 2118.3.2 实践操作 2148.3.3 小结 2188.3.4 课后习题 218第9章 分布式资源管理 2199.1 YARN介绍 2199.1.1 YARN的基本架构 2209.1.2 YARN组件功能 2219.1.3 YARN的执行过程 2239.2 实践操作 2249.3 小结 2309.4 课后习题 2300章 大数据处理架构 23110.1 Lambda架构介绍 23110.1.1 Lambda的基本结构 23110.1.2 优势与不足 23210.2 Kappa架构介绍 23310.2.1 Kappa的基本结构 23310.2.2 优势与不足 23410.3 架构对比 23410.4 小结 23510.5 课后习题 235参考文献 236
作者介绍
序言
— 没有更多了 —
以下为对购买帮助不大的评价