• 大数据技术基础
21年品牌 40万+商家 超1.5亿件商品

大数据技术基础

全新正版 假一赔十 可开发票

34.77 7.0折 49.8 全新

库存43件

北京东城
认证卖家担保交易快速发货售后保障

作者张成文 著

出版社人民邮电出版社

ISBN9787115636492

出版时间2024-08

装帧平装

开本16开

定价49.8元

货号1203366393

上书时间2024-10-01

轻阅书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
张成文,北京邮电大学计算机学院副教授,中国人工智能学会高级会员,在国际SCI期刊、电子学报英文版等国内外期刊上发表了几十篇高水平SCI论文,在计算机学报等国内top级学报上以及国际会议上发表了几十篇高水平EI论文。以项目负责人及骨干的身份参加了多个国家和部级科研项目,主要包括国家科技重大专项项目、国家973计划项目、国家863计划重大项目、国家自然科学基金项目、教育部新世纪优秀人才计划项目等。在研项目:智能感知网络及其在智慧城市中应用研究,“智慧系统”基础理论及体系架构研究,物联网服务边缘适配与集成协同模式挖掘研究等。

目录
第 1章  大数据概述1
1.1  基本概念1
1.1.1  5V特征1
1.1.2  数据类型2
1.1.3  大数据平台3
1.1.4  大数据的处理流程4
1.2  相关技术5
1.2.1  数据采集5
1.2.2  数据预处理6
1.2.3  数据存储6
1.2.4  数据挖掘与数据分析6
1.2.5  数据可视化8
1.3  应用领域9
1.4  课后习题9
第 2章  Python大数据分析10
2.1  Python介绍10
2.1.1  Python的应用场景10
2.1.2  Python的优点与缺点10
2.2  NumPy介绍11
2.2.1  NumPy的应用场景11
2.2.2  NumPy的数组对象与用法11
2.3  pandas介绍15
2.3.1  pandas的应用场景15
2.3.2  pandas的数据结构与用法15
2.4  Matplotlib介绍20
2.4.1  Matplotlib库的应用场景20
2.4.2  图表绘制20
2.5  实践操作28
2.6  小结33
2.7  课后习题33
第3章  Kafka34
3.1  Kafka介绍34
3.1.1  Kafka的基本架构34
3.1.2  Kafka的作用36
3.2  Kafka的重要特性37
3.2.1  高吞吐37
3.2.2  高可用38
3.3  安装与配置39
3.3.1  ZooKeeper的安装与配置39
3.3.2  Kafka的安装与配置40
3.4  实践操作41
3.5  小结44
3.6  课后习题44
第4章  数据存储45
4.1  HDFS45
4.1.1  Hadoop介绍45
4.1.2  HDFS介绍46
4.1.3  安装与配置51
4.1.4  实践操作61
4.1.5  小结66
4.1.6  课后习题66
4.2  HBase66
4.2.1  HBase介绍66
4.2.2  技术对比70
4.2.3  安装与配置71
4.2.4  实践操作73
4.2.5  小结75
4.2.6  课后习题76
4.3  Redis76
4.3.1  Redis介绍76
4.3.2  安装与配置80
4.3.3  实践操作82
4.3.4  小结85
4.3.5  课后习题85
第5章  图数据处理86
5.1  Neo4j86
5.1.1  Neo4j介绍86
5.1.2  安装与配置89
5.1.3  实践操作90
5.1.4  小结96
5.1.5  课后习题97
5.2  Spark GraphX97
5.2.1  图计算基础知识97
5.2.2  Spark GraphX介绍99
5.2.3  实践操作101
5.2.4  小结106
5.2.5  课后习题106
第6章  离线计算107
6.1  MapReduce107
6.1.1  MapReduce介绍108
6.1.2  安装与配置110
6.1.3  实践操作112
6.1.4  小结133
6.1.5  课后习题134
6.2  Spark134
6.2.1  Spark介绍134
6.2.2  RDD138
6.2.3  安装与配置143
6.2.4  实践操作145
6.2.5  小结151
6.2.6  课后习题151
第7章  实时计算152
7.1  Storm152
7.1.1  流计算介绍152
7.1.2  Storm介绍153
7.1.3  实践操作156
7.1.4  小结164
7.1.5  课后习题164
7.2  Spark Streaming165
7.2.1  Spark Streaming介绍165
7.2.2  DStream操作168
7.2.3  实践操作172
7.2.4  小结174
7.2.5  课后习题175
7.3  Flink175
7.3.1  Flink介绍175
7.3.2  技术对比179
7.3.3  实践操作180
7.3.4  小结186
7.3.5  课后习题186
第8章  OLAP数据分析187
8.1  Pig187
8.1.1  Pig介绍187
8.1.2  Pig Latin语言介绍189
8.1.3  Pig的安装与配置191
8.1.4  实践操作192
8.1.5  小结195
8.1.6  课后习题196
8.2  Hive196
8.2.1  数据仓库介绍196
8.2.2  Hive介绍197
8.2.3  技术对比201
8.2.4  安装与配置202
8.2.5  实践操作205
8.2.6  小结211
8.2.7  课后习题211
8.3  Spark SQL211
8.3.1  Spark SQL介绍211
8.3.2  实践操作214
8.3.3  小结218
8.3.4  课后习题218
第9章  分布式资源管理219
9.1  YARN介绍219
9.1.1  YARN的基本架构220
9.1.2  YARN组件功能221
9.1.3  YARN的执行过程223
9.2  实践操作224
9.3  小结230
9.4  课后习题230
第 10章  大数据处理架构231
10.1  Lambda架构介绍231
10.1.1  Lambda的基本结构231
10.1.2  优势与不足232
10.2  Kappa架构介绍233
10.2.1  Kappa的基本结构233
10.2.2  优势与不足234
10.3  架构对比234
10.4  小结235
10.5  课后习题235
参考文献236

内容摘要
大数据技术作为处理海量数据的关键工具,在数据分析、数据计算、资源管理等领域得到广泛应用。本书从初学者的角度出发,全面系统地介绍了Python大数据分析、数据存储、离线计算与实时计算等基本概念与方法,并以大量案例帮助读者理解大数据技术的方方面面。此外,本书还介绍了Kafka、图数据处理、OLAP数据分析、分布式资源管理和大数据处理架构等知识,以帮助读者快速熟悉大数据技术,并应用大数据技术解决现实生活中的问题。
本书内容新颖,案例丰富,既可作为高等院校计算机、数据分析等相关专业的教学用书,也可供对大数据技术感兴趣的初学者,以及从事数据科学、大数据技术研究和应用开发的人员参考。

主编推荐
1. 实用性:书中详细介绍了大数据技术的实际应用,提供了实用的案例分析和实战经验分享。
2. 前沿内容:涵盖了新的大数据技术和工具,让读者能够紧跟技术发展的脚步。
3. 适用人群广泛:内容既适合大数据初学者,也适合已有经验的专家。每一章节都有深入浅出的讲解。
4. 实际问题解决:书中深入探讨了大数据在各个行业中的应用,提供了实际问题的解决方案。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP