• 大数据实验手册
21年品牌 40万+商家 超1.5亿件商品

大数据实验手册

全新正版 极速发货

22.21 4.9折 45 全新

库存4件

广东广州
认证卖家担保交易快速发货售后保障

作者刘鹏 著

出版社电子工业出版社

ISBN9787121316180

出版时间2017-06

装帧平装

开本其他

定价45元

货号1201528100

上书时间2024-11-15

谢岳书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
刘鹏,教授,清华大学博士毕业,现任南京大数据研究院院长、中国信息协会大数据分会副会长、中国大数据专家委员会委员。
曾率队夺得2002 PennySort靠前计算机排序比赛优选(这是我国获得的靠前个大数据比赛世界优选),两次夺得全国高校科技比赛优选奖,并三次夺得清华大学科技比赛优选奖。
主持完成科研项目25项,发表论文80余篇,出版专业书籍20种。获部级科技进步二等奖4项,三等奖4项。2002年开创性提出“计算池”模式,被2007年开始流行的“云计算”所证实。2003年开创性提出“反垃圾邮件网格”,被2008年开始流行的“云安全”所证实。
获“全军十大学习成才标兵”(排名靠前)、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。

目录
目  录 

实验一  大数据实验一体机基础操作1
1.1  实验目的1
1.2  实验要求1
1.3  实验原理1
1.4  实验步骤9
实验二  HDFS实验:部署HDFS17
2.1  实验目的17
2.2  实验要求17
2.3  实验原理17
2.4  实验步骤19
实验三  HDFS实验:读写HDFS文件21
3.1  实验目的21
3.2  实验要求21
3.3  实验原理21
3.4  实验步骤23
实验四  YARN实验:部署YARN集群31
4.1  实验目的31
4.2  实验要求31
4.3  实验原理31
4.4  实验步骤33
4.5  实验结果35
实验五  MapReduce实验:单词计数37
5.1  实验目的37
5.2  实验要求37
5.3  实验原理37
5.4  实验步骤39
5.5  实验结果41
实验六  MapReduce实验:二次排序43
6.1  实验目的43
6.2  实验要求43
6.3  实验原理43
6.4  实验步骤43
6.5  实验结果48
实验七  MapReduce实验:计数器49
7.1  实验目的49
7.2  实验要求49
7.3   实验背景49
7.4  实验步骤51
7.5  实验结果53
实验八  MapReduce实验:Join操作55
8.1  实验目的55
8.2  实验要求55
8.3  实验背景55
8.4  实验步骤56
8.5  实验结果61
实验九  MapReduce实验:分布式缓存63
9.1  实验目的63
9.2  实验要求63
9.3  实验步骤63
9.4  实验结果68
实验十  Hive实验:部署Hive69
10.1  实验目的69
10.2  实验要求69
10.3  实验原理69
10.4  实验步骤70
10.5  实验结果71
实验十一  Hive实验:新建Hive表73
11.1  实验目的73
11.2  实验要求73
11.3  实验原理73
11.4  实验步骤73
11.5  实验结果75
实验十二  Hive实验:Hive分区77
12.1  实验目的77
12.2  实验要求77
12.3  实验原理77
12.4  实验步骤77
12.5  实验结果79
实验十三  Spark实验:部署Spark集群80
13.1  实验目的80
13.2  实验要求80
13.3  实验原理80
13.4  实验内容和步骤81
13.5  实验结果83
实验十四  Spark实验:SparkWordCount85
14.1  实验目的85
14.2  实验要求85
14.3  实验原理85
14.4  实验步骤89
14.5  实验结果89
实验十五  Spark实验:RDD综合实验90
15.1  实验目的90
15.2  实验要求90
15.3  实验原理90
15.4  实验步骤91
15.5  实验结果93
实验十六  Spark实验:Spark综例94
16.1  实验目的94
16.2  实验要求94
16.3  实验原理94
16.4  实验步骤96
实验十七  Spark实验:Spark SQL99
17.1  实验目的99
17.2  实验要求99
17.3  实验原理99
17.4  实验步骤100
17.5  实验结果101
实验十八  Spark实验:Spark Streaming103
18.1  实验目的103
18.2  实验要求103
18.3  实验原理103
18.4  实验步骤107
18.5  实验结果110
实验十九  Spark实验:GraphX111
19.1  实验目的111
19.2  实验要求111
19.3  实验原理111
19.4  实验步骤111
19.5  实验结果116
实验二十  部署ZooKeeper117
20.1  实验目的117
20.2  实验要求117
20.3  实验原理117
20.4  实验步骤117
20.5  实验结果119
实验二十一  ZooKeeper进程协作121
21.1  实验目的121
21.2  实验要求121
21.3  实验原理121
21.4  实验步骤121
21.5  实验结果123
实验二十二  部署HBase124
22.1  实验目的124
22.2  实验要求124
22.3  实验原理124
22.4  实验步骤125
22.5  实验结果127
实验二十三  新建HBase表128
23.1  实验目的128
23.2  实验要求128
23.3  实验原理128
23.4  实验步骤128
23.5  实验结果133
实验二十四  部署Storm135
24.1  实验目的135
24.2  实验要求135
24.3  实验原理135
24.4  实验步骤136
24.5  实验结果138
实验二十五  实时WordCountTopology139
25.1  实验目的139
25.2  实验要求139
25.3  实验原理139
25.4  实验步骤141
25.5  实验结果144
实验二十六  文件数据Flume至HDFS145
26.1  实验目的145
26.2  实验要求145
26.3  实验原理145
26.4  实验步骤147
26.5  实验结果149
实验二十七  Kafka订阅推送示例150
27.1  实验目的150
27.2  实验要求150
27.3  实验原理150
27.4  实验步骤152
27.5  实验结果154
实验二十八  Pig版WordCount155
28.1  实验目的155
28.2  实验要求155
28.3  实验原理155
28.4  实验步骤156
28.5  实验结果158
实验二十九  Redis部署与简单使用160
29.1  实验目的160
29.2  实验要求160
29.3  实验原理160
29.4  实验步骤162
29.5  实验结果163
实验三十  MapReduce与Spark读写Redis164
30.1  实验目的164
30.2  实验要求164
30.3  实验原理164
30.4  实验步骤165
30.5  实验结果170
实验三十一  MongoDB实验:读写MongoDB172
31.1  实验目的172
31.2  实验要求172
31.3  实验原理172
31.4  实验步骤173
31.5  实验结果177
实验三十二  LevelDB实验:读写LevelDB178
32.1  实验目的178
32.2  实验要求178
32.3  实验原理178
32.4  实验步骤181
32.5  实验结果183
实验三十三  Mahout实验:K-Means184
33.1  实验目的184
33.2  实验要求184
33.3  实验原理184
33.4  实验步骤187
33.5  实验结果188
实验三十四  使用Spark实现K-Means189
34.1  实验目的189
34.2  实验要求189
34.3  实验原理189
34.4  实验步骤189
34.5  实验结果191
实验三十五  使用Spark实现SVM192
35.1  实验目的192
35.2  实验要求192
35.3  实验原理192
35.4  实验步骤194
35.5  实验结果195
实验三十六  使用Spark实现FP-Growth197
36.1  实验目的197
36.2  实验要求197
36.3  实验原理197
36.4  实验步骤199
36.5  实验结果200
实验三十七  综合实战:车牌识别202
37.1  实验目的202
37.2  实验要求202
37.3  实验步骤202
37.4  实验结果209
实验三十八  综合实战:搜索引擎211
38.1  实验目的211
38.2  实验要求211
38.3  实验步骤211
38.4  实验结果236
实验三十九  综合实战:推荐系统239
39.1  实验目的239
39.2  实验要求239
39.3  实验步骤239
39.4  实验结果245
实验四十  综合实战:环境大数据247
40.1  实验目的247
40.2  实验要求247
40.3  实验原理247
40.4  实验步骤247
实验四十一  综合实战:智能硬件大数据托管259
41.1  实验目的259
41.2  实验要求259
41.3  实验原理259
41.4  实验步骤261
41.5  实验结果266
实验四十二  综合实战:贷款风险评估268
42.1  实验目的268
42.2  实验要求268
42.3  实验原理268
42.4  实验相关269
42.5  实验结果275

内容摘要
本书涵盖大数据专业经典的40个实验,每一个实验给出具体的目的、要求、原理,并给出详细的实验步骤和试验程序。具体包括HDFS实验、YARN实验、MapReduce实验、Hive实验、Spark实验、ZooKeeper实验、HBase实验、Storm实验等等。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP