• 大数据基础应用 大中专高职计算机 刘黎志 刘玮 张明
  • 大数据基础应用 大中专高职计算机 刘黎志 刘玮 张明
  • 大数据基础应用 大中专高职计算机 刘黎志 刘玮 张明
  • 大数据基础应用 大中专高职计算机 刘黎志 刘玮 张明
21年品牌 40万+商家 超1.5亿件商品

大数据基础应用 大中专高职计算机 刘黎志 刘玮 张明

none

32.35 5.4折 59.8 全新

仅1件

北京丰台
认证卖家担保交易快速发货售后保障

作者刘黎志 刘玮 张明

出版社机械工业

ISBN9787111763864

出版时间2024-09

版次1

装帧平装

开本16

页数298页

定价59.8元

货号712_9787111763864

上书时间2024-10-28

智胜图书专营店

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

本书遵循教指委相关指导文件和高等院校学规律编写而成。践行四新理念,融入思政元素,注重理论与实践相结合。

目录:

目  录
前言
章  hadoop分布式集群  1
1.1  什么是大数据  1
1.1.1  大数据的基本概念  1
1.1.2  大数据的产生和应用  2
1.2  大数据关键技术  2
1.2.1  文件系统  2
1.2.2  数据库系统  3
1.2.3  索引与查询技术  4
1.2.4  大数据分析技术  5
1.2.5  大数据处理工具  6
1.2.6  机器学与深度学  7
1.3  hadoop生态圈  8
1.4  hadoop分布式集群环境搭建  11
1.4.1  实验环境安装及配置  11
1.4.2  hadoop集群台的搭建  16
1.4.3  mapreduce测试  21
第2章  分布式计算框架
mapreduce  23
2.1  mapreduce分布式框架  23
2.1.1  mapreduce  23
2.1.2  合并函数(biner)  26
2.2  wordcount的处理过程  27
2.2.1  wordcount示例代码运行  27
2.2.2  wordcount源码分析  28
2.2.3  wordcount详细处理过程  32
2.2.4  mapreduce新旧版区别  33
2.3  mapreduce编程示例  33
2.3.1  eclie开发环境搭建  33
2.3.2  数据去重  38
2.3.3  数据排序  41
2.3.4  均  43
2.3.5  单表关联  45
2.3.6  多表关联  51
2.3.7  倒排索引  54
第3章  nosql数据库  60
3.1  nosql数据库概述  60
3.1.1  nosql数据库的特点  60
3.1.2  nosql数据库与关系数据库的
比较  61
3.1.3  nosql数据库的分类  61
3.2  hbase列式数据库  62
3.2.1  hbase的基本概念  62
3.2.2  hbase的安装及基本作  64
3.2.3  hbase客户端编程  69
3.3  hive数据仓库工具  82
3.3.1  hive的安装及环境配置  82
3.3.2  hive的基本使用  86
第4章  分布式计算框架spark  93
4.1  spark分布式计算引擎  93
4.1.1  spark的基本概念  93
4.1.2  spark的核心技术  95
4.1.3  spark生态系统  96
4.1.4  spark技术分析  96
4.1.5  spark的应用场景  97
4.2  spark分布式集群环境搭建  98
4.2.1  环境搭建  98
4.2.2  环境测试  100
4.3  rdd分布式编程技术  102
4.3.1  rdd的基本使用  102
4.3.2  rdd作  104
4.3.3  共享变量  115
4.4  spark sql查询分析技术  118
4.4.1  dataset(dataframe)和rdd  119
4.4.2  spark sql作  121
4.4.3  spark sql与数据源的交互  125
4.4.4  spark sql与hive交互  126
4.4.5  spark sql的分区及分桶  127
第5章  流式计算  130
5.1  flink的基本概念  130
5.1.1  flink框架  130
5.1.2  flink的应用  131
5.2  flink的安装和开发环境设置  133
5.2.1  flink本地安装  133
5.2.2  flink开发环境设置  134
5.3  数据流接  137
5.3.1  datastream概述  137
5.3.2  数据流接的基本应用  144
5.3.3  kafka消息中间件  148
5.4  水位线和窗  161
5.4.1  水位线(watermark)  161
5.4.2  窗(window)  165
5.4.3  应用举例  169
5.5  表接和表查询  175
5.5.1  动态表  176
5.5.2  表接和表查询的应用  179
第6章  数据可视化分析与预处理  184
6.1  数据可视化分析  184
6.1.1  分位数与箱线图  184
6.1.2  数据的相关与散点图  186
6.1.3  数据的分布与直方图  189
6.1.4  matplotlib绘图  191
6.2  数据预处理  203
6.2.1  连续型输入特征的
处理(归一化)  204
6.2.2  类别(离散)型输入特征的
处理  206
6.2.3  分类标签的处理  209
6.2.4  主成因分析(pca-principal ponent analysis)  209
第7章  大数据与机器学  214
7.1  使用scikit-learn进行机器学  214
7.1.1  scikit-learn简介  214
7.1.2  使用scikit-learn进行
机器学  215
7.2  分类问题  218
7.2.1  逻辑回归  219
7.2.2  混淆矩阵  222
7.2.3  多分类  224
7.2.4  不衡分类  226
7.2.5  交验证和参数寻优  235
7.3  回归问题  237
7.3.1  一元线回归  237
7.3.2  多元线回归  246
第8章  大数据与深度学  254
8.1  深度学概述  254
8.1.1  从神经网络到深度学  255
8.1.2  深度学框架keras  262
8.2  深度神经网络  263
8.2.1  深度神经网络示例  263
8.2.2  模型的保存和读取  266
8.2.3  模型训练的历史过程  267
8.3  卷积神经网络  268
8.3.1  卷积神经网络的层  270
8.3.2  使用n进行图像分类  278
8.3.3  使用vgg16网络模型  285
8.4  循环神经网络  287
8.4.1  rnn  287
8.4.2  lstm  289
参文献  296

内容简介:

本书首先介绍了大数据基础应用:重点讲解了如何搭建hadoop分布式集群台,使用java语言进行mapreduce分布式编程;hbae及hive数据库环境的安装和数据的增、删、改、查作;park台的搭建、rdd作及park ql查询;flink台的搭建,kafka消息中间件的使用及流批一体计算。其次对数据预处理的常用方法及如何使用matplotlib实现数据可视化进行了讨论。后讲解了大数据与机器学、深度学。本书将机器学算法划分为分类及回归两个问题进行了讨论,并结合cikitlearn进行了实例讲解。在深度学部分,对深度神经网络及卷积神经网络进行了介绍,如何使用kera框架实现图像分类进行了实例讲解,此外介绍了循环神经网络ltm的及应用。
本书适用于计算机类及信息技术类相关专业在读本科生及,也可供大数据及人工智能相关领域的技术人员参。
为了方便,本书配备电子课件、程序源代码等资源。凡选用本书作为教材的教师均可登录机械出版社教育服务网(.cmpedu.)注册后费下载。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP