• 大数据技术和应用
21年品牌 40万+商家 超1.5亿件商品

大数据技术和应用

全新正版 极速发货

37.05 6.3折 59 全新

仅1件

广东东莞
认证卖家担保交易快速发货售后保障

作者陈建平,陈志德,席进爱 编

出版社清华大学出版社

ISBN9787302542193

出版时间2020-01

装帧平装

开本16开

定价59元

货号1202006095

上书时间2024-11-30

休闲图书吧

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
第1章 了解大数据
1.1 大数据处理的基础技术
1.1.1 大数据相关概念
1.1.2 大数据处理流程
1.1.3 大数据处理基础技术
1.2 主流大数据技术
1.2.1 主流大数据技术各阶段
1.2.2 Hadoop生态系统
1.2.3 Hadoop核心组件简介
1.3 大数据平台解决方案
1.3.1 Cloudera
1.3.2 Hortonworks
1.3.3 MapR
1.3.4 FusionInsight
1.3.5 Transwarp Data Hub
1.4 大数据发展现状和趋势
1.4.1 大数据市场规模
1.4.2 国内大数据发展面临的问题
1.4.3 大数据发展趋势
1.5 习题
第2章 大数据基础软件
2.1 Linux基础介绍
2.1.1 用户和用户组管理
2.1.2 文件和目录操作
2.1.3 文本编辑器
2.2 Java基础介绍
2.2.1 Java基础
2.2.2 编程开发
2.2.3 Java开发环境配置
2.3 SQL语言基础介绍
2.3.1 数据库基础
2.3.2 SQL简介
2.3.3 SQL语法
2.3.4 SQL基础语法
2.4 实验一:在Linux中安装和使用Java
2.4.1 本实验目标
2.4.2 本实验知识点
2.4.3 项目实施过程
2.4.4 常见问题
2.5 实验二:在Linux中安装和使用MySQL
2.5.1 本实验目标
2.5.2 本实验知识点
2.5.3 项目实施过程
2.5.4 常见问题
2.6 习题
第3章 大数据采集
3.1 大数据采集技术介绍
3.2 常见采集工具和厂商
3.2.1 搜索引擎查看
3.2.2 工具分类
3.3 八爪鱼采集器介绍
3.3.1 八爪鱼采集原理
3.3.2 八爪鱼实现的功能
3.4 爬山虎采集器介绍
3.4.1 爬山虎介绍
3.4.2 产品特点和核心技术
3.4.3 软件界面
3.5 流数据采集工具Flume
3.5.1 Flume背景
3.5.2 Flume NG基本架构
3.5.3 Flume案例分析
3.6 数据传输工具Sqoop介绍
3.6.1 Sqoop工具介绍
3.6.2 Sqoop2特性
3.6.3 Sqoop案例
3.6.4 Sqoop问题集
3.7 实验三:Sqoop的安装配置及使用
3.7.1 本实验目标
3.7.2 本实验知识点
3.7.3 项目实施过程
3.7.4 常见问题
3.8 实验四:Kafka的安装、配置及使用
3.8.1 本实验目标
3.8.2 本实验知识点
3.8.3 项目实施过程
3.8.4 常见问题
第4章 大数据存储
4.1 数据库和数据仓库
4.1.1 数据库类型简介
4.1.2 数据仓库介绍
4.2 分布式文件系统HDFS
4.2.1 HDFS介绍
4.2.2 HDFS体系结构
4.3 分布式分析引擎Kylin介绍
4.3.1 Kylin简介
4.3.2 Kylin基本原理和架构
4.3.3 Kylin的最新特性
4.4 大数据仓库Hive
4.4.1 Hive简介
4.4.2 Hive体系结构
4.4.3 Hive数据存储模型
4.4.4 Hive应用场景
4.5 NoSQL数据库
4.5.1 NoSQL简介
4.5.2 NoSQL在系统架构中的应用
4.6 键-值存储数据库Memcached、Redis
4.6.1 Redis基本介绍
4.6.2 Redis命令总结
4.7 面向文档数据库MongoDB介绍
4.7.1 MongoDB简介
4.7.2 MongoDB深入剖析
4.8 实验五:Hadoop的安装、配置及HDFS使用
4.8.1 本实验目标
4.8.2 本实验知识点
4.8.3 项目实施过程
4.8.4 常见问题
4.9 实验六:Redis数据库的安装与使用
4.9.1 本实验目标
4.9.2 本实验知识点
4.9.3 项目实施过程
4.9.4 常用命令及配置文件介绍
4.10 实验七:HBase的安装和配置
4.10.1 本实验目标
4.10.2 本实验知识点
4.10.3 项目实施过程
4.10.4 常见问题
4.11 习题
第5章 Spark内存计算框架
5.1 Spark简介
5.2 Spark技术原理
5.2.1 Spark与Hadoop的对比
5.2.2 Spark运行架构
5.2.3 RDD基本概念
5.3 Spark SQL介绍
5.4 Spark Streaming实时处理技术
5.5 Spark MLlib数据挖掘库
5.5.1 机器学习定义
5.5.2 Spark MLlib的优势
5.5.3 Spark MLlib支持的机器学习类型
5.6 Spark GraphX图处理技术
5.7 Spark编程实例
第6章 大数据分析挖掘
6.1 大数据分析概述
6.1.1 数据分析与数据挖掘的区别
6.1.2 常见数据分析挖掘工具
6.1.3 数据挖掘十大算法介绍
6.2 分类算法概述
6.2.1 分类预测常见算法
6.2.2 分类预测实现过程
6.3 决策树算法介绍
6.3.1 决策树的定义
6.3.2 决策树的优缺点
6.3.3 决策树的发展
6.3.4 决策树的构造流程
6.3.5 决策树的相关指标
6.3.6 常见决策树算法
6.4 推荐算法介绍
6.4.1 常用推荐算法介绍
6.4.2 主要推荐方法对比
6.5 Apriori算法介绍
6.5.1 Apriori算法
6.5.2 频繁项集的评估标准
……

内容摘要
这是一本大数据技术入门的简明教材。全书理论和实践相结合,以应用实战为主,深入浅出地讲解每个知识点,对每个应用实验按学习习惯,分步骤讲解,每个步骤都有文字说明和效果截图,使读者能清晰地知晓动手实操的效果和错误之处。全书分为9章,全面介绍了大数据技术的相关基础知识、HDFS和数据库、采集传输工具、挖掘分析算法、Spark计算框架、可视化、大数据安全、大数据应用等内容,着重介绍了HDFS分布式文件系统、NoSQL等各种数据库、数据仓库Hive,以及数据采集分析技术,并配套了详细的实验教程以及练习题。本书适合作为高等院校计算机、软件工程、大数据专业高职、本科生的教材,同时可供企业中从事大数据开发的工程师和科技工作者参考。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP