大数据原理及实践
¥
20.93
5.4折
¥
39
全新
库存3件
作者张晓燕
出版社上海财经大学出版社
出版时间2023-01
版次1
装帧其他
货号R4库 12-26
上书时间2024-12-27
商品详情
- 品相描述:全新
图书标准信息
-
作者
张晓燕
-
出版社
上海财经大学出版社
-
出版时间
2023-01
-
版次
1
-
ISBN
9787564239091
-
定价
39.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
216页
-
字数
213千字
- 【内容简介】
-
近几年来,随着计算机和信息技术的迅猛发展和普及应用,行业应用系统的规模迅速扩大,行业应用所产生的数据呈爆炸性增长。人们把这种大规模数据称为“海量数据”。 本书针对社会需求,为信息管理与信息系统专业本科生提供大数据存储及处理方面的知识。通过系统的讲解大规模数据的存储及处理等基础知识,使学生了解分布式数据处理系统的基本思想、原理及架构;通过实际案例分析及实践,使学生掌握大数据存储及处理的技术方法,最终使学生具备参与大规模分布式数据处理系统的搭建、数据分析及处理以及数据可视化等方面的能力。 本书大致目录:第一章,第一章,Hadoop生态系统介绍;第二章,Hadoop基本原理及环境搭建;第三章,HDFS基本操作及MapReduce编程;第四章,数据仓库HIVE的基本原理及应用;第五章,SPARK基本原理及应用;第六章,综合案例。
- 【目录】
-
目 录 第1章 Hadoop生态系统简介/001 1.1 大数据发展/001 1.2 Hadoop平台介绍/006 1.3 相关的公司/009 1.4 Hadoop生态系统/011 第2章 Hadoop核心组件及其基本原理/014 2.1 HDFS基本原理/014 2.2 MapReduce分布式计算框架/022 2.3 Yarn介绍/029 第3章 Hadoop环境搭建/033 3.1 Linux基础/033 3.2 Linux的文件系统结构/036 3.3 文件类型/038 3.4 Linux基本操作命令/039 3.5 Linux下常用的工具软件/047 3.6 Hadoop环境搭建/051 第4章 Hive基本原理及安装部署/063 4.1 Hive基本原理/063 4.2 Hive的数据存储/064 4.3 Hive的安装部署/066 第5章 Hive的基本操作/070 5.1 Hive的DDL(data define language)操作/070 5.2 Hive的DML(data managed language)操作/076 5.3 Hive shell 参数/093 第6章 Spark基础知识/095 6.1 Spark原理/095 6.2 Spark架构及生态/098 6.3 Spark运行流程及特点/100 6.4 Spark运行模式/108 第7章 Spark RDD编程/114 7.1 RDD设计与运行原理/114 7.2 RDD基本操作/122 7.3 Spark SQL简介/132 第8章 基于MLLIB机器学习/140 8.1 概述/140 8.2 Spark分类和预测/142 8.3 决策树算法/145 8.4 朴素贝叶斯算法/152 8.5 回归分析与预测技术/157 8.6 聚类分析/167 大数据原理及实践 8.7 k-means聚类算法简介/172 8.8 DBSCAN聚类算法简介/179 8.9 关联规则分析简介/185 8.10 Apriori算法和FP Tree算法简介/188 参考文献/200
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价