• 大数据技术基础及应用教程(Linux+Hadoop+Spark)
21年品牌 40万+商家 超1.5亿件商品

大数据技术基础及应用教程(Linux+Hadoop+Spark)

44.9 7.5折 59.9 全新

库存5件

四川成都
认证卖家担保交易快速发货售后保障

作者井超樊永生编著

出版社机械工业出版社

ISBN9787111710912

出版时间2022-07

装帧平装

开本16开

定价59.9元

货号1202692433

上书时间2024-06-30

聚合博文书店

十年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
目录前言第一篇技术基础篇第1章大数据技术概述21.1大数据的基本概念21.1.1大数据的产生阶段21.1.2大数据的特征21.1.3大数据在各个领域的应用31.1.4大数据的核心技术和计算模式31.2分布式技术与集群41.2.1分布式技术概述41.2.2分布式大数据集群概述41.3大数据技术生态圈71.3.1Linux操作系统71.3.2Hadoop生态系统91.3.3Spark对Hadoop的完善13本章小结13本章练习13第2章大数据分析技术152.1大数据分析流程及相关技术152.1.1数据采集与预处理152.1.2大数据存储162.1.3大数据分析与挖掘172.1.4数据可视化182.2大数据分析常用方法182.2.1数理统计分析182.2.2聚类分析182.2.3分类分析192.2.4回归分析192.3数据分析基础工具192.3.1数据采集工具—Selenium和PhantomJS192.3.2数据清洗工具—Kettle202.3.3数据存储工具—MongoDB和MySQL212.3.4机器学习工具—Scikit-learn232.3.5数据可视化工具—Matplotlib、PyEcharts、Superset23本章小结25本章练习26第二篇分布式集群篇第3章Linux技术基础283.1用户与组管理283.1.1用户管理相关命令283.1.2组管理相关命令293.1.3其他命令293.2文件与目录管理293.2.1常用文件操作命令293.2.2目录操作命令313.2.3改变文件或目录访问权限323.2.4文件备份和压缩333.3进程管理与作业控制333.3.1进程查看343.3.2进程调度343.4磁盘存储管理343.4.1磁盘管理命令353.4.2存取命令353.5系统管理与常用网络命令353.5.1系统管理353.5.2常用网络命令363.6在线帮助系统363.7实践

内容摘要
本书从大数据技术相关概念出发,系统介绍了构建大数据平台的相关技术,并在此基础上进行离线数据分析和在线数据分析。全书共三篇,分为7章,内容包括技术基础篇、分布式集群篇、平台构建篇,第壹篇包括大数据技术概述、大数据分析技术,第二篇包括Linux技术基础、Hadoop技术基础及构建Hadoop集群、Spark技术基础及构建Spark集群,第三篇包括构建基于Spark的实时交易数据统计平台、构建基于Hadoop的离线电商大数据分析平台。本书以理论为基础,以实例为引导,完整阐述了如何从无到有搭建大数据平台,并在此平台基础上进行应用。本书配套资源丰富,包括教学PPT、所有程序的源代码、相关集群虚拟机、扩展学习视频、课后练习题及答案,可方便授课教师教学及学生自学。本书可作为高校数据科学与大数据技术等相关专业的教材,也可作为对大数据技术感兴趣的相关人员的参考用书。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP