大数据技术与机器学习Python实战
正版新书 新华官方库房直发 可开电子发票
¥
35.53
7.4折
¥
48
全新
仅1件
作者张晓明编著
出版社清华大学出版社
ISBN9787302581321
出版时间2021-08
版次1
装帧平装
开本16开
纸张胶版纸
页数256页
字数384千字
定价48元
货号SC:9787302581321
上书时间2024-12-23
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
张晓明,男,教授,博士,北京市教学名师,北京市中青年骨干教师,北京高校继续教育高水平教学团队带头人,计算机和大数据专业负责人。CCF分布式计算与系统专委会委员,全国高校计算机教育研究会理事,北京市高校计算机教育研究会常务理事。主讲《计算机网络》、《大数据技术及应用开发》等课程。出版《计算机网络教程(第2版)》、《C#网络通信程序设计》、《软件系统设计与体系结构》等教材7部,专著1部。荣获2018年北京市高等教育教学成果一等奖。从事网络计算与系统安全、大数据技术分析等研究,发表论文60余篇。
主编推荐:
本书是在Hadoop/Spark平台下开展Python应用开发,针对大数据处理周期,全面开展架构原理和编程实践的综合书籍。配套资源丰富,包括操作视频、PPT和实战程序。
内容简介:
本书基于计算机类专业对大数据平台技术和大规模数据处理的实战需求,在阐述数据科学、Hadoop和Spark配置要点和大数据处理周期的基础上,重点阐述大数据采集与存储、预处理、特征工程、数据可视化分析、机器学习基础等大数据处理技术及其Python实现,以及基于Hadoop和Spark平台的Python接口调用和机器学习编程实例分析。本书既强调了大数据处理周期的基本原理和关键技术,又突出机器学习算法及其在分布式系统中的应用编程方法。本书可作为高等院校计算机、大数据、人工智能、软件工程等专业的教材,也可作为大数据技术研发人员和研究生的学习参考用书。
目录:
第1章绪论
1.1大数据技术概述
1.1.1大数据的特点
1.1.2大数据与数据科学的关系
1.1.3大数据的关键技术
1.1.4大数据的计算模式
1.2基于Hadoop系统的大数据平台
1.2.1Hadoop的特点
1.2.2Hadoop的生态系统
1.3基于Spark系统的大数据平台
1.3.1Spark的生态系统
1.3.2Spark与Hadoop的比较
1.4面向实时计算的大数据平台
1.4.1Storm介绍
1.4.2Storm的核心组件
1.4.3Storm的特性
1.5大数据技术的发展趋势
1.6Windows1下Spark+Hadoop+Hive+Pyspark配置
第2章Hadoop系统应用开发基础
2.1HadoopYARN应用基础
2.1.1YARN的设计目标
2.1.2YARN的组件及架构
2.1.3YARN的运行流程
2.2HDFS文件系统及其应用
2.2.1HDFS体系结构
2.2.2HDFS的存储原理
2.2.3HDFS的数据读写过程
2.2.4HDFS的常用命令
2.3MapReduce计算模型及其应用
2.3.1MapReduce编程原理
2.3.2MapReduce模型的应用
2.4HBase大数据存储与访问
2.4.1HBase的体系结构
2.4.2Region的分区与列族
2.4.3HBase的数据模型
2.5基于Hado
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价