Spark大数据技术与应用
正版新书 新华官方库房直发 可开电子发票
¥
36.85
7.4折
¥
49.8
全新
仅1件
作者肖芳,张良均 主编
出版社人民邮电出版社
ISBN9787115464880
出版时间2018-02
版次1
装帧平装
开本16开
纸张胶版纸
页数272页
字数406千字
定价49.8元
货号SC:9787115464880
上书时间2024-06-04
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
张良均,高 级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。
内容简介:
本书以任务为导向,较为全面地介绍了Spark大数据技术的相关知识。全书共9章,具体内容包括Spark概述;Scala基础;Spark编程;Spark编程进阶;SparkSQL:结构化数据文件处理;SparkStreaming:实时计算框架;SparkGraphX:图计算框架;SparkMLlib:功能强大的算法库;项目案例:餐饮平台菜品智能推荐。本书的大部分章节都包含了实训与课后习题,通过练习和操作实践,帮助读者巩固所学的内容。
目录:
第 1章Spark概述1
任务1.1认识Spark1
1.1.1Spark的发展1
1.1.2Spark的特点2
1.1.3Spark生态圈4
1.1.4Spark的应用场景5
任务1.2搭建Spark环境5
1.2.1搭建单机版环境6
1.2.2搭建单机伪分布式环境6
1.2.3搭建接近分布式环境7
任务1.3了解Spark运行架构与原理10
1.3.1Spark集群架构11
1.3.2Spark作业运行流程11
1.3.3Spark核心数据集RDD15
1.3.4Spark核心原理17
小结19
第 2章Scala基础20
任务2.1Scala的简介与安装21
2.1.1Scala简介21
2.1.2Scala特性21
2.1.3Scala的环境设置及安装21
2.1.4运行Scala23
任务2.2定义函数识别号码类型24
2.2.1数据类型24
2.2.2常量和变量25
2.2.3表达式26
2.2.4数组27
2.2.5函数29
2.2.6任务实现31
任务2.3统计广州号码段数量32
2.3.1if判断32
2.3.2循环33
2.3.3任务实现34
任务2.4根据归属地对手机号码段分组34
2.4.1List35
2.4.2Set36
2.4.3Map37
2.4.4元组38
2.4.5函数组合器38
2.4.6任务实现39
任务2.5编写手机号码归属地信息查询程序40
2.5.1Scala类40
2.5.2S
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价