消息首页搜索举报

Spark大数据技术与应用肖芳张良均人民邮电出版社

笔记很少，整体很新，若有质量问题，支持退换货，售后无忧，但不要拍错哦！

4.83 1.0折 49.8 八五品

库存28件

浙江杭州

认证卖家担保交易快速发货售后保障

作者肖芳张良均

出版社人民邮电出版社

ISBN9787115464880

出版时间2018-02

版次1

装帧平装

开本16开

纸张胶版纸

页数272页

字数99999千字

定价49.8元

货号9787115464880

上书时间2023-12-25

籍利书店

八年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 9小时
好评率暂无

最新上架

全新正版图书汉语列举标记及连类复数表达研究丁加勇知识产权出版社有限责任公司9787513091213 ¥52.60

全新正版图书声乐练声曲0条克劳斯·海兹曼上海教育出版社有限公司9787544436311 ¥24.20

全新正版图书中西贸易文本中社会文化价值元素的翻译:以食装为例(西)陈正洋中译出版社有限公司9787500167594 大众 ¥39.80

全新正版图书世界城市更新华高莱斯中国大地出版社9787520009362 ¥32.00

全新正版图书父子宰相家训：聪训斋语、澄怀园语（精装）张英团结出版社9787512667808 ¥50.20

全新正版图书基于创新驱动的工程档案知识赋能及其实现路径研究陈慧科学出版社9787030782939 ¥95.00

全新正版图书闻一多评传黄超中华工商联合出版社有限责任公司9787515823089 ¥36.40

全新正版图书阳光之下肖仁福团结出版社9787512688773 长篇小说中国当代普通大众 ¥55.40

全新正版图书直播电商运营实务（新媒体电商技术系列教材）李国年黄旭强曾发超同济大学出版社9787576511857 ¥43.70

商品详情

品相描述：八五品: 八五品【书非常新，有少许笔记】但不影响阅读，无附件和增值服务等。

商品描述: 基本信息
书名:Spark大数据技术与应用
定价：49.80元
作者:肖芳张良均
出版社：人民邮电出版社
出版日期：2018-02-01
ISBN：9787115464880
字数：406000
页码：272
版次：
装帧：平装
开本：16开
商品重量：
编辑推荐

内容提要
本书以任务为导向，较为全面地介绍了Spark大数据技术的相关知识。全书共9章，具体内容包括Spark概述；Scala基础；Spark编程；Spark编程进阶；Spark SQL：结构化数据文件处理；Spark Streaming：实时计算框架；Spark GraphX：图计算框架；Spark MLlib：功能强大的算法库；项目案例：餐饮平台菜品智能推荐。本书的大部分章节都包含了实训与课后习题，通过练习和操作实践，帮助读者巩固所学的内容。
目录
章　Spark概述　1任务1.1　认识Spark　11.1.1　Spark的发展　11.1.2　Spark的特点　21.1.3　Spark生态圈　41.1.4　Spark的应用场景　5任务1.2　搭建Spark环境　51.2.1　搭建单机版环境　61.2.2　搭建单机伪分布式环境　61.2.3　搭建完全分布式环境　7任务1.3　了解Spark运行架构与原理　101.3.1　Spark集群架构　111.3.2　Spark作业运行流程　111.3.3　Spark核心数据集RDD　151.3.4　Spark核心原理　17小结　19第 2章　Scala基础　20任务2.1　Scala的简介与安装　212.1.1　Scala简介　212.1.2　Scala特性　212.1.3　Scala的环境设置及安装　212.1.4　运行Scala　23任务2.2　定义函数识别号码类型　242.2.1　数据类型　242.2.2　常量和变量　252.2.3　表达式　262.2.4　数组　272.2.5　函数　292.2.6　任务实现　31任务2.3　统计广州号码段数量　322.3.1　if判断　322.3.2　循环　332.3.3　任务实现　34任务2.4　根据归属地对段分组　342.4.1　List　352.4.2　Set　362.4.3　Map　372.4.4　元组　382.4.5　函数组合器　382.4.6　任务实现　39任务2.5　编写归属地信息查询程序　402.5.1　Scala类　402.5.2　Scala object　422.5.3　Scala模式匹配　422.5.4　Scala读取文件　442.5.5　任务实现　44小结　45实训　45实训1　编写函数过滤文本中的回文单词　45实训2　使用Scala编程输出杨辉三角　46课后习题　46第3章　Spark编程　48任务3.1　以学生成绩数据创建RDD　493.1.1　从内存中已有数据创建RDD　503.1.2　从外部存储创建RDD　513.1.3　任务实现　52任务3.2　查询学生成绩表中的前5名　523.2.1　使用map转换数据　523.2.2　使用sortBy排序　533.2.3　使用collect查询　533.2.4　使用flatMap转换数据　543.2.5　使用take方式查询某几个值　543.2.6　任务实现　55任务3.3　输出单科成绩为100分的学生ID　553.3.1　使用union合并多个RDD　563.3.2　使用filter进行过滤　563.3.3　使用distinct进行去重　563.3.4　简单的集合操作　573.3.5　任务实现　58任务3.4　输出每位学生所有科目的总成绩　583.4.1　键值对RDD简介　593.4.2　创建键值对RDD　593.4.3　转换操作keys与values　593.4.4　转换操作reduceByKey　603.4.5　转换操作groupByKey　603.4.6　任务实现　60任务3.5　输出每位学生的平均成绩　613.5.1　使用join连接两个RDD　613.5.2　使用zip组合两个RDD　633.5.3　使用combineByKey合并相同键的值　633.5.4　使用lookup查找指定键的值　643.5.5　任务实现　64任务3.6　将汇总后的学生成绩存储为文本文件　653.6.1　JSON文件的读取与存储　653.6.2　CSV文件的读取与存储　673.6.3　SquenceFile的读取与存储　693.6.4　文本文件的读取与存储　703.6.5　任务实现　71小结　72实训　72实训1　统计文本中性别为“男”的用户数　73实训2　单词计数　73课后习题　74第4章　Spark编程进阶　76任务4.1　搭建开发环境　774.1.1　下载与安装IntelliJ IDEA　774.1.2　Scala插件安装与使用　794.1.3　配置Spark运行环境　844.1.4　运行Spark程序　85任务4.2　使用移动平均预测股票涨跌　924.2.1　持久化（缓存）　934.2.2　数据分区　944.2.3　计算价格波动幅度　984.2.4　任务实现　100小结　103实训　103实训　竞赛网站访问日志分析　104课后习题　104第5章　Spark SQL：结构化数据文件处理　107任务5.1　认识Spark SQL　1085.1.1　Spark SQL简介　1085.1.2　Spark SQL CLI配置　1095.1.3　Spark SQL与Shell交互　110任务5.2　掌握DataFrame基础操作　1115.2.1　创建DataFrame对象　1115.2.2　DataFrame查看数据　1145.2.3　DataFrame查询操作　1175.2.4　DataFrame输出操作　123任务5.3　探索分析法律服务网站数据　1255.3.1　获取数据　1255.3.2　网页类型分析　1265.3.3　点击次数分析　1315.3.4　网页排名分析　133小结　135实训　135实训1　统计分析航空公司客户数据的空值以及异常值　135实训2　统计分析某公司每年的产品销售量及销售额　137课后习题　139第6章　Spark Streaming：实时计算框架　141任务6.1　初探Spark Streaming　1426.1.1　Spark Streaming概述　1426.1.2　Spark Streaming运行原理　1426.1.3　初步使用Spark Streaming　143任务6.2　掌握DStream编程模型　1456.2.1　DStream简介　1466.2.2　DStream转换操作　1466.2.3　DStream窗口操作　1486.2.4　DStream输出操作　151任务6.3　Spark Streaming实时更新热门博文　1556.3.1　Spark Streaming输入数据源　1556.3.2　Spark Streaming计算网页热度　1586.3.3　网页热度输出　1586.3.4　任务实现　159小结　161实训　161实训1　过滤打印包含单词error的记录　162实训2　实时过滤歌曲播放次数超过100次的记录并存储在HDFS上　162课后习题　162第7章　Spark GraphX：图计算框架　165任务7.1　认识Spark GraphX　1667.1.1　图的基本概念　1667.1.2　图计算的应用　1677.1.3　GraphX的基础概念　1687.1.4　GraphX的发展　168任务7.2　了解GraphX常用API　1697.2.1　图的创建与存储　1697.2.2　数据查询与数据转换　1747.2.3　结构转换与关联聚合　180任务7.3　构建信任网络并找出目标用户　1877.3.1　构建网站信任网络　1887.3.2　找出需要支付稿酬的用户　1887.3.3　找出进入热门榜的用户　189小结　191实训　191实训1　使用PageRank算法完成网页排名　191实训2　利用二度关系完成商品推荐　192课后习题　194第8章　Spark MLlib：功能强大的算法库　196任务8.1　了解MLlib算法库　1978.1.1　机器学习简介　1978.1.2　MLlib介绍　198任务8.2　以Logistic回归实现用户分类　2128.2.1　分析思路　2128.2.2　数据处理　2138.2.3　MLlib实现Logistic回归　2158.2.4　任务实现　217小结　221实训　221实训1　通过KMeans定位商圈　221实训2　朴素贝叶斯进行文本分类　222课后习题　223第9章　项目案例：餐饮平台菜品智能推荐　226任务9.1　推荐方案设计　2279.1.1　用户数据分析　2279.1.2　常用推荐算法　2299.1.3　推荐流程设计　231任务9.2　数据预处理　2329.2.1　原始数据探索分析　2339.2.2　异常数据处理　2379.2.3　数据变换处理　2379.2.4　数据集分割　239任务9.3　建立推荐模型　2409.3.1　以基于用户的协同过滤算法建模　2409.3.2　以基于物品的协同过滤算法建模　2439.3.3　以基于Spark ALS的协同过滤算法建立模型　2469.3.4　推荐模型的评测　251任务9.4　使用模型进行菜品推荐　2629.4.1　对某用户推荐10道新菜品　2629.4.2　对所有用户进行新菜品推荐　267小结　272
作者介绍
张良均，高级信息系统项目管理师，泰迪杯全国大学生数据挖掘竞赛（www.tipdm.org）的发起人。华南师范大学、广东工业大学兼职教授，广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历，主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格（水平）考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇，已取得国家发明专利12项，主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《Python数据分析与挖掘》等多本图书，主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书，具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。
序言

【封面】

— 没有更多了 —

Spark大数据技术与应用 肖芳 张良均 人民邮电出版社

籍利书店

商品详情

Spark大数据技术与应用肖芳张良均人民邮电出版社