Spark项目实战
¥
12.32
2.6折
¥
48
九五品
仅1件
作者黑马程序员 著
出版社清华大学出版社
ISBN9787302581475
出版时间2021-07
版次1
装帧平装
开本16开
纸张胶版纸
页数184页
字数99999千字
定价48元
上书时间2024-12-14
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:Spark项目实战
定价:48.00元
作者:黑马程序员 著
出版社:清华大学出版社
出版日期:2021-07-01
ISBN:9787302581475
字数:283000
页码:184
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
内容提要
本书运用Spark计算框架的核心组件对电商数据进行分析,以项目形式呈现,其内容涵盖环境搭建、数据分析、数据持久化和数据可视化, 涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和ZooKeeper等技术点的综合应用。针对项目开发过程的每个环节都进行了深入讲解,使读者由浅入深地了解每个环节的知识内容。本书共分为7章。章主要介绍项目开发的基本情况;第2章主要介绍大数据集群环境的搭建;第3章主要介绍通过Spark实现热门品类To10分析,并对分析结果进行持久化操作;第4章主要介绍通过Spark实现各区域热门商品Top3分析,并对分析结果进行持久化操作;第5章主要介绍通过Spark SQL实现网站转化率统计,并对分析结果进行持久化操作;第6章主要介绍通过Spark Streaming实现广告点击流实时统计,并实时持久化统计结果;第7章主要介绍通过可视化技术将第3~6章的分析与统计结果进行图形化展示。本书配有视频、源代码、教学设计、教学PPT、教学大纲等资源。同时,为了帮助初学者更好地学习书中的内容,还提供了在线答疑,欢迎读者关注。本书适合拥有Spark基础的读者阅读,也可以作为高等院校相关课程的教学参考书。读者不仅能够通过项目实战巩固基础知识的学习效果,还能学习商业智能系统的开发过程。
目录
目录章项目概述11.1项目需求和目标11.2预备知识21.3项目架构设计及技术选取21.4开发环境和开发工具介绍31.5项目开发流程41.6硬件要求51.7本章小结6第2章搭建大数据集群环境72.1安装准备72.1.1认识Linux操作系统 72.1.2创建虚拟机82.1.3启动虚拟机并安装Linux操作系42.1.4克隆虚拟机222.1.5配置Linux操作系统网络及主机名252.1.6SSH配置292.1.7配置时间同步362.2安装K412.3ZooKeeper集群部署422.3.1ZooKeeper集群的安装与配置…422.3.2ZooKeeper集群的启动与关闭…442.4Hadoop集群部署462.4.1Hadoop高可用集群规划462.4.2安装Hadoop472.4.3Hadoop高可用集群配置482.4.4启动Hadoop高可用集群552.5Spark集群部署602.5.1Spark集群部署模式602.5.2Spark集群安装配置612.5.3Spark集群测试622.6HBase集群部署642.6.1HBase集群规划642.6.2HBase集群安装配置652.6.3启动HBase集群672.7Kafka集群部署692.7.1Kafka集群的安装与配置692.7.2启动Kafka集群702.8本章小结72第3章热门品类0分析733.1数据集分析733.2实现思路分析743.3实现热门品类0753.3.1创建项目753.3.2创建Spark连接并读取数据集813.3.3获取业务数据823.3.4统计品类的行为类型833.3.5过滤品类的行为类型833.3.6合并相同品类的行为类型853.3.7根据品类的行为类型进行排序853.3.8数据持久化873.4运行程序923.5本章小结97第4章各区域热门商品Top3分析984.1实现思路分析984.2实现各区域热门商品Top3994.2.1创建Spark连接并读取数据集994.2.2获取业务数据1004.2.3过滤商品的行为类型1004.2.4转换数据格式1014.2.5统计每个区域中的不同商品1014.2.6根据区域进行分组1024.2.7根据区域内商品的查看次数进行排序1024.2.8数据持久化1034.3运行程序1064.4本章小结108目录Spark项目实战第5章网站转化率统计1095.1数据集分析1095.2实现思路分析1105.3实现网站转化率统计1115.3.1生成用户浏览网页数据1115.3.2修改pom.xml文件1125.3.3创建Spark连接并读取数据集1135.3.4统计每个页面访问次数1145.3.5获取每个用户浏览网页的顺序1145.3.6合并同一用户浏览的网页1145.3.7统计每个单跳的次数1155.3.8计算页面单跳转化率1165.3.9数据持久化1175.4运行程序1185.5本章小结121第6章广告点击流实时统计1226.1数据集分析1226.2实现思路分析1236.3数据库设计1246.4实现广告点击流实时统计1256.4.1修改pom.xml文件1256.4.2生产用户广告点击流数据1256.4.3创建Spark Streaming连接1286.4.4读取用户广告点击流数据1296.4.5获取业务数据1296.4.6读取黑名单用户数据1306.4.7过滤黑名单用户1316.4.8统计每个城市不同广告的点击次数1326.4.9添加黑名单用户1336.4.10数据持久化1346.5运行程序1356.6本章小结137第7章数据可视化1387.1系统概述1387.1.1技术选取1387.1.2系统架构1397.2数据表设计与实现1417.2.1数据表介绍1417.2.2Phoenix集成HBase1427.2.3建立Phoenix与HBase表映射1437.3创建Spring Boot项目1477.4实现热门品类0数据可视化1527.4.1创建实体类0Entity1527.4.2创建数据库访问接口0Dao1537.4.3创建控制器类0Controller1537.4.4创建HTML文件0.1547.4.5运行项目实现热门品类0数据可视化1577.5实现各区域热门商品Top3数据可视化1607.5.1创建实体类Top3Entity1607.5.2创建数据库访问接口Top3Dao1607.5.3创建控制器类Top3Controller1617.5.4创建HTML文件top3.1627.5.5运行项目实现各区域热门商品Top3数据可视化1647.6实现页面单跳转化率数据可视化1657.6.1创建实体类ConversionEntity1657.6.2创建数据库访问接口ConversionDao1657.6.3创建控制器类ConversionController1667.6.4创建HTML文件conversion.1667.6.5运行项目实现页面单跳转化率数据可视化1697.7实现广告点击流实时统计可视化1697.7.1创建实体类AdsEntity1697.7.2创建数据库访问接口AdsDao1707.7.3创建控制器类AdsController1707.7.4创建HTML文件ads.1717.7.5运行项目实现广告点击流实时统计可视化1737.8本章小结174
作者介绍
江苏传智播客教育科技股份有限公司(简称传智播客)是一家致力于培养高素质软件开发人才的科技公司,“黑马程序员”是传智播客旗下高端IT教育品牌。
序言
— 没有更多了 —
以下为对购买帮助不大的评价