• Spark
21年品牌 40万+商家 超1.5亿件商品

Spark

正版新书 新华官方库房直发 可开电子发票

37.17 6.3折 59 全新

仅1件

江苏南京
认证卖家担保交易快速发货售后保障

作者王家林,段智华编著

出版社机械工业出版社

ISBN9787111591979

出版时间2018-03

版次1

装帧平装

开本16开

纸张胶版纸

定价59元

货号SC:9787111591979

上书时间2024-09-18

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
内容简介:
Spark SQL是Spark生态环境中核心和基础的组件,是掌握Spark的关键所在。本书接近从企业级开发的角度出发,结合多个企业级应用案例,深入剖析Spark SQL。全书共分为8章,包括:认识Spark SQL、DataFrame原理与常用操作、Spark SQL操作多种数据源、Parquet列式存储、Spark SQL内置函数与窗口函数、Spark SQL UDF与UDAF、Thrift Server、Spark SQL综合应用案例。

本书可以使读者对Spark SQL有深入的理解,本书适合于Spark学习爱好者,是学习Spark SQL的入门和提高教材,也是Spark开发工程师开发过程中查阅Spark SQL的案头手册。

目录:
前言

第1章认识Spark SQL

1.1Spark SQL概述

1.1.1Spark SQL与DataFrame

1.1.2DataFrame与RDD的差异

1.1.3Spark SQL的发展历程

1.2从零起步掌握Hive

1.2.1Hive的本质是什么

1.2.2Hive安装和配置

1.2.3使用Hive分析搜索数据

1.3Spark SQL on Hive安装与配置

1.3.1安装Spark SQL

1.3.2安装MySQL

1.3.3启动Hive Metastore

1.4Spark SQL初试

1.4.1通过spark-shell来使用Spark SQL

1.4.2Spark SQL的命令终端

1.4.3Spark的Web UI

1.5本章小结

第2章DataFrame原理与常用操作

2.1DataFrame编程模型

2.2DataFrame基本操作实战

2.2.1数据准备

2.2.2启动交互式界面

2.2.3数据处理与分析

2.3通过RDD来构建DataFrame

2.4缓存表(列式存储)

2.5DataFrame API应用示例

2.6本章小结

第3章Spark SQL 操作多种数据源

3.1通用的加载/保存功能

3.1.1Spark SQL加载数据

3.1.2Spark SQL保存数据

3.1.3综合案例——电商热销商品排名

3.2Spark SQL操作H
...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP