• 【假一罚四】大数据库/高级大数据人才培养丛书编者:刘鹏
21年品牌 40万+商家 超1.5亿件商品

【假一罚四】大数据库/高级大数据人才培养丛书编者:刘鹏

集团直发,全新正版书籍,假一罚四,放心选购。可开发票

24.9 5.1折 49 全新

库存2件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者编者:刘鹏

出版社电子工业

ISBN9787121316197

出版时间2017-06

装帧其他

开本其他

定价49元

货号3874056

上书时间2024-09-02

朗朗图书书店

已实名 已认证 进店 收藏店铺
  • 店主推荐
  • 最新上架

   商品详情   

品相描述:全新
商品描述
作者简介
刘鹏,教授,清华大学博士毕业,现任中国信息协会大数据分会副会长、南京大数据研究院院长、中国大数据应用联盟人工智能专家委员会主任、中国大数据专家委员会委员。
曾率队夺得2002PennySort国际计算机排序比赛冠军(这是我国获得的第一个大数据比赛世界冠军),两次夺得全国高校科技比赛最高奖,三次夺得清华大学科技比赛最高奖。
主持完成科研项目25项,发表论文80余篇,出版专业图书20部。获部级科技进步二等奖4项、三等奖4项。2002年开创性提出“计算池”模式,被2007年开始流行的“云计算”所证实。2003年开创性提出“反垃圾邮件网格”,被2008年开始流行的“云安全”所证实。
荣获“全军十大学习成才标兵”(排名第一)、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。

目录
第1章 大数据库概述
  1.1 传统关系型数据库面临的问题
  1.2 大数据库技术
    1.2.1 列式数据库
    1.2.2 内存数据库
    1.2.3 键值数据库
    1.2.4 流式数据库
  1.3 大数据SQL
  1.4 当前主流大数据SQL简介
    1.4.1 Hive
    1.4.2 Impala
    1.4.3 Shark
    1.4.4 Spark SQL
  1.5 本章总结
  习题
  参考文献
第2章 分布式数据库HBase
  2.1 HBase基础
    2.1.1 体系架构
    2.1.2 数据模型
  2.2 HBase操作简介
    2.2.1 HBase接口简介
    2.2.2 HBase Shell实战
    2.2.3 HBase API
  2.3 HBase实战
    2.3.1 实战HBase之综例
    2.3.2 实战HBase之使用MapReduce构建索引
  习题
  参考文献
第3章 数据仓库工具Hive
  3.1 Hive简介
    3.1.1 工作原理
    3.1.2 体系架构
    3.1.3 计算模型
    3.1.4 Hive部署模式
  3.2 Hive的使用
    3.2.1 Hive的数据类型
    3.2.2 Hive接口汇总
  3.3 实战Hive Shell
    3.3.1 DDL操作
    3.3.2 DML操作
    3.3.3 SQL操作
  3.4 实战Hive之复杂语句
  3.5 实战Hive之综合示例
  3.6 实战Hive API接口
    3.6.1 UDF编程示例
    3.6.2 UDAF编程示例
  习题
  参考文献
第4章 大数据查询系统Impala
  4.1 Impala简介
    4.1.1 Impala的起源
    4.1.2 Impala的特点
    4.1.3 Impala 前辈及竞争对手
  4.2 Impala工作原理
    4.2.1 Impala 设计目标
    4.2.2 Impala 服务器组件
    4.2.3 Impala 编程特点
    4.2.4 Impala在Hadoop生态圈中的生存之道
  4.3 Impala环境搭建
    4.3.1 Impala 安装前的考虑
    4.3.2 Impala 安装途径与安装示范
  4.4 Impala操作实例
    4.4.1 Impala 基本操作
    4.4.2 Impala 数据库操作
  习题
  参考文献
第5章 内存数据库Spark
  5.1 Spark简介
    5.1.1 Spark的引入
    5.1.2 Spark生态系统BDAS
    5.1.3 Spark系统架构
    5.1.4 Spark工作流程
    5.1.5 Spark应用案例
  5.2 Spark计算模型
    5.2.1 Spark程序模型
    5.2.2 弹性分布式数据集(RDD)
    5.2.3 Spark算子
  5.3 Spark工作机制
    5.3.1 Spark运行机制
    5.3.2 Spark调度机制
    5.3.3 Spark I/O机制
    5.3.4 Spark通信机制
    5.3.5 Spark容错机制
    5.3.6 Spark Shuffle机制
  5.4 Scala快速入门
    5.4.1 Scala解释器
    5.4.2 变量
    5.4.3 函数
    5.4.4 编写Scala脚本
    5.4.5 while 配合if实现循环
    5.4.6 foreach和 for 来实现迭代
    5.4.7 类型参数化数组
    5.4.8 Lists
    5.4.9 使用元组(Tuples)
    5.4.10 Sets和Maps
    5.4.11 函数编程风格
    5.4.12 读取文件
  5.5 Spark环境部署
    5.5.1 安装与配置Spark
    5.5.2 Intellij IDEA构建Spark开发环境
    5.5.3 SBT构建Spark程序
    5.5.4 编译Spark程序
    5.5.5 远程调试Spark程序
    5.5.6 生成Spark部署包
  5.6 Spark 编程案例
    5.6.1 WordCount
    5.6.2 Top K
    5.6.3 倒排索引
  习题
  参考文献
第6章 Spark SQL
  6.1 Spark SQL简介
    6.1.1 Spark SQL发展历程
    6.1.2 Spark SQL 架构
  6.2 Spark SQL编程基础
    6.2.1 数据类型及表达式
    6.2.2 Spark SQL查询引擎Catalyst
    6.2.3 SQL DSL API
    6.2.4 Spark SQL ThriftServer和CLI
    6.2.5 Spark SQL常用操作
  6.3 Spark SQL实战
    6.3.1 Spark SQL开发环境搭建
    6.3.2 Spark SQL使用入门
  习题
  参考文献
第7章 键值数据库
  7.1 概述
    7.1.1 键值存储
    7.1.2 键值数据库
  7.2 Redis
    7.2.1 简介
    7.2.2 Redis数据服务及集群技术
    7.2.3 Redis安装
    7.2.4 Redis数据操作
    7.2.5 案例:网站访问历史记录查询
  7.3 Memcached
    7.3.1 简介
    7.3.2 Memcached缓存技术
    7.3.3 Memcached安装
    7.3.4 Memcached数据操作
    7.3.5 Memcached分布式技术
    7.3.6 案例:论坛帖子信息缓存
  7.4 典型应用及局限
    7.4.1 典型应用
    7.4.2 键值数据库局限
  习题
  参考文献
第8章 流式数据库
  8.1 流式计算模型
    8.1.1 流式计算概念
    8.1.2 流式计算数据特点
    8.1.3 流式计算典型应用
    8.1.4 典型流式计算平台
  8.2 流式计算关键技术
    8.2.1 计算拓扑
    8.2.2 消息传递
    8.2.3 高可用性
    8.2.4 语义保障
    8.2.5 其他关键技术
  8.3 Storm平台
    8.3.1 Storm简介
    8.3.2 Storm原理
    8.3.3 Storm部署
    8.3.4 案例:Maven环境下的Storm编程
  8.4 Spark Streaming平台
    8.4.1 Spark Streaming简介
    8.4.2 Spark Streaming原理
    8.4.3 案例:集群环境下的Spark Streaming编程
  习题
  参考文献
第9章 数据应用托管平台Docker
  9.1 Docker技术简介
    9.1.1 Docker是什么
    9.1.2 Docker的架构和流程
  9.2 Docker的优势和局限
    9.2.1 Docker的优势
    9.2.2 Docker的局限性
  9.3 基于Docker的大数据系统设计
    9.3.1 分布式Docker网络环境的搭建
    9.3.2 Docker集群管理系统:Kubernetes
  习题
  参考文献

内容摘要
。。。

精彩内容
。。。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP