消息首页搜索举报

【假一罚四】大数据库/高级大数据人才培养丛书编者:刘鹏

集团直发，全新正版书籍，假一罚四，放心选购。可开发票

24.9 5.1折 49 全新

库存2件

浙江嘉兴

认证卖家担保交易快速发货售后保障

作者编者:刘鹏

出版社电子工业

ISBN9787121316197

出版时间2017-06

装帧其他

开本其他

定价49元

货号3874056

上书时间2024-09-02

朗朗图书书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 16小时
好评率暂无

店主推荐
最新上架

【全新正版，假一罚四】猴子老曹/动物与孩子9787530165782叶广芩|责编:易江菊//张丹//邢蕾 ¥16.70

【全新正版】起床后的黄金1小时池田千惠9787547739228北京日报出版社 ¥12.90

【正版全新】悄悄话/全国优秀儿童文学奖大奖书系高洪波9787539574431福建少年儿童出版社 ¥13.80

【全新正版，假一罚四】陈土豆的红灯笼9787572138379谢华良/著 ¥12.90

【全新正版】（护眼版）汉字的故事(注音美绘本)/小学生课外阅读经典丛书编者:李林静|责编:魏红霞|总主编:金波9787570410521北京教育 ¥8.00

【全新正版，假一罚四】听风八百遍，才知是人间9787568099929史铁生等 ¥24.20

【全新正版，假一罚四】新东方100个句子记完2000个中考单词同步学练测9787572271007俞敏洪 ¥12.80

【全新正版，假一罚四】老友、爱人和大麻烦[加] 马修·派瑞9787544798501译林 ¥37.80

【全新正版】全部的你(增订版)杨定一著陈梦怡编9787516913871 ¥39.00

【假一罚四】幼儿情景认知双语发声书(精)书童文化 ¥75.00

【假一罚四】2023全国卫生专业技术资格考试指导——外科学全国卫生专业技术资格考试用书编写专家委员会 ¥130.90

【假一罚四】肿瘤科普百科丛书——肺癌吴楠 ¥33.60

【假一罚四】肺部小结节诊断与治疗(精)林强 ¥86.20

【假一罚四】张一鸣让字节跳动的创业哲学张笑恒 ¥26.30

【假一罚四】世界儿童共享的经典丛书：爱的教育(2021上少版)(意)埃迪蒙托·德·亚米契斯,海豚传媒 ¥12.80

【假一罚四】绿山墙的安妮(彩绘注音版)/小学生拓展阅读系列(加)露西·蒙哥马利 ¥6.40

【假一罚四】课程--基础原理和问题(上下第7版)/教育治理与领导力丛书艾伦·奥恩斯坦弗朗西斯·P.亨金斯 ¥91.40

【假一罚四】财报背后的投资秘密：“韭菜”的自我修养孙旭龙 ¥26.30

商品详情

品相描述：全新

商品描述: 作者简介
刘鹏，教授，清华大学博士毕业，现任中国信息协会大数据分会副会长、南京大数据研究院院长、中国大数据应用联盟人工智能专家委员会主任、中国大数据专家委员会委员。
曾率队夺得2002PennySort国际计算机排序比赛冠军（这是我国获得的第一个大数据比赛世界冠军），两次夺得全国高校科技比赛最高奖，三次夺得清华大学科技比赛最高奖。
主持完成科研项目25项，发表论文80余篇，出版专业图书20部。获部级科技进步二等奖4项、三等奖4项。2002年开创性提出“计算池”模式，被2007年开始流行的“云计算”所证实。2003年开创性提出“反垃圾邮件网格”，被2008年开始流行的“云安全”所证实。
荣获“全军十大学习成才标兵”（排名第一）、南京“十大杰出青年”、江苏省中青年科学技术带头人、清华大学“学术新秀”等称号。

目录
第1章大数据库概述
  1.1 传统关系型数据库面临的问题
  1.2 大数据库技术
    1.2.1 列式数据库
    1.2.2 内存数据库
    1.2.3 键值数据库
    1.2.4 流式数据库
  1.3 大数据SQL
  1.4 当前主流大数据SQL简介
    1.4.1 Hive
    1.4.2 Impala
    1.4.3 Shark
    1.4.4 Spark SQL
  1.5 本章总结
  习题
  参考文献
第2章分布式数据库HBase
  2.1 HBase基础
    2.1.1 体系架构
    2.1.2 数据模型
  2.2 HBase操作简介
    2.2.1 HBase接口简介
    2.2.2 HBase Shell实战
    2.2.3 HBase API
  2.3 HBase实战
    2.3.1 实战HBase之综例
    2.3.2 实战HBase之使用MapReduce构建索引
  习题
  参考文献
第3章数据仓库工具Hive
  3.1 Hive简介
    3.1.1 工作原理
    3.1.2 体系架构
    3.1.3 计算模型
    3.1.4 Hive部署模式
  3.2 Hive的使用
    3.2.1 Hive的数据类型
    3.2.2 Hive接口汇总
  3.3 实战Hive Shell
    3.3.1 DDL操作
    3.3.2 DML操作
    3.3.3 SQL操作
  3.4 实战Hive之复杂语句
  3.5 实战Hive之综合示例
  3.6 实战Hive API接口
    3.6.1 UDF编程示例
    3.6.2 UDAF编程示例
  习题
  参考文献
第4章大数据查询系统Impala
  4.1 Impala简介
    4.1.1 Impala的起源
    4.1.2 Impala的特点
    4.1.3 Impala 前辈及竞争对手
  4.2 Impala工作原理
    4.2.1 Impala 设计目标
    4.2.2 Impala 服务器组件
    4.2.3 Impala 编程特点
    4.2.4 Impala在Hadoop生态圈中的生存之道
  4.3 Impala环境搭建
    4.3.1 Impala 安装前的考虑
    4.3.2 Impala 安装途径与安装示范
  4.4 Impala操作实例
    4.4.1 Impala 基本操作
    4.4.2 Impala 数据库操作
  习题
  参考文献
第5章内存数据库Spark
  5.1 Spark简介
    5.1.1 Spark的引入
    5.1.2 Spark生态系统BDAS
    5.1.3 Spark系统架构
    5.1.4 Spark工作流程
    5.1.5 Spark应用案例
  5.2 Spark计算模型
    5.2.1 Spark程序模型
    5.2.2 弹性分布式数据集（RDD）
    5.2.3 Spark算子
  5.3 Spark工作机制
    5.3.1 Spark运行机制
    5.3.2 Spark调度机制
    5.3.3 Spark I/O机制
    5.3.4 Spark通信机制
    5.3.5 Spark容错机制
    5.3.6 Spark Shuffle机制
  5.4 Scala快速入门
    5.4.1 Scala解释器
    5.4.2 变量
    5.4.3 函数
    5.4.4 编写Scala脚本
    5.4.5 while 配合if实现循环
    5.4.6 foreach和 for 来实现迭代
    5.4.7 类型参数化数组
    5.4.8 Lists
    5.4.9 使用元组（Tuples）
    5.4.10 Sets和Maps
    5.4.11 函数编程风格
    5.4.12 读取文件
  5.5 Spark环境部署
    5.5.1 安装与配置Spark
    5.5.2 Intellij IDEA构建Spark开发环境
    5.5.3 SBT构建Spark程序
    5.5.4 编译Spark程序
    5.5.5 远程调试Spark程序
    5.5.6 生成Spark部署包
  5.6 Spark 编程案例
    5.6.1 WordCount
    5.6.2 Top K
    5.6.3 倒排索引
  习题
  参考文献
第6章 Spark SQL
  6.1 Spark SQL简介
    6.1.1 Spark SQL发展历程
    6.1.2 Spark SQL 架构
  6.2 Spark SQL编程基础
    6.2.1 数据类型及表达式
    6.2.2 Spark SQL查询引擎Catalyst
    6.2.3 SQL DSL API
    6.2.4 Spark SQL ThriftServer和CLI
    6.2.5 Spark SQL常用操作
  6.3 Spark SQL实战
    6.3.1 Spark SQL开发环境搭建
    6.3.2 Spark SQL使用入门
  习题
  参考文献
第7章键值数据库
  7.1 概述
    7.1.1 键值存储
    7.1.2 键值数据库
  7.2 Redis
    7.2.1 简介
    7.2.2 Redis数据服务及集群技术
    7.2.3 Redis安装
    7.2.4 Redis数据操作
    7.2.5 案例：网站访问历史记录查询
  7.3 Memcached
    7.3.1 简介
    7.3.2 Memcached缓存技术
    7.3.3 Memcached安装
    7.3.4 Memcached数据操作
    7.3.5 Memcached分布式技术
    7.3.6 案例：论坛帖子信息缓存
  7.4 典型应用及局限
    7.4.1 典型应用
    7.4.2 键值数据库局限
  习题
  参考文献
第8章流式数据库
  8.1 流式计算模型
    8.1.1 流式计算概念
    8.1.2 流式计算数据特点
    8.1.3 流式计算典型应用
    8.1.4 典型流式计算平台
  8.2 流式计算关键技术
    8.2.1 计算拓扑
    8.2.2 消息传递
    8.2.3 高可用性
    8.2.4 语义保障
    8.2.5 其他关键技术
  8.3 Storm平台
    8.3.1 Storm简介
    8.3.2 Storm原理
    8.3.3 Storm部署
    8.3.4 案例：Maven环境下的Storm编程
  8.4 Spark Streaming平台
    8.4.1 Spark Streaming简介
    8.4.2 Spark Streaming原理
    8.4.3 案例：集群环境下的Spark Streaming编程
  习题
  参考文献
第9章数据应用托管平台Docker
  9.1 Docker技术简介
    9.1.1 Docker是什么
    9.1.2 Docker的架构和流程
  9.2 Docker的优势和局限
    9.2.1 Docker的优势
    9.2.2 Docker的局限性
  9.3 基于Docker的大数据系统设计
    9.3.1 分布式Docker网络环境的搭建
    9.3.2 Docker集群管理系统：Kubernetes
  习题
  参考文献

内容摘要
。。。

精彩内容
。。。

— 没有更多了 —