GREENPLUM:从大数据战略到实现
¥
20.72
1.7折
¥
119
九品
仅1件
作者冯雷 姚延栋 高小明 杨瑜
出版社机械工业出版社
出版时间2018-04
版次1
装帧平装
货号A5
上书时间2024-12-23
商品详情
- 品相描述:九品
图书标准信息
-
作者
冯雷 姚延栋 高小明 杨瑜
-
出版社
机械工业出版社
-
出版时间
2018-04
-
版次
1
-
ISBN
9787111632160
-
定价
119.00元
-
装帧
平装
-
开本
其他
-
页数
391页
- 【内容简介】
-
大数据已经从概念变成广泛落地的现实,并且对传统企业产生越来越大的影响。本书从大数据、人工智能、云计算三者的关系谈起,论述了企业制订大数据战略的原则、方法、技术平台的选择、实施、运维与管理的方方面面,并辅以成功案例,多方面展示了大数据在企业的应用。
- 【作者简介】
-
冯雷,(Ray Feng)PivotaI(毕威拓)中国研发中心总经理。自研发中心成立至今,主持数亿元人民币投资的中国研发和运营。作为Pivoal优选产品关键领导人,冯雷为Pivotal公司的数字化理念建立和对应的软件产品提供战略输入。冯雷毕业于卡内基-梅隆大学,201 O年从美国硅谷归国,在500强公司EMC旗下创建Greenplum中国研发部门。201 3年,随着优选Pivotal组建,冯雷在中国Greenplum大数据和VMWa re的PaaS云的基础上组建了Pivotal中国研发中心。研发中心秉承硅谷的创新精神,确立了Pivoyal的Greerl plum、Cloud Foundry等开源产品的领域靠前地位以及与阿里云等知名企业在开源领域的合作落地。冯雷参与或主编了多部大数据和云技术著作,并持有两项美国云计算。
- 【目录】
-
序前 言部分 大数据战略章 ABC:人工智能、大数据和云计算 21.1 再谈云计算 21.1.1 云计算由南向转为北向 21.1.2 P层云的精细化发展 31.1.3 大数据系统在云中部署不断朝南上移 41.2 大数据 51.2.1 从CRUD到CRAP 51.2.2 MPP(大规模并行计算) 71.2.3 大数据系统 81.2.4 当大数据遇到云计算 101.3 人工智能 111.3.1 模型化方法 121.3.2 AI的发展史 141.3.3 对AI应用的正确预期 151.4 ABC之间的关系 161.5 AI和人 181.5.1 经验与逻辑 181.5.2 公理化的逻辑系统 211.5.3 图灵机和可计算数 251.5.4 认知边界上的考量 28第2章 建立基于大数据的高阶数字化战略 322.1 基于云原生应用的数字化战略 322.2 大数据和AI:企业未来的终极 竞争点 342.3 大数据战略的落地 362.3.1 大数据和AI人才 362.3.2 AI驱动的开发方法和文化 372.3.3 大数据基础设施的建设 392.4 大数据和AI的展望 41第二部分 大数据平台第3章 数据处理平台的演进 453.1 前数据处理时代 453.2 早期的电子数据处理 473.2.1 电子计算机的出现 473.2.2 软件 473.3 数据库 493.3.1 数据模型 503.3.2 数据独立性和不错数据处理语言 543.3.3 数据保护 573.3.4 数据库早期发展过程中的困境 573.4 NoSQL数据库 583.4.1 NoSQL出现的背景 583.4.2 NoSQL产品的共性 603.4.3 NoSQL的分类 613.5 SQL数据库的回归 623.5.1 NoSQL与SQL的融合 623.5.2 Hadoop不等于大数据 633.5.3 SQL从未离开 643.6 集成数据处理和分析平台 653.6.1 数据类型 653.6.2 业务场景 663.6.3 集中还是分散 673.7 数据平台的选型 683.8 小结 69第4章 Greenplum数据库快速入门 724.1 Greenplum数据库的发展和现状 724.2 Greenplum数据库的特性 734.3 Greenplum数据库的组成 754.4 Greenplum数据库的安装与部署 764.4.1 准备工作 764.4.2 安装Greenplum 774.4.3 初始化Greenplum数据库 804.5 Greenplum数据库的常用操作 824.6 Greenplum数据库的常用命令 834.6.1 gpstart 834.6.2 gpstop 834.6.3 gpstate 834.6.4 gpactivatestandby 844.6.5 gpconfig 844.6.6 gpdeletesystem 844.7 小结 85第5章 Greenplum的架构和核心引擎 865.1 Greenplum的架构 865.1.1 Greenplum Master 875.1.2 Greenplum Segment 875.1.3 Greenplum Interconnect 875.1.4 Greenplum Standby Master 875.1.5 Greenplum Mirror Segment 885.2 Greenplum查询计划 885.2.1 单机查询计划 895.2.2 并行查询计划 905.3 Greenplum数据库查询处理的过程 955.3.1 Greenplum数据库的主要功能组件 955.3.2 Greenplum数据库查询的执行流程 965.4 小结 97第6章 从ETL到数据联邦和数据虚拟化 986.1 Greenplum中的ETL 996.1.1 PostgreSQL的ETL工具箱 996.1.2 GPLOAD 1006.2 Greenplum的数据联邦 1046.2.1 dblink简介 1046.2.2 外部表 1076.2.3 GPFDIST外部表 1096.2.4 可执行外部表 1196.2.5 Greenplum的S3外部表 1206.2.6 GPHDFS外部表 1276.2.7 Spark连接器 1296.2.8 Gemfire连接器 1296.3 Greenplum的数据虚拟化框架 1306.3.1 PXF的架构 1306.3.2 PXF的环境配置 1316.3.3 GPHDFS与PXF比较 1326.4 小结 133第7章 混合负载和资源管理 1347.1 混合负载的机遇和挑战 1347.2 混合负载的业务和技术要求 1367.3 资源管理 1397.4 并发管理 1457.5 小结 146第三部分 机器学习与数据分析第8章 Greenplum中的过程化编程语言 1498.1 PL/Python 1508.1.1 PL/Python简介 1508.1.2 受信任的过程化编程语言 1518.1.3 安装Python包 1528.1.4 安装Greenplum数据计算Python包集合 1538.1.5 类型转换 1538.1.6 PL/Python函数中的数据共享 1548.2 PL/R 1558.2.1 PL/R简介 1568.2.2 安装R包 1588.2.3 安装Greenplum数据计算R包集合 1588.3 PL/Container 1588.3.1 PL/Container简介 1598.3.2 一个简单的例子 1598.3.3 PL/Container的基本操作方法 1628.3.4 PL/Container实践总结 1668.3.5 关于PL/Container的开发 1678.4 小结 167第9章 MADlib 机器学习库 1689.1 MADlib入门 1689.1.1 MADlib简介 1689.1.2 MADlib的特点 1699.1.3 MADlib与其他机器学习算法库的比较 1729.1.4 MADlib的快速安装 1739.2 MADlib的架构 1749.2.1 SQL用户接口 1749.2.2 Python驱动函数 1759.2.3 C++机器学习算法实现 1759.2.4 C++数据库抽象层 1769.3 MADlib应用 1779.3.1 数据预处理 1779.3.2 监督学习 1789.3.3 非监督学习 1849.3.4 时间序列
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价