数字化转型实践:构建云原生大数据平台
全新正版 极速发货
¥
63.32
5.8折
¥
109
全新
库存2件
作者金鑫 ,武帅
出版社电子工业出版社
ISBN9787121440069
出版时间2022-08
装帧平装
开本16开
定价109元
货号1202713150
上书时间2024-06-09
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
金鑫,微软技术专家,于2000年加入微软,专注于研究企业级应用和分布式系统。近年来,作为微软公有云架构和开发技术领域专家,主要从事微软云数据平台和开发平台的建设工作,致力于为客户提供云原生解决方案及技术咨询。武帅,微软技术专家,于2011年加入微软,一直从事开发测试技术和公有云的研究及咨询工作。目前专注于云计算的行业落地,致力于物联网、大数据和人工智能等新兴技术助力企业数字化转型的工作。
目录
第1章 数字化转型与数据技术001
1.1 数字化转型002
1.2 基于数据进行数字化转型004
1.3 数据仓库006
1.4 大数据009
1.5 数据湖013
1.6 云计算中数据技术的演进016
1.7 本书目标018
第2章 数据存储019
2.1 数据存储的发展与趋势020
2.1.1 集中式文件系统020
2.1.2 网络文件系统021
2.1.3 分布式文件系统022
2.1.4 云原生存储024
2.2 Azure Blob对象存储025
2.2.1 数据冗余策略027
2.2.2 分层存储030
2.2.3 兼容HDFS的WASB文件系统031
2.3 创建存储账号033
2.3.1 订阅033
2.3.2 资源组034
2.3.3 存储账号036
2.4 Azure数据湖存储039
2.4.1 分层命名空间039
2.4.2 兼容HDFS的ABFS文件系统040
2.5 创建数据湖存储043
2.6 基于HDFS访问数据湖存储045
2.7 在HDInsight中访问数据湖存储058
2.8 本章小结064
第3章 数据引入065
3.1 什么是数据引入066
3.2 数据引入面临的挑战067
3.3 数据引入工具069
3.4 数据工厂071
3.4.1 什么是数据工厂071
3.4.2 创建数据工厂072
3.4.3 数据工厂的主要组件076
3.5 引入数据084
3.5.1 数据复制084
3.5.2 管道设计088
3.5.3 参数化098
3.5.4 监控100
3.6 本章小结102
第4章 批量数据处理103
4.1 数据处理概述104
4.2 数据处理引擎105
4.2.1 MapReduce105
4.2.2 Spark107
4.3 Databricks111
4.4 使用Databricks处理批量数据115
4.5 Databricks的特性121
4.5.1 依赖库管理121
4.5.2 Databricks文件系统(DBFS)124
4.5.3 密钥管理126
4.5.4 Delta Lake129
4.6 使用数据工厂处理批量数据134
4.6.1 设计Data Flow134
4.6.2 Data Flow的设计模式144
4.6.3 如何选择Data Flow与Databricks145
4.7 本章小结146
第5章 实时数据处理147
5.1 什么是实时数据处理148
5.2 消息队列149
5.3 Kafka的使用153
5.3.1 创建虚拟网络153
5.3.2 创建Kafka集群155
5.3.3 配置IP advertising157
5.3.4 生产者发送数据159
5.4 实时数据处理引擎166
5.5 使用Spark Structured Streaming处理实时数据171
5.5.1 连通Kafka与Databricks171
5.5.2 在Databricks中处理数据174
5.5.3 使用Cosmos DB保存数据176
5.6 Event Hub182
5.7 本章小结190
第6章 数据仓库191
6.1 什么是数据仓库192
6.2 云原生数据仓库194
6.3 Synapse Analytics199
6.3.1 什么是Synapse Analytics199
6.3.2 Synapse SQL的架构200
6.3.3 创建Synapse工作区208
6.3.4 创建SQL池210
6.3.5 连接SQL池212
6.4 数据加载214
6.4.1 数据加载方式214
6.4.2 使用COPY导入数据220
6.5 Synapse SQL的资源和负荷管理227
6.5.1 资源类227
6.5.2 并发槽229
6.5.3 最大并发查询数231
6.5.4 工作负荷组232
6.5.5 工作负荷分类器239
6.6 数据仓库发展趋势242
6.6.1 挑战242
6.6.2 趋势244
6.7 Synapse Analytics的高级特性245
6.7.1 Synapse 工作室246
6.7.2 数据中心247
6.7.3 无服务器SQL池248
6.7.4 托管Spark252
6.8 本章小结257
第7章 数据可视化258
7.1 数据可视化概述259
7.2 数据可视化工具260
7.3 Power BI263
7.3.1 什么是Power BI263
7.3.2 Power BI的构件265
7.3.3 使用Power BI Desktop268
7.3.4 使用Power BI服务281
7.4 本章小结285
第8章 机器学习286
8.1 机器学习概述287
8.1.1 算法类型287
8.1.2 业务场景290
8.2 机器学习的流程291
8.3 机器学习的挑战与云原生平台的优势293
8.4 云原生机器学习平台296
8.4.1 创建工作区297
8.4.2 创建数据存储库298
8.4.3 创建数据集301
8.4.4 创建计算资源303
8.5 机器学习设计器305
8.6 自动化机器学习310
8.7 本章小结315
参考文献316
内容摘要
21世纪,互联网行业的爆发开启了全球数据量急剧增长的新时代,数据已经成为驱动企业数字化转型的核心力量。整个数据行业的技术能力不断提升,从数据库到数据仓库,再到开源大数据,都在经济社会中发挥着极其重要的作用。近年来,新兴数据技术与云计算相互辅助,共同发展,诞生了一系列云原生数据服务,让企业能够突破传统模式的局限,专注于业务,降本增效。本书以全球前沿的云原生服务为基础,详细展现了如何将数据存储、数据引入、批量数据处理、实时数据处理、数据仓库、数据可视化和机器学习等核心要素综合起来,逐步构建一个高效的大数据服务平台。
— 没有更多了 —
以下为对购买帮助不大的评价