• 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
  • 数据清洗与etl技术 大中专理科计算机 冯广 编
21年品牌 40万+商家 超1.5亿件商品

数据清洗与etl技术 大中专理科计算机 冯广 编

本教材资料齐全:配有电子教案、案例、题、试卷、实训教程等。

34.35 7.2折 48 全新

仅1件

北京丰台
认证卖家担保交易快速发货售后保障

作者冯广 编

出版社清华大学出版社

ISBN9787302600817

出版时间2022-04

版次1

装帧平装

开本16

页数232页

字数353千字

定价48元

货号xhwx_1202623182

上书时间2024-11-21

智胜图书专营店

七年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
主编:

本教材资料齐全:配有电子教案、案例、题、试卷、实训教程等。

目录:

章 从大数据到etl

1.1 大数据概述

1.1.1 大数据的定义

1.1.2 大数据的基本质

1.1.3 大数据的影响

1.1.4 大数据带来的挑战

1.2 科学处理数据

1.3 etl简介

1.3.1 etl的基本定义

1.3.2 etl的基本过程

1.3.3 etl的架构体系

1.3.4 etl的必要

1.3.5 etl的分类

1.3.6 基本etl过程与数据清理的区别

1.3.7 etl现状与发展

1.4 数据抽取

1.4.1 数据抽取的概念

1.4.2 分类抽取

1.4.3 数据抽取的原则和方法

1.5 数据转换

1.5.1 数据转换的概念

1.5.2 类型转换

1.6 数据加载

1.6.1 数据加载的概念

1.6.2 数据加载方式

1.7 实验任务——处理的年份

1.8 小结

1.9 题

第2章 数据抽取

2.1 数据源

2.1.1 关系数据库

2.1.2 非关系数据库

2.1.3 通用程序库

2.2 数据抽取方式

2.2.1 全量抽取

2.2.2 增量抽取

2.2.3 增量抽取的比较分析

2.3 hadoop的数据抽取

2.3.1 hadoop简介

2.3.2 hadoop研究现状

2.3.3 环境搭建

2.3.4 数据采集

2.4 web文件的数据抽取

2.4.1 web文件简介

2.4.2 主要工作

2.4.3 主要工具——connotate

2.4.4 应用分析——基于页面标签的web结构化数据抽取

2.5 数据库的数据抽取

2.5.1 数据库简介

2.5.2 主要应用——基于etl工具软件的数据抽取

2.6 文本文件的数据抽取

2.6.1 文本文件数据抽取及应用领域

2.6.2 网络爬虫

2.7 实验任务——mysql环境搭建及数据抽取

2.7.1 mysql在windows下的搭建

2.7.2 mysql在linux下的搭建

2.7.3 案例分析

2.8 小结

2.9 题

第3章 数据转换

3.1 数据转换

3.1.1 数据转换的概念

3.1.2 数据转换的标准

3.1.3 数据转换的方法

3.1.4 数据之间的关联

3.2 数据清洗

3.2.1 数据清洗的主要内容

3.2.2 数据清洗研究现状

3.2.3 数据清洗的必要

3.2.4 数据清洗的问题

3.2.5 数据清洗对工具的要求

3.2.6 数据清洗的流程

3.2.7 数据清洗的

3.2.8 数据清洗的方法

3.3 python下的数据清洗

3.3.1 python概述

3.3.2 python的特点

3.3.3 python pandas——数据清洗

3.4 数据转换工具

3.4.1 data stage

3.4.2 kettle

3.4.3 informatica powercenter

3.4.4 etl automation

3.4.5 ssis

3.4.6 几种工具之间的比较

3.5 实验任务——kettle的分类安装及案例分析

3.5.1 kettle的分类安装

3.5.2 案例分析——利用kettle处理错误代码行

3.6 小结

3.7 题

第4章 数据加载

4.1 数据加载

4.1.1 数据加载的概念

4.1.2 数据加载机制

4.2 数据加载技术

4.2.1 加载技术

4.2.2 全量数据加载流程

4.3 数据仓库

4.3.1 数据仓库基本内容

4.3.2 数据仓库架构

4.3.3 数据仓库设计

4.3.4 数据仓库的规划和需求分析

……

内容简介:

本书为大数据时代下的产物,由浅入深地介绍大数据及其相关知识,在大数据的背景下着重介绍etl数据处理技术,同时引入数据清洗的知识,理论与实际相结合,突出所长。在理论上,本书突出重点与难点,较为系统地介绍大数据的各项基本技术。在实践作上,本书贴近生活,切实理解,紧跟实验进行,并从中萃取。同时本书还介绍etl技术的主流工具,结合当下一些项目进行运用,并综合课后思题,使读者在学中体会大数据的乐趣,翱游在大数据的海洋中。
    本书可作为高校新兴专业——数据科学专业的配套教材,也可作为其他专业的选修课教材,还可作为初学者的学教程。

作者简介:

冯广,男,硕士生导师,现任广东大学网络信息与现代教育技术中心副主任博士网络规划师硕士导师。长期从事计算机网络技术、网络控制技术和控制科学与控制工程领域的与科研工作。主要研究方向有网络与信息化控制、优化控制、rfid技术、计算机网络等。

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP