• 大数据预处理技术
21年品牌 40万+商家 超1.5亿件商品

大数据预处理技术

批量上传,套装书可能不全,下单前咨询在线客服! 正版书 !!!

22.6 4.1折 55 全新

库存3件

四川成都
认证卖家担保交易快速发货售后保障

作者朱晓姝 许桂秋

出版社人民邮电出版社

ISBN9787115503510

出版时间2019-04

装帧平装

开本16开

定价55元

货号9787115503510

上书时间2024-11-19

百叶图书

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
商品简介

作者针对大数据问题,分析如何进行大数据的导入,如何使用大数据工具进行快速的数据预处理,以及如何构建数据仓库。详细讲解了Kettle工具的使用、数据集成、Kettle作业项设计等。

作者简介

许桂秋 男,85年出生,计算机学士,工商管理硕士。 2009年-2012年,中国石油天然气股份有限公司,负责项目管理工作,企业内部高级讲师; 2012年-2015年,曙光信息产业股份有限公司,负责项目管理与企业内部培训工作,企业内部高级讲师; 2016年至今,曙光瑞翼教育合作中心,教学运营总监,负责各高校合作项目部的具体运营管理及指导工作。

目录
第1章  数据预处理概述
  1.1  数据预处理的背景与目的
    1.1.1  数据预处理的背景:数据质量
    1.1.2  数据预处理的目的
  1.2  数据预处理的流程
    1.2.1  数据清理
    1.2.2  数据集成
    1.2.3  数据变换
    1.2.4  数据归约
    1.2.5  数据预处理的注意事项
  1.3  数据预处理的工具
第2章  Kettle工具的初步使用
  2.1  Kettle的安装
    2.1.1  Java的安装
    2.1.2  Kettle的下载安装与Spoon的启动
  2.2  Kettle的使用
    2.2.1  转换的基本概念
    2.2.2  第一个转换案例
第3章  基于Kettle的数据导入与导出
  3.1  基于文件的数据导入与导出
    3.1.1  文本文件的导入与导出
    3.1.2  文本文件的导入与导出案例
    3.1.3  Excel文件的导入与导出
    3.1.4  Excel文件的导入与导出案例
    3.1.5  XML文件的导入与导出
    3.1.6  XML文件的导入与导出案例
    3.1.7  JSON文件的导入与导出
    3.1.8  JSON文件的导入与导出案例
  3.2  基于数据库的数据导入与导出
    3.2.1  关系型数据库的数据导入与导出
    3.2.2  MySQL数据库的数据导入与导出案例
  3.3  基于Web的数据导入与导出
    3.3.1  HTML数据的导入与导出
    3.3.2  HTML数据的导入与导出案例
    3.3.3  基于HTTP GET请求的导入与导出
    3.3.4  基于HTTP GET请求的导入与导出案例
  3.4  基于CDC变更数据的导入与导出
    3.4.1  基于源数据的CDC
    3.4.2  基于源数据的CDC案例
    3.4.3  基于触发器的CDC
    3.4.4  基于触发器的CDC案例
    3.4.5  基于快照的CDC
    3.4.6  基于快照的CDC案例
    3.4.7  基于日志的CDC
    3.4.8  基于日志的CDC案例
第4章  数据清理
  4.1  数据清理概述
    4.1.1  常用的数据清理步骤
    4.1.2  字符串清理
    4.1.3  字段清理

内容摘要
 朱晓姝、许桂秋主编的《大数据预处理技术(数据科学与大数据技术专业系列规划教材)》采用理论与实践相结合的方式,全面介绍了大数据预处理技术,主要内容包括数据预处理概述、Kettle工具的初步使用、基于Kettle的数据导入与导出、数据清理、Kettle作业设计、构建数据仓库、基于Python的数据导入与导出、基于Python的数据整理。
本书可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据预处理课程的教材。

主编推荐

数据预处理是数据挖掘中必不可少的关键一步,更是进行数据挖掘前的准备工作,一方面保证挖掘数据的正确性和有效性;另一方面通过对数据格式和内容的调整,使数据更符合挖掘的需要。
【内容简介】

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP