• 数据分析实用技术 阿里云大数据分析师ACP认证培训教程
21年品牌 40万+商家 超1.5亿件商品

数据分析实用技术 阿里云大数据分析师ACP认证培训教程

若图片与书名不一致,以书名和定价为准!

34.65 6.3折 55 全新

库存9件

河北保定
认证卖家担保交易快速发货售后保障

作者赵强

出版社电子工业出版社

ISBN9787121419232

出版时间2021-09

版次1

装帧平装

开本16开

纸张胶版纸

定价55元

货号8687518

上书时间2024-09-06

中图网旗舰店

十二年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
基本信息
书名:数据分析实用技术 阿里云大数据分析师ACP认证培训教程
定价:55元
作者:赵强
出版社:电子工业出版社
出版日期:2021-09-01
ISBN:9787121419232
字数:
页码:
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐

内容提要
本书关注大数据分析师所需掌握的重要的基础能力。首先,本书阐述了大数据分析师的职业特点。其次,根据数据分析经常涉及的技术要求,按顺序介绍了什么是数据库,如何使用数据库,大数据环境下的分布式数据库Hadoop、阿里云MaxCompute,以及相对应的数据库查询语言SQL、MapReduce、Hive、Pig等基本的编程技术。为了提高数据分析工作的质量与效率,本书还详细介绍了数据项目质量控制的理论和实践,其中涉及了数据预处理、数据脱敏和脏数据处理的技能知识,同时介绍了在数据项目中SQL编程的实践方法。作为一本介绍数据分析的入门书籍,本书详细介绍了数据分析中常见的方法(如EDA),包括指标计算的一些常见形式。在企业环境中,数据分析常常以项目的形式出现,本书也向读者介绍了数据分析项目是如何承接、分解和实施的。后,本书还向读者介绍了常用的数据挖掘技术,如决策树、聚类分析和关联分析,让读者对算法在数据分析中的应用有直观的了解。本书可作为阿里云大数据分析师ACP认证培训的教材,也可作为高校大数据相关专业的学生教材,还可供希望从事大数据分析工作的读者阅读参考。
目录
目 录章  大数据分析领域职业介绍1.1  职业路径1.1.1  大数据职业生态1.1.2  大数据工程师职业方向1.1.3  大数据分析师职业方向1.1.4  大数据工作入门1.2  技能要求1.2.1  基本职业素养1.2.2  从数据中挖掘金矿1.2.3  大数据工程师的技能要求1.2.4  大数据分析师的技能要求1.3  工作情况1.3.1  典型的工作状态1.3.2  大数据职业的现状1.4  职业前景1.4.1  大数据职业的发展1.4.2  大数据的未来1.4.3  大数据职业的规划第2章  初识大数据2.1  大数据的基础知识2.1.1  什么是大数据2.1.2  大数据为什么重要2.1.3  大数据的维度2.2  大数据的类型2.2.1  结构化数据与非结构化数据2.2.2  几个大数据的例子2.3  大数据的行业应用2.4  企业面临的大数据挑战类型2.4.1  大数据从何而来2.4.2  企业如何获取大数据2.4.3  大数据的存储问题2.4.4  大数据对分析人才的要求2.4.5  大数据带来的挑战类型第3章  数据库基础3.1  数据库简介3.1.1  数据管理技术发展史3.1.2  数据库的应用3.1.3  数据库系统概述3.2  关系型数据库3.2.1  数据模型概述3.2.2  关系数据模型3.2.3  E-R数据模型3.2.4  关系型数据库的设计原则3.3  数据仓库3.3.1  数据仓库的历史3.3.2  数据仓库系统的组成3.3.3  ETL3.3.4  数据仓库与操作型数据库的关系3.4  Hadoop与分布式数据存储3.4.1  大数据对存储技术的挑战和Hadoop的起源3.4.2  Hadoop生态圈及系统架构3.4.3  Hadoop应用场景3.4.4  Hadoop局限性3.5  阿里云MaxCompute3.5.1  MaxCompute简介3.5.2  MaxCompute的基本概念3.5.3  MaxCompute数据的导入导出3.5.4  MaxCompute SQL3.5.5  函数3.5.6  MaxCompute MapReduce3.5.7  MaxCompute权限与安全3.6  常用Linux指令简介3.6.1  安装和登录指令3.6.2  文件处理指令3.6.3  系统管理相关指令3.6.4  网络操作指令3.6.5  系统安全相关指令3.6.6  其他指令第4章  数据分析工具与语言4.1  SQL基础4.1.1  SQL简介4.1.2  MySQL数据类型4.1.3  数据定义语言4.1.4  数据操作语言4.1.5  joi4.1.6  数据表的合并、交集4.1.7  SQL实用函数4.2  MapReduce4.2.1  MapReduce Job4.2.2  MapReduce主程序4.2.3  MapReduce主程序运行详解4.2.4  MapReduce数据流与控制流详解4.2.5  MapReduce小结4.3  Hive4.4  Pig4.5  HDFS4.5.1  HDFS的相关概念4.5.2  HDFS的基本操作4.5.3  HDFS常用的Java API介绍第5章  数据可视化5.1  数据可视化概念5.1.1  数据可视化的定义与原则5.1.2  数据可视化的设计思路5.2  数据可视化元素5.2.1  表格5.2.2  柱状图5.2.3  折线图5.2.4  饼图5.2.5  地图5.2.6  散点图5.2.7  其他常见图5.3  数据可视化设计原则5.4  DataV设计5.5  BI报表设计第6章  数据项目质量控制6.1  数据质量控制理论6.1.1  数据质量的五个维度6.1.2  脏数据类型6.2  评估数据的质量及其对项目的影响6.2.1  数据如何创造价值——DIK6.2.2  数据质量问题对企业创造价值的影响6.3  数据预处理6.3.1  数据预处理的五大步骤6.3.2  数据清洗场景6.3.3  脏数据清洗过程6.3.4  脏数据与脏数据清洗的基本方法6.3.5  脏数据处理的案例6.3.6  SQL处理脏数据示例6.4  数据脱敏6.4.1  确定数据脱敏对象6.4.2  隐私数据泄露类型6.4.3  隐私数据脱敏的要求6.4.4  常见的数据脱敏算法6.5  数据项目质量控制的类型第7章  数据编程基础7.1  面向分析的数据编程范例7.1.1  数据项目的特点7.1.2  数据项目编程的流程7.1.3  面向分析的数据编程范例7.2  编程效率和程序运行效率7.2.1  编程效率7.2.2  程序运行效率7.3  编程质量控制流程第8章  数据项目设计与执行8.1  数据分析项目计划管理流程8.2  数据项目设计方法8.2.1  项目目标8.2.2  背景调查8.2.3  分析范围8.2.4  分析结果交付形式8.3  数据分析项目的分类8.4  项目前分析和项目绩效考评第9章  数据分析技术9.1  指标体系9.1.1  绩效指标(KPI)的定义9.1.2  企业构建指标体系9.1.3  平衡计分卡常见指标9.2  数据分析9.2.1  数据分析的定义9.2.2  数据分析的目的9.2.3  数据分析的作用9.3  探索性数据分析(EDA)9.3.1  EDA简介9.3.2  单一变量探索性分析9.3.3  多变量探索性分析9.4  探索性数据分析应用案例9.4.1  情况介绍9.4.2  数据介绍9.4.3  EDA探索分析遵循银行政策情况9.4.4  EDA探索分析懒惰的银行客户代表9.4.5  EDA探索分析银行客户代表是否执行了有效的沟通9.5  EDA中的指标变换形式9.5.1  总量指标9.5.2  相对指标0章  常用数据挖掘技术10.1  决策树10.1.1  决策树概述10.1.2  信息熵10.1.3  ID3算法10.1.4  C4.5算法10.1.5  CART算法10.2  聚类分析10.2.1  聚类概述10.2.2  样本间距离10.2.3  K-means聚类10.2.4  群体距离10.2.5  层次聚类10.2.6  聚类算法的评估10.3  关联分析10.3.1  关联规则量化指标10.3.2  Apriori算法
作者介绍
赵强,杭州决明数据科技有限公司负责人,从事大数据应用与教育近20年,现为加拿大约克大学舒立克商学院MBA特聘教授,阿里云大学特聘专家教授。曾服务于世界500强企业中的零售、银行、电信企业和全球性的管理咨询公司,参与了众多国际企业营销和数据战略规划的制定和决策。对云计算与大数据应用结合有深刻体会,了解企业的需求,能够帮助企业制定优化的云计算大数据应用方案,乐于交流,愿意分享,在培训教育行业有一定知名度。
序言

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP