• 大数据分析技术
21年品牌 40万+商家 超1.5亿件商品

大数据分析技术

正版保障 假一赔十 可开发票

37.88 6.4折 59 全新

库存13件

广东广州
认证卖家担保交易快速发货售后保障

作者李俊翰,聂强

出版社机械工业出版社

ISBN9787111712084

出版时间2021-04

装帧平装

开本16开

定价59元

货号11715479

上书时间2024-08-31

灵感书店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介

李俊翰,中 员,执教13年。教学经验丰富。作为主研参与大数据技术与应用 专业教学资源库建设工作,主持子课程《应用程序开发基础(Java)》;发表SCI2篇,中文核心3篇;完成软件著作权1项,实用新型专利4项,横向课题2项;作为指导教师,指导学生参加全国职业院校技能大赛“大数据技术与应用”赛项获二等奖,重庆市职业院校技能竞赛“大数据技术与应用”赛项获得一等奖3项,“ ”暨金砖 技能大赛大数据赛项三等奖等;主参编教材《大数据采集与爬虫》《大数据平台应用》《Python编程基础》《Spark大数据实时分析实战》;作为主讲教师先后承担《数据预处理》《大数据编程基础(Python)》和《大数据可视化技术》等十余门课程。



目录

前言

项目1  认识大数据分析

1.1 大数据分析概述

1.1.1 大数据分析的概念和发展

1.1.2 大数据分析的作用和影响

1.2 大数据分析模型

1.2.1 大数据分析的技术和工具

1.2.2 大数据分析的流程

1.2.3 大数据分析的模型简介

【任务实施】

任务1 网站用户活跃度指标综合分析

任务2 身高体重指标数据关联分析

练习题

项目2  安装Python数据分析工具 

2.1 Python数据分析基本概念

2.1.1 Python数据分析的特点

2.1.2 Python与其他数据分析工具的比较

2.2 Python数据分析常用库介绍

2.2.1 NumPy简介

2.2.2 Pandas简介

2.2.3 SciPy简介

2.2.4 Matplotlib简介

2.2.5 scikit-learn简介

2.2.6 Statmodels简介

2.2.7 Seaborn简介

【任务实施】

任务1 在Windows系统中安装Anaconda

任务2 运行Jupyter Notebook

任务3 PyCharm的安装和使用

练习题

项目3  使用NumPy实现统计分析和处理

3.1 NumPy的基本概念

3.1.1 NumPy基础理论和引用方法

3.1.2 ndarry对象

3.1.3 NumPy数据类型

3.1.4 NumPy数组属性

3.1.5 NumPy切片和索引

3.2 NumPy函数

3.2.1 NumPy数学函数

3.2.2 NumPy数组维度操作函数

3.2.3 NumPy创建数组函数

3.2.4 NumPy常用IO函数

3.2.5 NumPy广播

【任务实施】

任务1 使用Numpy实现股票数据分析

任务2 使用Numpy实现豆瓣电影数据

分析

练习题

项目4  Pandas数据分析和处理

4.1 Pandas的基本概念

4.1.1 Pandas基础理论和引用方法

4.1.2 Pandas基本数据结构

4.2 Pandas的基本用法

4.2.1 创建Pandas对象

4.2.2 查看Pandas基本数据

4.2.3 Pandas索引和切片

4.2.4 Pandas缺失值和空值处理

4.2.5 Pandas连接和合并数据

4.2.6 Pandas分组

4.2.7 Pandas重塑

4.2.8 Pandas数据透视表

4.2.9 Pandas时间序列

4.2.10 Pandas分类

4.2.11 Pandas IO操作

【任务实施】

任务1 使用Pandas实现水果销售数据分析

任务2 使用Pandas实现用户消费行为数据分析

任务3 使用Pandas实现电商销售数据分析

练习题

项目5  Matplotlib数据分析可视化库

5.1 Matplotlib的基本概念

5.1.1 Matplotlib基础理论和引用方法

5.1.2 散点图

5.1.3 条形图

5.1.4 折线图

5.1.5 饼图

5.1.6 直方图

5.1.7 箱形图

5.2 组合图

5.2.1 曲线组合图

5.2.2 柱状、散点、折线组合图

5.2.3 直方图组合图123 【任务实施】

任务1 使用饼图实现零售总额数据分析

任务2 使用折线图实现零售总额数据分析

任务3 使用双柱状图实现零售总额变化情况数据分析

练习题

项目6  基于Hadoop的数据分析

6.1 掌握Hadoop框架和生态组件

6.1.1 Hadoop简介

6.1.2 Hadoop核心组件和工作原理

6.1.3 Hadoop安装、部署和应用

6.2 Hadoop生态组件

6.2.1 Hadoop生态圈简介

6.2.2 Hive的安装、部署和应用

6.2.3 Spark的安装、部署和应用

6.2.4 HBase的安装、部署和应用

6.2.5 Kafka的安装、部署和应用

6.2.6 Flume的安装、部署和应用

6.2.7 Sqoop的安装、部署和应用

6.2.8 Zookeeper的安装、部署和应用

【任务实施】

任务1 使用Hadoop及其组件Hive实现数据分析

任务2 使用Hadoop及其组件Spark实现数据分析

练习题

项目7  基于scikit-learn机器学习库的数据分析

7.1 掌握机器学习基本概念

7.1.1 机器学习简介

7.1.2 机器学习基本流程

7.1.3 机器学习开发流程

7.1.4 机器学习算法分类

7.2 掌握scikit-learn的基本用法

7.2.1 scikit-learn的安装和引用方法

7.2.2 scikit-learn的基本用法

【任务实施】

任务1 使用scikit-learn实现鸢尾花数据分析

任务2 使用scikit-learn实现波士顿房价数据分析

练习题

参考文献



主编推荐

本书为 教学资源库“大数据分析技术”课程的配套教材 本书采用项目驱动方式编写,理实一体 本书为新形态一体化教材,配套建设了电子课件、微课视频、源代码和习题答案等数字化学习资源



精彩内容

本书主要针对高职大数据技术专业和人工智能专业的学生,注重大数据分析技术的应用和实践。因此,《大数据分析技术》主要分为两个部分:第一部分是大数据分析技术的理论实践,主要讲解了大数据分析模型、Python数据分析工具、numpy和pandas数据分析库、matplotlib数据分析可视化库、Hadoop及其常用组件以及scikit-learn机器学习库的基本原理和操作。第二部分是任务实施,主要列举了17个实操案例充分呈现了大数据分析技术的主要功能和特点。本书配套完善的课程教学课件、案例教学视频、案例代码和课后习题,并将在在线开放课程平台进行免费学习。



—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP