Python数据分析项目全程实录
全新正版 极速发货
¥
58.75
6.5折
¥
89.8
全新
库存18件
作者明日科技 编
出版社清华大学出版社
ISBN9787302670537
出版时间2024-10
装帧平装
开本16开
定价89.8元
货号1203420188
上书时间2024-11-22
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
明日科技,全称是吉林省明日科技有限公司,是一家专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司,其编写的教材非常注重选取软件开发中的必需、常用内容,同时也很注重内容的易学、方便性以及相关知识的拓展性,深受读者喜爱。其教材多次荣获“全行业优秀畅销品种”“全国高校出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。
目录
第1章 热销产品销售数据统计分析 1
——pandas + numpy + matplotlib + ABC分类法
1.1 开发背景 1
1.2 系统设计 2
1.2.1 开发环境 2
1.2.2 分析流程 2
1.2.3 功能结构 2
1.3 技术准备 3
1.3.1 技术概览 3
1.3.2 ABC分类法 3
1.4 前期工作 4
1.4.1 开发环境设置 4
1.4.2 安装第三方模块 5
1.4.3 新建项目目录 5
1.4.4 数据准备 5
1.5 数据预处理 6
1.5.1 查看数据信息 6
1.5.2 缺失性分析 8
1.5.3 描述性统计分析 9
1.6 数据统计分析 10
1.6.1 月销售趋势分析 10
1.6.2 热销产品分析(ABC分类法) 12
1.6.3 热销单品环比增长情况分析 14
1.6.4 加购人数和购买数量分析 16
1.6.5 不同种类产品的销量占比情况分析 17
1.6.6 工作日与周末销量对比分析 19
1.7 项目运行 21
1.8 源码下载 22
第2章 篮坛薪酬揭秘:球员位置与薪资数据的深度分析 23
——pandas + numpy + matplotlib + seaborn
2.1 开发背景 24
2.2 系统设计 24
2.2.1 开发环境 24
2.2.2 分析流程 24
2.2.3 功能结构 25
2.3 技术准备 25
2.3.1 技术概览 25
2.3.2 详解read_htlm()获取网页数据全过程 25
2.3.3 应用lambda函数快速处理数据 26
2.4 数据准备 27
2.4.1 数据集介绍 27
2.4.2 确定网页数据的结构 28
2.4.3 获取当前数据 29
2.5 数据预处理 30
2.5.1 查看数据 30
2.5.2 数据清洗 31
2.5.3 获取并处理历史数据 33
2.6 基本统计分析 34
2.6.1 2024赛季球员的薪资排行TOP10 34
2.6.2 统计分析各个球队的薪资状况 36
2.6.3 勇士队球员的薪资状况分析 37
2.6.4 箱形图分析实力和战绩TOP5球队的薪资状况 39
2.6.5 对比分析2023—2024赛季各球队薪资变化 41
2.7 深度分析 42
2.7.1 球员薪资分布密度图 42
2.7.2 分析不同位置球员的薪资状况 43
2.7.3 分析球员位置和薪资的关系 45
2.8 项目运行 46
2.9 源码下载 47
第3章 股海秘籍:股票行情数据分析之旅 48
——tushare + pandas + matplotlib + numpy + mplfinance
3.1 开发背景 49
3.2 系统设计 49
3.2.1 开发环境 49
3.2.2 分析流程 49
3.2.3 功能结构 50
3.3 技术准备 50
3.3.1 技术概览 50
3.3.2 详解tushare模块获取股票数据 50
3.3.3 mplfinance模块的应用 53
3.4 前期准备 56
3.4.1 新建Jupyter Notebook文件 56
3.4.2 导入必要的库 58
3.4.3 获取股票行情数据 58
3.5 数据加载与预处理 59
3.5.1 数据加载与处理 59
3.5.2 数据查看与缺失性分析 59
3.5.3 描述性统计分析 60
3.5.4 抽取特征数据 61
3.5.5 异常值分析 61
3.5.6 数据归一化处理 61
3.6 数据统计分析 63
3.6.1 可视化股票走势图 63
3.6.2 股票成交量时间序列图 63
3.6.3 股票收盘价与成交量分析 64
3.6.4 股票涨跌情况分析 65
3.6.5 股票k线走势图 66
3.7 股票指标相关性分析 67
3.7.1 散点图矩阵分析 67
3.7.2 相关系数分析 68
3.8 项目运行 70
3.9 源码下载 71
第4章 京东某商家的销售评价数据分析 72
——pandas + numpy + jieba + matplotlib + pyecharts + snownlp
4.1 开发背景 72
4.2 系统设计 73
4.2.1 开发环境 73
4.2.2 分析流程 73
4.2.3 功能结构 73
4.3 技术准备 74
4.3.1 技术概览 74
4.3.2 详解jieba模块 74
4.3.3 绘制词云图 78
4.3.4 snownlp模块的应用 80
4.4 前期准备 82
4.4.1 安装第三方模块 82
4.4.2 新建Jupyter Notebook文件 82
4.4.3 导入必要的库 84
4.4.4 数据加载 84
4.5 数据预处理 84
4.5.1 查看数据 84
4.5.2 缺失性分析 85
4.5.3 数据处理 86
4.5.4 缺失值处理 87
4.5.5 数据类型转换 87
4.6 用户维度分析 88
4.6.1 总体评价状况分析 88
4.6.2 词云图分析差评用户 89
4.6.3 正负面情感对比分析 90
4.6.4 评价数量和评价时间的关系分析 91
4.7 商品维度分析 93
4.7.1 差评商品分析 93
4.7.2 各评价级别商品件数分析 93
4.8 项目运行 94
4.9 源码下载 95
第5章 商城注册用户数据探索分析 96
——MySQL + sqlalchemy + pandas + matplotlib
5.1 开发背景 97
5.2 系统设计 97
5.2.1 开发环境 97
5.2.2 分析流程 97
5.2.3 功能结构 97
5.3 技术准备 98
5.3.1 技术概览 98
5.3.2 详解sqlalchemy模块 98
5.3.3 数据类型转换两个核心方法 102
5.3.4 fill_between()函数的应用 102
5.4 导入MySQL数据 103
5.5 数据预处理 105
5.5.1 数据准备 105
5.5.2 sqlalchemy连接MySQL数据库 105
5.5.3 数据检测与处理 106
5.6 用户注册情况分析 107
5.6.1 年度注册用户分析 107
5.6.2 月度注册用户分析 109
5.6.3 小时注册用户分析 110
5.6.4 新注册用户分析 112
5.7 用户活跃情况分析 113
5.7.1 用户登录情况分析 113
5.7.2 用户登录周情况分析 114
5.7.3 用户登录时段分析(工作日) 116
5.7.4 用户登录时段分析(非工作日) 117
5.8 项目运行 118
5.9 源码下载 119
第6章 自媒体账号内容数据分析 120
——pandas + matplotlib + plotly
6.1 开发背景 120
6.2 系统设计 121
6.2.1 开发环境 121
6.2.2 分析流程 121
6.2.3 功能结构 121
6.3 技术准备 122
6.3.1 技术概览 122
6.3.2 pandas查看数据类型 122
6.3.3 详解to_datetime()函数转换时间序列数据 123
6.4 前期准备 125
6.4.1 安装第三方模块 125
6.4.2 新建Jupyter Notebook文件 126
6.4.3 导入必要的库 127
6.4.4 数据准备 127
6.4.5 数据预览 128
6.5 数据预处理 129
6.5.1 数据合并 129
6.5.2 查看数据 130
6.5.3 数据类型转换 130
6.5.4 描述性统计分析 131
6.6 数据统计分析 133
6.6.1 各类别内容阅读人数的集中趋势分析 133
6.6.2 各类别内容数量占比分析 134
6.6.3 箱形图分析各类别内容的阅读人数 135
6.6.4 水平柱形图分析平均展现量 136
6.6.5 箱形图分析内容展现量 137
6.6.6 内容展现量和阅读量的相关性分析 138
6.7 项目运行 139
6.8 源码下载 140
第7章 汽车数据可视化与相关性分析 141
——pandas + matplotlib + seaborn
7.1 开发背景 141
7.2 系统设计 142
7.2.1 开发环境 142
7.2.2 分析流程 142
7.2.3 功能结构 142
7.3 技术准备 143
7.3.1 技术概览 143
7.3.2 盘点seaborn自带的数据集 143
7.3.3 value_counts()方法的应用 147
7.3.4 详解pairplot()函数 147
7.4 前期准备 153
7.4.1 新建项目目录 153
7.4.2 数据准备 153
7.5 数据预处理 154
7.5.1 查看数据 154
7.5.2 缺失值查看与处理 155
7.5.3 描述性统计分析 156
7.6 数据统计分析 156
7.6.1 汽车产地占比情况分析 156
7.6.2 品牌旗下汽车差异情况分析 157
7.7 相关性分析 159
7.7.1 矩阵图分析相关性 159
7.7.2 相关系数分析相关性 160
7.7.3 散点图分析气缸数和马力之间的关系 160
7.7.4 折线图分析气缸数和油耗之间的关系 161
7.7.5 产地和油耗之间的关系 162
7.7.6 车型生产年份和油耗之间的关系 163
7.7.7 油耗、马力和重量之间的关系 164
7.8 项目运行 165
7.9 源码下载 166
……
内容摘要
本书精选不同行业、不同分析方法以及机器学习等方向的12个热门Python数据分析项目。这些项目既可以作为练手项目,也可以应用于实际数据分析工作中,其中的机器学习还可作为参赛项目的参考。总体来说,这些项目的实用性都非常强。具体项目包含:热销产品销售数据统计分析、篮坛薪酬揭秘:球员位置与薪资数据的深度分析、股海秘籍:股票行情数据分析之旅、京东某商家的销售评价数据分析、商城注册用户数据探索分析、自媒体账号内容数据分析、汽车数据可视化与相关性分析、抖音电商数据分析系统、会员数据化运营RFM分析实战、商超购物Apriori关联分析、基于K-Means算法实现鸢尾花聚类分析、电视节目数据分析系统。本书从数据分析、机器学习的角度出发,按照项目开发的顺序,系统、全面地讲解每一个项目的开发实现过程。体例上,每章一个项目,统一采用“开发背景→系统设计→技术准备→各功能模块实现→项目运行→源码下载”的形式完整呈现项目,给读者明确的成就感,可以让读者快速积累实际数据分析经验与技巧,早日实现就业目标。
— 没有更多了 —
以下为对购买帮助不大的评价