数据科学实战手册 第2版
批量上传,套装书可能不全,下单前咨询在线客服!有特殊要求,下单前请咨询客服!
¥
35.31
5.1折
¥
69
全新
库存3件
作者[印度]普拉罕·塔塔(Prabhanjan Tattar) [美]托尼·奥赫达(
出版社人民邮电出版社
ISBN9787115499257
出版时间2019-01
装帧平装
开本16开
定价69元
货号26439905
上书时间2024-11-01
商品详情
- 品相描述:全新
- 商品描述
-
导语摘要
本书对想学习数据分析的人来说是一本非常实用的参考书,书中有多个真实的数据分析案例,几乎是以手把手的方式教你一步一步地完成从数据分析的准备到分析结果报告的整个流程。无论是数据分析工作的从业者,还是有志于未来从事数据分析工作的在校大学生,都能从本书中获取一些新知识、新思想。同时,本书也是一本学习和提高R及Python编程的参考书。很多人有这样的感触,单纯地学习编程语言是很枯燥的过程,但利用本书学习R和Python语言可以很好地解决这个问题,生动实用的数据集以及非常有意思的分析结果会极大地激发读者学习的兴趣。本书案例包括汽车数据分析、税收数据分析、就业数据分析、股市数据分析、社交网络分析、大规模电影推荐、Twitter数据分析、新西兰海外游客预测分析以及德国信用数据分析等。
作者简介
作者简介
Prabhanjan Tattar有9年的统计分析工作经验。他的精力集中在通过简洁优美的程序解释统计和机器学习技术上。他已经写作了两本关于R的书,并在维护几个R包:gpk、RSADBE和ACSWR。
Tony Ojeda是一位经验丰富的数据科学家和企业家,在商业流程的zui优化方面非常专业,他是华盛顿特区数据实验室的创始人,致力于数据科学的教育事业和活动组织。
Sean Patrick Murphy在约翰? 霍普金斯大学的应用物理实验室做了15年的高级科研人员,他专注于机器学习、信号处理以及高性能计算等。他是MD数据科学见面会的联合创始人。
Benjamin Bengfort是一位非常有经验的数据科学家和Python开发者。他曾在业界和学术界工作过8年。他现在在马里兰大学派克学院攻读计算机博士学位
Abhijit Dasgupta有多年的生物制药行业咨询、商业分析、生物信息以及生物工程咨询方面的经验。他拥有华盛顿大学生物统计专业的博士学位,是华盛顿特区统计编程社群的创始人和联合组织者。
译者简介
刘旭华,现为中国农业大学理学院应用数学系副教授,北京理工大学博士,美国北卡莱罗纳大学教堂山分校访问学者,主要从事数理统计、数据科学、数学与统计软件等领域的教学与科研工作,主持及参与过多项国家自然科学基金、北京市自然科学基金等项目。
李晗,2015年毕业于广州华南理工大学,硕士期间主要从事信号处理、数据分析方面的研究。目前就职于中兴通讯,主要从事数据库、数据分析、容器化微服务方面的开发与运维工作。
闫晗:中国人民大学统计学院硕士,“统计之都”编辑部“搬砖工”。
目录
第 1章 准备数据科学环境1
1.1 理解数据科学管道2
1.1.1 操作流程2
1.1.2 工作原理3
1.2 在Windows、Mac OS X和Linux上安装R4
1.2.1 准备工作4
1.2.2 操作流程4
1.2.3 工作原理6
1.3 在R和RStudio中安装扩展包6
1.3.1 准备工作6
1.3.2 操作流程6
1.3.3 工作原理8
1.3.4 更多内容8
1.4 在Linux和Mac OS X上安装Python9
1.4.1 准备工作9
1.4.2 操作流程9
1.4.3 工作原理9
1.5 在Windows上安装Python10
1.5.1 操作流程10
1.5.2 工作原理11
1.6 在Mac OS X和Linux上安装Python数据库11
1.6.1 准备工作11
1.6.2 操作流程12
1.6.3 工作原理12
1.6.4 更多内容13
1.7 安装更多Python包13
1.7.1 准备工作14
1.7.2 操作流程14
1.7.3 工作原理15
1.7.4 更多内容15
1.8 安装和使用virtualenv15
1.8.1 准备工作16
1.8.2 操作流程16
1.8.3 工作原理18
1.8.4 更多内容18
第 2章 基于R的汽车数据可视化分析19
2.1 简介19
2.2 获取汽车燃料效率数据20
2.2.1 准备工作20
2.2.2 操作流程20
2.2.3 工作原理21
2.3 为你的第 一个分析项目准备好R21
2.3.1 准备工作21
2.3.2 操作流程21
2.3.3 更多内容22
2.4 将汽车燃料效率数据导入R22
2.4.1 准备工作22
2.4.2 操作流程22
2.4.3 工作原理24
2.4.4 更多内容24
2.5 探索并描述燃料效率数据25
2.5.1 准备工作25
2.5.2 操作流程25
2.5.3 工作原理27
2.5.4 更多内容28
2.6 分析汽车燃料效率数据随时间的变化情况29
2.6.1 准备工作29
2.6.2 操作流程29
2.6.3 工作原理37
2.6.4 更多内容38
2.7 研究汽车的品牌和型号38
2.7.1 准备工作39
2.7.2 操作流程39
2.7.3 工作原理41
2.7.4 更多内容41
第3章 基于Python的税收数据应用导向分析42
3.1 简介42
3.2 高收入数据分析的准备工作44
3.2.1 准备工作44
3.2.2 操作流程44
3.2.3 工作原理45
3.3 导入并探索性地分析世界高收入数据集45
3.3.1 准备工作45
3.3.2 操作流程45
3.3.3 工作原理51
3.3.4 更多内容52
3.4 分析并可视化美国高收入数据53
3.4.1 准备工作53
3.4.2 操作流程53
3.4.3 工作原理59
3.5 进一步分析美国高收入群体60
3.5.1 准备工作60
3.5.2 操作流程60
3.5.3 工作原理64
3.6 使用Jinja2汇报结果64
3.6.1 准备工作64
3.6.2 操作流程64
3.6.3 工作原理69
3.6.4 更多内容69
3.7 基于R的数据分析再实现70
3.7.1 准备工作70
3.7.2 操作流程70
3.7.3 更多内容74
第4章 股市数据建模75
4.1 简介75
4.2 获取股市数据76
4.3 描述数据78
4.3.1 准备工作78
4.3.2 操作流程78
4.3.3 工作原理79
4.3.4 更多内容79
4.4 清洗并探索性地分析数据80
4.4.1 准备工作80
4.4.2 操作流程80
4.4.3 工作原理85
4.5 生成相对估值85
4.5.1 准备工作86
4.5.2 操作流程86
4.5.3 工作原理89
4.6 筛选股票并分析历史价格90
4.6.1 准备工作90
4.6.2 操作流程90
4.6.3 工作原理95
第5章 就业数据可视化探索96
5.1 简介96
5.2 分析前的准备工作97
5.2.1 准备工作97
5.2.2 操作流程97
5.2.3 工作原理98
5.3 将就业数据导入R99
5.3.1 准备工作99
5.3.2 操作流程99
5.3.3 工作原理99
5.3.4 更多内容100
5.4 探索就业数据101
5.4.1 准备工作101
5.4.2 操作流程101
5.4.3 工作原理102
5.5 获取、合并附加数据103
5.5.1 准备工作103
5.5.2 操作流程103
5.5.3 工作原理105
5.6 添加地理信息105
5.6.1 准备工作106
5.6.2 操作流程106
5.6.3 工作原理108
5.7 提取州和县级水平的薪资及就业信息109
5.7.1 准备工作109
5.7.2 操作流程110
5.7.3 工作原理111
5.8 可视化薪资的地理分布112
5.8.1 准备工作112
5.8.2 操作流程113
5.8.3 工作原理115
5.9 分行业探索就业机会的地理分布115
5.9.1 操作流程116
5.9.2 工作原理117
5.9.3 更多内容117
5.10 绘制地理时间序列的动画地图118
5.10.1 准备工作118
5.10.2 操作流程118
5.10.3 工作原理122
5.10.4 更多内容122
5.11 函数基本性能测试122
5.11.1 准备工作123
5.11.2 操作流程123
5.11.3 工作原理125
5.11.4 更多内容125
第6章 汽车数据可视化(基于Python)126
6.1 简介126
6.2 IPython入门127
6.2.1 准备工作127
6.2.2 操作流程127
6.2.3 工作原理130
6.3 熟悉Jupyter Notebook130
6.3.1 准备工作130
6.3.2 操作流程130
6.3.3 工作原理132
6.3.4 更多内容132
6.4 为分析汽车燃料效率做好准备133
6.4.1 准备工作133
6.4.2 操作流程133
6.4.3 工作原理134
6.4.4 更多内容134
6.5 用Python探索并描述汽车燃料效率数据135
6.5.1 准备工作135
6.5.2 操作流程135
6.5.3 工作原理138
6.5.4 更多内容138
6.6 用Python分析汽车燃料效率随时间变化的情况139
6.6.1 准备工作139
6.6.2 操作流程139
6.6.3 工作原理144
6.6.4 更多内容145
6.7 用Python研究汽车的品牌和型号146
6.7.1 准备工作146
6.7.2 操作流程146
6.7.3 工作原理149
第7章 社交网络分析(基于Python)151
7.1 简介151
7.2 准备用Python进行社交网络的分析工作153
7.2.1 准备工作153
7.2.2 操作流程154
7.2.3 工作原理154
7.2.4 更多内容154
7.3 导入网络155
7.3.1 准备工作155
7.3.2 操作流程155
7.3.3 工作原理156
7.4 探索英雄网络的子图157
7.4.1 准备工作157
7.4.2 操作流程158
7.4.3 工作原理160
7.4.4 更多内容160
7.5 找出强关联160
7.5.1 准备工作161
7.5.2 操作流程161
7.5.3 工作原理163
7.5.4 更多内容164
7.6 找出关键人物164
7.6.1 准备工作164
7.6.2 操作流程164
7.6.3 工作原理168
7.6.4 更多内容168
7.7 探索全网特征174
7.7.1 准备工作174
7.7.2 操作流程174
7.7.3 工作原理175
7.8 社交网络中的聚类和社群发现175
7.8.1 准备工作176
7.8.2 操作流程176
7.8.3 工作原理179
7.8.4 更多内容179
7.9 可视化图180
7.9.1 准备工作180
7.9.2 操作流程180
7.9.3 工作原理181
7.10 R中的社交网络分析182
7.10.1 准备工作182
7.10.2 操作流程183
7.10.3 工作原理188
第8章 大规模电影推荐(基于Python)189
8.1 简介189
8.2 对偏好建模191
8.2.1 操作流程191
8.2.2 工作原理191
8.3 理解数据192
8.3.1 准备工作192
8.3.2 操作流程193
8.3.3 工作原理194
8.3.4 更多内容194
8.4 提取电影评分数据195
8.4.1 准备工作195
8.4.2 操作流程195
8.4.3 工作原理197
8.5 寻找高评分电影199
8.5.1 准备工作199
8.5.2 操作流程199
8.5.3 工作原理200
8.5.4 更多内容201
8.6 改善电影评分系统201
8.6.1 准备工作201
8.6.2 操作流程201
8.6.3 工作原理202
8.6.4 更多内容203
8.7 计算用户在偏好空间中的距离203
8.7.1 准备工作204
8.7.2 操作流程204
8.7.3 工作原理205
8.7.4 更多内容206
8.8 计算用户之间的相关性206
8.8.1 准备工作206
8.8.2 操作流程207
8.8.3 工作原理208
8.8.4 更多内容208
8.9 为用户寻找影评人208
8.9.1 准备工作209
8.9.2 操作流程209
8.9.3 工作原理210
8.10 预测用户电影评分211
8.10.1 准备工作211
8.10.2 操作流程211
8.10.3 工作原理212
8.11 基于物品的协同过滤213
8.11.1 准备工作214
8.11.2 操作流程214
8.11.3 工作原理215
8.12 建立非负矩阵分解模型216
8.12.1 操作流程217
8.12.2 工作原理217
8.13 将数据集载入内存219
8.13.1 准备工作219
8.13.2 操作流程219
8.13.3 工作原理220
8.13.4 更多内容221
8.14 导出SVD模型到硬盘221
8.14.1 操作流程222
8.14.2 工作原理223
8.15 训练SVD模型223
8.15.1 操作流程223
8.15.2 工作原理225
8.15.3 更多内容225
8.16 测试SVD模型226
8.16.1 操作流程226
8.16.2 工作原理226
8.16.3 更多内容227
第9章 获取和定位Twitter数据(基于Python)228
9.1 简介228
9.2 创建Twitter应用229
9.2.1 准备工作229
9.2.2 操作流程230
9.2.3 工作原理232
9.3 了解Twitter API v1.1232
9.3.1 准备工作233
9.3.2 操作流程233
9.3.3 工作原理234
9.3.4 更多内容235
9.4 获取粉丝和好友信息236
9.
— 没有更多了 —
以下为对购买帮助不大的评价