消息首页搜索举报

Python数据科学导论(概念技术与应用)

全新正版极速发货

30.57 5.2折 59 全新

库存4件

广东广州

认证卖家担保交易快速发货售后保障

作者(西)劳拉·伊瓜尔//桑蒂·塞吉|译者:章宗长//王艺深

出版社机械工业

ISBN9787111604648

出版时间2018-08

装帧其他

开本其他

定价59元

货号1201747979

上书时间2024-07-20

大智慧小美丽

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 16小时
好评率暂无

最新上架

埃里希凯斯特纳注音全套5月35曰/两个小洛特/小不点和安东 ¥29.24

如何让你爱的人爱上+爱的八次约会 ¥32.79

与时代谈谈心睡前聊一会儿（套装）音频书 ¥55.54

沉默的巡游+祈念守护人+长长的回廊3本套 ¥89.94

快乐读书吧三年级上 3册《安徒生童话》+《格林童话》+《稻草人》 ¥15.62

心理咨询师2级 ¥62.89

月光的合金(精)/露易丝.格丽克诗集虚拟套 ¥67.91

生活蒙太奇+你当像鸟飞往你的山共2册天然插画绘本艺术绘漫画比尔盖茨推荐文学自传体女性暖心励志小说书籍畅销书纽约时报自我成长 ¥94.57

阿多拉基 1 +2（废墟中的幸存者+在黑暗处的闪光） ¥18.45

商品详情

品相描述：全新

商品描述: 作者简介
LauraIgual博士是巴塞罗那大学数学和计算机科学系的副教授。她于2000年获得西班牙瓦伦西亚大学的数学学位，并于2006年获得西班牙庞培法布拉大学的博士学位。她的研究领域包括计算机视觉、医学成像、机器学习和数据科学。
SantiSeguí博士是巴塞罗那大学数学和计算机科学系的助理教授。自2007年起，他担任了西班牙巴塞罗那自治大学的计算机科学工程师。他于2011年获得西班牙巴塞罗那大学的博士学位。他的研究领域包括计算机视觉、应用机器学习和数据科学。

目录
译者序
原书前言
作者和贡献者简介
第1章数据科学概述 // 1
1.1　什么是数据科学 //1
1.2　关于本书 //2
第2章　数据专家的工具箱 //4
2.1　引言 // 4
2.2　为什么选择Python // 4
2.3　数据专家的基本Python库 // 5
2.3.1　数值和科学计算：NumPy和SciPy // 5
2.3.2　Scikit-learn：Python中的机器学习库 // 5
2.3.3　Pandas：Python数据分析库 // 5
2.4　数据科学生态系统的安装 // 6
2.5　集成开发环境 // 6
2.5.1　网络集成开发环境：Jupyter // 7
2.6　数据专家从Python开始 // 7
2.6.1　读取 // 11
2.6.2　选择数据 // 13
2.6.3　筛选数据 // 14
2.6.4　筛选缺失的数据 // 15
2.6.5　处理数据 // 15
2.6.6　排序 // 19
2.6.7　分组数据 // 20
2.6.8　重排数据 // 21
2.6.9　对数据进行排名 // 22
2.6.10　绘图 // 23
2.7　小结 // 24
第3章　描述统计学 // 25
3.1　引言 // 25
3.2　数据准备 // 25
3.2.1　Adult数据集示例 // 26
3.3　探索性数据分析 // 28
3.3.1　汇总数据 // 28
3.3.2　数据分布 // 31
3.3.3　离群点的处理 // 33
3.3.4　测量不对称性：偏度和皮尔逊中值偏度系数 // 36
3.3.5　连续分布 // 38
3.3.6　核密度 // 39
3.4　估计 // 41
3.4.1　样本和估计均值、方差和标准记分 // 41
3.4.2　协方差、皮尔逊相关和斯皮尔曼秩相关 // 42
3.5　小结 // 44
参考文献 // 45
第4章　统计推断 // 46
4.1　引言 // 46
4.2　统计推断：频率论方法 // 46
4.3　测量估计的差异性 // 47
4.3.1　点估计 // 47
4.3.2　置信区间 // 50
4.4　假设检验 // 53
4.4.1　用置信区间检验假设 // 53
4.4.2　使用p值检验假设 // 55
4.5　效应E是真实的吗 // 57
4.6　小结 // 57
参考文献 // 58
第5章　监督学习 // 59
5.1　引言 // 59
5.2　问题 // 60
5.3　第一步 // 60
5.4　什么是学习？ // 69
5.5　学习曲线 // 70
5.6　训练、验证和测试 // 73
5.7　两种学习模型 // 76
5.7.1　学习三要素 // 76
5.7.2　支持向量机 // 77
5.7.3　随机森林 // 79
5.8　结束学习过程 // 80
5.9　商业案例 // 81
5.10　小结 // 83
参考文献 // 83
第6章　回归分析 // 84
6.1　引言 // 84
6.2　线性回归 // 84
6.2.1　简单线性回归 // 85
6.2.2　多元线性回归和多项式回归 // 90
6.2.3　稀疏模型 // 90
6.3　逻辑斯蒂回归 // 97
6.4　小结 // 99
参考文献 // 99
第7章　无监督学习 // 100
7.1　引言 // 100
7.2　聚类 // 100
7.2.1　相似度和距离 // 101
7.2.2　什么是一个好的聚类？定义衡量聚类质量的度量 // 101
7.2.3　聚类技术的分类标准 // 104
7.3　案例学习 // 113
7.4　小结 // 118
参考文献 // 119
第8章　网络分析 // 120
8.1　引言 // 120
8.2　图的基本定义 // 121
8.3　社交网络分析 // 122
8.3.1　NetworkX基础 // 122
8.3.2　实际案例：Facebook数据集 // 123
8.4　中心性 // 125
8.4.1　在图中绘制中心性 // 130
8.4.2　PageRank // 132
8.5　自我网络 // 134
8.6　社区发现 // 138
8.7　小结 // 139
参考文献 // 139
第9章　推荐系统 // 140
9.1　引言 // 140
9.2　推荐系统如何工作？ // 140
9.2.1　基于内容的过滤 // 141
9.2.2　协作过滤 // 141
9.2.3　混合推荐系统 // 141
9.3　建模用户偏好 // 142
9.4　评估推荐系统 // 142
9.5　实际案例 // 143
9.5.1　MovieLens数据集 // 143
9.5.2　基于用户的协作过滤 // 145
9.6　小结 // 153
参考文献 // 153
第10章　用于情感分析的统计自然语言处理 // 154
10.1　引言 // 154
10.2　数据清洗 // 155
10.3　文本表示 // 158
10.3.1　二元组和n元组 // 163
10.4　实际案例 // 163
10.5　小结 // 168
参考文献 // 168
第11章　并行计算 // 169
11.1　引言 // 169
11.2　架构 // 170
11.2.1　入门指南 // 171
11.2.2　连接到集群（引擎）// 171
11.3　多核编程 // 172
11.3.1　引擎的直接视图 // 172
11.3.2　引擎的负载均衡视图 // 175
11.4　分布式计算 // 176
11.5　实际应用：纽约出租车旅行 // 177
11.5.1　直接视图非阻塞方案 // 178
11.5.2　实验结果 // 180
11.6　小结 // 182
参考文献 // 182

内容摘要
《Python数据科学导论》通过理论与实践相结合的方式来阐述数据科学的一系列重要概念及算法，以使读者学会如何管理并利用数据。本书共有11章，第1章概要地介绍了数据科学的现状并给出了一些使用本书的建议；第2章介绍了Python语言数据科学生态系统，涉及NumPy、SciPy和Pandas等热门第三方库；第3～7章着重讲解了统计学和机器学习的知识，涉及描述统计学、统计推断、监督学习、回归分析、无监督学习等主题；第8～10章详细介绍了数据科学的一些主要应用，如网络分析、推荐系统和情感分析；第11章介绍了并行计算及性能优化方法。

— 没有更多了 —