• Python数据分析
21年品牌 40万+商家 超1.5亿件商品

Python数据分析

全新正版 极速发货

33.74 5.7折 59 全新

库存3件

广东广州
认证卖家担保交易快速发货售后保障

作者(印尼)伊德里斯(Ivan Idris) 著;韩波 译

出版社人民邮电出版社

ISBN9787115411228

出版时间2016-02

装帧平装

开本16开

定价59元

货号1201244444

上书时间2024-09-04

曲奇书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
Ivan Idris,实验物理学硕士,学位论文侧重于应用计算机科学。毕业后,他曾经效力于多家公司,从事Java开发、数据仓库开发以及QA分析等方面的工作;目前,他的兴趣主要集中在商业智能、大数据和云计算等专业领域。Ivan Idris以编写简洁可测试的程序代码以及撰写有趣的技术文章为乐,同时也是Packt出版社NumPy Beginner's Guide-Second Edition、NumPy Cookbook和Learning NumPy Array等书籍的作者。

目录
章Python程序库入门1
1.1本书用到的软件2
1.1.1软件的安装和设置2
1.1.2Windows平台2
1.1.3Linux平台3
1.1.4MacOSX平台4
1.2从源代码安装NumPy、SciPy、matplotlib和IPython6
1.3用setuptools安装7
1.4NumPy数组7
1.5一个简单的应用8
1.6将IPython用作shell11
1.7学习手册页13
1.8IPythonnotebook14
1.9从何处寻求帮助和参考资料14
1.10小结15
第2章NumPy数组16
2.1NumPy数组对象16
2.2创建多维数组18
2.3选择NumPy数组元素18
2.4NumPy的数值类型19
2.4.1数据类型对象21
2.4.2字符码21
2.4.3Dtype构造函数22
2.4.4dtype属性23
2.5一维数组的切片与索引23
2.6处理数组形状24
2.6.1堆叠数组27
2.6.2拆分NumPy数组30
2.6.3NumPy数组的属性33
2.6.4数组的转换39
2.7创建数组的视图和拷贝40
2.8花式索引41
2.9基于位置列表的索引方法43
2.10用布尔型变量索引NumPy数组44
2.11NumPy数组的广播46
2.12小结49
第3章统计学与线性代数50
3.1Numpy和Scipy模块50
3.2用NumPy进行简单的描述性统计计算55
3.3用NumPy进行线性代数运算57
3.3.1用NumPy求矩阵的逆57
3.3.2用NumPy解线性方程组59
3.4用NumPy计算特征值和特征向量61
3.5NumPy随机数63
3.5.1用二项式分布进行博弈63
3.5.2正态分布采样66
3.5.3用SciPy进行正态检验67
3.6创建掩码式NumPy数组70
3.7小结75
第4章pandas入门76
4.1pandas的安装与概览77
4.2pandas数据结构之DataFrame78
4.3pandas数据结构之Series81
4.4利用pandas查询数据85
4.5利用pandas的DataFrame进行统计计算89
4.6利用pandas的DataFrame实现数据聚合91
4.7DataFrame的串联与附加操作95
4.8连接DataFrames96
4.9处理缺失数据问题99
4.10处理日期数据102
4.11数据透视表106
4.12访问远程数据107
4.13小结109
第5章数据的检索、加工与存储110
5.1利用NumPy和pandas对CSV文件进行写操作110
5.2NumPy.npy与pandasDataFrame112
5.3使用PyTables存储数据115
5.4PandasDataFrame与HDF5仓库之间的读写操作118
5.5使用pandas读写Excel文件120
5.6使用RESTWeb服务和JSON123
5.7使用pandas读写JSON124
5.8解析RSS和Atom订阅126
5.9使用BeautifulSoup解析HTML127
5.10小结134
第6章数据可视化136
6.1matplotlib的子库137
6.2matplotlib绘图入门137
6.3对数图139
6.4散点图141
6.5图例和注解143
6.6三维图145
6.7pandas绘图148
6.8时滞图150
6.9自相关图151
6.10Plot.ly153
6.11小结155
第7章信号处理与时间序列156
7.1statsmodels子库157
7.2移动平均值157
7.3窗口函数159
7.4协整的定义161
7.5自相关164
7.6自回归模型166
7.7ARMA模型170
7.8生成周期信号172
7.9傅里叶分析174
7.10谱分析177
7.11滤波177
7.12小结179
第8章应用数据库180
8.1基于sqlite3的轻量级访问181
8.2通过pandas访问数据库183
8.3SQLAlchemy185
8.3.1SQLAlchemy的安装和配置186
8.3.2通过SQLAlchemy填充数据库188
8.3.3通过SQLAlchemy查询数据库189
8.4PonyORM191
8.5Dataset:懒人数据库192
8.6PyMongo与MongoDB195
8.7利用Redis存储数据196
8.8ApacheCassandra197
8.9小结201
第9章分析文本数据和社交媒体203
9.1安装NLTK203
9.2滤除停用字、姓名和数字206
9.3词袋模型208
9.4词频分析209
9.5朴素贝叶斯分类211
9.6情感分析214
9.7创建词云217
9.8社交网络分析222
9.9小结224
0章预测性分析与机器学习225
10.1scikit-learn概貌226
10.2预处理228
10.3基于逻辑回归的分类230
10.4基于支持向量机的分类232
10.5基于ElasticNetCV的回归分析235
10.6支持向量回归237
10.7基于相似性传播算法的聚类分析240
10.8均值漂移算法242
10.9遗传算法244
10.10神经网络249
10.11决策树251
10.12小结253
1章Python生态系统的外部环境和云计算255
11.1与MATLAB/Octave交换信息256
11.2Installingrpy2安装rpy2257
11.3连接R257
11.4为Java传递NumPy数组260
11.5集成SWIG和NumPy261
11.6集成Boost和Python264
11.7通过f2py使用Fortran代码266
11.8配置谷歌应用引擎267
11.9在PythonAnywhere上运行程序269
11.10使用Wakari270
11.11小结271
2章性能优化、性能分析与并发性272
12.1代码的性能分析272
12.2安装Cython277
12.3调用C代码281
12.4利用multiprocessing创建进程池283
12.5通过Joblib提高for循环的并发性286
12.6比较Bottleneck函数与NumPy函数287
12.7通过Jug实现MapReduce289
12.8安装MPIforPython292
12.9IPythonParallel292
12.10小结296
附录A重要概念298
附录B常用函数303
附录C在线资源309

内容摘要
作为一种不错程序设计语言,Python凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。
本书是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组、matplotlib和pandas开始,陆续介绍了数据加工、数据处理和数据可视化等内容。同时,本书还介绍了信号处理、数据库、文本分析、机器学习、互操作性和性能优化等不错主题。在本书的结尾,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。
本书示例丰富、简单易懂,很好适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP