Python数据分析
¥
7.25
1.2折
¥
59
九五品
仅1件
作者[印尼]Ivan Idris 伊德里斯
出版社人民邮电出版社
ISBN9787115411228
出版时间2016-02
版次1
装帧平装
开本16开
纸张胶版纸
页数308页
字数99999千字
定价59元
上书时间2024-12-17
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:Python数据分析
定价:59.00元
作者:[印尼]Ivan Idris 伊德里斯
出版社:人民邮电出版社
出版日期:2016-02-01
ISBN:9787115411228
字数:434000
页码:308
版次:1
装帧:平装
开本:16开
商品重量:
编辑推荐
实用的Python开源模块的大集合;简单易懂、示例丰富的数据分析教程;掌握数据可视化、机器学习等高端主题;新手变身数据分析专家的上好读本;
内容提要
作为一种高级程序设计语言,Python凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众所认可。本书是一本介绍如何用Python进行数据分析的学习指南。全书共12章,从Python程序库入门、NumPy数组、matplotlib和pandas开始,陆续介绍了数据加工、数据处理和数据可视化等内容。同时,本书还介绍了信号处理、数据库、文本分析、机器学习、互操作性和性能优化等高级主题。在本书的结尾,还采用3个附录的形式为读者补充了一些重要概念、常用函数以及在线资源等重要内容。本书示例丰富、简单易懂,非常适合对Python语言感兴趣或者想要使用Python语言进行数据分析的读者参考阅读。
目录
目录章 Python程序库入门11.1 本书用到的软件21.1.1 软件的安装和设置21.1.2 Windows平台21.1.3 Linux平台31.1.4 Mac OS X平台41.2 从源代码安装NumPy、SciPy、matplotlib和IPython61.3 用setuptools安装71.4 NumPy数组71.5 一个简单的应用81.6 将IPython用作shell111.7 学习手册页131.8 IPython notebook141.9 从何处寻求帮助和参考资料141.10 小结15第2章 NumPy数组162.1 NumPy数组对象162.2 创建多维数组182.3 选择NumPy数组元素182.4 NumPy的数值类型192.4.1 数据类型对象212.4.2 字符码212.4.3 Dtype构造函数222.4.4 dtype属性232.5 一维数组的切片与索引232.6 处理数组形状242.6.1 堆叠数组272.6.2 拆分NumPy数组302.6.3 NumPy数组的属性332.6.4 数组的转换392.7 创建数组的视图和拷贝402.8 花式索引412.9 基于位置列表的索引方法432.10 用布尔型变量索引NumPy数组442.11 NumPy数组的广播462.12 小结49第3章 统计学与线性代数503.1 Numpy和Scipy模块503.2 用NumPy进行简单的描述性统计计算553.3 用NumPy进行线性代数运算573.3.1 用NumPy求矩阵的逆573.3.2 用NumPy解线性方程组593.4 用NumPy计算特征值和特征向量613.5 NumPy随机数633.5.1 用二项式分布进行博弈633.5.2 正态分布采样663.5.3 用SciPy进行正态检验673.6 创建掩码式NumPy数组703.7 小结75第4章 pandas入门764.1 pandas的安装与概览774.2 pandas数据结构之DataFrame784.3 pandas数据结构之Series814.4 利用pandas查询数据854.5 利用pandas的DataFrame进行统计计算894.6 利用pandas的DataFrame实现数据聚合914.7 DataFrame的串联与附加操作954.8 连接DataFrames964.9 处理缺失数据问题994.10 处理日期数据1024.11 数据透视表1064.12 访问远程数据1074.13 小结109第5章 数据的检索、加工与存储1105.1 利用NumPy和pandas对CSV文件进行写操作1105.2 NumPy.npy与pandas DataFrame1125.3 使用PyTables存储数据1155.4 Pandas DataFrame与HDF5仓库之间的读写操作1185.5 使用pandas读写Excel文件1205.6 使用REST Web服务和JSON1235.7 使用pandas读写JSON1245.8 解析RSS和Atom订阅1265.9 使用Beautiful Soup解析HTML1275.10 小结134第6章 数据可视化1366.1 matplotlib的子库1376.2 matplotlib绘图入门1376.3 对数图1396.4 散点图1416.5 图例和注解1436.6 三维图1456.7 pandas绘图1486.8 时滞图1506.9 自相关图1516.10 Plot.ly1536.11 小结155第7章 信号处理与时间序列1567.tatsmodels子库1577.2 移动平均值1577.3 窗口函数1597.4 协整的定义1617.5 自相关1647.6 自回归模型1667.7 ARMA模型1707.8 生成周期信号1727.9 傅里叶分析1747.10 谱分析1777.11 滤波1777.12 小结179第8章 应用数据库1808.1 基于sqlite3的轻量级访问1818.2 通过pandas访问数据库1838.3 SQLAlchemy1858.3.1 SQLAlchemy的安装和配置1868.3.2 通过SQLAlchemy填充数据库1888.3.3 通过SQLAlchemy查询数据库1898.4 Pony ORM1918.5 Dataset:懒人数据库1928.6 PyMongo与MongoDB1958.7 利用Redis存储数据1968.8 Apache Cassandra1978.9 小结201第9章 分析文本数据和社交媒体2039.1 安装NLTK2039.2 滤除停用字、姓名和数字2069.3 词袋模型2089.4 词频分析2099.5 朴素贝叶斯分类2119.6 情感分析2149.7 创建词云2179.8 社交网络分析2229.9 小结2240章 预测性分析与机器学习22510.cikit-learn概貌22610.2 预处理22810.3 基于逻辑回归的分类23010.4 基于支持向量机的分类23210.5 基于ElasticNetCV的回归分析23510.6 支持向量回归23710.7 基于相似性传播算法的聚类分析24010.8 均值漂移算法24210.9 遗传算法24410.10 神经网络24910.11 决策树25110.12 小结2531章 Python生态系统的外部环境和云计算25511.1 与MATLAB/Octave交换信息25611.2 Installing rpy2安装rpy225711.3 连接R25711.4 为Java传递NumPy数组26011.5 集成SWIG和NumPy26111.6 集成Boost和Python26411.7 通过f2py使用Fortran代码26611.8 配置谷歌应用引擎26711.9 在PythonAnywhere上运行程序26911.10 使用Wakari27011.11 小结2712章 性能优化、性能分析与并发性27212.1 代码的性能分析27212.2 安装Cython27712.3 调用C代码28112.4 利用multiprocessing创建进程池28312.5 通过Joblib提高for循环的并发性28612.6 比较Bottleneck函数与NumPy函数28712.7 通过Jug实现MapReduce28912.8 安装MPI for Python29212.9 IPython Parallel29212.10 小结296附录A 重要概念298附录B 常用函数303附录C 在线资源309
作者介绍
Ivan Idris,实验物理学硕士,学位论文侧重于应用计算机科学。毕业后,他曾经效力于多家公司,从事Java开发、数据仓库开发以及QA分析等方面的工作;目前,他的兴趣主要集中在商业智能、大数据和云计算等专业领域。Ivan Idris以编写简洁可测试的程序代码以及撰写有趣的技术文章为乐,同时也是Packt出版社NumPy Beginner's Guide-Second Edition、NumPy Cookbook和Learning NumPy Array等书籍的作者。读者可以访问ivanidris.net获取更多关于他的信息。
序言
— 没有更多了 —
以下为对购买帮助不大的评价