作者简介
吴喜之,北京大学数学力学系本科,美国北卡罗来纳大学统计博士。中国人民大学统计学院教授,博士生导师。曾在美国加利福尼亚大学、北卡罗来纳大学以及南开大学、北京大学等多所著名学府执教。
目录
第一部分 基础 第 1 章 软件准备 1.1 下载及安装 Python 1.2 Anaconda 的几种界面 1.3 下载并安装所需模块 第 2 章 Python 基础知识 2.1 一些基本常识 2.2 数组 (字符串、list、tuple、dict) 及与它们相关的函数和运算 2.3 函数、自定义函数、数组元素的计算、循环语句 2.4 伪随机数模块: random 2.5 变量的存储位置 2.6 数据输入输出 第 3 章 类和子类简介 3.1 class 3.2 subclass 第二部分 基本模块 第 4 章 numpy 模块 4.1 Numpy 数组的产生 4.2 数据文件的存取 4.3 数组 (包括矩阵) 及有关的运算 4.4 一些线性代数运算 4.5 关于日期和时间 4.6 多项式运算 4.7 向量化函数 第 5 章 pandas 模块 5.1 数据框的生成和基本性质 5.2 数据框文件的存取 5.3 对数据框元素 (行列) 的选择 5.4 数据框的一些简单计算 5.5 以变量的值作为条件的数据框操作例子 5.6 添加新变量, 删除变量、观测值或改变 index 5.7 数据框文件结构的改变 5.8 数据框文件的合并 5.9 pandas 序列的产生 5.10 pandas 序列的一些性质和计算 5.11 一个例子 5.12 pandas 专门的画图命令 第 6 章 matplotlib 模块 6.1 简单的图 6.2 几张图同框 6.3 排列几张图 6.4 三维图 第 7 章 scipy 模块 7.1 存取各种数据文件 7.2 常用的随机变量的分布及随机数的产生 7.3 自定义分布的随机变量及随机数的产生 7.4 定积分的数值计算 · · · · · · · · · · 136 第三部分 编程思维训练 第 8 章 基本编程训练 8.1 基本编程 8.2 更多的和矩阵有关的编程 8.3 和若干简单应用有关的编程训练 8.4 在 Excel 表格之外处理 Excel 数据的训练 第 9 章 若干计算方法的编程训练 9.1 Markov 链 9.2 Gibbs 抽样 9.3 EM 算法 9.4 MCMC 的 Metropolis 算法 第四部分 数据科学 第 10 章 探索性数据分析及数据准备 10.1 把数据转换成常规容易处理的形式 10.2 对数据的简单数字概括 10.3 描述性图形概述 10.4 数据的准备 第 11 章 有监督学习概论 11.1 数据科学的核心内容 11.2 有监督学习 11.3 通过两个案例介绍有监督学习要素 第 12 章 一些有监督学习模型 12.1 线性最小二乘回归 12.2 Logistic 回归的二分类方法 12.3 决策树分类与回归 12.4 基于决策树的组合方法: Bagging、随机森林、HGboost 12.5 人工神经网络分类与回归 12.6 k 最近邻方法分类与回归 12.7 支持向量机方法分类 12.8 朴素贝叶斯方法分类
内容摘要
第1章 软件准备
1.1 下载及安装Python可以从不同的平台来下载、安装和使用Python.根据笔者的经验,这方面最好的老是网络,每种操作系统都有一些最适合的方式,而且会随着操作系统和平台的更新而f委化.笔者觉得对于初学者最方便的平台是Anaconda.只要登录网页https://weontinuum.io/downloads,就知道如何在各种操作系统(Windows,macOS 及Linux)Anaconda.目前Pyrthon有3.x及2.x两个版本(本书使用3.x版本),另外可以选64位2位.安装之后,一些最基本的模块,比如 NumPy,pandas,matplotlib,IPython,SciPy 就都¥安装了.此后,可以以各种方式使用Python,比如通过Jupyter Notebook,IPython,Spyder等界面来运行.从运算来说,各种界面没有区别,但不同人的习惯不同,会有不同偏好.笔者所常用的界面是Jupyter Notebook,觉得它对于初学者来说更加方便,因为它把每一步程序及结果都自动记录下来,并且像纸质笔记本一样可以加入各种标题、文字内容、么式及表格.而Spyder为交互式的环境,提供了若干窗口分别编写程序文件、交互式输入代码及输出结果的Console,以及帮助窗口等等,有其好处,只是除了文件编写窗口,不记录敲入的结果.另外要注意,诸如 Windows 和Mac的OS 系统等都在不断地升级,Anaconda 也在改变,同时 Python及各个模块还在不断升级,本书所说的具体操作和代码会随之变化、相信读者会不断适应这些变化,与时俱进.1.2Anaconda的几种界面1.2.1使用Notebook安装完了 Anaconda 之后,就可以运行Notebook了.在Windows 下打开Notebook 有两种方法:(1)一种方法是在CMD窗口(即终端)进入你的程序文件所在的目录.如果还没有程序文件,就事先产生一个新目录,假定是D盘的D:/Python Work文件夹.这样,在CND界面中敲入D:,回车后就到了D:盘,然后键入cd Python Work即可到达你的工作目录;再键入jupyter notebook,则在默认浏览器产生一个工作界面(称为“Home”)如果你已经有文件,则会有书本图标开头的列表,文件名以.ipynb为扩展名。如果没有现成的,可创造新的文件,点击右上角的New 并选择Python3(如果你使用Python3.x的话),则产生一个没有名字的(默认是Untitled)以.ipynb为扩展名的文件(自动存在你的工作目录中)的页面,文件名字可以随时任意更改.(2)另一种方法是在电脑的程序列表中寻找Anaconda3,点击后在子目录中找到Jupyter Note?
……
精彩内容
学习自然语言必须依靠实践,学习计算机语言也一样。本书不采用详尽的使用手册式教学,而是通过实践帮助读者学会Python编程语言。如果你想开始学习Python,本书是一个良好的开端。
《Python——数据科学的手段(第2版)》比版增加了一倍的篇幅,内容选择和编排都有较大改动。全书四个部分共12章,部分基础,包括章软件准备、第2章Python基础知识、第3章类和子类简介;第二部分基本模块,包括第4章numpy模块、第5章pandas模块、第6章matplotlib模块、第7章scipy模块;第三部分编程思维训练,包括第8章基本编程训练、第9章若干计算方法的编程训练;第四部分数据科学,包括0章探索性数据分析及数据准备、1章有监督学习概论、2章一些有监督学习模型。
以下为对购买帮助不大的评价