• 机器学习常用算法速查手册
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

机器学习常用算法速查手册

正版新书 新华官方库房直发 可开电子发票

15.84 1.8折 88 全新

库存54件

江苏无锡
认证卖家担保交易快速发货售后保障

作者马特哈里森;杜春晓

出版社中国电力出版社

出版时间2020-12

版次1

装帧其他

货号文轩12.1

上书时间2024-12-02

   商品详情   

品相描述:全新
图书标准信息
  • 作者 马特哈里森;杜春晓
  • 出版社 中国电力出版社
  • 出版时间 2020-12
  • 版次 1
  • ISBN 9787519849481
  • 定价 88.00元
  • 装帧 其他
  • 开本 16开
  • 纸张 胶版纸
  • 页数 316页
  • 字数 380千字
【内容简介】
本书涵盖以下主题:
  用泰坦尼克号数据集讲解分类。
   清洗数据和处理缺失数据。
  探索数据分析。
   数据预处理的常用方法。
  选择对模型有用的特征。
  模型选择。
  度量标准和分类评估。
  多种回归分析技术。
  评估回归结果的度量标准。
  聚类算法。
  降维技术。
  scikit-learn流水线。
【作者简介】
Matt Harrison经营着一家叫作MetaSnake的公司,为客户提供Python和数据科学培训和咨询服务。他自2000年起一直使用 Python,期间涉足多个领域:数据科学、BI、存储、自动化测试、开源软件技术栈管理、金融和搜索。
【目录】
目录

前言 1

第1 章 机器学习入门 7

本书使用的库 7

用pip 安装库 10

用conda 安装库12

第2 章 机器学习流程概览 15

第3 章 数据分类工作流:泰坦尼克号数据集 17

项目布局建议 17

导入 18

提出问题 19

数据术语 19

获取数据 21

清洗数据 22

创建特征 29

数据采样 31

数据插值 31

规范数据 32

重构 33

基准模型 35

不同算法族 35

模型堆叠 37

建模 38

评估模型 38

优化模型 40

混淆矩阵 41

ROC 曲线 42

学习曲线 44

部署模型 45

第4 章 数据缺失 47

检查数据缺失情况 48

删除缺数据的行或列 52

插值 53

添加标识列 54

第5 章 清洗数据 55

处理列名 55

替换缺失值 56

第6 章 探索数据 59

数据大小 59

汇总统计 60

直方图 61

散点图 62

Joint Plot 图 63

Pair Grid 图 66

箱形图和小提琴图 68

比较两个序数型特征 69

相关性 71

RadViz 图 76

平行坐标图 78

第7 章 预处理数据 81

标准化 81

调整取值范围 83

虚拟变量 84

标签编码 85

频数编码 86

从字符串抽取类别型数据 87

类别型数据的其他编码方法 89

日期特征的处理方法 91

添加col_na 特征 92

特征工程 93

第8 章 特征选择 95

共线列 95

套索回归 99

递归特征消除 100

互信息 102

主成分分析 103

特征重要性 103

第9 章 类别不平衡 105

采用不同度量标准 105

树模型和集成方法 105

惩罚模型 106

对小众类别上采样 106

生成小众数据 107

对大众类别下采样 107

先上采样,再下采样 109

第10 章 分类 111

对数概率回归 112

朴素贝叶斯 117

支持向量机 120

k 近邻 123

决策树 126

随机森林 133

XGBoost 138

LightGBM150

TPOT 155

第11 章 模型选择 161

验证曲线 161

学习曲线 163

第12 章 度量标准和分类评估 165

混淆矩阵 165

度量标准 168

准确率 170

召回率 171

精准率 171

f1 值 172

分类报告 172

ROC 曲线 173

精准率- 召回率曲线 175

累积增益图 176

lift 曲线 178

类别平衡 180

类别预测错误 181

判别阈值 182

第13 章 解释模型 185

回归系数 185

特征重要性 186

LIME 包186

解释树模型 188

部分依赖图 189

替代模型 193

Shapley 值 194

第14 章 回归 199

基准模型 201

线性回归 202

支持向量机 206

k 近邻 208

决策树 210

随机森林 217

XGBoost 回归 220

LightGBM 回归 228

第15 章 度量标准和回归模型的评估 233

度量标准 233

残差图 236

异方差性 237

残差正态性 237

预测误差图 239

第16 章 解释回归模型 241

Shapley 值 241

第17 章 降维技术 247

PCA 方法 247

UMAP 方法 267

t-SNE 方法 273

PHATE 方法 277

第18 章 聚类 283

k-means 算法 283

层次聚类 290

理解簇 293

第19 章 流水线 299

分类流水线 299

回归流水线 302

PCA 流水线 303

作者介绍 305

封面介绍 305
点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP