基于Python的无监督学习

45.39 4.6折 98 全新

库存2件

山东泰安

认证卖家担保交易快速发货售后保障

作者[美]安库·A.帕特著

出版社中国电力出版社

出版时间2020-12

版次1

装帧平装

货号603 10-18

上书时间2024-10-20

邹鲁文化书店

十一年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 23小时
好评率暂无

最新上架

人工智能时代口译技术应用研究 ¥57.77

生态和谐社会伦理范式阐释研究 ¥57.77

星学大成(全2册) ¥57.77

《中国青年政治学院学报》创刊30周年纪念集（1982-2012） ¥57.77

金融祸福：毁掉世界经济的金融安排 ¥57.77

艺术谱系：名画密码与大师传承 ¥57.77

仲实：张仲实画传、忆念与研究 ¥57.77

长治市人民政府驻北京联络处志 ¥57.77

金光大国：亲历中国金属大国崛起（英文版） ¥57.77

商品详情

品相描述：全新

图书标准信息

作者 [美]安库·A.帕特著
出版社中国电力出版社
出版时间 2020-12
版次 1
ISBN 9787519849498
定价 98.00元
装帧平装
开本 16开
纸张胶版纸
页数 384页
字数 480千字

【内容简介】: 本书主要内容有：比较不同机器学习方法的优缺点、监督学习、无监督学习和强化学习。从头到尾的建立和管理机器学习项目。建立一个异常检测系统，以捕捉信用卡交易的欺诈。将用户集群到不同的同构组中。执行半监督学习。使用受限制玻尔兹曼机开发电影推荐系统。使用生成对抗网络生成合成图像。
【作者简介】: Ankur A.Patel是7Park data数据科学部门的副总裁（隶属于Vista Equity Partners投资组合公司）。在7Park data，Ankur和他的数据科学团队使用替代数据为对冲基金和企业构建数据产品，并为企业客户开发机器学习服务（MLaaS）。
【目录】: 目录

前言 1

第一部分无监督学习基础

第1 章机器学习生态系统中的无监督学习 15

机器学习基本术语 15

基于规则(Rules-Based) 与机器学习 17

监督学习与无监督学习 17

监督学习的优缺点 18

无监督学习的优缺点 19

使用无监督学习改进机器学习的解决方案 20

了解监督学习算法 23

线性算法 25

基于邻域的算法 26

基于树的算法 28

支持向量机 29

神经网络 30

了解无监督学习算法 30

降维 30

聚类 33

特征提取 35

无监督深度学习 36

使用无监督学习解决序列数据问题 38

利用无监督学习的强化学习 39

半监督学习 40

无监督学习的成功应用 40

结论 42

第2 章完整机器学习项目 43

环境设置 43

版本控制：Git 43

克隆本书的Git 存储库 44

科学库：Anaconda 发行版Python 44

神经网络：TensorFlow 和Keras 45

梯度提升算法，版本1: XGBoost 45

梯度提升算法，版本2：LightGBM 46

聚类算法 46

交互式计算环境：Jupyter Notebook 47

数据概述 47

数据准备 48

数据采集 48

数据研究 50

生成特征矩阵和标签数组 53

特征工程与特征选择 54

数据可视化（Data Visualization） 55

模型准备 56

分离出训练和测试数据集 56

选择成本函数 57

创建k 折交叉验证集 58

机器学习模型（第一部分） 58

评估指标 62

混淆矩阵（Confusion Matrix） 62

精确率召回率曲线（Precision-Recall Curve） 63

观察者操作特征曲线（receiver operating characteristic） 65

机器学习模型（第二部分） 68

模型2：随机森林(Random Forests) 68

模型3：XGBoost 梯度提升机（gradient boosting machine） 71

模型4：LightGBM 梯度提升机 74

使用测试集对四个模型评估 77

集成（Ensembles） 82

最终算法选择 86

完整生产系统 87

结论 87

第二部分使用SciKit-Learn 进行无监督学习

第3 章降维 91

降维的动因 91

降维算法 96

主成分分析（principal component analysis，PCA） 97

PCA 概念 97

PCA 练习 98

增量PCA 103

稀疏PCA 104

核PCA 105

奇异值分解 107

随机投影 108

等距映射 111

多维标度法 112

局部线性嵌入 113

t- 分布随机邻域嵌入 114

其他降维方法 115

字典学习 116

独立成分分析 118

结论 119

第4 章异常检测 120

信用卡欺诈检测 121

准备数据 121

定义异常评分函数 121

定义评估指标 123

定义绘图函数 124

普通PCA 异常检测 124

PCA 成分数量等于原始特征的数量 125

寻找最优主成分数 128

稀疏PCA 异常检测 130

核PCA 异常检测 132

高斯随机投影异常检测 135

稀疏随机投影异常检测 137

非线性异常检测 138

字典学习异常检测 139

ICA 异常检测 141

在测试数据集上运行欺诈检测解决方案 143

测试数据集上的普通PCA 异常检测 143

测试集上的ICA 异常检测 145

测试集上使用字典学习异常检测 146

结论 148

第5 章聚类 149

MNIST 数字集 150

聚类算法 151

k 均值 152

k 均值惯性 153

评估聚类结果 154

k 均值精度 156

k 均值和主成分的数量 158

原始数据集上的k 均值 159

层次聚类 161

层次聚类方法 162

树状图 163

评估聚类结果 165

密度聚类（DBSCAN） 168

DBSCAN 算法 168

HDBSCAN 170

结论 172

第6 章分组分割 173

借贷俱乐部数据 173

数据准备 174

将字符串格式转换为数字格式 176

输入缺失值 176

特征工程 179

选择最终特征集并执行缩放 179

指定用来评估的标签 179

聚类的好处 181

k 均值应用 183

分层聚类应用 186

HDBSCAN 应用程序 190

结论 192

第三部分使用TensorFlow 和Keras

无监督学习

第7 章自动编码器 195

神经网络 196

TensorFlow 198

Keras 199

自动编码器：编码器和解码器 199

欠完备自动编码器 200

过完备自动编码器 201

密集与稀疏自动编码器 202

降噪自动编码器 202

变分自动编码器 203

结论 204

第8 章自动编码器实践 205

数据准备 205

自动编码器的组成部分 208

激活函数 209

我们的第一台自动编码器 210

损失函数 211

优化器 211

训练模型 212

对测试集进行评估 214

具有线性激活函数的两层欠完备自动编码器 216

增加节点数 220

添加更多隐藏层 222

非线性自动编码器 223

具有线性激活的过完备自动编码器 226

具有线性激活、随机失活的过完备自动编码器 228

具有稀疏、线性激活、随机失活的过完备自动编码器 231

具有稀疏、线性激活、随机失活功能的过完备自动编码器 234

使用噪声数据集 236

降噪自动编码器 236

二层、降噪、具备线性激活的欠完备自动编码器 237

两层、降噪、具备线性激活的过完备自动编码器 240

两层、降噪、ReLu 激活的过完备自动编码器 242

结论 244

第9 章半监督学习 246

数据准备 246

监督模型 250

无监督模型 252

半监督模型 254

监督和无监督的合力 257

结论 258

第四部分使用TensorFlow 和Keras

进行深度无监督学习

第10 章使用受限玻尔兹曼机器的推荐系统 261

玻尔兹曼机器 262

推荐系统 263

协同过滤 263

Netflix 奖 264

MovieLens 数据集 264

数据准备 265

定义成本函数：均方误差 269

进行基线实验 270

矩阵分解 271

一个潜在因子 272

三个潜在因子 273

五个潜在因子 274

使用RBM 的协同过滤 274

RBM 神经网络结构 275

构建RBM 类的组件 277

训练RBM 推荐系统 280

结论 281

第11 章基于深度信念网络的特征检测 282

深层信念网络详述 282

MNIST 图像分类 283

受限波尔兹曼机 285

构建RBM 类的组件 286

使用RBM 模型生成图像 289

查看中间特征检测器 289

为DBN 训练三个RBM 290

检查特征检测器（Examine Feature Detectors） 293

查看生成的图像 294

完整DBN 297

DBN 训练的工作原理 302

训练DBN 302

无监督学习如何帮助监督学习 304

使用LightGBM 的图像分类器 312

监督学习 312

无监督和监督的解决方案 314

结论 315

第12 章生成对抗网络 316

生成对抗网络概念 316

深度卷积生成对抗网络 317

卷积神经网络 318

重新思考DCGAN 323

DCGAN 生成器 324

DCGAN 的鉴别器 326

鉴别器和对抗模型 327

MNIST 数据集的DCGAN 328

在MNIST 数据集执行DCGAN 330

结论 332

第13 章时间序列聚类 333

心电数据 334

走进时间序列聚类 334

心电图k 形时间序列聚类 335

数据准备 336

训练和评估 340

在ECG5000 上使用k 形进行时间序列聚类 342

数据准备 342

训练和评估 346

基于k 均值的ECG5000 时间序列聚类 348

基于ECG5000 的分层DBSCAN 时间序列聚类 349

比较时间序列聚类算法 350

k 形 351

k 均值 353

HDBSCAN 354

比较所有三种时间序列聚类方法 355

结论 357

第14 章尾声 358

监督学习 359

无监督学习 359

SciKit-Learn 360

TensorFlow 和Keras 361

强化学习 362

今天最有希望的无监督学习领域 362

无监督学习的未来 364

结语 366

作者介绍 367

封面介绍 367

点击展开点击收起

— 没有更多了 —