精通特征工程美爱丽丝·郑Alice Zheng 阿曼达·卡萨丽Amanda Casari 著陈光欣译

23 3.9折 59 全新

仅1件

上海浦东

认证卖家担保交易快速发货售后保障

作者[美]爱丽丝·郑(Alice Zheng) 阿曼达·卡萨丽（Amanda Casari）

出版社人民邮电出版社

出版时间2018-08

版次1

装帧平装

上书时间2024-12-28

如山抽丝

已实名进店收藏店铺

在售商品暂无
平均发货时间 14小时
好评率暂无

最新上架

汉语史稿 ¥24.00

经子浅谈 ¥14.00

化家为国--清代中期内务府的官僚体制(论衡系列) ¥42.00

中华国学文库：徐霞客游记校注（套装共2册） ¥68.00

应用回归分析（第5版）/21世纪统计学系列教材·普通高等教育“十一五”国家级规划教材 ¥17.00

阿里云天池大赛赛题解析――深度学习篇(博文视点出品) ¥38.00

体国经野之道 ¥34.00

唐宋建筑转型与法式化：五代宋金时期晋中地区木构建筑研究 ¥28.00

CDA二级认证教材-商业策略数据分析 ¥28.00

商品详情

品相描述：全新

图书标准信息

作者 [美]爱丽丝·郑(Alice Zheng) 阿曼达·卡萨丽（Amanda Casari）
出版社人民邮电出版社
出版时间 2018-08
版次 1
ISBN 9787115509680
定价 59.00元
装帧平装
开本其他
页数 156页
字数 254千字

【内容简介】: 本书介绍大量特征工程技术，阐明特征工程的基本原则。主要内容包括：机器学习流程中
的基本概念，数值型数据的基础特征工程，自然文本的特征工程，词频- 逆文档频率，高效的分类变量编码技术，主成分分析，模型堆叠，图像处理，等等。
【作者简介】: 爱丽丝·郑（Alice Zheng）亚马逊广告平台建模和优化团队负责人，应用机器学习、生成算法和平台开发领域的技术领dao者，前微软研究院机器学习研究员。

阿曼达·卡萨丽（Amanda Casari）谷歌云开发者关系工程经理，曾是Concur Labs的产品经理和数据科学家，在数据科学、机器学习、复杂系统和机器人等多个领域都有丰富经验。
【目录】: 前言     ix
第  1 章机器学习流程  1
1.1  数据  1
1.2  任务  1
1.3  模型  2
1.4  特征  3
1.5  模型评价  3
第  2 章简单而又奇妙的数值  4
2.1  标量、向量和空间  5
2.2  处理计数  7
2.2.1  二值化  7
2.2.2  区间量化（分箱）  9
2.3  对数变换  13
2.3.1  对数变换实战  16
2.3.2  指数变换：对数变换的推广  19
2.4  特征缩放/ 归一化  24
2.4.1  min-max 缩放  24
2.4.2  特征标准化/ 方差缩放  24
2.4.3  2
归一化  25
2.5  交互特征  28
2.6  特征选择  30
2.7  小结  31
2.8  参考文献  32
第3  章文本数据：扁平化、过滤和分块  33
3.1  元素袋：将自然文本转换为扁平向量  34
3.1.1  词袋  34
3.1.2  n 元词袋  37
3.2  使用过滤获取清洁特征  39
3.2.1  停用词  39
3.2.2  基于频率的过滤  40
3.2.3  词干提取  42
3.3  意义的单位：从单词、n 元词到短语  43
3.3.1  解析与分词  43
3.3.2  通过搭配提取进行短语检测  44
3.4  小结  50
3.5  参考文献  51
第4  章特征缩放的效果：从词袋到tf-idf  52
4.1  tf-idf：词袋的一种简单扩展  52
4.2  tf-idf 方法测试  54
4.2.1  创建分类数据集  55
4.2.2  使用tf-idf 变换来缩放词袋  56
4.2.3  使用逻辑回归进行分类  57
4.2.4  使用正则化对逻辑回归进行调优  58
4.3  深入研究：发生了什么  62
4.4  小结  64
4.5  参考文献  64
第5  章分类变量：自动化时代的数据计数  65
5.1  分类变量的编码  66
5.1.1  one-hot 编码  66
5.1.2  虚拟编码  66
5.1.3  效果编码  69
5.1.4  各种分类变量编码的优缺点  70
5.2  处理大型分类变量  70
5.2.1  特征散列化  71
5.2.2  分箱计数  73
5.3  小结  79
5.4  参考文献  80

第6  章数据降维：使用PCA 挤压数据  82
6.1  直观理解  82
6.2  数学推导  84
6.2.1  线性投影  84
6.2.2  方差和经验方差  85
6.2.3  主成分：第一种表示形式  86
6.2.4  主成分：矩阵- 向量表示形式  86
6.2.5  主成分的通用解  86
6.2.6  特征转换  87
6.2.7  PCA 实现  87
6.3  PCA 实战  88
6.4  白化与ZCA  89
6.5  PCA 的局限性与注意事项  90
6.6  用例  91
6.7  小结  93
6.8  参考文献  93
第7  章非线性特征化与k-均值模型堆叠  94
7.1  k-均值聚类  95
7.2  使用聚类进行曲面拼接  97
7.3  用于分类问题的k-均值特征化  100
7.4  优点、缺点以及陷阱  105
7.5  小结  107
7.6  参考文献  107
第8  章自动特征生成：图像特征提取和深度学习  108
8.1  最简单的图像特征（以及它们因何失效）  109
8.2  人工特征提取：SIFT 和HOG  110
8.2.1  图像梯度  110
8.2.2  梯度方向直方图  113
8.2.3  SIFT 体系  116
8.3  通过深度神经网络学习图像特征  117
8.3.1  全连接层  117
8.3.2  卷积层  118
8.3.3  ReLU 变换  122
8.3.4  响应归一化层  123
8.3.5  池化层  124
8.3.6  AlexNet 的结构  124
8.4  小结  127
8.5  参考文献  128
第9  章回到特征：建立学术论文推荐器  129
9.1  基于项目的协同过滤  129
9.2  第一关：数据导入、清理和特征解析  130
9.3  第二关：更多特征工程和更智能的模型  136
9.4  第三关：更多特征= 更多信息  141
9.5  小结  144
9.6  参考文献  144
附录A  线性建模与线性代数基础  145
A.1  线性分类概述  145
A.2  矩阵的解析  147
A.2.1  从向量到子空间  148
A.2.2  奇异值分解（SVD）  150
A.2.3  数据矩阵的四个基本子空间  151
A.3  线性系统求解  153
A.4  参考文献  155
作者简介  156
封面简介  156

点击展开点击收起

— 没有更多了 —

精通特征工程 美爱丽丝·郑Alice Zheng 阿曼达·卡萨丽Amanda Casari 著 陈光欣 译

如山抽丝

商品详情

图书标准信息

精通特征工程美爱丽丝·郑Alice Zheng 阿曼达·卡萨丽Amanda Casari 著陈光欣译