Java机器学习
¥
14.06
2.9折
¥
49
九品
仅1件
作者武传海 译
出版社人民邮电出版社
出版时间2017-09
版次1
装帧平装
货号A13
上书时间2024-11-06
商品详情
- 品相描述:九品
图书标准信息
-
作者
武传海 译
-
出版社
人民邮电出版社
-
出版时间
2017-09
-
版次
1
-
ISBN
9787115466808
-
定价
49.00元
-
装帧
平装
-
开本
16开
-
纸张
胶版纸
-
页数
171页
-
正文语种
简体中文
-
丛书
图灵程序设计丛书
- 【内容简介】
-
本书介绍如何使用Java创建并实现机器学习算法,既有基础知识,又提供实战案例。主要内容包括:机器学习基本概念、原理,Weka、Mahout、Spark等常见机器学习库的用法,各类机器学习常见任务,包括分类、预测预报、购物篮分析、检测异常、行为识别、图像识别以及文本分析。最后还提供了相关Web资源、各种技术研讨会议以及机器学习挑战赛等进阶所需内容。
本书适合机器学习入门者,尤其是想使用Java机器学习库进行数据分析的读者。
- 【目录】
-
第1章 机器学习应用快速入门1
1.1 机器学习与数据科学1
1.1.1 机器学习能够解决的问题2
1.1.2 机器学习应用流程3
1.2 数据与问题定义4
1.3 数据收集5
1.3.1 发现或观察数据5
1.3.2 生成数据6
1.3.3 采样陷阱7
1.4 数据预处理7
1.4.1 数据清洗8
1.4.2 填充缺失值8
1.4.3 剔除异常值8
1.4.4 数据转换9
1.4.5 数据归约10
1.5 无监督学习10
1.5.1 查找相似项目10
1.5.2 聚类12
1.6 监督学习13
1.6.1 分类14
1.6.2 回归16
1.7 泛化与评估18
1.8 小结21
第2章 面向机器学习的Java库与
平台22
2.1 Java环境22
2.2 机器学习库23
2.2.1 Weka23
2.2.2 Java机器学习25
2.2.3 Apache Mahout26
2.2.4 Apache Spark27
2.2.5 Deeplearning4j28
2.2.6 MALLET29
2.2.7 比较各个库30
2.3 创建机器学习应用31
2.4 处理大数据31
2.5 小结33
第3章 基本算法——分类、回归、
聚类34
3.1 开始之前34
3.2 分类35
3.2.1 数据35
3.2.2 加载数据36
3.2.3 特征选择37
3.2.4 学习算法38
3.2.5 对新数据分类40
3.2.6 评估与预测误差度量41
3.2.7 混淆矩阵41
3.2.8 选择分类算法42
3.3 回归43
3.3.1 加载数据43
3.3.2 分析属性44
3.3.3 创建与评估回归模型45
3.3.4 避免常见回归问题的小技巧48
3.4 聚类49
3.4.1 聚类算法49
3.4.2 评估50
3.5 小结51
第4章 利用集成方法预测客户关系52
4.1 客户关系数据库52
4.1.1 挑战53
4.1.2 数据集53
4.1.3 评估54
4.2 最基本的朴素贝叶斯分类器基准55
4.2.1 获取数据55
4.2.2 加载数据56
4.3 基准模型58
4.3.1 评估模型58
4.3.2 实现朴素贝叶斯基准线59
4.4 使用集成方法进行高级建模60
4.4.1 开始之前60
4.4.2 数据预处理61
4.4.3 属性选择62
4.4.4 模型选择63
4.4.5 性能评估66
4.5 小结66
第5章 关联分析67
5.1 购物篮分析67
5.2 关联规则学习69
5.2.1 基本概念69
5.2.2 Apriori算法71
5.2.3 FP-增长算法71
5.2.4 超市数据集72
5.3 发现模式73
5.3.1 Apriori算法73
5.3.2 FP-增长算法74
5.4 在其他领域中的应用75
5.4.1 医疗诊断75
5.4.2 蛋白质序列75
5.4.3 人口普查数据76
5.4.4 客户关系管理76
5.4.5 IT运营分析76
5.5 小结77
第6章 使用Apache Mahout制作
推荐引擎78
6.1 基本概念78
6.1.1 关键概念79
6.1.2 基于用户与基于项目的分析79
6.1.3 计算相似度的方法80
6.1.4 利用与探索81
6.2 获取Apache Mahout81
6.3 创建一个推荐引擎84
6.3.1 图书评分数据集84
6.3.2 加载数据84
6.3.3 协同过滤89
6.4 基于内容的过滤97
6.5 小结97
第7章 欺诈与异常检测98
7.1 可疑与异常行为检测98
7.2 可疑模式检测99
7.3 异常模式检测100
7.3.1 分析类型100
7.3.2 事务分析101
7.3.3 规划识别101
7.4 保险理赔欺诈检测101
7.4.1 数据集102
7.4.2 为可疑模式建模103
7.5 网站流量异常检测107
7.5.1 数据集107
7.5.2 时序数据中的异常检测108
7.6 小结113
第8章 利用Deeplearning4j进行
图像识别114
8.1 图像识别简介114
8.2 图像分类120
8.2.1 Deeplearning4j120
8.2.2 MNIST数据集121
8.2.3 加载数据121
8.2.4 创建模型122
8.3 小结128
第9章 利用手机传感器进行
行为识别129
9.1 行为识别简介129
9.1.1 手机传感器130
9.1.2 行为识别流水线131
9.1.3 计划132
9.2 从手机收集数据133
9.2.1 安装Android Studio133
9.2.2 加载数据采集器133
9.2.3 收集训练数据136
9.3 创建分类器138
9.3.1 减少假性转换140
9.3.2 将分类器嵌入移动应用142
9.4 小结143
第10章 利用Mallet进行文本挖掘——
主题模型与垃圾邮件检测144
10.1 文本挖掘简介144
10.1.1 主题模型145
10.1.2 文本分类145
10.2 安装Mallet146
10.3 使用文本数据147
10.3.1 导入数据149
10.3.2 对文本数据做预处理150
10.4 为BBC新闻做主题模型152
10.4.1 BBC数据集152
10.4.2 建模153
10.4.3 评估模型155
10.4.4 重用模型156
10.5 垃圾邮件检测157
10.5.1 垃圾邮件数据集158
10.5.2 特征生成159
10.5.3 训练与测试模型160
10.6 小结161
第11章 机器学习进阶162
11.1 现实生活中的机器学习162
11.1.1 噪声数据162
11.1.2 类不平衡162
11.1.3 特征选择困难163
11.1.4 模型链163
11.1.5 评价的重要性163
11.1.6 从模型到产品164
11.1.7 模型维护164
11.2 标准与标记语言165
11.2.1 CRISP-DM165
11.2.2 SEMMA方法166
11.2.3 预测模型标记语言166
11.3 云端机器学习167
11.4 Web资源与比赛168
11.4.1 数据集168
11.4.2 在线课程169
11.4.3 比赛170
11.4.4 网站与博客170
11.4.5 场馆与会议171
11.5 小结171
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价