数据挖掘:原理与应用
¥
37.2
4.7折
¥
79
全新
仅1件
作者丁兆云;周鋆;杜振国
出版社机械工业出版社
出版时间2021-12
版次1
装帧其他
货号9787111696308
上书时间2024-11-20
商品详情
- 品相描述:全新
图书标准信息
-
作者
丁兆云;周鋆;杜振国
-
出版社
机械工业出版社
-
出版时间
2021-12
-
版次
1
-
ISBN
9787111696308
-
定价
79.00元
-
装帧
其他
-
开本
16开
-
纸张
胶版纸
-
页数
290页
-
字数
400千字
- 【内容简介】
-
目前,数据挖掘类课程已成为我国新工科教育的数据科学思维提升课程,成为信息、电子等各类工科专业本科生与研究生的必修课。本书深入浅出地介绍了数据挖掘和数据分析的知识、常用的各类算法;系统梳理与比较各类算法的优缺点与适用场景。本书内容结合作者多年的科研和教学经验,大量案例来自作者的项目和科研成果,不仅适合作为大数据特色类专业的本科生和研究生教材,同时也适合机械、航空等其他工科专业的入门与自学教材,还可作为各专业本科生与研究生考试复习的参考资料。
- 【目录】
-
前言
第1章 绪论1
1.1 数据挖掘的出现1
1.2 为什么要学习数据挖掘1
1.2.1 数据爆炸但知识贫乏1
1.2.2 从商业数据到商业智能的进化2
1.2.3 科学发展范式2
1.3 什么是数据挖掘3
1.3.1 数据挖掘的出现3
1.3.2 数据挖掘的定义3
1.3.3 数据的含义4
1.3.4 信息的含义4
1.3.5 知识的含义5
1.3.6 数据、信息、知识的关系5
1.3.7 数据挖掘过程5
1.3.8 数据挖掘的关联课程6
1.4 数据挖掘的内容7
1.4.1 关联规则挖掘7
1.4.2 分类7
1.4.3 聚类9
1.4.4 回归10
1.5 本章小结10
第2章 认识数据11
2.1 数据的基本概念11
2.1.1 数据对象11
2.1.2 数据属性12
2.1.3 属性的类型13
2.1.4 属性类型的对比14
2.1.5 离散属性与连续属性14
2.2 数据的基本统计方法15
2.2.1 中心化趋势统计量:均值、中位数和众数15
2.2.2 离散度度量16
2.2.3 分布形状度量17
2.3 数据的基本可视化方法18
2.3.1 箱线图可视化18
2.3.2 直方图可视化19
2.3.3 散点图可视化19
2.4 数据相似性的计算方法20
2.4.1 数据相似性和相异性度量的基本概念20
2.4.2 标称属性的邻近性度量21
2.4.3 二值属性的邻近性度量22
2.4.4 序数属性的邻近性度量23
2.4.5 数值属性的邻近性度量23
2.4.6 混合类型属性的邻近性度量25
2.4.7 余弦相似性25
2.5 本章小结26
第3章 数据预处理27
3.1 数据质量27
3.2 数据预处理的主要任务27
3.2.1 数据清理27
3.2.2 数据集成28
3.2.3 数据规约32
3.2.4 数据规范化和数据离散化37
3.3 特征构造38
3.3.1 为什么需要特征构造38
3.3.2 基本特征构造法38
3.3.3 时间类型数据特征构造法39
3.3.4 时间序列数据特征构造法41
3.3.5 离散数据特征哑编码42
3.4 本章小结43
第4章 分类的基本概念与朴素贝叶斯分类器44
4.1 分类的基本概念44
4.2 朴素贝叶斯分类的基础理论45
4.2.1 贝叶斯示例45
4.2.2 贝叶斯定理46
4.2.3 极大后验假设46
4.2.4 多维属性的联合概率47
4.2.5 独立性假设47
4.2.6 训练集介绍47
4.3 贝叶斯分类的案例48
4.3.1 案例一:购买电脑预测48
4.3.2 案例二:垃圾邮件分类49
4.4 连续类型数据分类50
4.5 本章小结50
第5章 决策树分类51
5.1 决策树51
5.2 决策树构建的两个问题52
5.2.1 如何构建决策树52
5.2.2 构造什么样的决策树是合适的53
5.3 决策树算法54
5.3.1 Hunt算法54
5.3.2 构建决策树的关键问题56
5.3.3 信息增益算法57
5.3.4 C4.5算法59
5.3.5 CART算法61
5.4 本章小结64
第6章 规则和近邻分类器66
6.1 基于规则的分类66
6.1.1 基于规则的分类示例66
6.1.2 规则的质量68
6.1.3 规则分类器的特征68
6.1.4 基于规则的分类器的建立69
6.1.5 规则分类的特点76
6.2 急切学习与惰性学习76
6.3 近邻分类器77
6.3.1 近邻算法的定义77
6.3.2 K近邻分类算法78
6.4 本章小结79
第7章 回归算法80
7.1 线性回归的案例:房价预测80
7.2 线性回归算法81
7.2.1 线性回归的提出81
7.2.2 线性回归建模81
7.2.3 小二乘法82
7.3 优化求解方法83
7.3.1 梯度下降83
7.3.2 梯度下降法求解83
7.3.3 学习率分析84
7.3.4 梯度下降法收敛85
7.3.5 梯度下降法的变体86
7.4 逻辑回归87
7.4.1 逻辑回归函数87
7.4.2 逻辑回归的特点87
7.4.3 优势比88
7.4.4 逻辑回归参数估计89
7.4.5 逻辑回归正则化90
7.4.6 逻辑回归数值优化91
7.4.7 逻辑回归训练方法的优化93
7.5 决策树回归94
7.5.1 决策树回归的基本概念94
7.5.2 决策树分类划分点的选择94
7.5.3 决策树回归算法96
7.6 本章小结96
第8章 模型的评价97
8.1 分类模型的评价指标97
8.1.1 混淆矩阵97
8.1.2 准确率97
8.1.3 精确率与召回率98
8.1.4 ROC曲线99
8.2 不平衡分类102
8.2.1 基于抽样的方法103
8.2.2 两阶段学习104
8.2.3 代价敏感学习104
8.3 过拟合与欠拟合105
8.3.1 训练误差和泛化误差105
8.3.2 噪声导致的过拟合107
8.3.3 缺乏代表性样本导致的过拟合107
8.3.4 解决过拟合的方法一:减少泛化误差109
8.3.5 解决过拟合的方法二:使用确认集估计泛化误差110
8.4 其他模型评价指标113
8.4.1 回归模型113
8.4.2 聚类模型114
8.4.3 关联规则模型115
8.5 本章小结117
第9章 支持向量机分类器118
9.1 支持向量机的提出118
9.1.1 支持向量机简介118
9.1.2 传统分类方法的不足118
9.1.3 支持向量机的总体思想119
9.1.4 从Logistic回归到SVM分析119
9.1.5 支持向量机的应用120
9.2 深入支持向量机121
9.2.1 支持向量机算法的原理121
9.2.2 支持向量机建模122
9.2.3 支持向量机求解123
9.3 非线性支持向量机126
9.3.1 基于软间隔的C-SVM126
9.3.2 非线性SVM与核变换129
9.3.3 支持向量机二分类推广131
9.4 本章小结131
第10章 神经网络分类器132
10.1 人工神经网络出现的背景 132
10.1.1 发展历程132
10.1.2 端到端的学习133
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价