数据挖掘导论
¥
12.12
4.3折
¥
28
九品
仅1件
作者戴红、常子冠、于宁 著
出版社清华大学出版社
出版时间2014-11
版次1
装帧平装
货号A2
上书时间2024-12-24
商品详情
- 品相描述:九品
图书标准信息
-
作者
戴红、常子冠、于宁 著
-
出版社
清华大学出版社
-
出版时间
2014-11
-
版次
1
-
ISBN
9787302381044
-
定价
28.00元
-
装帧
平装
-
开本
其他
-
纸张
胶版纸
-
页数
207页
-
字数
331千字
- 【内容简介】
-
本书为数据挖掘入门级教材,共分8章,主要内容分为三个专题:技术、数据和评估。技术专题包括决策树技术、K-means算法、关联分析技术、神经网络技术、回归分析技术、贝叶斯分析、凝聚聚类、概念分层聚类、混合模型聚类技术的EM算法、时间序列分析和基于Web的数据挖掘等常用的机器学习方法和统计技术。数据专题包括数据库中的知识发现处理模型和数据仓库及OLAP技术。评估专题包括利用检验集分类正确率和混淆矩阵,并结合检验集置信区间评估有指导学习模型,使用无指导聚类技术评估有指导模型,利用Lift和假设检验比较两个有指导学习模型,使用MS Excel 2010和经典的假设检验模型评估属性,使用簇质量度量方法和有指导学习技术评估无指导聚类模型。
本书秉承教材风格,强调广度讲解。注重成熟模型和开源工具的使用,以提高学习者的应用能力为目标;注重结合实例和实验,加强基本概念和原理的理解和运用;注重实例的趣味性和生活性,提高学习者学习的积极性。使用章后练习、计算和实验作业巩固和检验所学内容;使用词汇表附录,解释和规范数据挖掘学科专业术语;使用适合教学的简单易用开源的Weka和通用的MS Excel软件工具实施数据挖掘验证和体验数据挖掘的精妙。
本书可作为普通高等院校计算机科学、信息科学、数学和统计学专业的入门教材,也可作为如经济学、管理学、档案学等对数据管理、数据分析与数据挖掘有教学需求的其他相关专业的基础教材。同时,对数据挖掘技术和方法感兴趣,致力于相关方面的研究和应用的其他读者,也可以从本书中获取基本的指导和体验。
本书配有教学幻灯片、大部分章后习题和实验的参考答案以及课程大纲。
- 【作者简介】
-
p>
- 【目录】
-
第1章认识数据挖掘1
1.1数据挖掘的定义1
1.2机器学习2
1.2.1概念学习2
1.2.2归纳学习3
1.2.3有指导的学习4
1.2.4无指导的聚类7
1.3数据查询8
1.4专家系统8
1.5数据挖掘的过程9
1.5.1准备数据10
1.5.2挖掘数据10
1.5.3解释和评估数据10
1.5.4模型应用11
1.6数据挖掘的作用11
1.6.1分类11
1.6.2估计12
1.6.3预测12
1.6.4无指导聚类12
1.6.5关联关系分析13
1.7数据挖掘技术13
1.7.1神经网络14
1.7.2回归分析14
1.7.3关联分析15
1.7.4聚类技术16
1.8数据挖掘的应用16
1.8.1应用领域16
1.8.2成功案例18
1.9Weka数据挖掘软件19
1.9.1Weka简介19
1.9.2使用Weka建立决策树模型22
1.9.3使用Weka进行聚类25
1.9.4使用Weka进行关联分析26
本章小结27
习题28
第2章基本数据挖掘技术30
2.1决策树30
2.1.1决策树算法的一般过程31
2.1.2决策树算法的关键技术32
2.1.3决策树规则40
2.1.4其他决策树算法41
2.1.5决策树小结41
2.2关联规则42
2.2.1关联规则概述42
2.2.2关联分析43
2.2.3关联规则小结46
2.3聚类分析技术47
2.3.1K-means算法48
2.3.2K-means算法小结51
2.4数据挖掘技术的选择51
本章小结52
习题53
第3章数据库中的知识发现55
3.1知识发现的基本过程55
3.1.1KDD过程模型55
3.1.2知识发现软件57
3.1.3KDD过程的参与者58
3.2KDD过程模型的应用58
3.2.1步骤1:商业理解58
3.2.2步骤2:数据理解59
3.2.3步骤3:数据准备60
3.2.4步骤4:建模65
3.2.5评估66
3.2.6部署和采取行动66
3.3实验:KDD案例66
本章小结72
习题73
第4章数据仓库74
4.1数据库与数据仓库74
4.1.1数据(库)模型75
4.1.2规范化与反向规范化77
4.2设计数据仓库79
4.2.1数据抽取、清洗、变换和加载79
4.2.2数据仓库模型82
4.2.3数据集市85
4.2.4决策支持系统86
4.3联机分析处理87
4.3.1概述87
4.3.2实验:使用OLAP辅助驾驶员行为分析90
4.4使用Excel数据透视表和数据透视图分析数据93
4.4.1创建简单数据透视表和透视图93
4.4.2创建多维透视表和透视图97
本章小结100
习题100
第5章评估技术102
5.1数据挖掘评估概述102
5.1.1评估内容102
5.1.2评估工具103
5.2评估有指导学习模型108
5.2.1评估分类类型输出模型108
5.2.2评估数值型输出模型109
5.2.3计算检验集置信区间111
5.2.4无指导聚类技术的评估作用112
5.3比较有指导学习模型112
5.3.1使用Lift比较模型112
5.3.2通过假设检验比较模型114
5.4属性评估115
5.4.1数值型属性的冗余检查115
5.4.2数值属性显著性的假设检验117
5.5评估无指导聚类模型118
本章小结118
习题119
第6章神经网络技术120
6.1神经网络概述120
6.1.1神经网络模型120
6.1.2神经网络的输入和输出数据格式121
6.1.3激励函数123
6.2神经网络训练124
6.2.1反向传播学习124
6.2.2自组织映射的无指导聚类127
6.2.3实验:应用BP算法建立前馈神经网络130
6.3神经网络模型的优势和缺点138
本章小结138
习题139
第7章统计技术141
7.1回归分析141
7.1.1线性回归分析142
7.1.2非线性回归149
7.1.3树回归151
7.2贝叶斯分析152
7.3聚类技术156
7.3.1分层聚类156
7.3.2基于模型的聚类163
7.4数据挖掘中的统计技术与机器学习技术165
本章小结165
习题167
第8章时间序列和基于Web的数据挖掘169
8.1时间序列分析169
8.1.1概述169
8.1.2线性回归分析解决时间序列问题173
8.1.3神经网络技术解决时间序列问题175
8.2基于Web的数据挖掘176
8.2.1概述176
8.2.2Web文本挖掘178
8.2.3Web使用挖掘179
8.3多模型分类技术185
8.3.1装袋技术185
8.3.2推进技术185
本章小结186
习题187
附录A词汇表188
附录B数据挖掘数据集201
参考文献
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价