消息首页搜索举报

数据挖掘原理(第2版) 9787560386508

可开发票，支持7天无理由

36 6.5折 55 全新

库存3件

天津西青

认证卖家担保交易快速发货售后保障

作者(英)马科斯·布拉默

出版社哈尔滨工业大学出版社

ISBN9787560386508

出版时间2021-01

装帧平装

开本16开

定价55元

货号1202302356

上书时间2024-01-28

果然是好书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

朋友圈的人际高手:快速找到你想找的任何人 9787559420923 ¥9.44

国家坐骑 9787546815596 ¥7.18

海洋的边缘 9787568253512 ¥7.18

会计综合实训(会计类图解版职业教育精品规划教材) 9787568250740 ¥3.35

30个影响一生的经典心理实验 9787515822167 ¥18.60

关于饕餮的故事梗概 9787506867368 ¥10.25

GB/T 34000-2016《中国造船质量标准》宣贯教材 9787506686778 ¥8.53

中国食品工业标准汇编:速冻米面食品卷 9787506688765 ¥22.90

思想道德修养与法律基础练习册 9787568254038 ¥7.28

商品详情

品相描述：全新

商品描述: 目录
章数据挖掘介绍

1.1数据爆炸

1.2知识发现

1.3数据挖掘的应用

1.4标记和未标记数据

1.5监督学习：分类

1.6监督学习：数值预测

1.7非监督学习：关联规则

1.8非监督学习：聚类

第2章数据挖掘中的数据

2.1标准制定

2.2变量类型

2.3数据准备

2.4缺失值

2.5减少属性数量

2.6数据集的UCI资源库

2.7本章总结

2.8自测题

参考文献

第3章分类简介：朴素贝叶斯与最近邻算法

3.1分类定义

3.2朴素贝叶斯分类器

3.3最近邻分类

3.4迫切和惰性学习

3.5本章总结

3.6自测题

第4章使用决策树进行分类

4.1决策规则和决策树

4.2TDIDT算法

4.3推理的类型

4.4本章总结

4.5自测题

参考文献

第5章决策树归纳：使用熵进行属性选择

5.1属性选择：一个试验

5.2替代决策树

5.3选择要拆分的属性：使用熵

5.4本章总结

5.5自测题

第6章决策树归纳：使用频率表进行属性选择

6.1在实践中计算熵

6.2其他属性选择标准：基尼指数

6.3X2属性选择标准

6.4归纳偏置

6.5使用增益比进行属性选择

6.6不同属性选择标准生成的规则数量

6.7缺少分支

6.8本章总结

6.9自测题

参考文献

第7章评估分类器的预测精度

7.1引言

7.2方法一：训练集和测试集

7.3方法二：k倍交叉验证

7.4方法三：N倍交叉验证

7.5实验结果一

7.6实验结果二：带有缺失值的数据集

7.7混淆矩阵

7.8本章总结

7.9自测题

参考文献

第8章连续型属性

8.1引言

8.2局部与全局离散化

8.3将局部离散化添加到TDIDT

8.4使用ChiMerge算法进行全局离散化

8.5全局和局部离散化树归纳法对比分析

8.6本章总结

8.7自测题

参考文献

第9章避免决策树的过度拟合

9.1处理训练集中的冲突

9.2更多关于规则过拟合的讨论

9.3预剪枝决策树

9.4后剪枝决策树

9.5本章总结

9.6自测题

参考文献

0章更多关于熵的讨论

10.1引言

10.2利用位编码信息

10.3在M个值中进行区分(M不是2的幂)

10.4对不等概率的数值进行编码

10.5训练集的熵

10.6信息增益必须是正值或零值

10.7利用信息增益减少分类任务的特征

10.8本章总结

10.9自测题

参考文献

1章采用模块化分类规则

11.1规则后剪枝

11.2冲突消解

11.3决策树的问题

11.4Prism算法

11.5本章总结

11.6自测题

参考文献

2章评估分类器的性能

12.1真假阳性与真假阴性

12.2性能指标

12.3真假阳性率与预测精度

12.4ROC图

12.5ROC曲线

12.6寻找最佳分类器

12.7本章总结

12.8自测题

3章大规模数据集处理

13.1引言

13.2数据的多处理器分布式处理

13.3情景学习：PMCRI

13.4评估分布式系统PMCRI的有效性

13.5逐步修改分类器

13.6本章总结

13.7自测题

参考文献

4章集成分类

14.1引言

14.2评估分类器性能

14.3为每个分类器选择不同的训练集

14.4为每个分类器选择不同的属性集

14.5合并分类：替代投票系统

14.6并行集成分类器

14.7本章总结

14.8自测题

参考文献

5章分类器性能比较

15.1引言

15.2成对t检验

15.3选择数据集进行比较评估

15.4采样

15.5“没有显著差异”的结果有多糟糕

15.6本章总结

15.7自测题

参考文献

6章关联规则挖掘一

16.1引言

16.2规则兴趣度量

16.3关联规则挖掘任务

16.4找到最好的Ⅳ条规则

16.5本章总结

16.6自测题

参考文献

7章关联规则挖掘二

17.1引言

17.2交易和商品集

17.3对商品集的支持

17.4关联规则

17.5生成关联规则

17.6Apriori算法

17.7生成支持商品集：一个例子

17.8从支持商品集中生成规则

17.9规则兴趣度量：提升度和杠杆率

17.10本章总结

17.11自测题

参考文献

8章关联规则挖掘三：频繁模式树

18.1引言：FP—gmwth

18.2建立FP树

18.3从FP树查找频繁商品集

18.4本章总结

18.5自测题

参考文献

9章聚类

19.1引言

19.2k-means聚类

19.3合成聚类

19.4本章总结

19.5自测题

第20章文本挖掘

20.1多重分类

20.2文本文件的表示方法

20.3词干和停止词

20.4使用信息增益进行特征缩减

20.5文本文档表示：构造向量空间模型

20.6权重归一化

20.7两个向量间距离测量

20.8文本分类器性能测量

20.9超文本分类

20.10本章总结

20.11自测题

附录

附录A涉及的数学知识

附录B数据集

附录C扩展资源

附录D术语和符号

附录E自测题答案

中英文对照表

内容摘要
Principles of Data Mining是数据挖掘领域具有重要影响的国外有名教材之一，原为斯普林格出版社计算机科学本科生系列教材中的一本。在读者的期待中，本书的译本得以出版。从数据集本身特性的探讨，到分类、规则挖掘及聚类等基本方法的阐明，再到数据科学的工程场景的融合，本书可帮助数据挖掘学习者形成清晰的学科观。本书具备如下特色：本书并未依赖数学工具和语言，而是通过对案例的精细剖析向读者传递了具有相当技术深度的内容，是一本对初学者友好并且技术足够有深度的专业基础书籍。本书侧重于数据挖掘技术领域通用原理的讲解，作者对数据挖掘中的分类、关联规则挖掘及聚类等基本问题中的共性原则基于案例进行了深入分析，对于数据技术初学者来说，这部分内容的理解比流行技术介绍有更重要的意义和价值。总之，本书是一部历久弥新的很好数据挖掘教材，既适合数据挖掘初学者探索数据挖掘的趣味，也适合数据挖掘从业者补遗学科知识体系、深入理解学科知识的内涵和外延。

— 没有更多了 —