数据挖掘原理(第2版)
全新正版 极速发货
¥
32.4
5.9折
¥
55
全新
库存3件
作者 (英)马科斯·布拉默
出版社 哈尔滨工业大学出版社
ISBN 9787560386508
出版时间 2021-01
装帧 平装
开本 16开
定价 55元
货号 1202302356
上书时间 2024-11-26
商品详情
品相描述:全新
商品描述
目录 章数据挖掘介绍 1.1数据爆炸 1.2知识发现 1.3数据挖掘的应用 1.4标记和未标记数据 1.5监督学习:分类 1.6监督学习:数值预测 1.7非监督学习:关联规则 1.8非监督学习:聚类 第2章数据挖掘中的数据 2.1标准制定 2.2变量类型 2.3数据准备 2.4缺失值 2.5减少属性数量 2.6数据集的UCI资源库 2.7本章总结 2.8自测题 参考文献 第3章分类简介:朴素贝叶斯与最近邻算法 3.1分类定义 3.2朴素贝叶斯分类器 3.3最近邻分类 3.4迫切和惰性学习 3.5本章总结 3.6自测题 第4章使用决策树进行分类 4.1决策规则和决策树 4.2TDIDT算法 4.3推理的类型 4.4本章总结 4.5自测题 参考文献 第5章决策树归纳:使用熵进行属性选择 5.1属性选择:一个试验 5.2替代决策树 5.3选择要拆分的属性:使用熵 5.4本章总结 5.5自测题 第6章决策树归纳:使用频率表进行属性选择 6.1在实践中计算熵 6.2其他属性选择标准:基尼指数 6.3X2属性选择标准 6.4归纳偏置 6.5使用增益比进行属性选择 6.6不同属性选择标准生成的规则数量 6.7缺少分支 6.8本章总结 6.9自测题 参考文献 第7章评估分类器的预测精度 7.1引言 7.2方法一:训练集和测试集 7.3方法二:k倍交叉验证 7.4方法三:N倍交叉验证 7.5实验结果一 7.6实验结果二:带有缺失值的数据集 7.7混淆矩阵 7.8本章总结 7.9自测题 参考文献 第8章连续型属性 8.1引言 8.2局部与全局离散化 8.3将局部离散化添加到TDIDT 8.4使用ChiMerge算法进行全局离散化 8.5全局和局部离散化树归纳法对比分析 8.6本章总结 8.7自测题 参考文献 第9章避免决策树的过度拟合 9.1处理训练集中的冲突 9.2更多关于规则过拟合的讨论 9.3预剪枝决策树 9.4后剪枝决策树 9.5本章总结 9.6自测题 参考文献 0章更多关于熵的讨论 10.1引言 10.2利用位编码信息 10.3在M个值中进行区分(M不是2的幂) 10.4对不等概率的数值进行编码 10.5训练集的熵 10.6信息增益必须是正值或零值 10.7利用信息增益减少分类任务的特征 10.8本章总结 10.9自测题 参考文献 1章采用模块化分类规则 11.1规则后剪枝 11.2冲突消解 11.3决策树的问题 11.4Prism算法 11.5本章总结 11.6自测题 参考文献 2章评估分类器的性能 12.1真假阳性与真假阴性 12.2性能指标 12.3真假阳性率与预测精度 12.4ROC图 12.5ROC曲线 12.6寻找最佳分类器 12.7本章总结 12.8自测题 3章大规模数据集处理 13.1引言 13.2数据的多处理器分布式处理 13.3情景学习:PMCRI 13.4评估分布式系统PMCRI的有效性 13.5逐步修改分类器 13.6本章总结 13.7自测题 参考文献 4章集成分类 14.1引言 14.2评估分类器性能 14.3为每个分类器选择不同的训练集 14.4为每个分类器选择不同的属性集 14.5合并分类:替代投票系统 14.6并行集成分类器 14.7本章总结 14.8自测题 参考文献 5章分类器性能比较 15.1引言 15.2成对t检验 15.3选择数据集进行比较评估 15.4采样 15.5“没有显著差异”的结果有多糟糕 15.6本章总结 15.7自测题 参考文献 6章关联规则挖掘一 16.1引言 16.2规则兴趣度量 16.3关联规则挖掘任务 16.4找到最好的Ⅳ条规则 16.5本章总结 16.6自测题 参考文献 7章关联规则挖掘二 17.1引言 17.2交易和商品集 17.3对商品集的支持 17.4关联规则 17.5生成关联规则 17.6Apriori算法 17.7生成支持商品集:一个例子 17.8从支持商品集中生成规则 17.9规则兴趣度量:提升度和杠杆率 17.10本章总结 17.11自测题 参考文献 8章关联规则挖掘三:频繁模式树 18.1引言:FP—gmwth 18.2建立FP树 18.3从FP树查找频繁商品集 18.4本章总结 18.5自测题 参考文献 9章聚类 19.1引言 19.2k-means聚类 19.3合成聚类 19.4本章总结 19.5自测题 第20章文本挖掘 20.1多重分类 20.2文本文件的表示方法 20.3词干和停止词 20.4使用信息增益进行特征缩减 20.5文本文档表示:构造向量空间模型 20.6权重归一化 20.7两个向量间距离测量 20.8文本分类器性能测量 20.9超文本分类 20.10本章总结 20.11自测题 附录 附录A涉及的数学知识 附录B数据集 附录C扩展资源 附录D术语和符号 附录E自测题答案 中英文对照表 内容摘要 Principles of Data Mining是数据挖掘领域具有重要影响的国外有名教材之一,原为斯普林格出版社计算机科学本科生系列教材中的一本。在读者的期待中,本书的译本得以出版。从数据集本身特性的探讨,到分类、规则挖掘及聚类等基本方法的阐明,再到数据科学的工程场景的融合,本书可帮助数据挖掘学习者形成清晰的学科观。本书具备如下特色:本书并未依赖数学工具和语言,而是通过对案例的精细剖析向读者传递了具有相当技术深度的内容,是一本对初学者友好并且技术足够有深度的专业基础书籍。本书侧重于数据挖掘技术领域通用原理的讲解,作者对数据挖掘中的分类、关联规则挖掘及聚类等基本问题中的共性原则基于案例进行了深入分析,对于数据技术初学者来说,这部分内容的理解比流行技术介绍有更重要的意义和价值。总之,本书是一部历久弥新的很好数据挖掘教材,既适合数据挖掘初学者探索数据挖掘的趣味,也适合数据挖掘从业者补遗学科知识体系、深入理解学科知识的内涵和外延。
— 没有更多了 —
本店暂时无法向该地区发货
以下为对购买帮助不大的评价