消息首页搜索举报

数据挖掘原理

正版保障假一赔十可开发票

32.96 6.0折 55 全新

库存10件

广东广州

认证卖家担保交易快速发货售后保障

作者[英]Max Bramer

出版社哈尔滨工业大学出版社有限公司

ISBN9787560386508

出版时间2020-11

装帧平装

开本16开

定价55元

货号10849343

上书时间2024-02-10

灵感书店

三年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 10小时
好评率暂无

最新上架

0-3岁育儿宝典 ¥7.66

我是科学家 ¥5.76

花与守梦人(2)-占星师的眼泪 ¥3.83

英语入门:口语零起点图解一看就会 ¥7.47

跟任何人都聊得来 ¥5.74

运输作业实务 ¥7.13

Access数据库程序设计实习实训指南 ¥4.43

药用植物繁育学 ¥6.16

配位聚合二烯烃橡胶 ¥28.89

商品详情

品相描述：全新

商品描述: 目录
第1章  数据挖掘介绍
  1.1  数据爆炸
  1.2  知识发现
  1.3  数据挖掘的应用
  1.4  标记和未标记数据
  1.5  监督学习：分类
  1.6  监督学习：数值预测
  1.7  非监督学习：关联规则
  1.8  非监督学习：聚类
第2章  数据挖掘中的数据
  2.1  标准制定
  2.2  变量类型
  2.3  数据准备
  2.4  缺失值
  2.5  减少属性数量
  2.6  数据集的UCI资源库
  2.7  本章总结
  2.8  自测题
  参考文献
第3章  分类简介：朴素贝叶斯与最近邻算法
  3.1  分类定义
  3.2  朴素贝叶斯分类器
  3.3  最近邻分类
  3.4  迫切和惰性学习
  3.5  本章总结
  3.6  自测题
第4章  使用决策树进行分类
  4.1  决策规则和决策树
  4.2  TDIDT算法
  4.3  推理的类型
  4.4  本章总结
  4.5  自测题
    参考文献
第5章  决策树归纳：使用熵进行属性选择
  5.1  属性选择：一个试验
  5.2  替代决策树
  5.3  选择要拆分的属性：使用熵
  5.4  本章总结
  5.5  自测题
第6章  决策树归纳：使用频率表进行属性选择
  6.1  在实践中计算熵
  6.2  其他属性选择标准：基尼指数
  6.3  X2属性选择标准
  6.4  归纳偏置
  6.5  使用增益比进行属性选择
  6.6  不同属性选择标准生成的规则数量
  6.7  缺少分支
  6.8  本章总结
  6.9  自测题
    参考文献
第7章  评估分类器的预测精度
  7.1  引言
  7.2  方法一：训练集和测试集
  7.3  方法二：k倍交叉验证
  7.4  方法三：N倍交叉验证
  7.5  实验结果一
  7.6  实验结果二：带有缺失值的数据集
  7.7  混淆矩阵
  7.8  本章总结
  7.9  自测题
    参考文献
第8章  连续型属性
  8.1  引言
  8.2  局部与全局离散化
  8.3  将局部离散化添加到TDIDT
  8.4  使用ChiMerge算法进行全局离散化
  8.5  全局和局部离散化树归纳法对比分析
  8.6  本章总结
  8.7  自测题
    参考文献
第9章  避免决策树的过度拟合
  9.1  处理训练集中的冲突
  9.2  更多关于规则过拟合的讨论
  9.3  预剪枝决策树
  9.4  后剪枝决策树
  9.5  本章总结
  9.6  自测题
  参考文献
第10章  更多关于熵的讨论
  10.1  引言
  10.2  利用位编码信息
  10.3  在M个值中进行区分(M不是2的幂)
  10.4  对不等概率的数值进行编码
  10.5  训练集的熵
  10.6  信息增益必须是正值或零值
  10.7  利用信息增益减少分类任务的特征
  10.8  本章总结
  10.9  自测题
  参考文献
第11章  采用模块化分类规则
  11.1  规则后剪枝
  11.2  冲突消解
  11.3  决策树的问题
  11.4  Prism算法
  11.5  本章总结
  11.6  自测题
    参考文献
第12章  评估分类器的性能
  12.1  真假阳性与真假阴性
  12.2  性能指标
  12.3  真假阳性率与预测精度
  12.4  ROC图
  12.5  ROC曲线
  12.6  寻找最佳分类器
  12.7  本章总结
  12.8  自测题
第13章  大规模数据集处理
  13.1  引言
  13.2  数据的多处理器分布式处理
  13.3  情景学习：PMCRI
  13.4  评估分布式系统PMCRI的有效性
  13.5  逐步修改分类器
  13.6  本章总结
  13.7  自测题
    参考文献
第14章  集成分类
  14.1  引言
  14.2  评估分类器性能
  14.3  为每个分类器选择不同的训练集
  14.4  为每个分类器选择不同的属性集
  14.5  合并分类：替代投票系统
  14.6  并行集成分类器
  14.7  本章总结
  14.8  自测题
    参考文献
第15章  分类器性能比较
  15.1  引言
  15.2  成对t检验
  15.3  选择数据集进行比较评估
  15.4  采样
  15.5  “没有显著差异”的结果有多糟糕
  15.6  本章总结
  15.7  自测题
    参考文献
第16章  关联规则挖掘一
  16.1  引言
  16.2  规则兴趣度量
  16.3  关联规则挖掘任务
  16.4  找到最好的Ⅳ条规则
  16.5  本章总结
  16.6  自测题
    参考文献
第17章  关联规则挖掘二
  17.1  引言
  17.2  交易和商品集
  17.3  对商品集的支持
  17.4  关联规则
  17.5  生成关联规则
  17.6  Apriori算法
  17.7  生成支持商品集：一个例子
  17.8  从支持商品集中生成规则
  17.9  规则兴趣度量：提升度和杠杆率
  17.10  本章总结
  17.11  自测题
    参考文献
第18章  关联规则挖掘三：频繁模式树
  18.1  引言：FP—gmwth
  18.2  建立FP树
  18.3  从FP树查找频繁商品集
  18.4  本章总结
  18.5  自测题
    参考文献
第19章  聚类
  19.1  引言
  19.2  k-means聚类
  19.3  合成聚类
  19.4  本章总结
  19.5  自测题
第20章  文本挖掘
  20.1  多重分类
  20.2  文本文件的表示方法
  20.3  词干和停止词
  20.4  使用信息增益进行特征缩减
  20.5  文本文档表示：构造向量空间模型
  20.6  权重归一化
  20.7  两个向量间距离测量
  20.8  文本分类器性能测量
  20.9  超文本分类
  20.10  本章总结
  20.11  自测题
附录
  附录A  涉及的数学知识
  附录B  数据集
  附录C  扩展资源
  附录D  术语和符号
  附录E  自测题答案
中英文对照表

内容摘要

第1章数据挖掘介绍
1-1数据爆炸  现代计算机系统以几乎无法想象的速度从各种各样的来源积累数据：商业街记录交易记录的售卖机；银行提现和信用卡交易记录；太空中的地球观测卫星；信息量不断增长的互联网。
下面的一些示例将用于指示所涉及的数据量(当读者阅读本书时，其中一些数字已大幅增加)：
(1)目前的NASA地球观测卫星每天产生l T字节的数据。这超过了以前所有观测卫星传输的总数据量。
(2)人类基因项目用数千字节存储每个遗传基因，基因总量有数十亿个。
(3)许多公司维护大型客户交易数据仓库。一个相当小的数据仓库可能包含超过一亿交易。
(4)每天在自动记录设备上记录大量数据，例如信用卡交易文件和网络日志，以及CCTV录音等非符号数据。
(5)估计有超过6．5亿个网站，其中一些非常大。
(6)Facebook拥有超过9亿用户(仍在快速增长中)，估计每天有30亿个帖子。
(7)据估计，Twitter有大约1．5亿用户，每天发送3．5亿条推文。
随着存储技术的进步，无论是在商业数据仓库、科研实验室还是其他地方，越来越多地以相对较低的成本存储大量数据，人们越来越认识到这些数据所包含的知识对公司的成长或衰退至关重要。知识可以导致科学上的重要发现，可以使我们准确地预测天气和自然灾害，可以使我们确定致命疾病的原因和可能的治疗方法，知识可能意味着生与死的区别。
然而，海量数据中的大部分数据仅仅被存储，甚至没有用最简单的方法进行分析和挖掘。可以说，世界正变得“数据丰富但知识贫乏”。而机器学习技术有可能解决围绕组织、政府和个人的数据浪潮问题。......

精彩内容
Principles of Data Mining是数据挖掘领域具有重要影响的国外著名教材之一，原为斯普林格出版社计算机科学本科生系列教材中的一本。在读者的期待中，本书的译本得以出版。从数据集本身特性的探讨，到分类、规则挖掘及聚类等基本方法的阐明，再到数据科学的工程场景的融合，本书可帮助数据挖掘学习者形成清晰的学科观。
    本书具备如下特色：
    本书并未依赖数学工具和语言，而是通过对案例的精细剖析向读者传递了具有相当技术深度的内容，是一本对初学者友好并且技术足够有深度的专业基础书籍。
    本书侧重于数据挖掘技术领域通用原理的讲解，作者对数据挖掘中的分类、关联规则挖掘及聚类等基本问题中的共性原则基于案例进行了深入分析，对于数据技术初学者来说，这部分内容的理解比流行技术介绍有更重要的意义和价值。
    总之，本书是一部历久弥新的优秀数据挖掘教材，既适合数据挖掘初学者探索数据挖掘的趣味，也适合数据挖掘从业者补遗学科知识体系、深入理解学科知识的内涵和外延。

— 没有更多了 —

数据挖掘原理

灵感书店

商品详情

相关推荐