数据挖掘
正版新书 新华官方库房直发 可开电子发票
¥
37.71
6.5折
¥
58
全新
库存3件
作者王朝霞 主编
出版社电子工业出版社
ISBN9787121335310
出版时间2018-03
版次1
装帧平装
开本16开
纸张胶版纸
页数330页
字数529千字
定价58元
货号SC:9787121335310
上书时间2024-12-03
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
作者简介:
刘鹏,解放军理工大学教授、博士生导师、学科带头人,清华大学博士。现任中国云计算专家咨询委员会秘书长、中国信息协会大数据分会副会长、中国电子学会云计算专家委员会云存储组组长、工信部云计算研究中心专家、江苏省云计算论坛。主持完成科研项目25项,发表论文80余篇,出版专业书籍18本。获部级科技进步二等奖4项,三等奖4项。获“全军十大学习成才标兵”、“南京市十大杰出青年”、清华大学“学术新秀”等称号。主编的《云计算》教材为全国销量优选的云计算书籍,被数百家高校用作教材,创办的中国云计算和中国大数据网站分别为云计算和大数据领域很知名的网站。
内容简介:
中国大数据专家委员会刘鹏教授联合全国上百家高校从事一线教学科研任务的教师,一起编撰不错大数据人才培养从书。本书是丛书之一,其定位是大数据挖掘技术与应用。本书系统地介绍了数据挖掘算法理论与方法、工具和应用,包括经典数据挖掘算法,大数据环境下常用数据挖掘算法的优化,大数据新常态下催生的数据分析方法(如推荐系统、链接分析与网页排序、互联网信息抽取、日志挖掘与查询分析)、工具与应用。本书适合作为相关专业本科和研究生教材。高职高专学校也可以选用部分内容开展教学。本书也很适合作为大数据分析研发人员的自学书籍。
目录:
第1章绪论1
1.1数据挖掘基本概念1
1.1.1数据挖掘的概念1
1.1.2大数据环境下的数据挖掘2
1.1.3数据挖掘的特性3
1.1.4数据挖掘的过程3
1.2数据挖掘起源及发展历史4
1.3数据挖掘常用工具7
1.3.1商用工具7
1.3.2开源工具8
1.4数据挖掘应用场景10
习题12
参考文献13
第2章数据预处理与相似性14
2.1数据类型14
2.1.1属性与度量14
2.1.2数据集的类型15
2.2数据预处理16
2.2.1数据清理16
2.2.2数据集成18
2.2.3数据规范化19
2.2.4数据约简20
2.2.5数据离散化22
2.3数据的相似性23
2.3.1数值属性的相似性度量23
2.3.2标称属性的相似性度量26
2.3.3组合异种属性的相似性度量27
2.3.4文档相似性度量28
2.3.5离散序列相似性度量30
习题31
参考文献32
第3章分类33
3.1分类的基本概念、分类过程及分类器性能的评估33
3.1.1分类的基本概念33
3.1.2分类的过程33
3.1.3分类器性能的评估方法34
3.2决策树
……
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价