数据挖掘(第2版)
¥
55.44
6.3折
¥
88
全新
库存9件
作者王朝霞
出版社电子工业出版社
出版时间2023-05
版次01
装帧其他
货号607 11-6
上书时间2024-11-06
商品详情
- 品相描述:全新
图书标准信息
-
作者
王朝霞
-
出版社
电子工业出版社
-
出版时间
2023-05
-
版次
01
-
ISBN
9787121455025
-
定价
88.00元
-
装帧
其他
-
开本
16开
-
页数
308页
-
字数
480千字
- 【内容简介】
-
本书是数据挖掘的第2版,系统地介绍了数据挖掘的理论、方法与应用,包括数据特征分析及预处理、经典数据挖掘算法(分类、回归、聚类、关联规则和集成学等)、大数据新常态下催生的数据分析方法(系统、分析与网页排序、互联网信息抽取、志挖掘与查询分析等)理论与方法。在此基础上,除章外,每章均有基于python语言的实例应用。
- 【作者简介】
-
刘鹏:教授,清华大学博士,云创大数据科技股份有限公司裁,中国大数据应用联盟人工智能专家委员会主任,中国信息协会教育分会人工智能教育专家委员会主任,普通高校生业创业指导委员会委员,第45届世界技能大赛中国区云计算选拔赛裁判长/专家指导组组长,2019年大数据建模比赛命题人,云计算研究中心专家。在云计算、大数据、人工智能领域具有多年的研究积累,是我国该领域的知名专家。主持科研项目40多项,发表80余篇,出版专业书籍30多种。曾于2002年获得全球数据处理比赛pennyort的世界,于2003年夺得挑战杯比赛。提出的反垃圾邮件网格,被ieee cluter 2003评为杰出网格项目,为解决困扰全球的垃圾邮件问题做出根本贡献,该技术成为云安全技术的基础。曾担任全军网格技术研究中心主任,获“全军十大学成才标兵”()、市“十大杰出青年”、“中国大数据创新百人”、江苏省“333工程”中青年领才、清华大学“学术新秀”等称号。
- 【目录】
-
章绪论1
1.1数据挖掘的基本概念1
1.1.1数据挖掘的概念1
1.1.2大数据环境下的数据挖掘2
1.1.3数据挖掘的特3
1.1.4数据挖掘的任务和功能3
1.1.5数据挖掘的对象4
1.1.6数据挖掘的过程5
1.2数据挖掘的起源及发展6
1.3数据挖掘的常用工具9
1.3.1商用工具9
1.3.2开源工具10
1.4数据挖掘的应用12
题15
参文献16
第2章数据特征分析及预处理17
2.1数据类型17
2.1.1属与度量17
2.1.2数据集的类型18
2.2数据特征分析19
2.2.1描述数据集中趋势的度量19
2.2.2描述数据离散程度的度量21
2.2.3数据相关分析24
2.3数据预处理28
2.3.1数据清洗28
2.3.2数据集成34
2.3.3数据规范化34
2.3.4数据规约38
2.3.5数据离散化45
2.4数据的相似47
2.4.1数值属的相似度量47
2.4.2标称属的相似度量49
2.4.3组合异种属的相似度量50
2.4.4文本的相似度量52
2.4.5离散序列的相似度量53
题55
参文献56
第3章分类57
3.1分类概述58
3.1.1分类的基本概念58
3.1.2分类的过程58
3.1.3分类器能的评估方法59
3.2决策树61
3.2.1决策树的基本概念62
3.2.2决策树的用途和特62
3.2.3决策树的工作63
3.2.4决策树的构建步骤64
3.2.5决策树算法65
3.3贝叶斯分类76
3.3.1贝叶斯定理76
3.3.2朴素贝叶斯分类77
3.3.3贝叶斯分析80
3.3.4贝叶斯决策80
3.3.5贝叶斯估计81
3.4支持向量机81
3.4.1支持向量机的主要思想82
3.4.2支持向量机的基础理论82
3.4.3支持向量机的87
3.5实战:python支持向量机分类92
题95
参文献95
第4章回归98
4.1回归的基本概念99
4.1.1回归分析的定义99
4.1.2回归分析的步骤99
4.1.3回归分析要注意的问题100
4.2一元回归分析100
4.2.1一元回归分析的模型设定100
4.2.2回归参数的小二乘估计102
4.2.3基本设下ols估计的统计质104
4.2.4误差方差估计105
4.2.5回归系数检验(t检验)106
4.2.6拟合优度和模型检验(f检验)107
4.3多元线回归分析108
4.3.1多元线回归模型108
4.3.2多元线回归模型的定110
4.3.3多元线回归模型的参数估计110
4.3.4显著检验112
4.3.5回归变量的选择与逐步回归114
4.4逻辑回归分析116
4.4.1逻辑回归模型116
4.4.2logit变换117
4.4.3估计回归系数118
4.4.4logistic分布118
4.4.5列联表的logistic回归模型119
4.5其他回归分析120
4.5.1多项式回归120
4.5.2逐步回归120
4.5.3岭回归120
4.5.4套索回归121
4.5.5弹网络122
4.6实战:获得优选时的药物用量122
题127
参文献128
第5章聚类129
5.1聚类基本概念129
5.2划分聚类方法131
5.2.1k-均算法132
5.2.2k-中心点算法134
5.3层次聚类方法137
5.3.1层次聚类方法的分类137
5.3.2birch算法141
5.4密度聚类方法144
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价