数据挖掘(第2版)
¥
48.42
7.1折
¥
68
九品
仅1件
作者蒋盛益
出版社电子工业出版社
出版时间2023-02
版次1
装帧其他
货号A9
上书时间2024-12-09
商品详情
- 品相描述:九品
图书标准信息
-
作者
蒋盛益
-
出版社
电子工业出版社
-
出版时间
2023-02
-
版次
1
-
ISBN
9787121450778
-
定价
68.00元
-
装帧
其他
-
开本
16开
-
页数
324页
-
字数
518千字
- 【内容简介】
-
本书内容分为数据挖掘理论和数据挖掘实践两部分。数据挖掘理论部分主要包括数据挖掘的基本概念、数据预处理、聚类分析、分类与回归、关联规则挖掘及离群点检测。数据挖掘实践部分讨论数据挖掘在文本挖掘和金融领域中的应用,通过虚假新闻检测和社交平台情绪分析等案例,展示数据挖掘在文本挖掘方面的应用;通过潜在贷款客户挖掘、贷款违约等案例展示数据挖掘在金融领域的应用。 本书可作为高等学校计算机、数据科学与大数据、电子商务、信息科学等相关专业的教材或参考书,也可供从事数据挖掘研究的科研、技术人员参考。
- 【作者简介】
-
蒋盛益,教授、博士,硕士生导师;广东省\"千百十\"工程省级培养对象,广东外语外贸大学教学名师。中国计算机学会高级会员,中国计算机学会中文信息技术专委会委员,中国中文信息学会计算语言学专业委员会委员、社会媒体处理专委会委员,人工智能学会机器学习专委会委员,广东省计算机学会常务理事;广州市计算机学会常务理事;第十、十一届广东省政协委员。先后在湖南师范大学、中南工业大学、华中科技大学毕业,分别获理学学士学位、理学硕士学位、工学博士学位。目前重点研究方向是利用自然语言处理、社会网络分析技术来处理网络新闻和社交媒体中的数据,包括新闻观点自动提取、对特定事件的立场(支持还是反对)分析、舆情传播模式研究、用户影响力分析等。应用背景包括国内外舆情分析、海上丝绸之路的情报分析。
- 【目录】
-
目 录
上篇 理论篇
第1章 绪论2
1.1 数据挖掘技术使用背景4
1.2 数据挖掘任务及过程5
1.2.1 数据挖掘定义5
1.2.2 数据挖掘任务5
1.2.3 数据挖掘过程7
1.2.4 数据挖掘对象8
1.2.5 数据挖掘工具及其选择13
1.3 数据挖掘应用13
1.3.1 数据挖掘在计算机领域中的应用14
1.3.2 数据挖掘在商业领域中的应用15
1.3.3 数据挖掘在其他领域中的应用16
1.3.4 数据挖掘技术的前景17
1.4 数据挖掘与隐私保护18
本章小结20
习题120
第2章 数据处理基础23
2.1 数据24
2.1.1 数据及数据类型24
2.1.2 数据集的类型25
2.2 数据探索27
2.2.1 描述性统计分析27
2.2.2 数据可视化30
2.2.3 辛普森悖论34
2.3 数据预处理37
2.3.1 数据清理38
2.3.2 数据集成41
2.3.3 特征变换41
2.3.4 数据归约48
2.4 相似性度量55
2.4.1 属性之间的相似性度量56
2.4.2 对象之间的相似性度量57
本章小结60
习题261
第3章 分类和回归65
3.1 分类概述66
3.2 决策树分类方法67
3.2.1 决策树的基本概念67
3.2.2 构建决策树的要素68
3.2.3 Hunt算法73
3.2.4 C4.5算法74
3.2.5 CART算法79
3.2.6 决策树算法的特点90
3.3 贝叶斯分类方法90
3.3.1 贝叶斯定理91
3.3.2 朴素贝叶斯分类算法92
3.3.3 贝叶斯信念网络96
3.4 k-最近邻分类方法97
3.4.1 k-最近邻分类的基本问题98
3.4.2 k-最近邻分类算法描述98
3.4.3 k-最近邻分类算法的优缺点100
3.5 神经网络分类方法100
3.5.1 人工神经网络的基本概念100
3.5.2 典型神经网络模型介绍102
3.5.3 神经网络的特点103
3.5.4 深度网络和深度学习算法104
3.6 支持向量机105
3.7 集成分类方法107
3.8 分类问题拓展113
3.8.1 不平衡分类问题113
3.8.2 半监督学习115
3.8.3 单类分类115
3.8.4 多标签分类115
3.8.5 层次分类115
3.9 分类模型的评价116
3.9.1 分类模型性能评价指标116
3.9.2 分类模型的过度拟合117
3.9.3 评估分类模型性能的方法117
3.10 综合案例:信用风险分析118
3.11 回归分析121
3.11.1 多元线性回归模型122
3.11.2 非线性回归125
3.11.3 逻辑回归127
本章小结131
习题3131
第4章 聚类分析137
4.1 聚类分析概述138
4.2 k-means算法及其改进141
4.2.1 基本k-means算法141
4.2.2 k-means聚类算法的拓展145
4.3 层次聚类算法150
4.3.1 二分k-means算法151
4.3.2 BIRCH算法152
4.3.3 CURE算法154
4.3.4 ROCK算法155
4.4 基于密度的聚类算法157
4.5 基于图的聚类算法160
4.5.1 Chameleon聚类算法160
4.5.2 基于SNN的聚类算法165
4.6 一趟聚类算法167
4.6.1 阈值选择167
4.6.2 算法应用171
4.7 基于模型的聚类算法172
4.7.1 期望最大化方法172
4.7.2 概念聚类172
4.7.3 SOM方法174
4.8 聚类算法评价176
4.9 综合案例:航空公司客户价值分析178
本章小结184
习题4184
第5章 关联分析187
5.1 关联分析概述188
5.2 关联规则分析基础188
5.2.1 基本概念188
5.2.2 基础分析方法190
5.3 Apriori算法192
5.3.1 Apriori性质192
5.3.2 产生频繁项集193
5.3.3 频繁项集构造示例194
5.3.4 产生关联规则195
5.3.5 规则的评估标准198
5.3.6 Apriori算法评价201
5.4 FP-Growth算法201
5.4.1 FP-tree表示法201
5.4.2 构建FP-tree202
5.4.3 发现频繁项集204
5.5 关联规则扩展205
5.5.1 关联规则分类205
5.5.2 多层次关联规则206
5.5.3 多维度关联规则207
5.5.4 定量关联规则208
5.5.5 基于约束的关联规则208
5.5.6 序列模式挖掘208
5.6 综合案例:移动业务关联分析209
5.6.1 数据准备209
5.6.2 数据预处理209
5.6.3 关联规则挖掘过程211
5.6.4 规则的优化214
5.6.5 模型的应用215
本章小结216
习题5216
第6章 离群点挖掘220
6.1 离群点挖掘概述221
6.2 基于统计的方法222
6.3 基于距离的方法224
6.4 基于相对密度的方法226
6.5 基于聚类的方法231
6.5.1 基于对象的离群因子方法231
6.5.2 基于簇的离群因子方法234
6.5.3 基于聚类的动态数据离群点检测方法236
6.6 离群点挖掘方法的评估237
6.7 综合案例237
6.7.1 离群点检测在癌症诊断中的应用237
6.7.2 离群点检测在网络入侵检测中的应用239
本章小结242
习题6242
下篇 实践篇
第7章 文本挖掘246
7.1 文本挖掘概述247
7.1.1 分词247
7.1.2 文本表示与词权重计算250
7.1.3 文本特征选择252
7.1.4 文本分类253
7.1.5 文本聚类256
7.1.6 文档自动摘要258
7.1.7 文本情感分析262
7.1.8 用户画像265
7.2 案例分析269
7.2.1 虚假新闻检测案例269
7.2.2 社交平台情感分类277
本章小结283
第8章 数据挖掘的金融应用285
8.1 数据挖掘在金融领域中的应用概述287
8.1.1 金融科技287
8.1.2 金融领域中的数据挖掘应用289
8.2 银行潜在贷款客户挖掘295
8.2.1 业务理解295
8.2.2 数据理解与数据准备296
8.2.3 模型构建与评估299
8.3 贷款违约301
本章小结305
附录A 数据挖掘常用资源列表307
参考文献308
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价