大数据处理方法与电信客户价值管理
全新正版 假一赔十 可开发票
¥
45.2
6.6折
¥
69
全新
库存4件
作者邓维斌,胡峰,刘进
出版社电子工业出版社
ISBN9787121394560
出版时间2020-08
装帧平装
开本16开
定价69元
货号1202128661
上书时间2024-12-13
商品详情
- 品相描述:全新
- 商品描述
-
目录
章 大数据处理概述1
1.1 大数据的定义1
1.2 大数据带来的挑战与机遇3
1.3 大数据研究的现状5
1.3.1 大数据处理平台5
1.3.2 大数据处理算法6
1.3.3 大数据应用研究9
1.4 大数据研究的挑战与趋势10
1.5 本章小结11
参考文献12
第2章 Spark点排序识别聚类结构算法19
2.1 引言19
2.2 点排序识别聚类结构算法21
2.3 Spark并行内存计算框架23
2.4 基于Spark的OPTICS算法25
2.5 仿真实验与结果分析27
2.5.1 度量标准27
2.5.2 数据集与运行环境28
2.5.3 实验方法29
2.5.4 实验结果与分析29
2.6 本章小结32
参考文献33
第3章 Spark标签校准排序多标签算法35
3.1 引言35
3.2 校准标签排序算法与并行化研究36
3.2.1 校准标签排序算法介绍36
3.2.2 校准标签排序算法研究现状37
3.3 朴素贝叶斯校准标签排序方法37
3.3.1 朴素贝叶斯概率模型37
3.3.2 朴素贝叶斯校准标签排序算法38
3.3.3 仿真实验与结果分析40
3.4 朴素贝叶斯校准标签排序方法的并行化研究44
3.4.1 Spark并行化内存计算44
3.4.2 朴素贝叶斯校准标签排序算法的并行化研究45
3.4.3 仿真实验与结果分析47
3.5 本章小结51
参考文献52
第4章 不平衡数据的样本权重欠采样方法54
4.1 引言54
4.2 不平衡数据处理的相关方法55
4.2.1 K-means聚类算法55
4.2.2 AdaCost算法56
4.2.3 Bagging算法58
4.3 基于样本权重的欠采样方法59
4.3.1 样本权重的确定59
4.3.2 分类器加权投票60
4.4 仿真实验与结果分析61
4.4.1 分类的评价方法61
4.4.2 非参数统计检验方法62
4.4.3 UCI数据集检验63
4.5 本章小结67
参考文献68
第5章 不平衡数据的三支决策过采样算法70
5.1 引言70
5.2 三支决策粗糙集71
5.2.1 邻域模型71
5.2.2 邻域三支决策模型71
5.3 不平衡数据的三支决策过采样算法74
5.3.1 算法思路74
5.3.2 算法描述与分析76
5.4 仿真实验与结果分析77
5.4.1 数据集选择77
5.4.2 实验方法78
5.4.3 实验结果分析79
5.5 本章小结84
参考文献84
第6章 三支决策主动学习方法87
6.1 引言87
6.2 主动学习理论88
6.2.1 主动学习工作机制88
6.2.2 主动学习方法的分类88
6.3 三支决策主动学习89
6.3.1 对冗余信息的删减89
6.3.2 对无标签样本的区域划分90
6.3.3 对不同区域样本的处理91
6.3.4 算法描述92
6.4 仿真实验与结果分析95
6.4.1 数据集选择95
6.4.2 实验方法95
6.4.3 实验结果分析96
6.5 本章小结100
参考文献100
第7章 邻域粗糙集主动学习方法104
7.1 引言104
7.2 邻域粗糙集基本理论104
7.3 邻域粗糙集主动学习算法106
7.3.1 算法思路106
7.3.2 算法描述109
7.4 仿真实验与结果分析110
7.4.1 数据集与实验方法110
7.4.2 结果与分析111
7.5 本章小结117
参考文献118
第8章 决策熵增量学习方法120
8.1 引言120
8.2 粗糙集的基本概念121
8.3 决策熵增量知识获取算法123
8.3.1 算法复杂度分析126
8.3.2 实例分析126
8.4 仿真实验与结果分析128
8.4.1 UCI数据集测试128
8.4.2 KDDCUP99数据集测试130
8.4.3 KDDCUP99数据集连续增量测试130
8.5 本章小结131
参考文献131
第9章 MapReduce并行增量FP-Growth算法133
9.1 引言133
9.2 MapReduce编程模型与Hadoop平台135
9.2.1 MapReduce编程模型135
9.2.1 Hadoop平台介绍136
9.3 MapReduce增量FP-Growth算法138
9.3.1 增量学习138
9.3.2 FP-Growth算法139
9.3.3 MapReduce并行FP-Growth算法140
9.3.4 MapReduce并行增量FP-Growth算法141
9.4 仿真实验与结果分析143
9.4.1 MapReduce并行增量FP-Growth算法单机效率测试143
9.4.2 MapReduce并行增量FP-Growth算法集群效率测试143
9.4.3 Mapreduce并行增量FP-Growth算法性能测试146
9.5 本章小结149
参考文献149
0章 电信客户价值评价151
10.1 引言151
10.2 客户价值与评价152
10.2.1 客户价值的概念152
10.2.2 电信客户价值与评价153
10.3 优势关系粗糙集的基本概念155
10.4 领域及数据驱动的数据挖掘模型156
10.4.1 数据驱动的数据挖掘156
10.4.2 领域驱动的数据挖掘157
10.4.3 面向领域的数据驱动的数据挖掘158
10.5 领域及数据驱动的电信客户价值评价方法159
10.5.1 电信客户价值评价的特征提取159
10.5.2 电信客户价值评价流程161
10.5.3 电信客户价值评价算法162
10.6 仿真实验163
10.6.1 算法效果验证163
10.6.2 算法应用165
10.7 本章小结167
参考文献167
1章 电信客户换机预测171
11.1 引言171
11.2 优势关系粗糙集换机预测方法172
11.2.1 算法描述172
11.2.2 仿真实验174
11.3 数据驱动的电信客户换机预测方法179
11.3.1 手机客户特征提取179
11.3.2 算法描述180
11.3.3 仿真实验182
11.4 本章小结185
参考文献186
2章 电信客户流失预测188
12.1 引言188
12.2 C4.5决策树及其改进算法189
12.2.1 C4.5决策树189
12.2.2 改进C4.5决策树算法190
12.3 改进C4.5决策树不平衡数据抽样方法191
12.3.1 算法思路191
12.3.2 算法描述192
12.4 实验与结果分析193
12.4.1 电信客户流失预测流程194
12.4.2 实验数据选择195
12.2.3 实验结果与分析196
12.5 本章小结198
参考文献198
内容摘要
近年来,大数据已在公共管理、医疗卫生、金融与商务等领域得到了广泛应用。如何对海量和高速增长的数据进行有效处理以及如何针对不同领域特点有效应用大数据,倍受广大科研工作者的广泛关注。本书集结了作者近年来在大数据及其应用领域的研究成果,针对大数据高效处理问题,从点排序识别聚类、多标签排序、不平衡数据采样、主动学习、增量学习等方面研究并设计了相关算法。在此基础上,对大数据环境下电信客户价值评价、客户换机预测和客户流失预测等问题,设计了相关算法、流程和仿真实验,并提出了一些合理化的建议,为大数据分析与在相关行业的应用提供了参考。
— 没有更多了 —
以下为对购买帮助不大的评价