• 数据分析与数据挖掘
21年品牌 40万+商家 超1.5亿件商品

数据分析与数据挖掘

①全新正版,现货速发,7天无理由退换货②天津、成都、无锡、广东等多仓就近发货,订单最迟48小时内发出③无法指定快递④可开电子发票,不清楚的请咨询客服。

63.12 7.1折 89 全新

仅1件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者编者:姜维|责编:石会敏

出版社电子工业

ISBN9787121447433

出版时间2023-01

装帧平装

开本其他

定价89元

货号31679594

上书时间2024-10-13

倒爷图书专营店

三年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
姜维,男,副教授,1978年出生,汉族,博士,博士后、哈尔滨工业大学管理科学与工程系,硕士生导师。2007年哈尔滨工业大学计算机学院博士毕业,2010年哈尔滨工业大学管理科学与工程博士后。作为第1编著者出版著作5部。作为第一、第二作者发表论文50余篇。在计算机学报、自动化学报、电子学报、高技术通讯、计算机集成制造、系统工程理论与实践、系统工程与电子技术、国防科技大学学报、控制与决策等都有文章发表。发表3篇SCI国际期刊文章,20余篇EI期刊文章。目前作为负责人共完成或承担国家自然科学基金3项,已完成某军口预研基金项目,教育部博士点基金、中国博士后科学基金、中央高校基本科研专项项目,哈尔滨工业大学青年教改项目。作为第2负责人完成多项军口项目:总装备部军口重点预研项目,某预研基金项目,某军口重大专项项目,载人航天工程某项目。

目录
目    录

第1章  数据分析与数据挖掘基础1
1.1  数据分析与数据挖掘需求1
1.1.1  数据分析与数据挖掘1
1.1.2  大数据处理需求2
1.1.3  数据分析误区与隐私问题3
1.2  数据分析与数据挖掘的工作过程3
1.2.1  数据分析的主要工作过程3
1.2.2  数据收集5
1.2.3  数据展示6
1.3  数据的组织和数据的类型7
1.3.1  数据的一般组织形式7
1.3.2  数据类型8
1.3.3  分类数据的编码9
1.4  数据的常用描述性统计量11
1.4.1  数据的中心趋势11
1.4.2  数据的离散程度12
1.4.3  数据的形态统计量15
1.5  数据的基本描述性统计分析18
1.5.1  数据的描述性统计18
1.5.2  五数概括与盒图19
1.5.3  数据的描述性统计图20
1.6  本章小结22
本章概念与关键词22
练习与思考23
第2章  数据抽样与推断检验24
2.1  随机变量概率分布24
2.1.1  概率分布24
2.1.2  正态分布26
2.1.3  二项分布与泊松分布28
2.1.4  几何分布与超几何分布29
2.2  抽样统计分析31
2.2.1  抽样的相关概念31
2.2.2  概率抽样的典型方法33
2.2.3  非随机抽样的典型方法34
2.3  基本抽样分布34
2.3.1  经验分布、理论分布与抽样分布34
2.3.2  三大抽样分布36
2.3.3  小概率事件38
2.4  常用的抽样分布与区间估计40
2.4.1  常用的统计量抽样分布40
2.4.2  置信区间与区间估计42
2.5  常用的参数检验45
2.5.1  假设检验一般过程45
2.5.2  常用的参数检验统计量47
2.6  常用的单样本非参数检验48
2.6.1  卡方检验48
2.6.2  二项分布检验49
2.6.3  固定参数的超几何分布检验49
2.6.4  游程检验50
2.6.5  单样本K-S检验54
2.7  本章小结56
本章概念与关键词57
练习与思考57
第3章  可视化图与分组检验59
3.1  数据的常用可视化图分析59
3.1.1  数据的常用可视化图59
3.1.2  基于图的可视化观测一般过程62
3.2  均值比较和t检验62
3.2.1  分组统计62
3.2.2  数据标准化与Z-Score63
3.2.3  单样本t检验64
3.2.4  两独立样本t检验65
3.2.5  两配对样本t检验67
3.3  方差齐性检验68
3.3.1  Levene方差齐性检验68
3.3.2  基于F检验的方差齐性检验69
3.3.3  Brown-Forsythe方差齐性检验70
3.3.4  Bartlett’s方差齐性检验70
3.4  两独立样本的非参数检验71
3.4.1  Mann-Whitney U检验71
3.4.2  两独立样本K-S检验74
3.4.3  两独立样本游程检验76
3.4.4  两独立样本Moses极端反应检验77
3.4.5  两独立样本Brown-Mood中位数
      检验78
3.5  两配对样本的非参数检验81
3.5.1  两配对样本符号检验81
3.5.2  中位数、分位数及比例的符号
      检验82
3.5.3  两配对样本Wilcoxon符号秩
      检验83
3.5.4  Wilcoxon符号秩单样本检验85
3.5.5  两配对样本McNemar检验86
3.5.6  边缘齐性检验88
3.6  多样本的非参数检验88
3.6.1  多独立样本中位数检验88
3.6.2  多独立样本Kruskal-Wallis检验90
3.6.3  多独立样本Jonckheere-Terpstra
      检验91
3.6.4  多配对样本Friedman检验94
3.6.5  多配对样本Kendall协同系数
      检验96
3.6.6  多配对样本Cochran’s Q检验97
3.7  本章小结98
本章概念与关键词99
练习与思考99
第4章  方差分析与相关性分析102
4.1  方差分析102
4.1.1  方差分析中的变量102
4.1.2  单因素方差分析103
4.1.3  单因素方差Brown-Forsythe
      检验105
4.1.4  单因素方差Welch’s t检验106
4.1.5  无交互作用的双因素方差分析107
4.1.6  有交互作用的双因素方差分析109
4.2  Post Hoc检验111
4.2.1  LSD检验111
4.2.2  Studentized极差分布112
4.2.3  Tukey’s Range检验113
4.2.4  Tukey-Kramer检验115
4.2.5  SNK检验117
4.2.6  其他几种常用检验方法118
4.3  连续属性数据的相关性分析119
4.3.1  协方差的线性相关性度量119
4.3.2  相关系数的线性相关性度量122
4.3.3  Spearman秩相关系数124
4.4  离散属性相关性分析126
4.4.1  交叉列联表分析126
4.4.2  用卡方检验进行离散相关性分析127
4.4.3  列联表上常用的指标128
4.4.4  Fisher’s exact检验129
4.5  本章小结131
本章概念与关键词132
练习与思考132
第5章  数据的预处理与距离分析134
5.1  数据的预处理134
5.1.1  数据清理134
5.1.2  数据集成136
5.1.3  数据变换137
5.1.4  数据归约137
5.2  数据的常用组织方式138
5.2.1  数据的常用逻辑组织138
5.2.2  数据的常用物理组织139
5.2.3  高精度计算与矩阵计算139
5.2.4  编程语言、软件工具140
5.3  相似度计算与距离分析140
5.3.1  相似度与距离的转换140
5.3.2  闵可夫斯基距离143
5.3.3  马氏距离145
5.3.4  混合属性的相似度与距离147
5.4  kNN分类模型148
5.4.1  kNN分类模型概述148
5.4.2  距离加权kNN分类模型150
5.5  参数的点估计151
5.5.1  原点矩与中心矩151
5.5.2  矩估计法152
5.5.3  极大似然估计法153
5.6  本章小结156
本章概念与关键词156
练习与思考156
第6章  回归分析158
6.1  一元线性回归158
6.1.1  一元线性回归问题描述158
6.1.2  一元线性回归模型与求解159
6.1.3  确认回归方程的精度161
6.1.4  总体回归的方差分析162
6.1.5  残差分析164
6.1.6  回归方程参数检验167
6.1.7  回归方程预测与控制168
6.2  多元线性回归170
6.2.1  多元线性回归问题描述170
6.2.2  多元线性回归模型与求解172
6.2.3  确认回归方程的精度173
6.2.4  残差分析174
6.2.5  回归方程参数检验175
6.2.6  回归方程预测176
6.3  常用的曲线回归177
6.3.1  曲线回归问题177
6.3.2  多项式回归177
6.3.3  指数回归与对数回归179
6.3.4  其他常见曲线回归179
6.4  最小二乘法及其应用179
6.4.1  最小二乘法线性拟合179
6.4.2  伪逆矩阵求解180
6.4.3  Moore-Pseudo逆矩阵181
6.4.4  最小均方误差算法182
6.4.5  非线性回归183
6.4.6  智能优化求解技术183
6.5  Logistic回归184
6.5.1  Logistic回归分类与基本函数184
6.5.2  Logistic回归系数计算185
6.6  本章小结186
本章概念与关键词187
练习与思考187
第7章  空间降维技术189
7.1  主成分分析189
7.1.1  主成分分析描述189
7.1.2  基于协方差矩阵的主成分分析190
7.1.3  基于相关系数矩阵的主成分
      分析192
7.1.4  主成分分析与因子分析的联系193
7.1.5  主成分分析的作用194
7.2  因子分析案例研究196
7.2.1  研究的目的与内容196
7.2.2  变量选取与数据来源196
7.2.3  因子分析过程197
7.2.4  因子回归分析198
7.2.5  案例研究结论199
7.3  奇异值分解200
7.3.1  SVD的协同过滤推荐200
7.3.2  SVD在协同过滤中的应用203
7.3.3  SVD增量式协同过滤方法204
7.4  主成分回归与逐步回归205
7.4.1  多重共线性205
7.4.2  主成分回归207
7.4.3  逐步回归207
7.5  本章小结208
本章概念与关键词208
练习与思考209
第8章  关联规则与点对相关性210
8.1  频繁模式与关联规则的基本
     概念210
8.1.1  频繁模式的基本概念210
8.1.2  关联规则的基本概念211
8.1.3  极大频繁模式与闭频繁模式212
8.2  频繁模式挖掘213
8.2.1  Apriori算法213
8.2.2  垂直数据格式214
8.2.3  基于频繁模式计算关联规则215
8.3  频繁模式树216
8.3.1  频繁模式树的构建216
8.3.2  频繁模式树的递归过程219
8.4  点对相似度的典型度量220
8.4.1  点对关系常见度量220
8.4.2  点对相关性度量的几种特性222
8.5  信息熵及其应用与点对相关性
     度量224
8.5.1  信息熵224
8.5.2  联合熵与互信息226
8.5.3  信息增益、相对熵和交叉熵228
8.5.4  互信息、交叉熵用于相关性229
8.6  本章小结230
本章概念与关键词230
练习与思考231
第9章  决策树232
9.1  分类问题与模型训练232
9.1.1  分类问题描述232
9.1.2  分类问题举例与泛化问题233
9.1.3  分类模型的常见评价指标235
9.2  决策树及ID3算法236
9.2.1  决策树概述236
9.2.2  ID3算法238
9.3  C4.5算法与连续属性特征分
     类树241
9.3.1  C4.5算法241
9.3.2  连续属性的决策树构建241
9.4  CART决策树243
9.4.1  CART分类树243
9.4.2  CART回归树244
9.5  决策树剪枝250
9.5.1  剪枝问题的提出与先剪枝技术250
9.5.2  错误率降低剪枝法251
9.5.3  悲观剪枝法251
9.5.4  代价复杂度剪枝法254
9.6  ROC曲线与AUC指标255
9.6.1  ROC曲线描述与绘制255
9.6.2  ROC曲线绘制与作用257
9.6.3  AUC指标与应用258
9.7  本章小结259
本章概念与关键词259
练习与思考260
第10章  贝叶斯分类261
10.1  连续属性贝叶斯分类器261
10.1.1  单个连续属性贝叶斯分类261
10.1.2  多个连续属性的最小总风险
     决策262
10.1.3  多个连续属性的最小平均误差率
       决策263
10.2  正态概率分布下的贝叶斯分
      类器264
10.2.1  分类器的判别函数表示形式264
10.2.2  正态分布下的贝叶斯判别函数264
10.2.3  正态分布下的贝叶斯判别举例265
10.3  离散属性贝叶斯分类器267
10.3.1  离散属性贝叶斯模型267
10.3.2  朴素贝叶斯分类器267
10.4  朴素贝叶斯文本分类和TAN贝叶斯
      模型270
10.4.1  朴素贝叶斯文本分类器270
10.4.2  TAN贝叶斯分类模型272
10.5  贝叶斯分类器中的参数估计与非参数
      估计276
10.5.1  贝叶斯分类器中的参数估计276
10.5.2  非参数估计277
10.6  本章小结278
本章概念与关键词279
练习与思考279
第11章  特征空间与判别分析280
11.1  特征空间280
11.1.1  特征空间构造280
11.1.2  特征空间评价282
11.1.3  特征空间变换284
11.1.4  证据空间285
11.2  特征提取与特征选择285
11.2.1  特征提取285
11.2.2  特征选择285
11.2.3  jiang相关系数286
11.2.4  过滤式特征选择288
11.2.5  封装式特征选择288
11.2.6  嵌入式特征选择289
11.3  极大似然判别分析289
11.3.1  极大似然判别分析的工作过程289
11.3.2  极大似然判别分析的应用举例290
11.4  距离判别分析290
11.4.1  距离与相似度的常用度量290
11.4.2  距离判别分析的工作原理291
11.4.3  距离判别法的检验与多总体距离
       判别293
11.4.4  两总体方差是否有相同的检验294
11.4.5  加权的距离或相似度应用于距离判别
       分析与kNN分类模型296
11.5  Fisher判别分析296
11.5.1  两类别的线性判别中的最佳投影
       方向296
11.5.2  两类别的线性判别过程298
11.5.3  多重线性判别分析299
11.5.4  Fisher判别分析应用举例301
11.6  本章小结303
本章概念与关键词303
练习与思考303
第12章  感知机与支持向量机305
12.1  线性判别函数305
12.1.1  线性判别函数表示305
12.1.2  多重线性判别函数306
12.1.3  广义线性判别函数306
12.2  感知机分类器307
12.2.1  M-P模型307
12.2.2  感知机结构308
12.2.3  感知机训练算法309
12.2.4  感知机应用举例312
12.3  感知机训练算法扩展313
12.3.1  感知机的典型训练算法313
12.3.2  感知机松弛算法314
12.3.3  最小均方误差求解算法314
12.3.4  Ho-kashyap求解算法316
12.3.5  多分类扩展伪逆求解317
12.3.6  感知机的对偶形式318
12.4  最大间隔超平面与结构风险319
12.4.1  最大间隔超平面319
12.4.2  经验风险最小化与结构风险
        最小化320
12.5  支持向量机323
12.5.1  线性可分时的支持向量机323
12.5.2  数据不可分时的线性SVM327
12.5.3  非线性支持向量机332
12.5.4  支持向量机中的其他问题336
12.6  本章小结338
本章概念与关键词339
练习与思考339
第13章  人工神经网络341
13.1  激活函数与多层感知机341
13.1.1  常见激活函数341
13.1.2  多层感知机结构344
13.1.3  多层感知机设计345
13.2  BP神经网络347
13.2.1  BP神经网络及BP算法347
13.2.2  BP算法训练中的注意事项351
13.3  BP神经网络应用355
13.3.1  二分类问题应用355
13.3.2  多分类问题与拟合问题359
13.4  深度学习361
13.4.1  深度学习技术环境361
13.4.2  卷积神经网络363
13.4.3  卷积神经网络训练与应用
        举例368
13.4.4  循环神经网络373
13.4.5  其他深度学习技术376
13.5  本章小结378
本章概念与关键词379
练习与思考379
第14章  集成学习381
14.1  机器学习中的若干问题381
14.1.1  机器学习的主要任务类型381
14.1.2  机器学习的泛化问题382
14.1.3  维数灾难问题384
14.1.4  机器学习模型的优越性问题385
14.2  统计量重抽样技术386
14.2.1  偏差与方差386
14.2.2  刀切法统计量估计387
14.2.3  自助法统计量估计388
14.3  分类器重抽样技术与组合
      分类器389
14.3.1  Bagging法389
14.3.2  Boosting法389
14.3.3  Bagging法与Boosting法的主要
        特点390
14.3.4  组合分类器390
14.4  随机森林与Adaboost算法393
14.4.1  随机森林393
14.4.2  Adaboost算法396
14.5  分类模型中的若干问题397
14.5.1  用二分类器处理多分类问题397
14.5.2  多标签分类方法399
14.5.3  类别数据不平衡问题400
14.5.4  单纯提高精确率与单纯提高
        召回率的方法401
14.6  本章小结402
本章概念与关键词403
练习与思考403
第15章  聚类分析与离群点分析404
15.1  聚类问题与聚类类型404
15.1.1  聚类问题404
15.1.2  聚类类型405
15.2  基于划分的聚类406
15.2.1  k-means聚类406
15.2.2  k-medoids聚类408
15.3  层次聚类410
15.3.1  簇间距离的计算410
15.3.2  层次聚类方法410
15.4  基于密度的聚类412
15.4.1  DBSCAN聚类412
15.4.2  OPTICS聚类415
15.5  基于网格的聚类与基于模型的
   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP