• 大数据解析与应用导论(赵春晖)
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

大数据解析与应用导论(赵春晖)

38.1 5.6折 68 全新

仅1件

河北保定
认证卖家担保交易快速发货售后保障

作者赵春晖 编著

出版社化学工业出版社

出版时间2022-09

版次1

装帧平装

货号9787122409966

上书时间2024-12-19

   商品详情   

品相描述:全新
图书标准信息
  • 作者 赵春晖 编著
  • 出版社 化学工业出版社
  • 出版时间 2022-09
  • 版次 1
  • ISBN 9787122409966
  • 定价 68.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 286页
  • 字数 457千字
【内容简介】
信息时代,大数据的应用无处不在。手机中“淘宝”“抖音”的商品推送、短视频内容推送背后,是大数据用户画像及推荐算法;道路上的“一路绿灯”背后,是智能交通——交通管理部门分析、调整交通情况;新冠肺炎疫情不漏一人的流调背后,是智慧“战疫”——有关部门以“大数据 网格化”的方式识别和挖掘目标人群迁徙轨迹;智慧电厂“一键启停、无人值守”的背后,是以大数据为基础的工业级智能化应用。本书从大数据解析的基本概念讲起,“庖丁解牛”式地为大家讲解大数据解析中常用的基础算法,介绍不同算法的基本原理和适用场合,揭开大数据解析的神秘面纱。“纸上得来终觉浅,绝知此事要躬行。”本书结合研究实例,以问题为导向,深入浅出,引导大家“根据钉子选择锤子”,领略大数据的魅力。本书是数据分析及相关课程的教学用书,适用于高等院校自动化、数据科学与大数据技术、人工智能等涉及数据挖掘相关的专业的本科生。
【目录】
1绪论1

1.1统计学基础1

1.1.1期望、方差、协方差1

1.1.2一元高斯分布3

1.1.3多元高斯分布3

1.1.4KL散度4

1.2人工智能简介4

1.2.1人工智能的概念5

1.2.2人工智能的发展5

1.2.3人工智能的学派7

1.3机器学习7

1.3.1基本概念8

1.3.2机器学习的范式8

1.3.3机器学习的三要素9

1.3.4过拟合与正则化11

1.3.5偏差与方差12

1.4深度学习14

1.4.1生物神经网络14

1.4.2人工神经网络15

1.4.3主流的深度学习框架16

本章小结17

习题117

参考文献18

2数据预处理与特征工程20

2.1数据预处理20

2.1.1数据清洗21

2.1.2数据变换24

2.2特征工程27

2.2.1特征提取27

2.2.2特征选择27

2.3应用实例30

2.3.1数据集简介与环境准备30

2.3.2数据集导入与字段理解31

2.3.3缺失值处理31

2.3.4异常值处理32

2.3.5数据变换33

2.3.6特征工程34

2.3.7案例小结34

本章小结34

习题235

参考文献36

3数据降维37

3.1数据降维简介37

3.2主成分分析算法38

3.2.1主成分分析算法简介38

3.2.2主成分分析的数学原理38

3.2.3主成分分析的直观理解40

3.3慢特征分析算法41

3.3.1慢特征分析算法简介41

3.3.2慢特征分析的数学原理41

3.3.3慢特征分析的直观理解43

3.4应用实例44

3.4.1主成分分析的数值示例44

3.4.2主成分分析的应用示例45

本章小结47

习题347

参考文献48

4回归分析50

4.1回归分析基本概念50

4.1.1回归的起源50

4.1.2回归模型的建立及应用51

4.1.3回归模型分类52

4.1.4回归模型效果评估52

4.2最小二乘回归53

4.2.1最小二乘法拟合目标53

4.2.2最小二乘回归原理54

4.2.3最小二乘法的几何意义56

4.2.4最小二乘法的缺陷57

4.3岭回归与LASSO回归57

4.3.1岭回归算法58

4.3.2LASSO回归算法61

4.3.3线性回归模型的正则化项63

4.4主元回归64

4.4.1维数灾难64

4.4.2主元回归建模65

4.4.3主成分个数选取65

4.4.4主元回归与岭回归66

4.5偏最小二乘回归66

4.5.1偏最小二乘建模67

4.5.2目标函数与算法推导67

4.5.3潜变量个数确定69

4.6回归案例分析70

本章小结72

习题472

参考文献73

5聚类分析75

5.1基本思想与概念75

5.1.1聚类的概念75

5.1.2聚类算法分类76

5.2相似性度量77

5.2.1相似性度量的基本概念77

5.2.2距离度量77

5.2.3相关系数81

5.2.4选择相似性衡量手段的原则82

5.3K-均值聚类算法简介83

5.3.1算法思想83

5.3.2算法流程84

5.3.3算法关键影响因素85

5.3.4算法应用:图像压缩86

5.4高斯混合模型简介87

5.4.1算法介绍87

5.4.2利用GMM算法进行聚类88

5.4.3算法示例88

本章小结91

习题591

参考文献92

6判别分析93

6.1基本理论93

6.1.1判别的基本概念93

6.1.2判别的效果评估94

6.2距离判别94

6.3贝叶斯判别95

6.3.1贝叶斯的统计思想96

6.3.2贝叶斯最小错误率判别96

6.3.3贝叶斯最小风险判别97

6.3.4先验概率的选取97

6.3.5多总体贝叶斯判别准则98

6.3.6多总体贝叶斯判别函数98

6.4Fisher判别100

6.4.1Fisher判别的基本思想100

6.4.2Fisher判别的优化目标100

6.4.3多分类问题101

6.4.4Fisher判别的分析步骤102

6.4.5案例分析103

本章小结104

习题6104

参考文献105

7支持向量机107

7.1线性可分支持向量机107

7.1.1线性可分的概念107

7.1.2间隔最大化108

7.1.3支持向量机求解109

7.2软间隔支持向量机111

7.3非线性支持向量机112

7.4支持向量回归114

7.5支持向量机实例116

7.5.1线性可分支持向量机实例116

7.5.2非线性支持向量机实例117

本章小结118

习题7118

参考文献119

8典型相关分析120

8.1基本概念120

8.1.1CCA的历史及用途120

8.1.2CCA的思想121

8.1.3CCA的扩展方法122

8.2典型相关分析算法介绍122

8.3CCA算法拓展125

8.3.1多视角CCA125

8.3.2核CCA127

8.3.3深度CCA128

8.3.4判别CCA128

8.3.5局部保留CCA130

8.4典型相关分析案例分析130

8.4.1案例一:城市竞争力分析130

8.4.2案例二:多标签分类132

本章小结134

习题8135

参考文献136

9决策树与随机森林138

9.1决策树基本内容138

9.2决策树算法介绍139

9.2.1信息熵和信息增益140

9.2.2剪枝算法142

9.3随机森林介绍143

9.4应用实例145

9.4.1Python实现决策树145

9.4.2Python实现随机森林146

本章小结148

习题9149

参考文献150

10神经网络151

10.1基本概念151

10.1.1基本结构——神经元模型151

10.1.2感知机152

10.1.3多层前馈神经网络153

10.1.4激活函数153

10.1.5误差反向传播算法155

10.2深度神经网络157

10.2.1模型优化方法157

10.2.2参数初始化160

10.2.3数据预处理161

10.2.4防止过拟合162

10.2.5数据增强162

10.3宽度学习(BLS)简介163

10.3.1BLS产生背景163

10.3.2RVFLNN简介164

10.3.3BLS算法介绍164

10.3.4BLS实际应用案例168

本章小结169

习题10169

参考文献170

11卷积神经网络172

11.1卷积神经网络基础172

11.1.1卷积172

11.1.2池化(pooling)174

11.1.3卷积神经网络的优点175

11.1.4LeNet176

11.2卷积网络进阶与实例178

11.2.1特殊的卷积核178

11.2.2卷积网络实例181

本章小结185

习题11185

参考文献186

12循环神经网络187

12.1循环神经网络基础187

12.1.1RNN的用途187

12.1.2RNN的结构及工作方式188

12.1.3LSTM的结构及计算方式189

12.2循环神经网络进阶191

12.2.1残差循环神经网络191

12.2.2门控循环单元GRU192

12.2.3双向循环神经网络193

12.2.4堆叠循环神经网络194

本章小结194

习题12195

参考文献196

13自编码器197

13.1自编码器简介197

13.1.1回顾:监督学习、半监督学习、无监督学习197

13.1.2生成模型与判别模型198

13.1.3自编码器的公式化表述199

13.1.4关于自编码器的讨论199

13.1.5常见的自编码器变体200

13.2稀疏自编码器201

13.2.1稀疏自编码器结构201

13.2.2堆栈自编码器结构203

13.2.3堆栈稀疏自编码器206

13.3去噪自编码器206

13.3.1原理介绍206

13.3.2训练过程207

13.3.3堆栈去噪自编码器208

13.3.4稀疏去噪自编码器209

13.3.5流形学习角度看去噪自编码器210

13.3.6小结211

13.4变分自编码器211

13.4.1变分自编码器的引出212

13.4.2变分自编码器的推导212

13.4.3变分自编码器的网络结构214

13.4.4变分自编码器的实例214

13.4.5变分自编码器的拓展216

13.4.6小结217

本章小结217

习题13217

参考文献219

14集成学习221

14.1集成学习简介221

14.1.1基本概念与模型结合策略221

14.1.2小结225

14.2集成学习:Bagging225

14.2.1算法简介225

14.2.2Bagging算法的自助采样226

14.2.3Bagging算法的结合策略227

14.2.4偏差与方差分析230

14.3集成学习:Boosting233

14.3.1算法简介233

14.3.2AdaBoost234

14.3.3GBDT238

14.4应用实例240

14.4.1Bagging实例:Random Forest240

14.4.2Boosting实例:AdaBoost244

本章小结245

习题14246

参考文献247

15案例分析249

15.1二手车交易价格预测249

15.1.1案例背景249

15.1.2数据概览与评测标准249

15.1.3整体思路251

15.1.4数据分析与预处理251

15.1.5特征工程与特征筛选253

15.1.6平均值编码253

15.1.7数据建模与融合255

15.1.8小结256

15.2糖尿病的血糖预测256

15.2.1背景介绍257

15.2.2数据获取257

15.2.3数据预处理257

15.2.4算法与实验结果259

15.2.5小结263

15.3工业蒸汽量预测263

15.3.1数据集介绍263

15.3.2数据清洗与特征工程263

15.3.3基本回归模型训练与分析264

15.3.4XGBoost模型训练与结果分析266

15.3.5小结268

15.4双盲降噪自编码器实现降噪268

15.4.1软测量任务需求268

15.4.2问题分析269

15.4.3去噪算法概述270

15.4.4双盲降噪自编码器271

15.4.5DBDAE降噪与软测量272

15.4.6小结276

15.5心率异常检测276

15.5.1心电图数据277

15.5.2基于残差神经网络的心电诊断277

15.5.3基于知识 特征工程的心电诊断279

15.5.4小结284

本章小结284

习题15284

参考文献286

 
点击展开 点击收起

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP