• 数据挖掘与应用 以SAS和R为工具(第2版)
21年品牌 40万+商家 超1.5亿件商品

数据挖掘与应用 以SAS和R为工具(第2版)

全新正版 极速发货

38.15 6.6折 58 全新

库存3件

广东广州
认证卖家担保交易快速发货售后保障

作者张俊妮

出版社北京大学出版社

ISBN9787301299098

出版时间2018-10

装帧平装

开本16开

定价58元

货号1201782714

上书时间2024-12-02

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
张俊妮:美国哈佛大学统计学博士,北京大学光华管理学院商务统计及经济计量系副教授。研究领域包括:贝叶斯分析、因果推断、数据挖掘及文本挖掘。在Journal of American Statistical Association、Statistica Sinica、等期刊上发表二十余篇论文,出版英文专著。曾获北京大学教学很好奖、光华管理学院很好课程奖。

目录
前言

章数据挖掘概述01

1.1什么是数据挖掘02

1.2统计思想在数据挖掘中的重要性02

1.3数据挖掘的应用案例07

1.4CRISP-DM数据挖掘方法论14

1.5SEMMA数据挖掘方法论15

第2章数据理解和数据准备17

2.1数据理解19

2.2数据准备22

2.3数据理解和数据准备示例:FNBA信用卡数据35

第3章缺失数据51

3.1缺失数据模式和缺失数据机制52

3.2缺失数据机制对数据分析的影响53

3.3缺失值插补62

3.4缺失数据插补及分析示例:纽约空气质量64

第4章关联规则挖掘73

4.1关联规则的实际意义74

4.2关联规则的基本概念及Apriori算法74

4.3序列关联规则80

4.4关联规则挖掘示例81

4.5关联规则挖掘的其他讨论85

第5章多元统计中的降维方法88

5.1主成分分析89

5.2探索性因子分析97

5.3多维标度分析104

第6章聚类分析111

6.1距离与相似度的度量113

6.2k均值聚类算法117

6.3层次聚类法122

第7章预测性建模的一些基本方法130

7.1判别分析131

7.2朴素贝叶斯分类算法134

7.3k近邻法137

7.4线性回归141

7.5广义线性模型149

第8章回归模型中的规则化和变量选择168

8.1线性回归中的规则化和变量选择169

8.2广义线性模型中的规则化和变量选择181

第9章神经网络的基本方法184

9.1神经网络架构及基本组成185

9.2误差函数190

9.3神经网络训练算法193

9.4提高神经网络模型的可推广性198

9.5数据预处理200

9.6神经网络建模示例201

9.7自组织图222

0章卷积神经网络230

10.1深度神经网络231

10.2卷积神经网络架构232

10.3卷积神经网络示例:Fashion-MNIST数据239

1章决策树方法245

11.1决策树简介246

11.2决策树的生长与修剪248

11.3对缺失数据的处理155

11.4变量选择256

11.5决策树的优缺点257

2章支持向量机274

12.1支持向量机用于二分类问题275

12.2支持向量机用于多分类问题284

12.3支持向量机用于回归问题285

3章模型评估290

13.1因变量为二分变量的情形291

13.2因变量为多分变量的情形301

13.3因变量为连续变量的情形303

13.4模型评估示例:德国信用数据的模型评估304

4章模型组合与两阶段模型312

14.1模型组合313

14.2随机森林321

14.3两阶段模型324

5章协同过滤326

15.1基于用户(User-based)的协同过滤327

15.2基于物品(Item-based)的协同过滤328

15.3基于SVD的协同过滤328

15.4基于FunkSVD的协同过滤329

15.5协同过滤示例:动漫片推荐331

参考文献337

内容摘要
《数据挖掘与应用:以SAS和R为工具(第二版)》是数据挖掘领域的经典教材,基于北京大学光华管理学院“数据挖掘与应用”课程。书中系统、全面地介绍了数据挖掘领域的理论、技术工具以及实践方法。主要内容包括:数据挖掘方法论、数据理解和数据准备、缺失数据、关联规则挖掘、多元统计降维、聚类分析、线性回归和广义线性回归、回归模型规则化、神经网络、决策树、支持向量机、模型评估、模型组合、协同过滤等。书中在每种数据挖掘技术后,均辅以大量医疗、金融、营销、保险、政府部门等应用案例,并均配有相关应用的SAS和R语言代码,以及视频课程二维码。第二版更新:第二版在头一版的基础上,增加了缺失数据、回归模型中的规则化和变量选择、卷积神经网络、支持向量机、协同过滤这5章内容。在已有各章内,本书亦增加了新的内容和示例。近些年来,R因为其自由、免费、开源,已经发展为数据分析领域不错大的软件之一。因此,本书除了继续展示SAS程序,还增加了R程序。

主编推荐
"* 数据挖掘领域的经典教材,基于北京大学光华管理学院“数据挖掘与应用”课程。
* “哈佛小魔女”,中科院少年班天才统计学家张俊妮教授十年一剑之作。
* 加入大量医疗、金融、营销、保险、政府部门等应用案例。
* 再版加入40余堂视频课程,以及SAS和R语言代码,购书扫描二维码免费观看下载。
* 可用于高校经管、统计、计算机专业,商学院师生教材使用,同时从业者,以及所有想提高数据挖掘技术的非专业读者,可以配合视频课程自学精进。"

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP