数据分析
¥
23.95
3.0折
¥
79
九五品
仅1件
作者[葡]乔·门德斯·莫雷拉,[巴西]安德烈·卡
出版社清华大学出版社
ISBN9787302568476
出版时间2021-06
版次1
装帧平装
开本16开
纸张胶版纸
页数252页
字数99999千字
定价79元
上书时间2024-05-08
商品详情
- 品相描述:九五品
- 商品描述
-
基本信息
书名:数据分析
定价:79.00元
作者:[葡]乔·门德斯·莫雷拉,[巴西]安德烈·卡
出版社:清华大学出版社
出版日期:2021-06-01
ISBN:9787302568476
字数:343000
页码:252
版次:
装帧:平装
开本:16开
商品重量:
编辑推荐
《数据分析——统计、描述、预测与应用》是一本系统论述数据分析的原则和方法的学习指南。本书宏观而且系统地给出了数据分析的一般理论与方法,这对于理解和进行数据分析实践极具参考价值。本书涉及的基本概念、基本理论与分析方法的相关术语通俗易懂,易于理解。学习本书无需统计或编程技术的知识基础。本书三位作者均是数据分析领域的科学家,他们在书中深入浅出剖析了数据分析背后的方法论,并给出了练习与实例,便于读者动手实践。此外,作者们制作了实用的教学课件,可供相关高校计算机、大数据、金融学等专业授课使用。
内容提要
本书介绍数据分析的统计基础、种类划分,并列举大量实例以说明数据分析方法和算法。内容主要分为4部分,部分为章,介绍一些概念,简单描述数据分析方法和一些实例; 第2部分包括第2~7 章,介绍描述性分析和数据预处理的主要方法,包括描述统计、多元描述分析、聚类以及频繁模式挖掘等;第3部分包括第8~12章,介绍预测性分析的主要方法,其中包括多种回归算法、二元回归、分类的性能测量以及基于概率和距离测量的方法,以及决策树、人工神经网络和支持向量机等较为先进的方法; 第4部分为3章,利用描述和预测这两种方法,简单讨论文本、网页以及社交媒体的应用。
目录
部分背 景 介 绍章我们可以用数据做什么1.1大数据和数据科学1.2大数据架构1.3小数据1.4什么是数据1.5数据分析简单分类1.6数据使用实例1.6.1美国威斯康星州的乳腺癌数据1.6.2波兰企业破产数据1.7一个数据分析项目1.7.1数据分析方法论简史1.7.2KDD过程1.7.3CRISPDM方法1.8本书的组织结构1.9本书面向的对象第2部分理 解 数 据第2章描述统计学2.1尺度类型2.2描述单元分析2.2.1单元频数2.2.2单元数据可视化2.2.3单元统计2.2.4常见的单元概率分布2.3描述性双元分析2.3.1两个定量属性2.3.2两个定性属性,其中至少有一个是名义属性2.3.3两个序数属性2.4本章小结2.5练习第3章描述性多元分析3.1多元频数3.2多元数据可视化3.3多元统计3.3.1位置多元统计3.3.2离散多元统计3.4信息图和词云3.4.1信息图3.4.2词云3.5本章小结3.6练习第4章数据质量和预处理4.1数据质量4.1.1缺失值4.1.2冗余数据4.1.3不一致数据4.1.4噪声数据4.1.5离群值4.2转换为不同的尺度类型4.2.1名义尺度转换为相对尺度4.2.2序数尺度转换为相对或尺度4.2.3相对或尺度转换为序数或名义尺度4.3转换为不同尺度4.4数据转换4.5维度降低4.5.1属性聚合4.5.2属性选择4.6本章小结4.7练习第5章聚类5.1距离度量5.1.1常见属性类型值之间的差异5.1.2定量属性对象的距离度量5.1.3非常规属性的距离度量5.2聚类验证5.3聚类技术5.3.1K均值5.3.2DBSCAN5.3.3聚合层次聚类技术5.4本章小结5.5练习第6章频繁模式挖掘6.1频繁项集6.1.1设置支持度阈值6.1.2Apriori——基于连接的方法6.1.3Eclat算法6.1.4FPGrowth6.1.5频繁项集和闭合频繁项集6.2关联规则6.3支持度与置信度的意义6.3.1交叉支持度模式6.3.2提升度6.3.3辛普森悖论6.4其他模式6.4.1序列模式6.4.2频繁序列挖掘6.4.3闭合和序列6.5本章小结6.6练习第7章描述性分析的备忘单和项目7.1描述性分析备忘单7.1.1数据总结7.1.2聚类方法7.1.3频繁模式挖掘7.2描述性分析项目7.2.1理解业务7.2.2理解数据7.2.3准备数据7.2.4建模7.2.5评价7.2.6部署第3部分预 测 未 知第8章回归8.1预测性能评估8.1.1泛化8.1.2模型验证8.1.3回归的预测性能度量8.2寻找模型参数8.2.1线性回归8.2.2偏差方差权衡8.2.3收缩方法8.2.4使用属性的线性组合方法8.3技术选型8.4本章小结8.5练习第9章分类9.1二元分类9.2分类的预测性能度量9.3基于距离的学习算法9.3.1k近邻算法9.3.2基于案例的推理9.4概率分类算法9.4.1逻辑回归算法9.4.2朴素贝叶斯(NB)算法9.5本章小结9.6练习0章其他预测方法10.1基于搜索的算法10.1.1决策树归纳算法10.1.2回归决策树10.2基于优化的算法10.2.1人工神经网络10.2.2支持向量机10.3本章小结10.4练习1章高级预测话题11.1集成学习11.1.1Bagging11.1.2随机森林11.1.3AdaBoost11.2算法的偏差11.3非二元分类任务11.3.1单类分类11.3.2多类分类11.3.3排序分类11.3.4多标签分类11.3.5层次分类11.4高级预测数据准备技术11.4.1数据分类不均衡11.4.2不完全目标标记11.5具有监督可解释技术的描述和预测11.6练习2章预测性分析的备忘单和项目12.1预测性分析备忘单12.2预测性分析项目12.2.1业务理解12.2.2数据理解12.2.3数据准备12.2.4建模12.2.5评估12.2.6部署第4部分常见的数据分析应用3章文本、网络和社交媒体应用13.1文本挖掘13.1.1数据采集13.1.2特征提取13.1.3剩下的阶段13.1.4趋势13.2推荐系统13.2.1反馈13.2.2推荐任务13.2.3推荐技术13.2.4小结13.3社交网络分析13.3.1社交网络的表示13.3.2节点的基本属.3.3网络的基本和结构属.3.4趋势和小结13.4练习附录A对CRISPDM方法的全面描述参考文献
作者介绍
[葡]乔 门德斯 莫雷拉(João Mendes Moreira)博士,葡萄牙波尔图大学(University of Porto)工程系教授,葡萄牙波尔图人工智能与决策支持实验室(LIAAD-INESC TEC, Porto)研究员。[巴]安德烈 卡瓦略(André de Carvalho)博士,巴西圣保罗大学(São Paulo)数学和计算机科学研究所教授。[匈]托马斯 霍瓦斯(Tomáš Horváth)博士,匈牙利布达佩斯罗兰大学(Eötvös Loránd University )助理教授,与斯洛伐克科希策帕沃尔 约瑟夫 沙法利克大学(Pavol Jozef Šafárik University)长期进行科研合作。
序言
— 没有更多了 —
以下为对购买帮助不大的评价