• 机器学习与R语言(原书第3版)
  • 机器学习与R语言(原书第3版)
21年品牌 40万+商家 超1.5亿件商品

机器学习与R语言(原书第3版)

全新正版 极速发货

62.38 6.3折 99 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者[美]布雷特·兰茨(Brett Lantz)

出版社机械工业

ISBN9787111684572

出版时间2021-06

装帧平装

开本其他

定价99元

货号31180769

上书时间2024-05-28

书香美美

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介

布雷特·兰茨(Brett Lantz)

在应用创新的数据方法来理解人类的行为方面有十余年经验。他是一位DataCamp讲师,经常在世界各地的机器学习会议和研讨会上进行演讲。他致力于研究数据科学在体育、自动驾驶汽车、外语学习和时尚等领域的应用,并维护dataspelunking.com这个网站,该网站致力于分享有关探寻数据中所蕴含的洞察的知识。


译者简介:

许金炜 

2016年上海大学统计学硕士毕业,参与翻译《机器学习与R语言》版和第2版、《R语言数据挖掘》及《R语言编程指南》第2版,曾于各类数学建模竞赛中斩获佳绩。目前主要于金融行业从事风控领域及量化方面的工作。




目录
译者序<br/>前 言<br/>第1章 机器学习简介1<br/>1.1 机器学习的起源1<br/>1.2 机器学习的使用与滥用2<br/>1.2.1 机器学习的成功应用3<br/>1.2.2 机器学习的限制4<br/>1.2.3 机器学习的伦理方面5<br/>1.3 机器如何学习7<br/>1.3.1 数据存储8<br/>1.3.2 抽象化8<br/>1.3.3 一般化10<br/>1.3.4 评估11<br/>1.4 实践中的机器学习12<br/>1.4.1 输入数据的类型13<br/>1.4.2 机器学习算法的类型14<br/>1.4.3 为输入数据匹配算法15<br/>1.5 使用R进行机器学习16<br/>1.5.1 安装R添加包17<br/>1.5.2 载入和卸载R添加包18<br/>1.5.3 安装RStudio18<br/>1.6 总结19<br/>第2章 管理和理解数据20<br/>2.1 R数据结构20<br/>2.1.1 向量20<br/>2.1.2 因子22<br/>2.1.3 列表23<br/>2.1.4 数据框25<br/>2.1.5 矩阵和数组27<br/>2.2 用R管理数据28<br/>2.2.1 保存、载入和移除R数据结构29<br/>2.2.2 从CSV文件导入数据和将数据保存为CSV文件29<br/>2.3 探索和理解数据31<br/>2.3.1 探索数据的结构31<br/>2.3.2 探索数值变量32<br/>2.3.3 探索分类变量40<br/>2.3.4 探索变量之间的关系41<br/>2.4 总结44<br/>第3章 懒惰学习——使用近邻分类46<br/>3.1 理解近邻分类46<br/>3.1.1 k近邻算法47<br/>3.1.2 为什么k-NN算法是懒惰的52<br/>3.2 例子—用k-NN算法诊断乳腺癌53<br/>3.2.1 第1步—收集数据53<br/>3.2.2 第2步—探索和准备数据54<br/>3.2.3 第3步—基于数据训练模型57<br/>3.2.4 第4步—评估模型的性能58<br/>3.2.5 第5步—提高模型的性能59<br/>3.3 总结61<br/>第4章 概率学习——朴素贝叶斯分类62<br/>4.1 理解朴素贝叶斯62<br/>4.1.1 贝叶斯方法的基本概念63<br/>4.1.2 朴素贝叶斯算法67<br/>4.2 例子—基于贝叶斯算法的手机垃圾短信过滤72<br/>4.2.1 第1步—收集数据72<br/>4.2.2 第2步—探索和准备数据73<br/>4.2.3 第3步—基于数据训练模型84<br/>4.2.4 第4步—评估模型的性能85<br/>4.2.5 第5步—提高模型的性能86<br/>4.3 总结87<br/>第5章 分而治之——应用决策树和规则进行分类88<br/>5.1 理解决策树88<br/>5.1.1 分而治之89<br/>5.1.2 C5.0决策树算法92<br/>5.2 例子—使用C5.0决策树识别高风险银行贷款95<br/>5.2.1 第1步—收集数据95<br/>5.2.2 第2步—探索和准备数据95<br/>5.2.3 第3步—基于数据训练模型98<br/>5.2.4 第4步—评估模型的性能100<br/>5.2.5 第5步—提高模型的性能100<br/>5.3 理解分类规则104<br/>5.3.1 独立而治之104<br/>5.3.2 1R算法106<br/>5.3.3 RIPPER算法108<br/>5.3.4 来自决策树的规则109<br/>5.3.5 什么使决策树和规则贪婪110<br/>5.4 例子—应用规则学习算法识别有毒的蘑菇111<br/>5.4.1 第1步—收集数据111<br/>5.4.2 第2步—探索和准备数据112<br/>5.4.3 第3步—基于数据训练模型112<br/>5.4.4 第4步—评估模型的性能114<br/>5.4.5 第5步—提高模型的性能115<br/>5.5 总结117<br/>第6章 预测数值型数据——回归方法118<br/>6.1 理解回归118<br/>6.1.1 简单线性回归120<br/>6.1.2 普通最小二乘估计122<br/>6.1.3 相关性123<br/>6.1.4 多元线性回归124<br/>6.2 例子—应用线性回归预测医疗费用127<br/>6.2.1 第1步—收集数据128<br/>6.2.2 第2步—探索和准备数据128<br/>6.2.3 第3步—基于数据训练模型132<br/>6.2.4 第4步—评估模型的性能134<br/>6.2.5 第5步—提高模型的性能135<br/>6.2.6 第6步—用回归模型进行预测138<br/>6.3 理解回归树和模型树140<br/>6.4 例子—用回归树和模型树估计葡萄酒的质量142<br/>6.4.1 第1步—收集数据142<br/>6.4.2 第2步—探索和准备数据143<br/>6.4.3 第3步—基于数据训练模型144<br/>6.4.4 第4步—评估模型的性能147<br/>6.4.5 第5步—提高模型的性能149<br/>6.5 总结151<br/>第7章 黑箱方法—神经网络和支持向量机152<br/>7.1 理解神经网络152<br/>7.1.1 从生物神经元到人工神经元153<br/>7.1.2 激活函数154<br/>7.1.3 网络拓扑156<br/>7.1.4 用后向传播训练神经网络159<br/>7.2 例子—用人工神经网络对混凝土的强度进行建模160<br/>7.2.1 第1步—收集数据161<br/>7.2.2 第2步—探索和准备数据161<br/>7.2.3 第3步—基于数据训练模型162<br/>7.2.4 第4步—评估模型的性能164<br/>7.2.5 第5步—提高模型的性能165<br/>7.3 理解支持向量机169<br/>7.3.1 用超平面分类169<br/>7.3.2 对非线性空间使用核函数173<br/>7.4 例子—用支持向量机进行光学字符识别175<br/>7.4.1 第1步—收集数据175<br/>7.4.2 第2步—探索和准备数据176<br/>7.4.3 第3步—基于数据训练模型177<br/>7.4.4 第4步—评估模型的性能179<br/>7.4.5 第5步—提高模型的性能180<br/>7.5 总结182<br/>第8章 探寻模式——基于关联规则的购物篮分析183<br/>8.1 理解关联规则183<br/>8.1.1 用于关联规则学习的Apriori算法184<br/>8.1.2 度量规则兴趣度—支持度和置信度185<br/>8.1.3 用Apriori原则建立规则186<br/>8.2 例子—用关联规则确定经常一起购买的食品杂货187<br/>8.2.1 第1步—收集数据187<br/>8.2.2 第2步—探索和准备数据188<br/>8.2.3 第3步—基于数据训练模型193<br/>8.2.4 第4步—评估模型的性能195<br/>8.2.5 第5步—提高模型的性能197<br/>8.3 总结200<br/>第9章 寻找数据的分组——k均值聚类201<br/>9.1 理解聚类201<br/>9.1.1 聚类—一种机器学习任务202<br/>9.1.2 k均值聚类算法203<br/>9.2 例子—用k均值聚类探寻青少年市场细分209<br/>9.2.1 第1步—收集数据209<br/>9.2.2 第2步—探索和准备数据210<br/>9.2.3 第3步—基于数据训练模型213<br/>9.2.4 第4步—评估模型的性能215<br/>9.2.5 第5步—提高模型的性能217<br/>9.3 总结219<br/>第10章 模型性能的评估220<br/>10.1 度量分类方法的性能220<br/>10.1.1 理解分类器的预测221<br/>10.1.2 深入探讨混淆矩阵224<br/>10.1.3 使用混淆矩阵度量性能225<br/>10.1.4 准确率之外的其他性能度量指标226<br/>10.1.5 使用ROC曲线可视化性能权衡233<br/>10.2 评估未来的性能237<br/>10.3 总结242<br/>第11章 提高模型的性能243<br/>11.1 调整多个模型来提高性能243<br/>11.2 使用元学习来提高模型的性能251<br/>11.2.1 理解集成学习251<br/>11.2.2 bagging253<br/>11.2.3 boosting254<br/>11.2.4 随机森林256<br/>11.3 总结261<br/>第12章 其他机器学习主题262<br/>12.1 管理和准备真实数据262<br/>12.1.1 使用tidyverse添加包使数据变得“整洁”263<br/>12.1.2 读取和写入外部数据文件265<br/>12.1.3 查询SQL数据库中的数据266<br/>12.2 处理在线数据和服务270<br/>12.2.1 下载网页的所有文本270<br/>12.2.2 解析网页中的数据271<br/>12.3 处理特定领域的数据277<br/>12.3.1 分析生物信息学数据277<br/>12.3.2 分析和可视化网络数据277<br/>12.4 提高R语言的性能280<br/>12.4.1 处理非常大的数据集281<br/>12.4.2 使用并行计算来加快学习过程283<br/>12.4.3 部署优化的学习算法290<br/>12.4.4 GPU计算292<br/>12.5 总结294

内容摘要
本书共12章:第1章介绍机器学习的基本概念和理论,并介绍用于机器学习的R软件环境的准备;第2章介绍如何应用R来管理数据,进行数据的探索分析和数据可视化;第3~9章介绍典型的机器学习算法,包括k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类,并给出大量的实际案例和详细的分析步骤,例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等;第10章介绍模型性能评价的原理和方法;第11章给出提高模型性能的几种常用方法;第12章讨论用R进行机器学习时可能遇到的一些高级专题,如特殊形式的数据、大数据集的处理、并行计算和GPU计算等技术。<br><br>

主编推荐
机器学习的核心是将数据转换为可操作的知识。R提供了一组强大的机器学习方法,可以帮助你快速轻松地发现数据背后隐藏的信息。本书通过清晰和实用的案例来探索机器学习在现实世界中的应用。无论你是经验丰富的R用户还是R初学者,都会从本书中学到如何发现关键信息、做出新的预测并进行可视化。本书的第3版包含更新和更好的库、有关机器学习中的道德和偏差问题的建议,以及深度学习的简介。通过阅读本书,你将学到:•通过示例发现机器学习的起源以及计算机的学习方式。•使用R语言为机器学习准备数据。•使用很近邻和贝叶斯方法对重要结果进行分类。•使用决策树、关联规则和支持向量机预测未来事件。•使用回归方法预测数值型数据和估计金融数据。•使用人工神经网络为复杂过程建模——深度学习的基础。•避免机器学习模型中的偏差。•评估模型并改善其性能。•将R连接到SQL数据库和新兴的大数据技术,例如Spark、H2O和TensorFlow。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP