• Apache
21年品牌 40万+商家 超1.5亿件商品

Apache

正版新书 新华官方库房直发 可开电子发票

37.76 6.4折 59 全新

库存2件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)刘永川(Alex Liu) 著;闫龙川,高德荃,李君婷 译

出版社机械工业出版社

ISBN9787111562559

出版时间2017-03

版次1

装帧平装

开本16开

纸张胶版纸

页数208页

定价59元

货号SC:9787111562559

上书时间2024-11-08

江苏读客文化

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
精彩内容:
Preface?前    言作为数据科学家和机器学习专业人员,我们的工作是建立模型进行欺诈检测、预测客户流失,或者在广泛的领域将数据转换为洞见。为此,我们有时需要处理大量的数据和复杂的计算。因此,我们一直对新的计算工具满怀期待,例如Spark,我们花费了很多时间来学习新工具。有很多可用的资料来学习这些新的工具,但这些资料大多都由计算机科学家编写,更多的是从计算角度来描述。    作为Spark用户,数据科学家和机器学习专业人员更关心新的系统如何帮助我们建立准确度更高的预测模型,如何使数据处理和编程更加简单。这是本书的写作目的,也是由数据科学家来执笔本书的主要原因。    与此同时,数据科学家和机器学习专业人员已经开发了工作框架、处理过程,使用了一些较好的建模工具,例如R语言和SPSS。我们了解到一些新的工具,例如Spark的MLlib,可以用它们来取代一些旧的工具,但不能全部取代。因此,作为Spark的用户,将Spark与一些已有的工具共同使用对我们十分关键,这也成为本书主要的关注点之一,是本书不同于其他Spark书籍的一个关键因素。    整体而言,本书是一本由数据科学家写给数据科学家和机器学习专业人员的Spark参考书,目的是让我们更加容易地在Spark上使用机器学习。    主要内容第1章,从机器学习的角度介绍Apache Spark。我们将讨论Spark DataFrame和R语言、Spark pipeline、RM4E数据科学框架,以及Spark notebook和模型的实现。    第2
...
内容简介:
本书包装了一系列项目“蓝图”,展示了Spark可以帮你解决的一些有趣挑战,读者在将理论知识实践于一些实际项目之前,会了解到如何使用Sparknotebook,以及如何访问、清洗和连接不同的数据集,你将在其中了解Spark机器学习如何帮助你完成从欺诈检测到分析客户流失等各种工作。你还将了解如何使用Spark的并行计算能力构建推荐引擎。
目录:
译者序
前言
第1章Spark机器学习简介
1.1Spark概述和技术优势
1.1.1Spark概述
1.1.2Spark优势
1.2在机器学习中应用Spark计算
1.3机器学习算法
1.4MLlib
1.5SparkRDD和DataFrame
1.5.1SparkRDD
1.5.2SparkDataFrame
1.5.3R语言DataFrameAPI
1.5.4机器学习框架、RM4E和Spark计算
1.5.5机器学习框架
1.5.6RM4E
1.5.7Spark计算框架
1.6机器学习工作流和Sparkpipeline
1.7机器学习工作流示例
1.8Sparknotebook简介
1.8.1面向机器学习的notebook方法
1.8.2Sparknotebook
1.9小结
第2章Spark机器学习的数据准备
2.1访问和加载数据集
2.1.1访问公开可用的数据集
2.1.2加载数据集到Spark
2.1.3数据集探索和可视化
2.2数据清洗
2.2.1处理数据不完备性
2.2.2在Spark中进行数据清洗
2.2.3更简便的数据清洗
2.3一致性匹配
2.3.1一致性问题
2.3.2基于Spark的一致性匹配
2.3.3实体解析
2.3.4更好的一致性匹配
2.4数据集重组
2.4.1数据集重组任务
2.4.2使用SparkSQL进行数据集重组
2.4.3在Spark上使用R语言进行数据集重组
2.5数据集连接
2.5.1数据连接及其
...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP