• 实用机器学习
21年品牌 40万+商家 超1.5亿件商品

实用机器学习

全新正版 极速发货

45.2 5.7折 79 全新

仅1件

广东广州
认证卖家担保交易快速发货售后保障

作者(印)苏尼拉·格拉普蒂(Sunila Gollapudi) 著;张世武,陈铁兵,商旦 译

出版社机械工业出版社

ISBN9787111598886

出版时间2018-06

装帧平装

开本16开

定价79元

货号1201707877

上书时间2024-09-06

大智慧小美丽

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
苏尼拉·格拉普蒂,担任Broadridge金融解决方案(印度)有限公司的技术副总裁。该公司是美国Broadridge金融解决方案公司的全资子公司(BR)。她在IT服务领域拥有14年的丰富实践经验。她目前负责印度很好架构中心,是大数据和数据科学计划的领军人物。
张世武毕业于北京科技大学数学系,曾先后在中科院计算所、新浪、汽车之家、国美大数据研究院等机构与公司从事搜索引擎研发和管理工作,在Linux C/C++方面有着丰富的研发经验。感兴趣的研究领域包括全文索引内核、分布式搜索引擎框架、相关性排序、机器学习算法等。译著有《深入理解ElasticSearch》。

目录
推荐序一
推荐序二
译者序
前言
关于作者
关于审校者
章 机器学习简介
1.1 机器学习
1.1.1 定义
1.1.2 核心概念与术语
1.1.3 什么是学习
1.1.4 机器学习中的数据不一致性
1.1.5 机器学习实践范例
1.1.6 机器学习问题类型
1.2 性能度量
1.3 机器学习的相关领域
1.3.1 数据挖掘
1.3.2 人工智能
1.3.3 统计学习
1.3.4 数据科学
1.4 机器学习处理流程及解决方案架构
1.5 机器学习算法
1.5.1 基于决策树的算法
1.5.2 基于贝叶斯的算法
1.5.3 基于核方法的算法
1.5.4 聚类算法
1.5.5 人工神经网络
1.5.6 降维方法
1.5.7 集成方法
1.5.8 基于实例的算法
1.5.9 基于回归分析的算法
1.5.10 基于关联规则的算法
1.6 机器学习工具与框架
1.7 小结
第2章 机器学习和大规模数据集
2.1 大数据和大规模机器学习
2.1.1 功能与架构:方法论的失配
2.1.2 机器学习的可扩展性和性能
2.1.3 模型选择过程
2.1.4 大规模机器学习的潜在问题
2.2 算法和并发
2.3 垂直扩展的机器学习技术方案
2.3.1 MapReduce编程架构
2.3.2 利用消息传递接口进行高性能计算
2.3.3 LINQ框架
2.3.4 使用LINQ操作数据集
2.3.5 GPU
……
第3章 Hadoop架构和生态系统简介
第4章 机器学习工具、库及框架
第5章 基于决策树的学习
第6章 基于实例和核方法的学习
第7章 关联规则学习
第8章 聚类学习
第9章 贝叶斯学习
0章 基于回归的学习
1章 深度学习
2章 强化学习
3章 集成学习
4章 下一代机器学习数据架构

内容摘要
苏尼拉·格拉普蒂著的《实用机器学习/数据科学与工程技术丛书》探索了一系列广泛应用的机器学习技术,用实际例子揭示常见数据中隐藏的处理技巧。虽然机器学习是高度理论性的,但是本书提供了一种令人耳目一新的实操方法,同时也没有忽略底层原理。
本书涵盖当前靠前的数据科学语言(如Python和R)、被低估但很好强大的Julia,以及一系列大数据平台(包括Spark、Hadoop和Mahout等)。实用的机器学习技术是现代数据科学家掌握机器学习应用的重要资源。
本书还探讨了机器学习的前沿进展,提供了一些关于深度学习和强化学习的范例和指导原则,完美演绎实操过程及算法原理。

精彩内容
前言从结构复杂的海量数据集中探索数据蕴含的意义,是日益增长的现实需求。机器学习与预测分析技术是进行此类探索的重要工具。机器学习利用历史数据集,提取其中蕴含的模式,在不断的迭代中提升预测效果。机器学习能发现数据中隐含的动态趋势、模式及关系,这对业务增长非常重要。    在本书中,读者不仅仅能学到机器学习的基本知识,同时也能了解到现实世界的数据复杂性,然后使用Hadoop及其生态系统软件来处理和管理结构化及非结构化数据。    主要内容章介绍机器学习的基本概念及其常见语义。通过一些简单的术语来定义机器学习。本章是其余章节的基础。    第2章探索大规模数据集,包括其公共特性、数据重复问题、数据量快速增长的原因,以及如何处理大数据。    第3章介绍Hadoop,从Hadoop核心框架开始,然后扩展到其生态系统。学完本章,读者将掌握Hadoop的配置、部分功能的运行,同时也能了解到某些Hadoop生态系统组件。读者将能够运行和管理Hadoop环境及理解命令行工具的使用。    第4章介绍一些开源的机器学习工具,包括安装、算法在特定工具或平台中的实现,以及这些库、工具及框架的运行,这些工具或库包括Apache Mahout、Python、R、Julia以及Apache Spark中的MLlib。值得强调的是,本章中也会着重介绍这些库、工具或框架与Hadoop的集成。    第5章介绍一种有监督学习技术,称为决策树,它既可解决分类问题也可以解决回归问题。本章内容覆盖从特征选择到决策树分裂、剪枝等多个环节。重点介绍几类决策树算法,如CART、C45、随机森林以及一些不错的决策树。    第6章介绍两种机器学习方法——基于实例和基于核方法的学习,并讨论它们是如何解决分类与预测问题的。在基于实例的方法中,会详细介绍最近邻算法。而在基于核方法的机器学习算法中,会重点介绍如何使用支持向量机解决现实问题。    第7章探讨关联规则学习相关算法:Apriori及FPgrowth。借助一个常见的例子,手把手教读者通过Apriori及FPgrowth算法进行频繁模式挖掘。    第8章讨论聚类学习方法,聚类是一种无监督学习方法。本章将深入介绍kmeans聚类,同时利用Mahout、R、Python、Julia、Spark等工具演示如何实现kmeans聚类。    第9章介绍贝叶斯学习。此外,介绍一些核心的统计学概念,从基本术语到各种分布模型。最后会深入介绍贝叶斯定理,以及如何利用它解决现实问题。    0章介绍基于回归分析的机器学习,重点介绍如何利用Mahout、R、Python、Julia、Spark等工具实现线性回归和逻辑回归。另外,也会介绍相关统计概念,如方差、协方差、ANOVA等。最后会利用案例深入介绍如何使用回归模型解决现实问题。    1章首先介绍生物学中的神经元模型、人工神经网络的功能以及与它的关联。读者将会学到人工神经网络的核心概念、全连接神经网络的结构。本章也会探究某些关键的激活函数,它们用到了矩阵乘法。    2章介绍一种新的机器学习技术,称为强化学习。读者将会了解到它与传统的有监督和无监督机器学习技术的区别。本章也会介绍MDP基础,以及相关的案例。    3章讨论机器学习中的集成学习方法,带领读者通过真实案例掌握某些有监督集成学习技术。最后,本章将以源代码形式介绍如何利用R、Python(scikitlearn)、Julia、Spark、Mahout等工具演示梯度提升算法。    4章介绍机器学习的实现。读者需要深刻理解传统分析平台的局限,以及为什么它们不能适应现代数据需求。读者也应该了解新的数据架构范式,如Lambda架构混合持久化(多模型数据库架构);本章也会介绍语义架构,它帮助使用者进行无缝数据集成。    阅读准备欲演示本书中的范例,需预先安装下列软件:    ●R(2151)●Apache Mahout (09)●Python(scikitlearn)●Julia(034)●Apache Spark(Scala 2104)目标读者本书的目标读者是那些想了解机器学习实践及通过机器学习技术解决现实应用的数据科学家。本书能指导读者了解机器学习和预测分析的基本原理及最新进展,了解大数据革命的方方面面,这是任何致力于解决当前大数据问题的人员的必备资源。如果你想立即着手练习,需具备基本的编程(Python和R)功底和数学知识。    范例源码及彩图下载本书提供了源代码供读者下载,网址为https://githubcom/PacktCode/PracticalMachineLearning。    为了帮助读者更好地理解书中的内容,本书提供了彩图的PDF文件供读者下载:http://wwwpacktpubcom/sites/default/files/downloads/Practical_Machine_Learning_ColorImagespdf。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP