• 数据算法
21年品牌 40万+商家 超1.5亿件商品

数据算法

正版新书 新华官方库房直发 可开电子发票

28.16 2.2折 128 全新

库存7件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)马哈默德·帕瑞斯安(Mahmoud Parsian) 著;苏金国 等 译

出版社中国电力出版社

ISBN9787512395947

出版时间2016-10

版次1

装帧平装

开本16开

纸张胶版纸

页数680页

字数834千字

定价128元

货号SC:9787512395947

上书时间2024-12-23

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
Mahmoud Parsian,计算机科学博士,是一位热衷于实践的软件专家,作为开发人员、设计人员、架构师和作者,他有30多年的软件开发经验。目前领导着Illumina的大数据团队,在过去15年间,他主要从事Java(服务器端)、数据库、MapReduce和分布式计算的有关工作。Mahmoud还著有《JDBC Recipes》和《JDBC Metadata,MySQL,and Oracle Recipes》等书(均由Apress出版)。
精彩内容:
随着大规模搜索引擎(如Google和Yahoo! )、基因组分析(DNA测序、RNA测序和生物标志物分析)以及社交网络(如Facebook 和Twitter) 的不断发展,需要生成和处理的数据量已经超过了千万亿字节。为了满足如此庞大的计算需求,我们需高效、可伸缩的并行算法。MapReduce范式就是解决这些问题的一个框架。
MapReduce是一个软件框架,可以采用并行、分布式方式处理GB、TB,甚至PB级的大数据集,同时它也是一个在商用服务器集群之上完成大规模数据处理的执行框架。实现MapReduce 的方法有很多,不

过这本书中我们主要关注Apache Spark 和MapReduce/ Hadoop。你将通过简单而具体的示例来了解如何用Spark和Hadoop实现MapReduce。
这本书将为以下领域提供了基本分布式算法(分别用MapReduce、Hadoop和Spark实现),并按照这些领域组织本书的章节:
. 基本设计模式。

. 数据挖掘和机器学习。

. 生物信息、基因组和统计。

. 优化技术。

MapReduce是什么?
MapReduce 是一种编程范式,可以利用集群环境的成百上千台服务器实现强大的可伸缩性。MapReduce一词最早源于函数式编程,由Google在一篇名为“MapReduce: Simplified Data Processing on

Large Clusters ”的文章中率先提出。Google的MapReduc
...
内容简介:
《数据算法:Hadoop/Spark大数据处理技巧》介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这还概要介绍了MapReduce、Hadoop和Spark。
主要包括:
完成超大量交易的购物篮分析。
数据挖掘算法(K-均值、KNN和朴素贝叶斯)。
使用超大基因组数据完成DNA和RNA测序。
朴素贝叶斯定理和马尔可夫链实现数据和市场预测。
推荐算法和成对文档相似性。
线性回归、Cox回归和皮尔逊(Pearson)相关分析。
等位基因频率和DNA挖掘。
社交网络分析(推荐系统、三角形计数和情感分析)。
目录:
序1
前言3
第1章二次排序:简介19
二次排序问题解决方案21
MapReduce/Hadoop的二次排序解决方案25
Spark的二次排序解决方案29
第2章二次排序:详细示例42
二次排序技术43
二次排序的完整示例46
运行示例——老版本HadoopAPI50
运行示例——新版本HadoopAPI52
第3章靠前0列表54
TopN设计模式的形式化描述55
MapReduce/Hadoop实现:专享键56
Spark实现:专享键62
Spark实现:非专享键73
使用takeOrdered()的Spark靠前0解决方案84
MapReduce/Hadoop靠前0解决方案:非专享键91
第4章左外连接96
左外连接示例96
MapReduce左外连接实现99
Spark左外连接实现105
使用leftOuterJoin()的Spark实现117
第5章反转排序127
反转排序模式示例128
反转排序模式的MapReduce/Hadoop实现129
运行示例134
第6章移动平均137
示例1:时间序列数据(股票价格)137
示例2:时间序列数据(URL访问数)138
形式定义139
POJO移动平均解决方案140
MapReduce/Hadoop移动平均解决方案143
第7章购物篮分析155
MBA目标155
MBA的应用领域157
使用MapReduce的购物篮分析157
Spark解决方案166
运行Spark实现的YARN脚本179
第8章共同好友182<
...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP