• Spark
21年品牌 40万+商家 超1.5亿件商品

Spark

正版新书 新华官方库房直发 可开电子发票

31.95 7.1折 45 全新

仅1件

江苏南京
认证卖家担保交易快速发货售后保障

作者(印)亚达夫(Rishi Yadav) 著;顾星竹,刘见康 译

出版社人民邮电出版社

ISBN9787115429667

出版时间2016-10

版次1

装帧平装

开本16开

纸张胶版纸

页数190页

字数251千字

定价45元

货号SC:9787115429667

上书时间2024-09-10

文源文化

六年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
亚达夫,拥有17年设计和开发企业级应用的经验。他是一位开源软件专家,引领了美国公司的大数据趋势。Rish被评为2014年40位40岁以下硅谷杰出工程师之一。他于1998年获得杰出的印度理工学院(Indian Institute of Technology,IIT)德里分校的学士学位。大约在10年前,Rishi创办了InfoObjects,这是一家以深度探索数据为宗旨的企业。该公司已连续4年被列入发展快公司5000强。InfoObjects也被授予了2014及2015年度湾区杰出工作地点首名的桂冠。Rishi还是一位开源社区贡献者和活跃的博主。
内容简介:
Spark是一个基于内存计算的开源集群计算系统,它很好小巧玲珑,让数据分析更加快速,已逐渐成为新一代大数据处理平台中的佼佼者。
本书内容分为12章,从认识Apache Spark开始讲解,陆续介绍了Spark的使用、外部数据源、Spark SQL、Spark Streaming、机器学习、监督学习中的回归和分类、无监督学习、推荐系统、图像处理、优化及调优等内容。
本书适合大数据领域的技术人员,可以帮助他们更好地洞悉大数据,本书也适合想要学习Spark进行大数据处理的人员,它将是一本不错的参考教程。
目录:
第1章开始使用Apache Spark 1
1.1简介1
1.2使用二进制文件安装Spark2
1.3通过Maven构建Spark源码5
1.4在Amazon EC2上部署Spark7
1.5在集群上以独立模式部署
Spark13
1.6在集群上使用Mesos部署Spark18
1.7在集群上使用YARN部署19
1.8使用Tachyon作为堆外存储层22
第2章使用Spark开发应用27
2.1简介27
2.2探索Spark shell27
2.3在Eclipse中使用Maven开发Spark应用29
2.4在Eclipse中使用SBT开发Spark应用33
2.5在Intellij IDEA中使用Maven开发Spark应用34
2.6在Intellij IDEA中使用SBT开发Spark应用36
第3章外部数据源38
3.1简介38
3.2从本地文件系统加载数据39
3.3从HDFS加载数据40
3.4从HDFS加载自定义输入格式的数据45
3.5从Amazon S3加载数据46
3.6从Apache Cassandra加载数据49
3.7从关系型数据库加载数据54
第4章Spark SQL57
4.1简介57
4.2理解Catalyst优化器60
4.3创建HiveContext63
4.4使用case类生成数据格式66
4.5编程指定数据格式67
4.6使用Parquet格式载入及存储数据69
4.7使用JSON格式载入及存
...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP