Spark深度学习指南
全新正版 极速发货
¥
63.36
5.8折
¥
109
全新
库存5件
作者艾哈迈德·谢里夫
出版社电子工业出版社
ISBN9787121378829
出版时间2020-01
装帧平装
开本16开
定价109元
货号1202003349
上书时间2024-06-02
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
关于作者AhmedSherif是一名数据科学家,自2005年以来一直从事各种各样的数据研究工作。他从2013年开始使用BI解决方案并慢慢转向数据科学。2016年,他从西北大学获得了预测分析硕士学位,在那里他研究使用Python和R语言进行机器学习和预测建模的科学与应用。最近,他一直使用Azure在云端开发机器学习和深度学习解决方案。2016年,他出版了他的第一本书《实用商业智能》。他目前是微软公司的数据和人工智能技术解决方案专家。
“首先,我要感谢我的妻子Ameena和我的三个可爱的孩子Safiya、Hamza和Layla,感谢他们给我力量和支持来完成这本书。没有他们的爱与支持,我恐怕无法完成本书。我还要感谢我的合著者Amrith,感谢他给予我写这本书的决心和为本书付出的努力。”AmrithRavindra是一位机器学习爱好者,拥有电气与工业工程学位。在攻读硕士学位期间,他深入地研究了机器学习问题,加深了自己对数据科学的热爱程度。工程专业的研究生课程给他提供了数学背景,使他开始了机器学习领域的职业生涯。他在坦帕市举行的当地数据科学聚会上遇到了AhmedSherif。他们决定合作写一本关于他们最喜欢的机器学习算法的书。他希望这本书能够帮助他实现成为数据科学家并积极为机器学习做出贡献的最终目标。
“首先,我要感谢Ahmed给我这个机会和他一起工作。对我来说,写这本书比读大学本身更好。接下来,我要感谢我的爸爸、妈妈和姐姐,他们一直给我动力,给我成功的动力。最后,我要感谢我的朋友们,没有他们的指教,我永远不会像这样快速地成长。”关于审稿人MichalMalohlava是SparklingWater的创始人。他是一位极客、开发者,同时也是一位拥有10年软件开发经验的Java、Linux编程语言爱好者。他于2012年在布拉格查理大学获得博士学位,并在普渡大学完成博士后工作。他参与了用于高级大数据数学与计算的H2O平台的开发,并将其整合到Spark引擎中,以名为SparklingWater的项目发布。
AdnanMasood博士是人工智能和机器学习研究员、软件架构师和微软数据平台最有价值专家。他目前在USTGlobal公司担任人工智能和机器学习首席架构师,在那里他与斯坦福人工智能实验室和麻省理工学院人工智能实验室合作构建企业解决方案。作为斯坦福大学的访问学者、亚马逊编程语言畅销书FunctionalProgrammingwithF#的作者,他最近在丹佛市女性技术会议上发表的演讲强调了STEM(科学、技术、工业、数学)和技术领域多样化的重要性。该演讲被新闻媒体广为传播。
目录
目录
1 为深度学习开发设置Spark1
介绍1
下载Ubuntu桌面映像2
在macOS中使用VMWare Fusion安装和配置Ubuntu3
在Windows中使用Oracle VirtualBox安装和配置Ubuntu8
为谷歌云平台安装和配置Ubuntu桌面端11
在Ubuntu桌面端安装和配置Spark23
集成Jupyter Notebook与Spark29
启动和配置Spark集群33
停止Spark集群34
2 在Spark中创建神经网络36
介绍36
在PySpark中创建数据帧37
在PySpark数据帧中操作列41
将PySpark数据帧转换为数组42
在散点图中将数组可视化46
设置输入神经网络的权重和偏差49
规范化神经网络的输入数据52
验证数组以获得最佳的神经网络性能55
使用sigmoid设置激活函数57
创建sigmoid导数60
计算神经网络中的代价函数62
根据身高值和体重值预测性别66
预测分数并进行可视化69
3 卷积神经网络的难点72
介绍72
难点1:导入MNIST图像73
难点2:可视化MNIST图像77
难点3:将MNIST图像导出为文件80
难点4:增加MNIST图像82
难点5:利用备用资源训练图像86
难点6:为卷积神经网络优先考虑高级库88
4 循环神经网络的难点94
介绍94
前馈网络简介95
循环神经网络的顺序工作103
难点1:梯度消失问题108
难点2:梯度爆炸问题111
长短期记忆单元的顺序工作114
5 用Spark机器学习预测消防部门呼叫119
介绍119
下载旧金山消防局呼叫数据集119
识别逻辑回归模型的目标变量123
为逻辑回归模型准备特征变量130
应用逻辑回归模型137
评估逻辑回归模型的准确度142
6 在生成网络中使用LSTM145
介绍145
下载将用作输入文本的小说/书籍145
准备和清理数据151
标记句子156
训练和保存LSTM模型158
使用模型生成类似的文本163
7 使用TF-IDF进行自然语言处理171
介绍171
下载治疗机器人会话文本数据集172
分析治疗机器人会话数据集176
数据集单词计数可视化178
计算文本的情感分析180
从文本中删除停用词184
训练TF-IDF模型188
评估TF-IDF模型性能192
比较模型性能和基线分数194
8 使用XGBoost进行房地产价值预测196
下载金斯县房屋销售数据集196
执行探索性分析和可视化199
绘制价格与其他特征之间的相关性210
预测房价223
9 使用长短期记忆单元预测苹果公司股票市场价格229
下载苹果公司的股票市场数据229
探索和可视化苹果公司的股票市场数据233
准备用于提升模型性能的股票市场数据238
构建长短期记忆单元模型246
评估长短期记忆单元模型249
10 使用深度卷积网络进行人脸识别252
介绍252
下载MIT-CBCL数据集并将其加载到内存中252
绘制并可视化目录中的图像257
图像预处理262
模型构建、训练和分析269
11 使用Word2Vec创建和可视化单词向量277
介绍277
获取数据277
导入必要的库281
准备数据284
构建和训练模型288
进一步可视化293
进一步分析300
12 使用Keras创建电影推荐引擎304
介绍304
下载MovieLens数据集305
操作和合并MovieLens数据集312
探索MovieLens数据集318
为深度学习流水线准备数据集322
应用Keras深度学习模型327
评估推荐引擎的准确度331
13 使用TensorFlow在Spark中进行图像分类333
介绍333
下载梅西和罗纳尔多各30张图像334
使用深度学习包安装PySpark339
将图像加载到PySpark数据帧341
理解迁移学习344
创建用于图像分类训练的流水线346
评估模型性能348
微调模型参数350
内容摘要
本书开头部分讲了如何按照深度学习的需求来配置ApacheSpark,以实现不同类型的神经网络,接下来讲述了在分布式环境中实现深度学习涉及的常见和不那么常见的需求。另外,你还将学到Spark中的深度学习代码,这些代码可以复用到其他类似的问题中,或者稍作改动用于略有不同的问题。将带你一起用Spark对数据进行分流和聚类用TensorFlow、deeplearning4j和Caffe在Spark中实现和部署深度学习模型,例如CNN、RNN和LSTM。学完本书的内容,你将能够在Spark上训练和部署有效的深度学习模型。
— 没有更多了 —
以下为对购买帮助不大的评价