• 深度强化学习实战
  • 深度强化学习实战
  • 深度强化学习实战
  • 深度强化学习实战
21年品牌 40万+商家 超1.5亿件商品

深度强化学习实战

正版新书 新华官方库房直发 可开电子发票

59.9 5.0折 119.8 全新

库存25件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)亚历山大·扎伊,(美)布兰登·布朗

出版社人民邮电出版社

ISBN9787115576361

出版时间2023-04

版次1

装帧平装

开本16开

纸张胶版纸

页数312页

字数428千字

定价119.8元

货号SC:9787115576361

上书时间2024-05-10

江苏读客文化

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
Alexander Zai曾担任Codesmith(一个沉浸式的编码训练营)首席技术官和技术顾问、Uber 软件工程师、Bonjo和AmazonAI机器学习工程师,他也是开源深度学习框架Apache MXNet的贡献者。此外,他还是两家公司的联合创立人,其中一家曾是Y-combinator的参与者。

Brandon Brown从很小的时候就开始编程,大学期间做过兼职软件工程师,但最终选择投身医疗行业(在此期间,他在医疗保健科技领域担任软件工程师)。受深度强化学习的启发,他近期专注于计算精神病学的研究。
主编推荐:
1.详细讲解深度强化学习基础知识,内容丰富
2.提供多个实战案例,学习更有效,实践更有用
3.包含核心算法+PyTorch、OpenAI Gym等流行工具,新颖实用
4.作者在深度强化学习领域经验丰富,知识点梳理清晰,易懂易学
内容简介:
本书先介绍深度强化学习的基础知识及相关算法,然后给出多个实战项目,以期让读者可以根据环境的直接反馈对智能体加以调整和改进,提升运用深度强化学习技术解决实际问题的能力。本书涵盖深度Q网络、策略梯度法、演员-评论家算法、进化算法、Dist-DQN、多智能体强化学习、可解释性强化学习等内容。本书给出的实战项目紧跟深度强化学习技术的发展趋势,且所有项目示例以Jupter Notebook样式给出,便于读者修改代码、观察结果并及时获取经验,能够带给读者交互式的学习体验。
本书适合有一定深度学习和机器学习基础并对强化学习感兴趣的读者阅读。
目录:
第一部分基础篇

第1章什么是强化学习3

1.1深度强化学习中的“深度”4

1.2强化学习5

1.3动态规划与蒙特卡洛7

1.4强化学习框架9

1.5强化学习可以做什么12

1.6为什么是深度强化学习14

1.7教学工具:线图15

1.8后续内容概述17

小结18

第2章强化学习问题建模:马尔可夫决策过程19

2.1线图与本书的教学方法19

2.2解决多臂老虎机问题22

2.2.1探索与利用23

2.2.2贪婪策略24

2.2.3Softmax选择策略29

2.3应用老虎机算法优化广告投放31

2.3.1上下文老虎机31

2.3.2状态、动作和奖励32

2.4利用PyTorch构建网络33

2.4.1自动微分33

2.4.2构建模型34

2.5解决上下文老虎机问题35

2.6马尔可夫性质39

2.7预测未来奖励:价值和策略函数41

2.7.1策略函数42

2.7.2很优策略43

2.7.3价值函数43

小结44

第3章预测很好状态和动作:深度Q网络46

3.1Q函数46

3.2Q-learning导航47

3.2.1Q-learning是什么48

3.2.2应用于Gridworld游戏49

3.2.3超参数50

3.2.4贴现因子50

3.2.5构建网络52

3.2.6介绍Gridworld游戏引擎53

3.2.7构
...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP