深度强化学习
正版新书 新华官方库房直发 可开电子发票
¥
62.37
6.3折
¥
99
全新
库存14件
作者刘驰[等]编著
出版社机械工业出版社
ISBN9787111646648
出版时间2020-03
版次1
装帧平装
开本16开
纸张胶版纸
页数377页
定价99元
货号SC:9787111646648
上书时间2024-10-31
商品详情
- 品相描述:全新
-
全新正版 提供发票
- 商品描述
-
内容简介:
本书共分为四篇,即深度强化学习、多智能体深度强化学习、多任务深度强化学习和深度强化学习的应用。由浅入深、通俗易懂,涵盖经典算法和近几年的前沿技术进展。特别是书中详细介绍了每一种代表性算法的代码原型实现,旨在理论与实践相结合,让读者学有所得、学有所用。第一篇(包含第1~3章)主要讲解深度强化学习基础,侧重于单智能体强化学习算法,相对简单,有助于初级读者理解,同时涵盖了近几年的经典算法和一些前沿的研究成果。第二篇(包含第4~5章)主要侧重于对多智能体深度强化学习的讲解,从多智能体强化学习基本概念到相关算法的讲解和分析,以多个极具代表性的算法为例带领读者逐步学习多智能体训练及控制的理论与方法。同时,还介绍了多智能体强化学习领域一些前沿学术成果。第三篇(包含第6~7章)扩展到多任务场景,称为多任务深度强化学习。首先介绍了多任务强化学习的基本概念和相关基础知识,随后讲解了部分经典的多任务深度强化学习算法。第四篇(包含第8~11章)主要讲解深度强化学习的实际应用,涉及游戏、机器人控制、计算机视觉和自然语言处理四大领域。通过领域应用中思想和方法的讲解,培养读者跨领域解决实际问题的能力,以帮助读者熟练掌握和使用深度强化学习这一强大的方法来解决和优化实际工程领域中的问题。
目录:
前言
致谢
数学符号
第一篇深度强化学习
第1章深度强化学习基础2
1.1强化学习2
1.1.1强化学习的发展历史2
1.1.2强化学习简介4
1.1.3深度强化学习简介6
1.2马尔可夫属性和决策过程9
1.2.1马尔可夫属性9
1.2.2马尔可夫决策过程11
1.3强化学习核心概念12
1.3.1值函数12
1.3.2动态规划14
1.3.3时间(序)差分15
1.3.4策略梯度16
1.3.5actor-critic方法17
1.4Q-learning18
1.4.1Q-learning简介18
1.4.2算法19
1.4.3相关变量及影响20
1.4.4实现方法21
第2章深度强化学习算法22
2.1基于值的深度强化学习算法22
2.1.1深度Q网络22
2.1.2深度双Q网络27
2.1.3竞争网络架构31
2.1.4平均值DQN33
2.1.5多DQN变种结合体:Rainbow37
2.1.6基于动作排除的DQN42
2.2基于策略的深度强化学习算法46
2.2.1循环确定性策略梯度46
2.2.2深度确定性策略梯度55
2.2.3信赖域策略优化62
2.2.4近端策略优化68
2.3基于模型的深度强化学习算法73
2.3.1基于模型加速的连续深度Q-learning73
2.3.2范例模型探索80
2
...
— 没有更多了 —
全新正版 提供发票
以下为对购买帮助不大的评价