深度强化学习
全新正版 假一赔十 可开发票
¥
46.48
5.2折
¥
89
全新
库存12件
作者(印)莫希特·塞瓦克 著 尹大伟,吴敏杰 译
出版社国防工业出版社
ISBN9787118131796
出版时间2024-06
装帧平装
开本16开
定价89元
货号1203344284
上书时间2024-11-04
商品详情
- 品相描述:全新
- 商品描述
-
目录
第1章强化学习简介:AI智能体背后的智能
1.1什么是人工智能,强化学习与它有什么关系?
1.2理解强化学习的基本设计
1.3强化学习中的奖励和确定一个合适的奖励函数所涉及的问题
1.4强化学习的状态
1.5强化学习中的智能体
1.6小结
第2章强化学习的数学和算法理解:马尔可夫决策过程与解决方法
2.1马尔可夫决策过程
2.2贝尔曼方程
2.3动态规划和贝尔曼方程
2.4价值迭代和策略迭代方法
2.5小结
第3章编码环境和马尔可夫决策过程的求解:编码环境、价值迭代和策略迭代算法
3.1以网格世界问题为例
3.2构建环境
3.3平台要求和代码的工程架构
……
内容摘要
本书主要内容包括:介绍了强化学习的基本概念,如智能体、环境、状态、奖励、动作等;介绍了强化学习的数学和算法原理,如马尔可夫决策过程和贝尔曼方程,并在此基础上讨论了动态规划、值迭代和策略迭代方法;介绍了强化学习的估计与控制问题,并通过实例展示了Q学习的编程;深入探讨了深度学习的概念、架构机制,通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念,为后续章节与强化学习算法相结合作铺垫。
— 没有更多了 —
以下为对购买帮助不大的评价