• 深度强化学习理论与实践
  • 深度强化学习理论与实践
  • 深度强化学习理论与实践
  • 深度强化学习理论与实践
  • 深度强化学习理论与实践
  • 深度强化学习理论与实践
21年品牌 40万+商家 超1.5亿件商品

深度强化学习理论与实践

全新正版 极速发货

57.11 6.4折 89 全新

库存9件

广东广州
认证卖家担保交易快速发货售后保障

作者龙强,章胜 编

出版社清华大学出版社

ISBN9787302625544

出版时间2023-03

装帧平装

开本16开

定价89元

货号1202837482

上书时间2024-06-01

徐小智的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
龙强,博士、副教授、硕士研究生导师;就职于西南科技大学数理学院数据科学系,中国运筹学会终生会员;主要从事很优化理论与算法、机器学习算法研究;在国际国内学术期刊上发表论文20余篇,获批国家发明专利3项,主持和参与国家自然科学基金3项,参与国家社会科学基金1项;讲授“深度强化学习”“深度学习与神经网络”“算法设计与分析”“很优化理论与算法”“机器学习”等课程。
章胜,博士、副研究员、硕士研究生导师;就职于中国空气动力研究与发展中心,中国空气动力学学会会员;主要从事飞行器轨迹优化、非线性控制与智能控制研究。在国际及国内学术期刊上发表论文20篇,获批国家发明专利5项,主持和参与国家自然科学基金、国家重点基础研究发展计划等项目15项。

目录
第1章 强化学习的模型

1.1.1 强化学习简介

1.1.2 强化学习的历史

1.1.3 强化学习与机器学习的关系

1.2 强化学习的模型

1.2.1 强化学习基本模型和要素

1.2.2 强化学习的执行过程

1.2.3 强化学习的数学模型——马尔可夫决策过程

1.2.4 环境模型案例

1.3 Gym介绍

1.3.1 Gym简介

1.3.2 Gym安装

1.3.3 Gym的环境描述和案例

1.3.4 在Gym中添加自编环境

1.3.5 直接使用自编环境

第2章 动态规划法

……

内容摘要
本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍了强化学习的模型,第5章简单介绍了深度学习和PyTorch编程框架。
本书可以作为理工科大学相关专业研究生的学位课教材,也可以作为人工智能、机器学习相关专业高年级本科生的选修课教材,还可以作为相关领域学术研究人员、教师和工程技术人员的参考资料。

主编推荐
本书系统介绍深度强化学习的理论和算法,并配有大量的案例。全书核心内容可以分为3部分,第一部分为经典强化学习,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。
★ 大多数每个算法配有一个或多个测试案例,便于读者理解理论和算法;
★ 每个案例都配有编程实现的代码,便于读者理论联系实际,并亲自上手实践;
★ 为减轻读者编写代码的难度,本书所有案例的代码都是可以独立运行的,并且尽量减少了对依赖包的使用。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP