消息首页搜索举报

深入浅出强化学习

正版新书新华官方库房直发可开电子发票

56.89 7.2折 79 全新

库存6件

湖北武汉

认证卖家担保交易快速发货售后保障

作者郭宪,方勇纯编著

出版社电子工业出版社

ISBN9787121329180

出版时间2018-01

版次1

装帧平装

开本16开

纸张胶版纸

页数239页

字数284千字

定价79元

货号SC:9787121329180

上书时间2024-11-27

沈成书店

十二年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 13小时
好评率暂无

最新上架

我怎样画山水画 ¥16.54

中国绝美古诗词(马)/田英章田雪松硬笔字帖 ¥3.24

正宗过瘾川菜 ¥35.36

文育IP ¥27.84

股市猎手吃定主升浪空中加油战法精解 ¥30.41

标准化应知应会 ¥75.60

彩票追号绝技 ¥22.04

夏目友人帐(11-15) ¥42.75

黑暗中的笑声 ¥25.44

商品详情

品相描述：全新: 全新正版提供发票

商品描述: 作者简介:
郭宪，南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业，同年保送到中国科学院沈阳自动化研究所硕博连读，主攻机器人动力学建模与控制，并于2016年1月获得工学博士学位；期间在靠前外知名杂志和会议发表论文数10篇。2016年以来，郭博士主攻方向为机器人智能感知和智能决策，目前主持两项重量课题，内容涉及深度学习、深度强化学习等智能算法在机器人领域中的应用。
内容简介:
郭宪、方勇纯编著的《深入浅出强化学习（原理入门）》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理，覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从很基本的马尔科夫决策过程入手，将强化学习问题纳入到严谨的数学框架中，接着阐述了解决此类问题很基本的方法――动态规划方法，并从中总结出解决强化学习问题的基本思路：交互迭代策略评估和策略改善。基于这个思路，分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。很后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
除了系统地介绍基本理论，书中还介绍了相应的数学基础和编程实例。因此，《深入浅出强化学习（原理入门）》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
目录:
1 绪论
1.1 这是一本什么书
1.2 强化学习可以解决什么问题
1.3 强化学习如何解决问题
1.4 强化学习算法分类及发展趋势
1.5 强化学习仿真环境构建
1.5.1 gym安装及简单的demo示例
1.5.2 深入剖析gym环境构建
1.6 本书主要内容及安排
第一篇强化学习基础
2 马尔科夫决策过程
2.1 马尔科夫决策过程理论讲解
2.2 MDP中的概率学基础讲解
2.3 基于gym的MDP实例讲解
2.4 习题
3 基于模型的动态规划方法
3.1 基于模型的动态规划方法理论
3.2 动态规划中的数学基础讲解
3.2.1 线性方程组的迭代解法
3.2.2 压缩映射证明策略评估的收敛性
3.3 基于gym的编程实例
3.4 很优控制与强化学习比较
3.5 习题
第二篇基于值函数的强化学习方法
4 基于蒙特卡罗的强化学习方法
4.1 基于蒙特卡罗方法的理论
4.2 统计学基础知识
4.3 基于Python的编程实例
4.4 习题
5 基于时间差分的强化学习方法
5.1 基于时间差分强化学习算法理论讲解
5.2 基于Python和gym的编程实例
5.3 习题
6 基于
...

— 没有更多了 —