消息首页搜索举报

深度强化学习

正版新书新华官方库房直发可开电子发票

41.27 6.9折 59.8 全新

库存11件

江苏南京

认证卖家担保交易快速发货售后保障

作者刘全,黄志刚编著

出版社清华大学出版社

ISBN9787302578208

出版时间2021-08

版次1

装帧平装

开本16开

纸张胶版纸

页数260页

字数393千字

定价59.8元

货号SC:9787302578208

上书时间2024-09-16

文源文化

六年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 9小时
好评率暂无

最新上架

新时代首都基层党建创新实践案例 ¥54.60

现代机载总线技术(全2册) ¥214.92

Kubernetes权威指南企业级容器云实战 ¥48.95

走出孤独 ¥10.56

甘祖昌精神 ¥26.27

何为共同富裕 ¥30.36

蒙文通全集 ¥607.60

少见皮肤肿瘤病理图谱 ¥94.80

诺比与外星动物园 ¥17.00

商品详情

品相描述：全新: 全新正版提供发票

商品描述: 作者简介:
"刘全，苏州大学教授，博士生导师。吉林大学博士, 南京大学软件新技术国家重点实验室博士后。苏州市人工智能学会常务理事、秘书长。2006年开始从事强化学习
领域的教学和科研工作。主讲研究生、本科生《强化学习》及相关课程16次。主持“深度强化学习方法研究”、“部分感知强化学习理论及方法”、“基于tableau的逻辑强化学习研究”等国家、省部级项目10余项。目前主要研究方向为：深度强化学习。
2012年获江苏省教工委优秀共产党员称号。2011年、2012年入选江苏省“六大人才”、江苏省“333”人才培养计划。"
主编推荐:
强化学习是目前机器学习领域最热门的方向之一，本书经多年的实践教学经验的积累，形成了一套完整的教学体系。并结合流行的深度学习框架PyTorch，该书在理论和应用上都是较优选的。本书理论结合实践，深入浅出地讲解相关算法和实例。
内容简介:
本书基于PyTorch框架，用通俗易懂的语言深入浅出地介绍了强化学习的基本原理，包括传统的强化学习基本方法和目前流行的深度强化学习方法。在对强化学习任务建模的基础上，首先介绍动态规划法、蒙特卡洛法、时序差分法等表格式强化学习方法，然后介绍在PyTorch框架下，DQN、DDPG、A3C等基于深度神经网络的大规模强化学习方法。全书以一个扫地机器人任务贯穿始终，并给出具有代表性的实例，增加对每个算法的理解。全书配有PPT和视频讲解，对相关算法和实例配有代码程序。全书共分三部分：第一和第二部分（第1～8章）为表格式强化学习部分，着重介绍深度强化学习概述、环境的配置、数学建模、动态规划法、蒙特卡洛法、时序差分法、n-步时序差分法、规划和蒙特卡洛树搜索；第三部分（第9～14章）为深度强化学习部分，着重介绍深度学习、PyTorch与神经网络、深度Q网络、策略梯度、基于确定性策略梯度的深度强化学习、AC框架的拓展。全书提供了大量的应用实例，每章章末均附有习题。本书既适合作为高等院校计算机、软件工程、电子工程等相关专业高年级本科生、研究生的教材，又可为人工智能、机器学习等领域从事项目开发、科学研究的人员提供参考。
目录:
第一部分：预备知识及环境安装

第1章深度强化学习概述

1.1引言

1.2深度学习

1.3强化学习

1.4深度强化学习

1.5小结

1.6习题

第2章环境的配置

2.1PyTorch简介

2.2PvTorch和TensorFlow

2.3强化学习的开发环境

2.3.1Anaconda环境搭建

2.3.2Anaconda环境管理

2.3.3PyTorch的安装

2.3.4JupyterNotebook的安装

2.3.5JupyterNotebook的使用

2.3.6Gym的安装

2.3.7Gym案例

2.4小结

2.5习题

第二部分：表格式强化学习

第3章数学建模

3.1马尔可夫决策过程

3.2基于模型与无模型

3.3求解强化学习任务

3.3.1策略

3.3.2奖赏与回报

3.3.3值函数与贝尔曼方程

3.3.4很优策略与很优值函数

3.4探索与利用

3.5小结

3.6习题

第4章动态规划法

4.1策略迭代

4.1.1策略评估

4.1.2策略迭代

4.2值迭代

4.3广义策略迭代

4.4小结

4.5习题

第5章蒙特卡洛法

5.1蒙特卡洛法的基本概念

5.1.1MC的核心要素

5.1.2MC的特点

5.2蒙特卡洛预测

5.3蒙特卡洛评估<
...

— 没有更多了 —

深度强化学习

文源文化

商品详情

相关推荐