• 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
  • 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
  • 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
  • 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
  • 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
  • 深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书
21年品牌 40万+商家 超1.5亿件商品

深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书

全新正版 极速发货

32.48 5.4折 59.8 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者编者:刘全//黄志刚|责编:王冰飞

出版社清华大学

ISBN9787302578208

出版时间2021-08

装帧平装

开本其他

定价59.8元

货号31214046

上书时间2024-08-29

书香美美

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
作者简介
\\\"刘全,苏州大学教授,博士生导师。 吉林大学博士,南京大学软件新技术国家重点实验室博士后。苏州市人工智能学会常务理事、秘书长。2006年开始从事强化学习领域的教学和科研工作。主讲研究生、本科生《强化学习》及相关课程16次。主持“深度强化学习方法研究”、“部分感知强化学习理论及方法”、“基于tableau的逻辑强化学习研究”等国家、省部级项目10余项。目前主要研究方向为:深度强化学习。 2012年获江苏省教工委优秀共产党员称号。2011年、2012年入选江苏省“六大人才”、江苏省“333”人才培养计划。\\\"

目录
第一部分:预备知识及环境安装
  第1章  深度强化学习概述
    1.1  引言
    1.2  深度学习
    1.3  强化学习
    1.4  深度强化学习
    1.5  小结
    1.6  习题
  第2章  环境的配置
    2.1  PyTorch简介
    2.2  PvTorch和TensorFlow
    2.3  强化学习的开发环境
      2.3.1  Anaconda环境搭建
      2.3.2  Anaconda环境管理
      2.3.3  PyTorch的安装
      2.3.4  Jupyter Notebook的安装
      2.3.5  Jupyter Notebook的使用
      2.3.6  Gym的安装
      2.3.7  Gym案例
    2.4  小结
    2.5  习题
第二部分:表格式强化学习
  第3章  数学建模
    3.1  马尔可夫决策过程
    3.2  基于模型与无模型
    3.3  求解强化学习任务
      3.3.1  策略
      3.3.2  奖赏与回报
      3.3.3  值函数与贝尔曼方程
      3.3.4  最优策略与最优值函数
    3.4  探索与利用
    3.5  小结
    3.6  习题
  第4章  动态规划法
    4.1  策略迭代
      4.1.1  策略评估
      4.1.2  策略迭代
    4.2  值迭代
    4.3  广义策略迭代
    4.4  小结
    4.5  习题
  第5章  蒙特卡洛法
    5.1  蒙特卡洛法的基本概念
      5.1.1  MC的核心要素
      5.1.2  MC的特点
    5.2  蒙特卡洛预测
    5.3  蒙特卡洛评估
    5.4  蒙特卡洛控制
      5.4.1  基于探索始点的蒙特卡洛控制
      5.4.2  同策略蒙特卡洛控制

内容摘要
围绕着MDP模型,阐述动态规划、蒙特卡罗、动态
规划等有穷表格式强化学习方法。在深度强化学习框架PyTorch下,阐述DQN,DDDPG,A3C等算法。
本书以实例为导向,深度浅出地讲解相关算法。全书采用完整的数学体系,各章内容循序渐进,严谨地讲授强化学习的理论基础,主要定理均给出证明过程。基于理论讲解强化学习算法,覆盖了所有主流强化学习算法,包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。适合本科以上的人工智能相关专业学生及工程人员。

主编推荐
强化学习是目前机器学习领域很热门的方向之一,本书经多年的实践教学经验的积累,形成了一套完整的教学体系。并结合流行的深度学习框架PyTorch,该书在理论和应用上都是较优选的。本书理论结合实践,深入浅出地讲解相关算法和实例。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP