消息首页搜索举报

深度强化学习实践(影印版)(英文版)

全新正版极速发货

73.08 6.7折 109 全新

仅1件

广东广州

认证卖家担保交易快速发货售后保障

作者(俄罗斯)马克西姆·拉潘

出版社东南大学

ISBN9787564183219

出版时间2019-05

装帧其他

开本其他

定价109元

货号30620849

上书时间2024-06-03

书香美美

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 16小时
好评率暂无

最新上架

藏书·家：爱书人与他们的理想书房 ¥52.91

数数看(精) ¥13.29

人的境况(第2版) ¥42.17

一年级课外书共5册 ¥68.69

少年特战队17-20共4册 ¥35.30

阴摩罗鬼之瑕（下） ¥23.25

法医笔记：死亡背后的真相 ¥12.51

阿凡提的故事比智慧/上海美影经典动画故事 ¥3.64

这样爱你刚刚好我的一年级孩子+这样爱你刚刚好我的六年级孩子等共6册 ¥129.20

商品详情

品相描述：全新

商品描述: 目录
Preface
Chapter 1: What is Reinforcement Learning?
  Learning - supervised, unsupervised, and reinforcement
  RL formalisms and relations
    Reward
    The agent
    The environment
    Actions
    Observations
  Markov decision processes
    Markov process
    Markov reward process
    Markov decision process
  Summary
Chapter 2: OpenAI Gym
  The anatomy of the agent
  Hardware and software requirements
  OpenAI Gym API
    Action space
    Observation space
    The environment
    Creation of the environment
    The CartPole session
  The random CartPole agent
  The extra Gym functionality - wrappers and monitors
    Wrappers
    Monitor
  Summary
Chapter 3: Deep Learning with PyTorch
  Tensors
    Creation of tensors
    Scalar tensors
    Tensor operations
    GPU tensors
  Gradients
    Tensors and gradients
  NN building blocks
  Custom layers
  Final glue - loss functions and optimizers
    Loss functions
    Optimizers
  Monitoring with TensorBoard
    TensorBoard 101
    Plotting stuff
  Example -GAN on Atari images
  Summary
Chapter 4: The Cross-Entropy Method
  Taxonomy of RL methods
  Practical cross-entropy
  Cross-entropy on CartPole

内容摘要
强化学习(RL)的最新发展结合深度学习(DL)，在训练代理以类似人的方式解决复杂问题方面取得了前所未有的进步。Google使用算法在著名的Atari街机游戏中获胜将该领域推至高峰，研究人员也在源源不断地产生新的想法。
本书是关于最新DL工具及其局限性的全面指南。
在应用于真实环境之前，你得评估包括交叉熵和策略梯度在内的多种方法。试试Atari的虚拟游戏和像connect4这样的家庭最爱。本书介绍了RL的基础知识，为你提供了编写智能学习代理所需的原理，以承担一系列艰巨的实际任务。让你了解如何在“网格世界”环境中实现Q-learning，教你的代理购买和交易股票，发现自然语言模型如何推动了聊天机器人的火爆。

— 没有更多了 —

深度强化学习实践(影印版)(英文版)

书香美美

商品详情

相关推荐