• Python深度强化学习:基于Chainer和OpenAIGym
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

Python深度强化学习:基于Chainer和OpenAIGym

48.42 6.1折 79 九品

仅1件

北京东城
认证卖家担保交易快速发货售后保障

作者[日]西崎博光(Hiromitsu Nishizaki) 著;[日]牧野浩二(Koji Makino)、申富饶、于僡 译

出版社机械工业出版社

出版时间2021-12

版次1

装帧平装

货号A19

上书时间2024-11-01

图书-天下的书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 [日]西崎博光(Hiromitsu Nishizaki) 著;[日]牧野浩二(Koji Makino)、申富饶、于僡 译
  • 出版社 机械工业出版社
  • 出版时间 2021-12
  • 版次 1
  • ISBN 9787111692584
  • 定价 79.00元
  • 装帧 平装
  • 开本 16开
  • 纸张 胶版纸
  • 页数 228页
【内容简介】

本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。

【作者简介】
:
    牧野浩二(Koji Makino),东京工业大学博士,现任山梨大学大学院综合研究部工学领域的助理教授。迄今为止,一直在使用地球模拟器进行纳米碳研究,是使用Arduino进行机器人模型实验的负责人,具有从微机到超级计算机的各种编程经验。主要致力于研究人类的隐性知识,并且正在进行从测量仪器开发到数据分析的连贯研究。
【目录】

译者序< br > 前言< br > 第1章 引言  1< br > 11 深度强化学习可以做什么  1< br > 12 本书的结构  4< br > 13 框架:Chainer和ChainerRL  6< br > 14 Python的运行检查  6< br > 15 Chainer的安装  9< br > 16 ChainerRL的安装  12< br > 17 模拟器:OpenAI Gym  14< br > 第2章 深度学习  17< br > 21 什么是深度学习  17< br > 22 神经网络  18< br > 23 基于Chainer的神经网络  21< br > 231 Chainer与神经网络的对应  24< br > 232 Chainer程序  25< br > 233 参数设置  26< br > 234 创建数据  27< br > 235 定义神经网络  27< br > 236 各种声明  28< br > 237 显示训练状态  28< br > 238 保存训练状态  31< br > 239 执行训练  32< br > 24 与其他神经网络的对应  32< br > 241 感知器  32< br > 242 5层神经网络(深度学习)  33< br > 243 计算输入中的1的数量  34< br > 25 基于深度神经网络的手写数字识别  35< br > 251 手写数字的输入格式  36< br > 252 深度神经网络的结构  39< br > 253 8×8的手写数字数据  41< br > 26 基于卷积神经网络的手写数字识别  43< br > 261 卷积  45< br > 262 激活函数  49< br > 263 池化  49< br > 264 执行  50< br > 27 一些技巧  53< br > 271 读取文件数据  54< br > 272 使用训练模型  55< br > 273 重启训练  56< br > 274 检查权重  56< br > 275 从文件中读取手写数字  57< br > 第3章 强化学习  59< br > 31 什么是强化学习  59< br > 311 有监督学习  60< br > 312 无监督学习  60< br > 313 半监督学习  60< br > 32 强化学习原理  61< br > 33 通过简单的示例来学习  61< br > 34 应用到Q学习问题中  63< br > 341 状态  63< br > 342 行动  63< br > 343 奖励  63< br > 344 Q值  64< br > 35 使用Python进行训练  67< br > 351 运行程序  67< br > 352 说明程序  69< br > 36 基于OpenAI Gym的倒立摆  73< br > 361 运行程序  73< br > 362 说明程序  74< br > 37 如何保存和加载Q值  79< br > 第4章 深度强化学习  81< br > 41 什么是深度强化学习  81< br > 42 对于老鼠学习问题的应用  83< br > 421 运行程序  83< br > 422 说明程序  85< br > 423 如何保存和读取智能体模型  91< br > 43 基于OpenAI Gym的倒立摆  91< br > 431 运行程序  91< br > 432 说明程序  92< br > 44 基于OpenAI Gym的太空侵略者  97< br > 45 基于OpenAI Gym的颠球  99< br > 451 运行程序  101< br > 452 说明程序  102< br > 46 对战游戏  109< br > 461 黑白棋  109< br > 462 训练方法  111< br > 463 变更盘面  121< br > 464 黑白棋实体  121< br > 465 如何与人类对战  123< br > 466 卷积神经网络的应用  127< br > 47 使用物理引擎进行模拟  128< br > 471 物理引擎  129< br > 472 运行程序  130< br > 473 说明程序  131< br > 48 物理引擎在颠球问题中的应用  132< br > 49 物理引擎在倒立摆问题中的应用  140< br > 410 物理引擎在机械臂问题中的应用  144< br > 411 使用其他深度强化学习方法  151< br > 4111 深度强化学习的类型  151< br > 4112 将训练方法更改为DDQN  153< br > 4113 将训练方法更改为PER-DQN  153< br > 4114 将训练方法更改为DDPG  153< br > 4115 将训练方法更改为A3C  155< br > 第5章 实际环境中的应用  157< br > 51 使用摄像机观察环境(MNIST)  157< br > 511 摄像机设置  158< br > 512 通过卷积神经网络对摄像机图像进行分类  160< br > 513 使用图像大小为28×28的手写数字进行训练  163< br > 52 实际环境中的老鼠学习问题  164< br > 53 使用Raspberry Pi处理老鼠学习问题  168< br > 531 环境构建  169< br > 532 以输入输出为重点的简化  169< br > 533 使用摄像机测量环境  176< br > 54 使用Arduino + PC处理老鼠学习问题  181< br > 541 环境构建  182< br > 542 以输入输出为重点的简化  185< br > 543 使用摄像机测量环境  193< br > 55 使用Raspberry Pi + Arduino处理老鼠学习问题  197< br > 56 结语  201< br > 附录  202

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP