¥ 54.71 6.9折 ¥ 79 九五品
仅1件
作者[日]西崎博光(Hiromitsu Nishizaki) 著;[日]牧野浩二(Koji Makino)、申富饶、于僡 译
出版社机械工业出版社
出版时间2021-12
版次1
装帧平装
货号A19
上书时间2024-11-01
本书基于强化学的库Chainer(Chainere)和AI模拟环境的OpenAI gym-不仅仅是软件模拟-也详述了使用RaspbbilryPi和ARduino的实际环境的应用。
译者序< br > 前言< br > 第1章 引言 1< br > 11 深度强化学习可以做什么 1< br > 12 本书的结构 4< br > 13 框架:Chainer和ChainerRL 6< br > 14 Python的运行检查 6< br > 15 Chainer的安装 9< br > 16 ChainerRL的安装 12< br > 17 模拟器:OpenAI Gym 14< br > 第2章 深度学习 17< br > 21 什么是深度学习 17< br > 22 神经网络 18< br > 23 基于Chainer的神经网络 21< br > 231 Chainer与神经网络的对应 24< br > 232 Chainer程序 25< br > 233 参数设置 26< br > 234 创建数据 27< br > 235 定义神经网络 27< br > 236 各种声明 28< br > 237 显示训练状态 28< br > 238 保存训练状态 31< br > 239 执行训练 32< br > 24 与其他神经网络的对应 32< br > 241 感知器 32< br > 242 5层神经网络(深度学习) 33< br > 243 计算输入中的1的数量 34< br > 25 基于深度神经网络的手写数字识别 35< br > 251 手写数字的输入格式 36< br > 252 深度神经网络的结构 39< br > 253 8×8的手写数字数据 41< br > 26 基于卷积神经网络的手写数字识别 43< br > 261 卷积 45< br > 262 激活函数 49< br > 263 池化 49< br > 264 执行 50< br > 27 一些技巧 53< br > 271 读取文件数据 54< br > 272 使用训练模型 55< br > 273 重启训练 56< br > 274 检查权重 56< br > 275 从文件中读取手写数字 57< br > 第3章 强化学习 59< br > 31 什么是强化学习 59< br > 311 有监督学习 60< br > 312 无监督学习 60< br > 313 半监督学习 60< br > 32 强化学习原理 61< br > 33 通过简单的示例来学习 61< br > 34 应用到Q学习问题中 63< br > 341 状态 63< br > 342 行动 63< br > 343 奖励 63< br > 344 Q值 64< br > 35 使用Python进行训练 67< br > 351 运行程序 67< br > 352 说明程序 69< br > 36 基于OpenAI Gym的倒立摆 73< br > 361 运行程序 73< br > 362 说明程序 74< br > 37 如何保存和加载Q值 79< br > 第4章 深度强化学习 81< br > 41 什么是深度强化学习 81< br > 42 对于老鼠学习问题的应用 83< br > 421 运行程序 83< br > 422 说明程序 85< br > 423 如何保存和读取智能体模型 91< br > 43 基于OpenAI Gym的倒立摆 91< br > 431 运行程序 91< br > 432 说明程序 92< br > 44 基于OpenAI Gym的太空侵略者 97< br > 45 基于OpenAI Gym的颠球 99< br > 451 运行程序 101< br > 452 说明程序 102< br > 46 对战游戏 109< br > 461 黑白棋 109< br > 462 训练方法 111< br > 463 变更盘面 121< br > 464 黑白棋实体 121< br > 465 如何与人类对战 123< br > 466 卷积神经网络的应用 127< br > 47 使用物理引擎进行模拟 128< br > 471 物理引擎 129< br > 472 运行程序 130< br > 473 说明程序 131< br > 48 物理引擎在颠球问题中的应用 132< br > 49 物理引擎在倒立摆问题中的应用 140< br > 410 物理引擎在机械臂问题中的应用 144< br > 411 使用其他深度强化学习方法 151< br > 4111 深度强化学习的类型 151< br > 4112 将训练方法更改为DDQN 153< br > 4113 将训练方法更改为PER-DQN 153< br > 4114 将训练方法更改为DDPG 153< br > 4115 将训练方法更改为A3C 155< br > 第5章 实际环境中的应用 157< br > 51 使用摄像机观察环境(MNIST) 157< br > 511 摄像机设置 158< br > 512 通过卷积神经网络对摄像机图像进行分类 160< br > 513 使用图像大小为28×28的手写数字进行训练 163< br > 52 实际环境中的老鼠学习问题 164< br > 53 使用Raspberry Pi处理老鼠学习问题 168< br > 531 环境构建 169< br > 532 以输入输出为重点的简化 169< br > 533 使用摄像机测量环境 176< br > 54 使用Arduino + PC处理老鼠学习问题 181< br > 541 环境构建 182< br > 542 以输入输出为重点的简化 185< br > 543 使用摄像机测量环境 193< br > 55 使用Raspberry Pi + Arduino处理老鼠学习问题 197< br > 56 结语 201< br > 附录 202
python深度强化学习
全新保定
¥ 28.83
Python深度强化学习
全新保定
¥ 48.19
python深度强化学习
全新保定
¥ 29.67
python深度强化学习
全新保定
¥ 29.67
Python深度强化学习
九五品北京
¥ 33.26
Python深度强化学习:基于Chainer和OpenAIGym
全新广州
¥ 45.20
Python深度强化学习:基于Chainer和OpenAIGym
全新广州
¥ 48.83
Python深度强化学习:基于Chainer和OpenAIGym
全新保定
¥ 31.60
Python深度强化学习:基于Chainer和OpenAIGym
九五品廊坊
¥ 54.17
Python深度强化学习:基于Chainer和OpenAIGym
九品北京
¥ 48.34
— 没有更多了 —
以下为对购买帮助不大的评价