• Python深度强化学习入门:强化学习和深度学习的搜索与控制
  • Python深度强化学习入门:强化学习和深度学习的搜索与控制
21年品牌 40万+商家 超1.5亿件商品

Python深度强化学习入门:强化学习和深度学习的搜索与控制

正版新书 新华官方库房直发 可开电子发票

56.97 6.4折 89 全新

仅1件

江苏南京
认证卖家担保交易快速发货售后保障

作者(日)伊藤多一 等

出版社机械工业出版社

ISBN9787111700722

出版时间2022-04

版次1

装帧平装

开本32开

纸张胶版纸

页数504页

字数384千字

定价89元

货号SC:9787111700722

上书时间2024-12-14

问典书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
作者简介:
    伊藤多一,1995年在名古屋大学理学研究所完成博士课程,井获得博士学位。后一直从事粒子物理学研究,直到2004年3月。同年,加入了一家专门从事合同数据分析的风险公司,井参与了多个数据分析项目。自2013年以来,他一直在BrainPad公司从事机器学习的广告效果分析工作。自2016年以来,通过深度学习参与了图像分析项目。
主编推荐:
人工智能无疑是近年来热门词汇,而深度强化学习又是热门中的热门,对于想要进入人工智能行业的您来说,节省时间、快速入门首要问题。再多的知识也要实践,现场实操,才是快速学习、消化的通路。   《Python深度强化学习入门:强化学习和深度学习的搜索与控制 》正是这样一本,从基础理论讲起,以实操驱动的方式全面展示技巧和方法,为您提供了快速入门深度强化学习的途径,找到了学习的方法。
内容简介:
本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念;第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法;第3章通过深度学习、卷积神经网络(CNN)、循环神经网络(RNN)介绍了强化学习中深度学习的特征提取方法;第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现;第5章通过策略梯度法的连续控制、学习算法和策略模型等,详细介绍了深度强化学习在连续控制问题中的应用及具体实现;第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现;第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。
目录:
译者序

原书前言

阅读本书需要的知识基础

本书的结构

本书示例的运行环境

第1部分  基础篇

第1章  强化学习的用途

1.1  机器学习的分类

1.1.1  监督学习

1.1.2  无监督学习

1.1.3  强化学习

1.2  强化学习的学习机制

1.3  深度强化学习

第2章  强化学习的算法

2.1  强化学习的基本概念

2.1.1  强化学习的问题设定

2.1.2  强化学习的机制

2.1.3  关于本章的内容

2.2  马尔可夫决策过程和贝尔曼方程

2.2.1  马尔可夫决策过程

2.2.2  贝尔曼方程

2.3  贝尔曼方程的求解方法

2.3.1  动态规划法

2.3.2  蒙特卡洛法

2.3.3  TD学习法

2.4  无模型控制

2.4.1  策略改进的方法

2.4.2  基于价值的方法

2.4.3  基于策略的方法

2.4.4  Actor-Critic法

第3章  深度学习的特征提取

3.1  深度学习

3.1.1  深度学习的出现和背景

3.1.2  什么是深度学习?

3.1.3  深度学习平台

3.2  CNN

3.2.1  什么是CNN

3.2.2  CNN的应用

3.3  RNN

3.3.1  什么是RNN

3.3.2  什么是LSTM

3.3.3  RNN的应用
...

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP