• 【假一罚四】强化学习
  • 【假一罚四】强化学习
21年品牌 40万+商家 超1.5亿件商品

【假一罚四】强化学习

全新正版书籍,假一罚四,放心选购。可开发票,24小时内发货。

64.4 5.0折 128 全新

库存50件

浙江嘉兴
认证卖家担保交易快速发货售后保障

作者(英) 菲尔·温德尔博士著

出版社中国电力出版社

ISBN9787519869618

出版时间2023-02

装帧平装

开本其他

定价128元

货号4335807

上书时间2024-12-18

朗朗图书书店

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
前言

 
 
 
 

商品简介

本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到最z先进的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。
本书的主要内容有:学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解最z前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。



作者简介

Phil Winder博士是一名多学科交叉的软件工程师、作家和科技顾问,同时也是温德研究所的CEO。该研究所主要提供云计算科学咨询,主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。作者于英国赫尔大学获得电子工程硕士和博士学位,现居英国约克郡。译者介绍邹伟,睿客邦创始人、国内资深AI专家,擅长利用AI技术解决工业、工程中的复杂问题。华东建筑设计研究总院研究员、山东交通学院客座教授、天津大学创业导师、中华中医药学会会员,领导睿客邦与全国二十多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,目前已出版多本机器学习、深度学习领域的专著和译著。



目录
本书的主要内容有: 学习强化学习是什么, 以及算法如何解决具体问题。掌握强化学习的基础知识, 包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案, 如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法, 包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

内容摘要
本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到最z优选的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。
本书的主要内容有:学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用优选的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解最z前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

主编推荐

【内容简介】

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP