消息首页搜索举报

【假一罚四】强化学习

全新正版书籍，假一罚四，放心选购。可开发票，24小时内发货。

64.4 5.0折 128 全新

库存50件

浙江嘉兴

认证卖家担保交易快速发货售后保障

作者(英) 菲尔·温德尔博士著

出版社中国电力出版社

ISBN9787519869618

出版时间2023-02

装帧平装

开本其他

定价128元

货号4335807

上书时间2024-12-18

朗朗图书书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

【假一罚四】诗歌风赏 ¥25.30

【假一罚四】颐和园里的猫画师 ¥18.30

【假一罚四】“一带一路”贸易发展 ¥48.20

【假一罚四】洛克的政府论 ¥18.30

【假一罚四】狄仁杰之铁尸迷案 ¥45.00

【假一罚四】朱元璋传 ¥24.80

【假一罚四】“一带一路”金融合作 ¥52.50

【假一罚四】右脑贴贴贴 ¥2.90

【假一罚四】三十而励筑梦百年 ¥62.00

商品详情

品相描述：全新

商品描述

前言

商品简介

本书作者创办了自己名字命名的研究型公司，本书涵盖了从基本的构建模块到最z先进的实践。通过本书，你将探索强化学习的当前状态、关注工业应用、学习大量算法，本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书，书中包含很多数学知识，并期望读者是熟悉机器学习的。
本书的主要内容有：学习强化学习是什么，以及算法如何解决具体问题。掌握强化学习的基础知识，包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案，如元学习、分层学习、多智能体、模仿学习等。了解最z前沿的深度强化学习算法，包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

作者简介

Phil Winder博士是一名多学科交叉的软件工程师、作家和科技顾问，同时也是温德研究所的CEO。该研究所主要提供云计算科学咨询，主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。作者于英国赫尔大学获得电子工程硕士和博士学位，现居英国约克郡。译者介绍邹伟，睿客邦创始人、国内资深AI专家，擅长利用AI技术解决工业、工程中的复杂问题。华东建筑设计研究总院研究员、山东交通学院客座教授、天津大学创业导师、中华中医药学会会员，领导睿客邦与全国二十多所高校、国企建立了AI联合实验室，完成50多个深度学习实践项目，目前已出版多本机器学习、深度学习领域的专著和译著。

目录
本书的主要内容有: 学习强化学习是什么, 以及算法如何解决具体问题。掌握强化学习的基础知识, 包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案, 如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法, 包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

内容摘要
本书作者创办了自己名字命名的研究型公司，本书涵盖了从基本的构建模块到最z优选的实践。通过本书，你将探索强化学习的当前状态、关注工业应用、学习大量算法，本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书，书中包含很多数学知识，并期望读者是熟悉机器学习的。
本书的主要内容有：学习强化学习是什么，以及算法如何解决具体问题。掌握强化学习的基础知识，包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用优选的强化学习解决方案，如元学习、分层学习、多智能体、模仿学习等。了解最z前沿的深度强化学习算法，包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

主编推荐

【内容简介】

— 没有更多了 —