• Reinforcement Learning and Dynamic Programming Using Function Approximators 英文原版 基于函数逼近的强化学习与动态规划 Q值迭代 近似策略 基函数 人工智能 机器学习 自动控制专业人员
  • Reinforcement Learning and Dynamic Programming Using Function Approximators 英文原版 基于函数逼近的强化学习与动态规划 Q值迭代 近似策略 基函数 人工智能 机器学习 自动控制专业人员
  • Reinforcement Learning and Dynamic Programming Using Function Approximators 英文原版 基于函数逼近的强化学习与动态规划 Q值迭代 近似策略 基函数 人工智能 机器学习 自动控制专业人员

Reinforcement Learning and Dynamic Programming Using Function Approximators 英文原版 基于函数逼近的强化学习与动态规划 Q值迭代 近似策略 基函数 人工智能 机器学习 自动控制专业人员

原版正版

699 九五品

仅1件

北京昌平
认证卖家担保交易快速发货售后保障

作者Lucian Busoniu

出版社CRC Press

ISBN9781439821084

出版时间2010-03

装帧精装

页数280页

上书时间2019-09-19

书香无界

已实名 进店 收藏店铺
  • 店主推荐
  • 最新上架
现货  Automatic Control Systems, 10e 英文原版 自动控制系统,第十版 Farid Golnaraghi
现货 Automatic Control Systems, 10e 英文原版 自动控制系统,第十版 Farid Golnaraghi ¥899.00
现货  Computational Contact and Impact Mechanics: Fundamentals of Modeling Interfacial Phenomena in Nonlinear Finite Element Analysis 英文原版 计算力学 冲击力学 接触力学 界面现象建模基础 原理 非线性有限元分析
现货 Computational Contact and Impact Mechanics: Fundamentals of Modeling Interfacial Phenomena in Nonlinear Finite Element Analysis 英文原版 计算力学 冲击力学 接触力学 界面现象建模基础 原理 非线性有限元分析 ¥799.00
现货 Fabrication Methods for Precision Optics 英文原版  精密光学元件测量制造、性能、应用 精密制造中使用的光学工具  理论光学和应用光学
现货 Fabrication Methods for Precision Optics 英文原版 精密光学元件测量制造、性能、应用 精密制造中使用的光学工具 理论光学和应用光学 ¥658.00
现货 The Chemistry of Food 英文原版  食品化学 食品分析 导论 工艺  理论 标准
现货 The Chemistry of Food 英文原版 食品化学 食品分析 导论 工艺 理论 标准 ¥699.00
现货  Mechanical Engineers' Handbook, Volume 2: Design, Instrumentation, and Controls 英文原版 机械工程师手册 设计 仪器 控制  梅尔·库兹  Myer Kutz  环境意识制造 材料选用手册
现货 Mechanical Engineers' Handbook, Volume 2: Design, Instrumentation, and Controls 英文原版 机械工程师手册 设计 仪器 控制 梅尔·库兹 Myer Kutz 环境意识制造 材料选用手册 ¥899.00
现货工程技术 Statistical Data Analytics: Foundations for Data Mining, Informatics, and Knowledge Discovery 统计数据分析基础 数据挖掘方法与技术  信息学 情报学  知识发现
现货工程技术 Statistical Data Analytics: Foundations for Data Mining, Informatics, and Knowledge Discovery 统计数据分析基础 数据挖掘方法与技术 信息学 情报学 知识发现 ¥678.00
现货化学工程精装 Chemical Process Design and Integration 英文原版 化学化工工艺设计与集成 化工工艺学 合成 制备 设备 制作 加工流程
现货化学工程精装 Chemical Process Design and Integration 英文原版 化学化工工艺设计与集成 化工工艺学 合成 制备 设备 制作 加工流程 ¥999.00
现货计算机 Operating System Concepts 10ed (EPUB Reg Card + Abridged Print Companion Set) Abraham Silberschatz 英文原版 现代操作系统概念 基本原理与实践 基础技术
现货计算机 Operating System Concepts 10ed (EPUB Reg Card + Abridged Print Companion Set) Abraham Silberschatz 英文原版 现代操作系统概念 基本原理与实践 基础技术 ¥999.00
现货工程技术 Deformation and Fracture Mechanics of Engineering Materials Hertzberg 英文原版 工程材料的变形与断裂力学 疲劳力学 弹塑性断裂、损伤力学测试技术 基本原理、方法及其应用
现货工程技术 Deformation and Fracture Mechanics of Engineering Materials Hertzberg 英文原版 工程材料的变形与断裂力学 疲劳力学 弹塑性断裂、损伤力学测试技术 基本原理、方法及其应用 ¥999.00

   商品详情   

品相描述:九五品
商品描述
From household appliances to applications in robotics, engineered systems involving complex dynamics can only be as effective as the algorithms that control them. While Dynamic Programming (DP) has provided researchers with a way to optimally solve decision and control problems involving complex dynamic systems, its practical value was limited by algorithms that lacked the capacity to scale up to realistic problems.

 However, in recent years, dramatic developments in Reinforcement Learning (RL), the model-free counterpart of DP, changed our understanding of what is possible. Those developments led to the creation of reliable methods that can be applied even when a mathematical model of the system is unavailable, allowing researchers to solve challenging control problems in engineering, as well as in a variety of other disciplines, including economics, medicine, and artificial intelligence.

Reinforcement Learning and Dynamic Programming Using Function Approximators provides a comprehensive and unparalleled exploration of the field of RL and DP. With a focus on continuous-variable problems, this seminal text details essential developments that have substantially altered the field over the past decade. In its pages, pioneering experts provide a concise introduction to classical RL and DP, followed by an extensive presentation of the state-of-the-art and novel methods in RL and DP with approximation. Combining algorithm development with theoretical guarantees, they elaborate on their work with illustrative examples and insightful comparisons. Three individual chapters are dedicated to representative algorithms from each of the major classes of techniques: value iteration, policy iteration, and policy search. The features and performance of these algorithms are highlighted in extensive experimental studies on a range of control applications.

The recent development of applications involving complex systems has led to a surge of interest in RL and DP methods and the subsequent need for a quality resource on the subject. For graduate students and others new to the field, this book offers a thorough introduction to both the basics and emerging methods. And for those researchers and practitioners working in the fields of optimal and adaptive control, machine learning, artificial intelligence, and operations research, this resource offers a combination of practical algorithms, theoretical analysis, and comprehensive examples that they will be able to adapt and apply to their own work.

Access the authors' website at www.dcsc.tudelft.nl/rlbook/ for additional material, including computer code used in the studies and information concerning new developments.

—  没有更多了  —

以下为对购买帮助不大的评价

孔夫子旧书网交易保障
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP