• 动态规划与最优控制——近似动态规划(第2卷)
21年品牌 40万+商家 超1.5亿件商品

动态规划与最优控制——近似动态规划(第2卷)

正版新书 新华官方库房直发 可开电子发票

99.33 7.7折 129 全新

库存27件

江苏南京
认证卖家担保交易快速发货售后保障

作者(美)徳梅萃·P.博塞克斯

出版社清华大学出版社

ISBN9787302561460

出版时间2021-02

版次1

装帧平装

开本16开

纸张胶版纸

页数504页

字数841千字

定价129元

货号SC:9787302561460

上书时间2024-05-08

江苏读客文化

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
全新正版 提供发票
商品描述
主编推荐:
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机最短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。
内容简介:
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机最短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。
目录:
第1章  折扣问题——理论1

1.1  总费用最小化——介绍1

1.1.1  有限阶段动态规划算法3

1.1.2  符号简写与单调性4

1.1.3  无穷阶段结果的预览6

1.1.4  随机的和依赖历史的策略7

1.2  折扣问题——各阶段费用有界9

1.3  调度与多柄老虎机问题15

1.3.1  项目的指标16

1.3.2  项目逐个退出策略17

1.4  折扣连续时间问题23

1.5  压缩映射的作用32

1.5.1  极大模压缩33

1.5.2  折扣问题——单阶段费用无界38

1.6  折扣动态规划的一般形式40

1.6.1  压缩与单调性的基本结论44

1.6.2  折扣动态博弈49

1.7  注释、参考文献及习题50

习题51

第2章  折扣问题——计算方法57

2.1  马尔可夫决策问题57

2.2  值迭代59

2.2.1  值迭代的单调误差界59

2.2.2  值迭代的变形65

2.2.3  Q-学习67

2.3  策略迭代69

2.3.1  针对费用的策略迭代69

2.3.2  Q-因子的策略迭代72

2.3.3  乐观策略迭代73

2.3.4  有限前瞻策略和滚动75

2.4  线性规划方法79

2.5  一般折扣问题的方法81

2.5.1  采用近似的有限前瞻策略83

2.5.2  推广的值迭代
...

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

全新正版 提供发票
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP