• 深度强化学与实践 人工智能 陈喆 新华正版
21年品牌 40万+商家 超1.5亿件商品

深度强化学与实践 人工智能 陈喆 新华正版

36 6.1折 59 全新

库存38件

河北廊坊
认证卖家担保交易快速发货售后保障

作者陈喆

出版社清华大学出版社

ISBN9787302660705

出版时间2024-05

版次1

装帧平装

开本16

页数240页

字数369千字

定价59元

货号313_9787302660705

上书时间2024-08-16

悦霖图书

五年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
正版特价新书
商品描述
目录:

章引言1

1.1深度强化学及其简史1

1.2深度强化学的应用领域3

1.3深度强化学方法的实现4

1.3.1numpy库和matplotlib库4

1.3.2pytorch框架7

1.4本章实验解析11

1.5本书各章联系14

1.6本章小结14

1.7思与练15

第2章从神经网络到深度学16

2.1神经网络回顾16

2.1.1神经网络的推测过程17

2.1.2神经网络的训练过程18

2.1.3神经网络实践23

2.2从神经网络到深度神经网络26

2.3深度神经网络29

2.3.1深度神经网络的推测过程29

2.3.2深度神经网络的训练过程30

2.3.3反向模式自动微分34

2.3.4深度神经网络实践及分析35

2.4卷积神经网络37

2.4.1卷积层和合并层38

2.4.2卷积神经网络实践41

2.5循环神经网络42

2.6本章实验解析45

2.7本章小结51

2.8思与练52

第3章强化学基础53

3.1强化学概述53

3.1.1多问题53

3.1.2利用与探索57

3.1.3强化学的要素58

3.2有限马尔可夫决策过程59

3.2.1与马尔可夫59

3.2.2什么是有限马尔可夫决策过程60

3.2.3收益与策略63

3.3求解mdp65

3.3.1贝尔曼方程与贝尔曼优方程65

3.3.2价值迭代69

3.3.3策略评估74

3.3.4策略迭代77

3.3.5广义策略迭代82

3.4本章实验解析85

3.5本章小结90

3.6思与练90

第4章行动价值方法92

4.1行动价值与优行动价值92

4.1.1行动价值92

4.1.2优行动价值96

4.2蒙特卡洛方法99

4.3q学107

4.4dyna-q114

4.5使用监督学方法推测优行动价值的极限值118

4.6使用深度神经网络推测优行动价值的极限值124

4.7本章实验解析129

4.8本章小结136

4.9思与练136

第5章策略梯度方法138

5.1策略梯度基本方法138

5.2蒙特卡洛策略梯度方法142

5.2.1各个行动的蒙特卡洛策略梯度方法142

5.2.2单个行动的蒙特卡洛策略梯度方法147

5.2.3移的蒙特卡洛策略梯度方法149

5.3行动评价方法154

5.4不观测160

5.5本章实验解析163

5.6本章小结168

5.7思与练169

附录a实验参程序及注释171

参文献231

内容简介:

本书从的角度,力求讲解清楚深度学、强化学、深度强化学中的一些精选方法,并从实践的角度,通过一系列循序渐进的原创实验,读者独立编程实现这些方法,以期为读者精通深度强化学并应用深度强化学方法解决实际问题奠定坚实基础。
本书不仅适合计算机科学与技术、人工智能、物联网工程、数据科学与大数据、软件工程、通信工程、电子信息、机器人工程、自动化、智能制造等相关专业高年级本科生及与自学使用,也适合机器学等领域的从业者、科研人员及爱好者自学与参使用。

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

正版特价新书
此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP