临时通知 :春节期间正常发货!!!
正版保障 假一赔十 可开发票
¥ 32.69 5.5折 ¥ 59 全新
库存78件
送至北京市朝阳区
运费快递 ¥5.90
作者陈喆
出版社清华大学出版社
ISBN9787302660705
出版时间2024-05
装帧平装
开本16开
定价59元
货号29720043
上书时间2024-10-22
评价14325好评率 99.94%
“水之积也不厚,则其负大舟也无力。风之积也不厚,则其负大翼也无力。”
深度强化学习是机器学冠上的一颗璀璨明珠。从AlphaGo到ChatGPT,处处都有它的身影。
虽然深度强化学习问世至今已有多年,但鲜见适合初学者学习的、讲解清楚的、系统的、原理与实践并重的深度强化学习教材。这是阻碍更多人掌握深度强化学习的“拦路虎”。其中一个原因是,强化学习领域和深度学习领域的技术相对复杂——不易想清楚,更不易讲清楚。强化学习领域有一本权威的英文教科书,笔者曾在几年内读了几遍,似懂非懂。某些知名高校的强化学习英文课程,听得云里雾里。有的发表在知名学术期刊上的深度强化学习高被引论文,也存在值得商榷之处。
一本好书是一条捷径,尽管著书是一项苦差事、著“填坑”书更是呕心沥血坐冷板凳啃硬骨头。
本书从原理和实践的角度,尽量详细、清楚、系统地讲解深度学习、强化学习,以及深度强化学习中的精选方法及其编程实现,以期为读者夯实深度强化学习基础。唯有夯实基础,才能走得更远。希望本书对有志精通深度强化学习的读者有所帮助。
本书假设读者已经学习过“高等数学”“线性代数”“概率论与数理统计”等数学类课程、使用过Python语言进行编程、学习过机器学习中的监督学习方法。如果还没有学习过机器学习,推荐在开始学习本书之前学习《机器学习原理与实践(微课版)》(清华大学出版社,2022年6月出版)的前两章。
本书共分5章。
第1章简要介绍深度强化学习的概念、历史及应用领域,并为编程实现奠定基础。
第2章回顾神经网络,重点讲解深度神经网络、卷积神经网络及循环神经网络。
第3章主要讲解强化学习、有限马尔可夫决策过程,以及依赖模型的求解方法。
第4章主要讲解行动价值方法,包括蒙特卡洛方法、Q学习、DynaQ,以及使用深度神经网络等监督学习模型的行动价值方法。
第5章主要讲解策略梯度方法,包括蒙特卡洛策略梯度方法和行动评价方法,并给出不完全观测情况下的应对办法。
本书共有41个实验。希望通过一系列循序渐进的原创实验,引领读者独立编程实现深度强化学习方法,以加深读者对深度强化学习的理解,并具备应用深度强化学习解决实际问题的能力。在做每个实验时,如果只根据实验提示就能独立完成实验,可给自己一个“优秀”的成绩;如果在参考实验解析后可以独立完成实验,可给自己一个“良好”的成绩;如果在参考附录中给出的实验程序和中文注释后可以完成实验,可给自己一个“中等”的成绩。
受学识、表达、精力等因素所限,书中难免存在不足之处,恳请读者指正。
感谢我的父母、妻女,没有他们的支持与多方面持续付出,就不会有这本书。如果没有选择写作此书,他们的生活和学习将会更好,因此亏欠于他们。谨以此书献给我的父母、妻女。同时,感谢所有支持过本书写作与帮助过本书出版、发行的人们!
“当你学会了,尝试去教人;当你获得了,尝试去给予。”
陈喆2024年1月于沈阳
本书从原理的角度,力求讲解清楚深度学习、强化学习、深度强化学习中的一些精选方法,并从实践的角度,通过一系列循序渐进的原创实验,引领读者独立编程实现这些方法,以期为读者精通深度强化学习并应用深度强化学习方法解决实际问题奠定坚实基础。
本书不仅适合计算机科学与技术、人工智能、物联网工程、数据科学与大数据、软件工程、通信工程、电子信息、机器人工程、自动化、智能制造等相关专业高年级本科生及研究生教学与自学使用,也适合机器学习等领域的从业者、科研人员及爱好者自学与参考使用。
第1章引言1
1.1深度强化学习及其简史1
1.2深度强化学习的应用领域3
1.3深度强化学习方法的实现4
1.3.1NumPy库和Matplotlib库4
1.3.2PyTorch框架7
1.4本章实验解析11
1.5本书各章联系14
1.6本章小结14
1.7思考与练习15
第2章从神经网络到深度学习16
2.1神经网络回顾16
2.1.1神经网络的推测过程17
2.1.2神经网络的训练过程18
2.1.3神经网络实践23
2.2从神经网络到深度神经网络26
2.3深度神经网络29
2.3.1深度神经网络的推测过程29
2.3.2深度神经网络的训练过程30
2.3.3反向模式自动微分34
2.3.4深度神经网络实践及分析35
2.4卷积神经网络37
2.4.1卷积层和合并层38
2.4.2卷积神经网络实践41
2.5循环神经网络42
2.6本章实验解析45
2.7本章小结51
2.8思考与练习52第3章强化学习基础53
3.1强化学习概述53
3.1.1多老虎机问题53
3.1.2利用与探索57
3.1.3强化学习的要素58
3.2有限马尔可夫决策过程59
3.2.1状态与马尔可夫性59
3.2.2什么是有限马尔可夫决策过程60
3.2.3收益与策略63
3.3求解MDP65
3.3.1贝尔曼方程与贝尔曼最优方程65
3.3.2价值迭代69
3.3.3策略评估74
3.3.4策略迭代77
3.3.5广义策略迭代82
3.4本章实验解析85
3.5本章小结90
3.6思考与练习90
深度强化学习原理与实践目录第4章行动价值方法92
4.1行动价值与最优行动价值92
4.1.1行动价值92
4.1.2最优行动价值96
4.2蒙特卡洛方法99
4.3Q学习107
4.4DynaQ114
4.5使用监督学习方法推测最优行动价值的极限值118
4.6使用深度神经网络推测最优行动价值的极限值124
4.7本章实验解析129
4.8本章小结136
4.9思考与练习136
第5章策略梯度方法138
5.1策略梯度基本方法138
5.2蒙特卡洛策略梯度方法142
5.2.1各个行动的蒙特卡洛策略梯度方法142
5.2.2单个行动的蒙特卡洛策略梯度方法147
5.2.3平移的蒙特卡洛策略梯度方法149
5.3行动评价方法154
5.4不完全观测160
5.5本章实验解析163
5.6本章小结168
5.7思考与练习169
附录A实验参考程序及注释171
参考文献231
本书从原理的角度,力求讲解清楚深度学习、强化学习、深度强化学习中的一些精选方法,并从实践的角度,通过一系列循序渐进的原创实验,引领读者独立编程实现这些方法,以期为读者精通深度强化学习并应用深度强化学习方法解决实际问题奠定坚实基础。
本书不仅适合计算机科学与技术、人工智能、物联网工程、数据科学与大数据、软件工程、通信工程、电子信息、机器人工程、自动化、智能制造等相关专业高年级本科生及研究生教学与自学使用,也适合机器学习等领域的从业者、科研人员及爱好者自学与参考使用。
?精选深度学习、强化学习、深度强化学习中的一些常用方法。
?从原理的角度,力求讲解清楚这些方法,以帮助读者迅速掌握并深入理解这些方法。
?从实践的角度,通过41个循序渐进的原创实验,引领读者独立编程实现这些方法,为读者精通深度强化学习并应用深度强化学习方法解决实际问题奠定坚实基础。
?每个实验配有提示、解析及带中文注释的参考程序3种不同层面的指导,供读者根据情况选择使用。
?提供完整的实验参考程序,可通过扫描书中二维码下载,便于读者迅速应用书中方法解决实际问题。
杨树达日记(16开精装 全九册 原箱装)
全新东莞
¥895.00
数千年瑶医秘验方首次公开的《瑶医效方选编》
七五品唐山
¥500.00
骆以军毛笔签名(上下册均签名、钤印)+ 钤印 · 限量编号毛边本 · 台湾印刻文学版《西夏旅馆(上下)》(锁线胶订)
全新北京
¥178.00
毛泽东选集红皮全四卷(第一到第四卷)1-4卷
八品日照
¥100.00
毛泽东选集
九五品成都
¥2800.00
《东方艺术·书法》杂志-黄庭坚书法精品:行书《奉题琴师元公此君轩诗》、《薄酒丑妇歌》册(此2拓本较为少见,相关内容共63页)、黄君《黄庭坚此君轩诗及其书作考》,秦官印封泥精选(相关内容52页)、秦官印封泥著录史略、秦官印封泥总目(繁体字版)、《秦官印封泥总目》注录详释(繁体字版),来楚生先生印选及评析(共21页),来楚生自用印选
八五品荆州
¥89.00
限量编号精装<毛边本>(限量100) 台湾联经版 高阳《高阳作品集 世情小说系列:《印心石》、《金缕鞋》、《凤尾香罗》、《安乐堂》、《水龙吟》、《苏州格格》(新校版,共六册)》典藏精装书盒套组
全新北京
¥895.00
毛主席诗词三十七首(集宋黄善夫刻史记字) kq 线装本清样本极其罕见 尺寸23.5厘米12.5厘米0.5厘米与正式出版同品种书大有差距,原本就没有封皮和白板内页,线不松很紧凑;三面是毛边本没有切割,一面是双层折齐也不是很齐不需要切割,正式产品都边齐的。有的页面有油墨不干净是油印本的油痕迹。用纸张也完全不同。所以判断是清样本。 天下红色书店之书
八品青岛
¥2700000.00
易筋洗髓经
八品潍坊
¥98.00
我们这一家
八品佛山
¥80.00
金文字典
八五品北京
¥180.00
毛泽东选集1-4(老一代电影艺术家方辉藏书)
八五品天津
¥1500.00
江西省泰和县桥头镇名老中医关培善经验介绍《简易针灸推拿疗法》
八品唐山
¥3000.00
恶——或者自由的戏剧(萨弗兰斯基经典名著,卫茂平先生经典译本!2001年1印3000册,非馆未阅,品近全新)【免邮挂】
九五品北京
¥125.00
子恺漫画全集之一 古诗新画--民国36年
八品广州
¥200.00
朝日画报别册 柯罗(Corot)
八五品成都
¥180.00
人力资源管理法务/高等教育管理系列规划教材
八五品东莞
¥12.32
古拉格群岛(上中下)
八五品北京
¥188.00
中草药临床实践资料+中草药协定处方+蛇伤常用方药+医学资料第2-5期 + 收集民间验方、偏方、秘方的通知+手诊疗法+摘除卵巢肿瘤报告(油印本,全部都是验方,合订1本)
八品福州
¥6800.00
宋本一叶
全新济宁
¥230000.00
— 没有更多了 —
微信扫码逛孔网
无需下载
非常满意诶,是正版新书没错!纸张也是护眼的看着很舒服,谢啦!
陈守忠先生纪念论文集