揭秘深度强化学习
批量上传,套装书可能不全,下单前咨询在线客服!有特殊要求,下单前请咨询客服!
¥
59.81
6.7折
¥
89.8
全新
仅1件
作者彭伟
出版社中国水利水电出版社
ISBN9787517062387
出版时间2018-05
装帧其他
开本16开
定价89.8元
货号9787517062387
上书时间2024-10-24
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
彭伟,AvatarWorks人工智能实验室研究员,电子科技大学EE学士,厦门大学计算机硕士,具有良好的软硬件能力。目前主要从事人工智能、机器学习算法的研究。主要的项目经历包括视觉目标跟踪、行人检测、目标检测、3D动画风格传输、虚拟机器人行为系统等,具有丰富的实战经验。
目录
第1章 深度强化学习概览
1.1 什么是深度强化学习?
1.1.1 俯瞰强化学习
1.1.2 来一杯深度学习
1.1.3 Hello,深度强化学习
1.2 深度强化学习的学习策略
1.3 本书的内容概要
参考文献
第2章 强化学习基础
2.1 真相——经典的隐马尔科夫模型(HMM)
2.1.1 HMM引例
2.1.2 模型理解与推导
2.1.3 隐马尔科夫应用举例
2.2 逢考必过—马尔科夫决策过程(MDP)
2.2.1 MDP生活化引例
2.2.2 MDP模型
2.2.3 MDP模型引例
2.2.4 模型理解
2.2.5 探索与利用
2.2.6 值函数和动作值函数
2.2.7 基于动态规划的强化问题求解
2.3 糟糕,考试不给题库—无模型强化学习
2.3.1 蒙特卡洛算法
2.3.2 时序差分算法
2.3.3 异步强化学习算法
2.4 学霸来了——强化学习之模仿学习
2.4.1 模仿学习(Imitation Learning)
2.4.2 逆强化学习
本章总结
参考文献
第3章 深度学习基础
3.1 深度学习简史
3.1.1 神经网络发展史
3.1.2 深度学习的分类
3.1.3 深度学习的应用
3.1.4 深度学习存在的问题
3.2 深度学习基础概念
3.2.1 深度学**体感知
3.2.2 神经网络的基本组成
3.2.3 深度学习训练
3.2.4 梯度下降法
3.2.5 反向传播算法(BP)
3.3 数据预处理
3.3.1 主成分分析(PCA)
3.3.2 独立成分分析(ICA)
3.3.3 数据白化处理
3.4 深度学习硬件基础
3.4.1 深度学习硬件基础
3.4.2 GPU简介
3.4.3 CUDA编程
内容摘要
深度强化学习(DeepReinforcementLearning,DRL)是深度学习算法和强化学习算法的巧妙结合,它是一种新兴的通用人工智能算法技术,也是机器学习的前沿技术,DRL算法潜力无限,AlphaGo是目前该算法相当成功的使用案例。DRL算法以马尔科夫决策过程为基础,是在深度学习强大的非线性函数的拟
合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划(DP)的算法以及基于策略优化的算法,本书的目的就是要把这两种主要的算法(及设计技巧)讲解清楚,使算法研究人员能够熟练地掌握。
彭伟编著的《揭秘深度强化学习》共10章,首先以AlphaGo在围棋大战的伟大事迹开始,引起对人工智能发展和现状的介绍,进而介绍深度强化学习的基本知识。然后分别介绍了强化学习(重点介绍蒙特卡洛算法和时序差分算法)和深度学习的基础知识、功
能神经网络层、卷积神经网络(CNN)、循环神经网络(RNN),以及深度强化学习的理论基础和当前主流的算法框架。最后介绍了深度强化学习在不同领域
的几个应用实例。引例、基础知识和实例相结合,方便读者理解和学习。
《揭秘深度强化学习》内容丰富,讲解全面、语言描述通俗易懂,是深度强化学习算法入门的优选。
本书适合计算机专业本科相关学生、人工智能领域的研究人员以及所有对机器学习和人工智能算法感兴趣的人员。
— 没有更多了 —
以下为对购买帮助不大的评价