深度强化学 人工智能 (荷)阿斯克·普拉特|译者:殷海英 新华正版
正版新书 新华官方库房直发 可开电子发票
¥
54.27
6.8折
¥
79.8
全新
库存5件
作者[荷兰]阿斯克·普拉特(askeat)
出版社清华大学出版社
出版时间2018-10
版次1
装帧平装
货号文轩12.21
上书时间2024-12-21
商品详情
- 品相描述:全新
图书标准信息
-
作者
[荷兰]阿斯克·普拉特(askeat)
-
出版社
清华大学出版社
-
出版时间
2018-10
-
版次
1
-
ISBN
9787302659792
-
定价
79.80元
-
装帧
平装
-
开本
16开
-
页数
264页
-
字数
521千字
- 【内容简介】
-
近年来,深度强化学习成为关注的热点。在自动驾驶、棋牌游戏、分子重排和机器人等领域,计算机程序能够通过强化学习,理解以前被视为超级困难的问题,取得了令人瞩目的成果。在围棋比赛中,AlphaGo接连战胜樊麾、李世石和柯洁等人类冠军。深度强化学习从生物学和心理学领域的研究中受到启发。生物学激发了人工神经网络和深度学习的出现,而心理学研究人和动物如何学习,如何通过正负刺激来强化目标行为。了解了强化学习如何指导机器人行走时,我们不禁联想到儿童如何在玩中学习。动物行为和大脑结构可作为新的科学和工程蓝图。计算机似乎真正具备了人类的某些行为特征,深度强化学习技术成为实现AI梦想的核心。
教育界也十分重视深度强化学习的研究进展。许多大学开设了深度强化学习课程。本书恰到好处地介绍了深度强化学习领域的技术细节,可作为AI研究生课程的教材。本书讲解全面,涵盖深度Q-learning的基本算法,乃至多智能体强化学习和元学习等高级主题。
- 【目录】
-
第1章简介
1.1什么是深度强化学习
1.1.1深度学习
1.1.2强化学习
1.1.3深度强化学习
1.1.4应用
1.1.5四个相关领域
1.2三种机器学习范式
12.1监督学习
1.2.2无监督学习
1.2.3强化学习
1.3本书概述
1.3.1预备知识
1.3.2本书结构
第2章表格值为基础的强化学习
2.1序贯决策问题
2.1.1网格世界
2.1.2迷宫和盒子谜题
2.2基于表格值的智能体
2.2.1智能体和环境
……
点击展开
点击收起
— 没有更多了 —
以下为对购买帮助不大的评价