Python深度强化学习 使用PyTorch,TensorFlow和OpenAI Gym
全新正版 假一赔十 可开发票
¥
50.63
7.3折
¥
69
全新
库存4件
作者(印)尼米什·桑吉
出版社清华大学出版社
ISBN9787302607724
出版时间2022-10
装帧平装
开本16开
定价69元
货号1202778353
上书时间2025-01-01
商品详情
- 品相描述:全新
- 商品描述
-
作者简介
"作者简介
Nimish Sanghi(尼米什·桑吉)一位充满激情的技术领导者,专注于使用技术解决客户问题,在软件和咨询领域拥有超过25年的工作经验,拥有人工智能和深度学习的多项证书,获得印度理工学院电气工程学士学位、印度管理学院工商管理硕士学位。曾在普华永道、IBM和Oracle等公司担任领导职务,负责盈亏管理。2006年,在SOAIS公司开启软件咨询创业之旅,为《财富》100强的众多公司提供自动化和数字化转型服务,实现从本地应用到云计算的转型。人工智能和自动化驱动的初创公司领域的天使投资人,联合创立面向印度市场的SaaS人力资源和薪资Paybooks平台,联合创立提供人工智能驱动的工作流ZipperAgent自动化平台和视频营销ZipperHQ自动化平台(总部位于波士顿的初创公司),现任这两个平台的首席技术官和首席数据科学家。
译者简介
罗俊海,博士(后),电子科技大学副教授、硕士生导师。主要研究方向为智能计算、目标检测和数据融合,主持国家自然科学基金、四川省科技厅基金、总装预研基金和中央高校基本科研业务等15项,参与制订标准6项,发表文章60余篇,其中SCI检索50余篇,总引用1500余次。申请和授权发明专利30余项,获四川省科学技术进步奖二等奖和三等奖各1项。出版《多源数据融合和传感器管理》《使用HTML和CSS开发WEB网站》《物联网系统开发及应用实战》等专著和教材5部,以及译著《实用MATLAB深度学习:基于项目的方法》。"
目录
第1章强化学习导论
1.1强化学习概述
1.2机器学习分类
1.2.1监督学习
1.2.2无监督学习
1.2.3强化学习
1.2.4核心元素
1.3基于强化学习的深度学习
1.4实例和案例
1.4.1自动驾驶汽车
1.4.2机器人
1.4.3推荐系统
1.4.4金融和贸易
1.4.5医疗保健
1.4.6游戏
1.5库与环境设
1.6总结
第2章马尔可夫决策
……
内容摘要
本书重点突出深度强化学习理论的基本概念、前沿基础理论和Python应用实现。首先介绍马尔可夫决策、基于模型的算法、无模型方法、动态规划、蒙特卡洛和函数逼近等基础知识;然后详细阐述强化学习、深度强化学习、多智能体强化学习等算法,及其Python应用实现。本书既阐述奖励、价值函数、模型和策略等重要概念和基础知识,又介绍深度强化学习理论的前沿研究和热点方向。本书英文版出版之后,广受好评,已成为深度强化学习领域畅销教材,也可为人工智能和机器学习等领域的科研工作者、技术工程师提供参考。
主编推荐
"(1)知识覆盖全面,内容新颖独特,涵盖基于模型的算法、无模型方法、深度Q-学习、策略梯度和多智能体强化学习等算法以及国际前沿研究和热点方向。
(2)侧重基本概念和基础知识,总结提炼强化学习和深度强化学习的理论研究。
(3)重点突出在OpenAI Gym工具包下使用PyTorch和TensorFlow框架的深度强化学习算法。
(4)详尽分析特定场景领域的数学建模和理论推导过程,理论讲解深入浅出,应用实例简洁易懂,源代码清晰易理解。 (5)适合作为大学生的教材以及工程师的参考书籍。在有限篇幅内系统精炼地阐明基本理论、方法,辅以典型的理论分析、实例和相关程序,化繁为简,便于学习和认知。
"
— 没有更多了 —
以下为对购买帮助不大的评价