消息首页搜索举报

强化学习算法入门曾我部东马中国水利水电9787522617619全新正版

46.61 6.7折 69.8 全新

库存2件

河南平顶山

认证卖家担保交易快速发货售后保障

作者曾我部东马

出版社中国水利水电

ISBN9787522617619

出版时间2023-08

装帧平装

开本其他

定价69.8元

货号31921335

上书时间2024-11-29

万卷淘书斋

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 10小时
好评率暂无

最新上架

班门·街道编者:班门编委会|北京联合9787559672810全新正版 ¥61.16

知识管理视域下高校教师胜任力研究李虹|责编:杨晓芳中国社科9787522730813全新正版 ¥74.33

胜利的浪潮/二战回忆录(英)温斯顿·丘吉尔|译者:蔡亮吉林出版集团9787558171314全新正版 ¥24.28

民用P波段SAR卫星原理及应用陈筠力//陈杰//汪长城|责编:张丹丹中国宇航9787515921082全新正版 ¥74.30

诗经民俗学阐释研究(1919-1949)何昆|责编:杨康中国社科9787522729718全新正版 ¥74.98

船舶模拟电子技术基础(高等职业教育船舶与海洋工程装备类专业新形态教材)编者:王丽琴|责编:阎少华北京理工大学9787576305272全新正版 ¥38.69

视觉大[美]胡安·贝拉斯科，[美]萨穆埃尔·贝拉斯科民主与建设9787513944281全新正版 ¥215.22

神经康复评定与治疗技术操作规范（康复技术规范化培训系列教材）宋为群,胡昔权人民卫生9787117352802全新正版 ¥56.27

江南水乡传统村落礼制建筑营造技艺保护与传承研究王浩|河海大学9787563085842全新正版 ¥100.41

商品详情

品相描述：全新

商品描述: 作者简介
\"[日]曾我部东马理学博士(物理学专业)。曾任马克斯·普朗克研究所（德国）博士研究员、剑桥大学（英国）研究员。2009年回到日本，参与创立了Grid公司，担任董事兼首席技术官。2011年起先后担任东京大学尖端科学技术研究中心特聘助理教授、特聘副教授。2016年3月起任电气通信大学副教授，同时兼任Grid公司首席技术顾问、东京大学尖端科学技术研究中心客座研究员至今。
他以开发具有“深度学习—深度强化学习—回归预测—优化”功能的跨功能机器学习框架∞ReNom而闻名，目前在开发以量子机器学习为代表的最先进量子算法∞ReNomQ的同时，还致力于使用深度强化学习的“在线优化问题”的研究。\"

目录
第一章强化学习的基本概念 1.1 平均值与期望值 1.2 平均值与值 1.3 平均值与马尔可夫 1.4 贝尔曼方程的平均推导 1.5 蒙特卡洛学习方法的平均推导 1.6 TD 方法的平均推导第2章特征与每个算法的应用 2.1 测量π（A | S） 2.2 动态规划 2.3 蒙特卡罗方法 2.4 TD(0) 方法第 3 章函数逼近方法 3.0 介绍 3.1 函数逼近的基本概念 3.2 使用函数逼近模型的 V(St) 表达 3.3 机器学习的值函数 3.4 应用蒙特卡罗方法的价值函数回归 3.5 应用Td(0)-SARSA方法回归行为状态价值函数 3.6 应用Td(0)-Q方法回归行为状态价值函数第4章深度强化学习的原理和方法 4.1 在TD-Q学习中行为价值函数回归由NN 4.2 行为状态值函数通过 DQN 逼近 4.3 概率策略梯度法 4.4 行列式策略梯度方法 4.5 TRPO PPO 方法 4.6 Alpha Go 零学习方法 4.7 总结与扩展

内容摘要
\"作为第一个战胜围棋世界冠军的人工智能机器人AlphaGo，我们知道其主要工作原理是深度学习。随着AlphaGoZero和AlphaZero的相继发布，作为机器学习经典算法之一的强化学习，在人工智能领域受到了更多的关注。
《强化学习算法入门》使用通俗易懂的语言，按照“原理-公式-程序”的方式，对强化学习的基础知识进行了详细讲解。书中先让大家从熟悉的“平均值计算”作为切入点，学习强化学习的基本概念，然后结合实例学习了函数近似方法、深度强化学习的原理和方法等，比较了各算法的特点和应用，并用Python和MATLAB两种语言进行了编程实现。
《强化学习算法入门》内容丰富，实践性强，特别适合高校人工智能相关专业学生，机器学习、深度学习工程师等学习强化学习算法。\"

精彩内容
\"本书读者对象：大中专院校计算机、人工智能相关专业学生，对机器学习、强化学习算法感兴趣的程序员。
●本书从初高中学生都熟悉的“平均值计算”的角度出发，简单易懂地解释复杂的强化学习原理。 ●使用常见的例子（多臂老虎机问题和网格世界问题）对各种算法进行比较，使它们的特点更易理解。 ●对于强化学习的核心算法，提供了Python3和MATLAB两种类型的代码。执行代码，可直观理解“原理→公式→程序”这一系列流程。\"

— 没有更多了 —