• 强化学习算法入门
图书条目标准图
21年品牌 40万+商家 超1.5亿件商品

强化学习算法入门

正版现货,品相完整,套书只发一本,多版面书籍只对书名

41.5 5.9折 69.8 九品

仅1件

北京海淀
认证卖家担保交易快速发货售后保障

作者曾我部东马

出版社水利水电出版社

出版时间2024-01

版次1

装帧其他

上书时间2024-08-20

新起点书店

四年老店
已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:九品
图书标准信息
  • 作者 曾我部东马
  • 出版社 水利水电出版社
  • 出版时间 2024-01
  • 版次 1
  • ISBN 9787522617619
  • 定价 69.80元
  • 装帧 其他
  • 开本 32开
  • 纸张 胶版纸
  • 页数 175页
  • 字数 203.000千字
【内容简介】
作为第一个战胜围棋世界冠军的人工智能机器人AlphaGo,我们知道其主要工作原理是深度学习。随着AlphaGo Zero和Alpha Zero的相继发布,作为机器学习经典算法之一的强化学习,在人工智能领域受到了更多的关注。
  《强化学习算法入门》使用通俗易懂的语言,按照“原理-公式-程序”的方式,对强化学习的基础知识进行了详细讲解。书中先让大家从熟悉的“平均值计算”作为切入点,学习强化学习的基本概念,然后结合实例学习了函数近似方法、深度强化学习的原理和方法等,比较了各算法的特点和应用,并用Python和MATLAB两种语言进行了编程实现。
  《强化学习算法入门》内容丰富,实践性强,特别适合高校人工智能相关专业学生,机器学习、深度学习工程师等学习强化学习算法。
【作者简介】
[日] 曾我部东马

理学博士(物理学专业)。曾任马克斯·普朗克研究所(德国)博士研究员、剑桥大学(英国)研究员。2009年回到日本,参与创立了Grid公司,担任董事兼首席技术官。2011年起先后担任东京大学尖端科学技术研究中心特聘助理教授、特聘副教授。2016年3月起任电气通信大学副教授,同时兼任Grid公司首席技术顾问、东京大学尖端科学技术研究中心客座研究员至今。

他以开发具有“深度学习—深度强化学习—回归预测—优化”功能的跨功能机器学习框架∞ReNom而闻名,目前在开发以量子机器学习为代表的最先进量子算法∞ReNomQ的同时,还致力于使用深度强化学习的“在线优化问题”的研究。
【目录】


章基于“均”的强化学的基本概念

1.0简介

1.1均值与期望值

1.1.1均值

1.1.2期望值

1.1.3期望值与均值的关系

1.2均值和价值



1.3均值和马尔可夫

1.3.1均值的计算公式及其变形

1.3.2逐次均值表达和mp

1.4用均值推导贝尔曼方程

1.4.1均值表达和价值函数的引入

1.4.2决策型贝尔曼方程式的推导

1.4.3概率型贝尔曼方程式的推导

……

点击展开 点击收起

   相关推荐   

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP