消息首页搜索举报

统计强化学习(现代机器学习方法)/智能科学与技术丛书9787111622451

正版图书，可开发票，请放心购买。

62.93 8.0折 79 全新

仅1件

广东广州

认证卖家担保交易快速发货售后保障

作者(日)杉山将|译者:高阳

出版社机械工业

ISBN9787111622451

出版时间2019-05

装帧其他

开本其他

定价79元

货号30628401

上书时间2024-07-27

淘书宝店

九年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 8小时
好评率暂无

店主推荐
最新上架

基因Ⅻ9787040486896 ¥498.00

美国陆军·装甲旅战斗队目标编制与装备 20179787547613573 ¥215.00

精神分析研究第二辑9787100126359 ¥252.00

直击二战：钢铁的碰撞·库尔斯克战役9787548424161 ¥50.00

DARPA创新计划Ⅱ9787118116304 ¥350.00

军事系统建模与仿真9787118105056 ¥288.00

超声相控阵原理9787118111545 ¥242.00

机载雷达多目标跟踪技术9787118088311 ¥130.00

联合作战计划时空推演理论与技术9787118117851 ¥260.00

开心猫奇遇记+森林里的恐龙朋友4册9787559704900 ¥51.10

海潮9787570223848 ¥24.51

未解之谜3册9787548052920 ¥40.73

焰火（中小学生阅读指导目录·初中）9787570224357 ¥9.34

DK人类的旅程（精美翔实的5000年人类旅行史让每一个热爱旅行的人发现旅行的意义）9787559655707 ¥114.00

肺肾同治少感冒长得高/孙德仁小儿推拿大图册9787122366450 ¥14.85

挑战思维极限(勾股定理的365种证明)9787302458791 ¥29.80

脉动中国(许纪霖的50堂传统文化课)(精)9787542672278 ¥65.00

水街520号的狸猫+阳子湖秘境+皮影的幻想国+你好花精灵共四册9787210135937 ¥80.11

商品详情

品相描述：全新

商品描述: 导语摘要
本书为强化学习算法引入了一种发人深省的统计处理方法，反映了作者在该领域的工作和研究状态，为快速发展的机器学习文献补充了最新的资料。初学者和经验丰富的研究人员都会发现此书是理解最新强化学习技术的重要来源。

作者简介
杉山将（MasashiSugiyama）东京大学教授，拥有东京工业大学计算机科学博士学位，研究兴趣包括机器学习与数据挖掘的理论、算法和应用，涉及信号处理、图像处理、机器人控制等。2007年获得IBM学者奖，以表彰其在机器学习领域非平稳性方面做出的贡献。2011年获得日本信息处理协会颁发的Nagao特别研究员奖，以及日本文部科学省颁发的青年科学家奖，以表彰其对机器学习密度比范型的贡献。

目录
译者序
序
前言
作者简介
第一部分  简介
  第1章  强化学习介绍
    1.1  强化学习
    1.2  数学形式化
    1.3  本书结构
      1.3.1  模型无关策略迭代
      1.3.2  模型无关策略搜索
      1.3.3  基于模型的强化学习
第二部分  模型无关策略迭代
  第2章  基于值函数近似的策略迭代
    2.1  值函数
      2.1.1  状态值函数
      2.1.2  状态-动作值函数
    2.2  最小二乘策略迭代
      2.2.1  瞬时奖赏回归
      2.2.2  算法
      2.2.3  正则化
      2.2.4  模型选择
    2.3  本章小结
  第3章  值函数近似中的基函数设计
    3.1  图中的高斯核
      3.1.1  MDP-诱导图
      3.1.2  通用高斯核
      3.1.3  测地线高斯核
      3.1.4  扩展到连续状态空间
    3.2  图解说明
      3.2.1  配置
      3.2.2  测地线高斯核
      3.2.3  通用高斯核
      3.2.4  图拉普拉斯特征基
      3.2.5  扩散小波
    3.3  数值示例
      3.3.1  机器人手臂控制
      3.3.2  机器人导航
    3.4  本章小结
  第4章  策略迭代中的样本重用
    4.1  形式化
    4.2  离策略值函数近似
      4.2.1  片段重要性加权
      4.2.2  每次决策的重要性加权
      4.2.3  自适应的每次决策重要性加权
      4.2.4  图解说明
    4.3  展平参数的自动选择
      4.3.1  重要性加权交叉验证
      4.3.2  图解说明
    4.4  样本重用策略迭代

内容摘要
本书将统计学习和强化学习相结合，对强化学习函数估计中的基函数设计、样本重用以及策略搜索、
模型估计等做了深入浅出的介绍。全书共11章，分为四部分：第一部分（第1章）介绍了强化学习的基本知识；第二部分（第2～6章）介绍了模型无关策略迭代的知识；第三部分（第7～9章）介绍了模型无关策略搜索的知识；第四部分（第10～11章）介绍了基于模型的强化学习。本书适合从事人工智能和机器学习研究和应用的专家学者、技术人员、研究生阅读。

— 没有更多了 —