消息首页搜索举报

【假一罚四】深度学习入门

集团直发，全新正版书籍，假一罚四，放心选购。24小时内发货，可开发票。

68.4 6.2折 109.8 全新

库存88件

广东东莞

认证卖家担保交易快速发货售后保障

作者(日) 斋藤康毅著

出版社人民邮电出版社

ISBN9787115649171

出版时间2024-08

装帧平装

开本其他

定价109.8元

货号4667377

上书时间2024-11-26

朗朗图书书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

【假一罚四】保险实务 ¥25.10

【假一罚四】刘氏气色形态罐诊罐疗 ¥20.80

【假一罚四】揭开装修内幕装修防上当一本通 ¥15.40

【假一罚四】砌筑工程工程量清单计价条文注释与实例解析 ¥17.50

【假一罚四】新疆植物病害识别手册 ¥30.90

【假一罚四】会计学 ¥19.80

【假一罚四】建筑施工强制性条文速查手册 ¥18.20

【假一罚四】十一五农业产业化发展报告 ¥127.70

【假一罚四】小城文化人 ¥15.30

商品详情

品相描述：全新

商品描述: 作者简介
斋藤康毅，1984年出生于日本长崎县，东京工业大学毕业，并完成东京大学研究生院课程。目前在某企业从事人工智能相关的研究和开发工作。著有“鱼书”系列《深度学习入门：基于Python的理论与实现》《深度学习进阶：自然语言处理》《深度学习入门2：自制框架》，同时也是Python in Practice、The Elements of Computing Systems、Building MachineLearning Systems with Python的日文版译者。

【译者介绍】

郑明智，智慧医疗工程师。主要研究方向为医疗与前沿ICT技术的结合及其应用。译有《深度学习基础与实践》《详解深度学习》《白话机器学习的数学》等书。

目录
本书前半部分介绍强化学习的重要思想和基础知识, 后半部分介绍如何将深度学习应用于强化学习, 遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入, 依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程, 以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后, 神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。

内容摘要
本书前半部分介绍强化学习的重要思想和基础知识，后半部分介绍如何将深度学习应用于强化学习，遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入，依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程，以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后，神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。本书延续“鱼书”系列的风格，搭配丰富的图、表、代码示例，加上轻松、简明的讲解，让人循序渐进地理解强化学习中各种方法之间的关系，于不知不觉中登堂入室。

主编推荐
沿袭“鱼书”系列风格，提供实际代码，边实践边学习，无须依赖外部库，从零开始实现支撑强化学习的基础技术。

本书有什么特点?

●把握潮流中的变与不变

在快速发展变化的深度学习领域，有变化的事物，有不变的事物。有些事物会随潮流而消逝，有些则会被传承下去。本书从马尔可夫决策过程、贝尔曼方程、蒙特卡洛方法、时间差分法等强化学习基础方法，自然而然地过渡到神经网络和深度学习，从前沿视角为读者遴选出最值得关注的强化学习理论和方法。

●内容丰富，讲解简明易懂

作为超高人气“鱼书”系列第四部作品，本书延续了这一系列的写作和讲解风格，搭配丰富的图、表、代码示例，加上轻松、简明的讲解，能够让人非常信服地理解强化学习中各种方法之间的关系，于不知不觉中登堂入室。

●原理与实践并重

本书旨在确保读者能够牢固掌握强化学习的独特理论，奉行“只有做出来才能真正理解”的理念，将这一主题的每个构成要素都从“理论”和“实践”两个方面进行详尽解释，并鼓励读者动手尝试。与仅通过数学公式解释理论的图书不同，读者将通过实际运行本书代码获得许多令人惊叹的领悟。

— 没有更多了 —

【假一罚四】深度学习入门

朗朗图书书店

商品详情

相关推荐