消息首页搜索举报

【假一罚四】深度强化学习

集团直发，全新正版书籍，假一罚四，放心选购。24小时内发货。

50 5.6折 89 全新

库存24件

浙江嘉兴

认证卖家担保交易快速发货售后保障

作者(印) 莫希特·塞瓦克著

出版社国防工业出版社

ISBN9787118131796

出版时间2024-06

装帧精装

开本其他

定价89元

货号4659330

上书时间2024-12-03

朗朗图书书店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 15小时
好评率暂无

最新上架

【假一罚四】小淘气尼古拉的故事(典藏版)全3册

【假一罚四】小淘气尼古拉的故事(典藏版)全3册 ¥70.60

【假一罚四】小珠人找影子 ¥15.30

【假一罚四】物流技能竞赛指导(21世纪高职高专规划教材)/物流管理系列

【假一罚四】物流技能竞赛指导(21世纪高职高专规划教材)/物流管理系列 ¥27.20

【假一罚四】最好不相见最好不相念(闲品历代爱情往事)

【假一罚四】最好不相见最好不相念(闲品历代爱情往事) ¥17.30

【假一罚四】园林工程材料与应用图例

【假一罚四】园林工程材料与应用图例 ¥51.40

【假一罚四】人鼠之间/约翰·斯坦贝克作品系列

【假一罚四】人鼠之间/约翰·斯坦贝克作品系列 ¥12.90

【假一罚四】缺失的语文课(那些被你轻视的常识)

【假一罚四】缺失的语文课(那些被你轻视的常识) ¥22.40

【假一罚四】说唱唱本与票房--北京民间说唱研究

【假一罚四】说唱唱本与票房--北京民间说唱研究 ¥55.30

【假一罚四】戴夫的时空奇妙漂流(2)/奇幻爆笑漫画植物大战僵尸2

【假一罚四】戴夫的时空奇妙漂流(2)/奇幻爆笑漫画植物大战僵尸2 ¥5.80

商品详情

品相描述：全新

商品描述: 目录
本书主要内容包括: 介绍了强化学习的基本概念, 如智能体、环境、状态、奖励、动作等; 介绍了强化学习的数学和算法原理, 如马尔可夫决策过程和贝尔曼方程, 并在此基础上讨论了动态规划、值迭代和策略迭代方法; 介绍了强化学习的估计与控制问题, 并通过实例展示了Q学习的编程; 深入探讨了深度学习的概念、架构机制, 通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念, 为后续章节与强化学习算法相结合作铺垫。

内容摘要
本书主要内容包括：介绍了强化学习的基本概念，如智能体、环境、状态、奖励、动作等；介绍了强化学习的数学和算法原理，如马尔可夫决策过程和贝尔曼方程，并在此基础上讨论了动态规划、值迭代和策略迭代方法；介绍了强化学习的估计与控制问题，并通过实例展示了Q学习的编程；深入探讨了深度学习的概念、架构机制，通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念，为后续章节与强化学习算法相结合作铺垫。

— 没有更多了 —

店铺评价

消息首页搜索

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用

暂时不用

打开孔网APP