• 信息物理系统强化学习(网络安全示例)/计算机科学丛书
21年品牌 40万+商家 超1.5亿件商品

信息物理系统强化学习(网络安全示例)/计算机科学丛书

全新正版 极速发货

55.09 7.0折 79 全新

库存2件

广东广州
认证卖家担保交易快速发货售后保障

作者(美)李崇//邱美康|责编:王春华//冯秀泳|译者:卢苗苗//计湘婷//何源//席瑞//金梦

出版社机械工业

ISBN9787111676478

出版时间2021-03

装帧平装

开本其他

定价79元

货号31109027

上书时间2024-05-28

书香美美

已实名 已认证 进店 收藏店铺

   商品详情   

品相描述:全新
商品描述
目录
出版者的话
译者序
前言
作者简介
第一部分  介绍
  第1章  强化学习概述
    1.1  强化学习综述
      1.1.1  引言
      1.1.2  与其他机器学习方法的比较
      1.1.3  强化学习示例
      1.1.4  强化学习应用
    1.2  强化学习的发展历史
      1.2.1  传统的强化学习
      1.2.2  深度强化学习
    1.3  强化学习的仿真工具
    1.4  本章小结
  第2章  信息物理系统和网络安全概述
    2.1  引言
    2.2  信息物理系统研究示例
      2.2.1  资源分配
      2.2.2  数据传输与管理
      2.2.3  能源控制
      2.2.4  基于模型的软件设计
    2.3  网络安全威胁
      2.3.1  网络安全的对手
      2.3.2  网络安全的目标
    2.4  本章小结
    2.5  练习
第二部分  强化学习在信息物理系统中的应用
  第3章  强化学习问题
    3.1  多臂赌博机问题
      3.1.1  ε-greedy算法
      3.1.2  softmax算法
      3.1.3  UCB算法
    3.2  上下文赌博机问题
    3.3  完整的强化学习问题
      3.3.1  强化学习的要素
      3.3.2  马尔可夫决策过程介绍
      3.3.3  值函数
    3.4  本章小结
    3.5  练习
  第4章  基于模型的强化学习
    4.1  引言
    4.2  动态规划
      4.2.1  策略迭代法
      4.2.2  价值迭代法
      4.2.3  异步动态规划
    4.3  部分可观察马尔可夫决策过程
    4.4  连续马尔可夫决策过程
      4.4.1  惰性近似
      4.4.2  函数近似
    4.5  本章小结
    4.6  练习
  第5章  无模型强化学习
    5.1  引言
    5.2  强化学习预测
      5.2.1  蒙特卡罗学习
      5.2.2  时序差分学习
    5.3  强化学习控制
      5.3.1  蒙特卡罗控制
      5.3.2  基于时序差分的控制
      5.3.3  策略梯度
      5.3.4  actor-critic
    5.4  高级算法
      5.4.1  期望Sarsa
      5.4.2  双Q-learning
    5.5  本章小结
    5.6  练习
  第6章  深度强化学习
    6.1  引言
    6.2  深度神经网络
      6.2.1  卷积神经网络
      6.2.2  循环神经网络
    6.3  深度学习在值函数上的应用
    6.4  深度学习在策略函数上的应用
      6.4.1  DDPG
      6.4.2  A3C
    6.5  深度学习在强化学习模型上的应用
    6.6  深度强化学习计算效率
    6.7  本章小结
    6.8  练习
第三部分  案例研究
  第7章  强化学习与网络安全
    7.1  传统的网络安全方法
      7.1.1  传统的网络安全技术
      7.1.2  新兴网络安全威胁
    7.2  强化学习在网络安全中的应用
      7.2.1  移动群智感知中的虚假感知攻击
      7.2.2  认知无线电网络中的安全强化
      7.2.3  移动边缘计算中的安全问题
      7.2.4  网络安全分析师的动态调度
    7.3  本章小结
    7.4  练习
  第8章  案例研究:智能电网中的在线网络攻击检测
    8.1  引言
    8.2  系统模型和状态估计
      8.2.1  系统模型
      8.2.2  状态估计
    8.3  问题描述
    8.4  解决方案
    8.5  仿真结果
      8.5.1  仿真设计与参数设置
      8.5.2  性能评估
    8.6  本章小结
  第9章  案例研究:击败中间人攻击
    9.1  引言
    9.2  强化学习方法
      9.2.1  状态空间
      9.2.2  行动空间
      9.2.3  奖励
    9.3  实验和结果
      9.3.1  模型训练
      9.3.2  在线实验
    9.4  讨论
      9.4.1  基于探测器的检测系统
      9.4.2  运用SDN/OpenFlow使模型实用
    9.5  本章小结
参考文献
索引

内容摘要
 本书通过系统介绍强化学习领域的基础与算法,在强化学习与信息物理系统两个领域之间建立起联系,每一部分都列举了一个或几个最新的信息物理系统示例,以帮助读者直观地理解强化学习技术的实用性。本书分为三个部分。第一部分对强化学习、信息物理系统和网络安全进行了概要介绍。第二部分正式介绍强化学习的框架,并对强化学习问题进行定义,给出了两类解决方法-基于模型的解决方案和无模型的解决方案。第三部分通过回顾现有的网络安全技术并描述新兴的网络威胁
,将注意力转移到网络安全,之后给出了两个案例研究。

—  没有更多了  —

以下为对购买帮助不大的评价

此功能需要访问孔网APP才能使用
暂时不用
打开孔网APP