消息首页搜索举报

图书条目标准图

网络智能化中的深度强化学习技术

正版新书新华官方库房直发可开电子发票

98.87 6.6折 149.8 全新

库存7件

江苏无锡

认证卖家担保交易快速发货售后保障

作者戚琦；付霄元；庄子睿；王敬宇；廖建新

出版社人民邮电出版社

出版时间2023-04

版次1

装帧其他

货号文轩12.1

上书时间2024-12-03

千正旗舰版一正版促销

九年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 14小时
好评率暂无

店主推荐
最新上架

窗边的小豆豆合集（1-6）（爱心树童书） ¥190.00

正版现货如果历史是一群喵12:元末民初篇 ¥29.90

可复制的领导力 ¥32.00

如果历史是一群喵6-魏晋南北篇(限量历史喵折立卡片） ¥39.00

如果历史是一群喵9·五代十国篇 ¥29.00

如果历史是一群喵4·东汉末年篇 ¥29.00

如果历史是一群喵5·乱世三国篇 ¥29.00

神雕侠侣全四册金庸作品集(09－12) ¥78.00

鹿鼎记金庸 ¥125.00

拉汉对照优士丁尼国法大全选译(第1卷)：法的一般规范Ⅰ ¥38.64

社会学词典(第4版) ¥184.92

形而上学导论(汉译名著本)(新版) ¥26.91

不合时宜的考察 ¥37.80

汉语介词语义的演变模式 ¥136.62

有声的中国——演说的魅力及其可能性(人文史丛书) ¥40.71

汉语韵律语法学纲要(商务馆语言学教材书系) ¥88.32

蔡义江新评红楼梦（精装典藏本） ¥343.62

耶路撒冷以东：一部巴以边界的民族志(日新文库) ¥58.65

商品详情

品相描述：全新

图书标准信息

作者戚琦；付霄元；庄子睿；王敬宇；廖建新
出版社人民邮电出版社
出版时间 2023-04
版次 1
ISBN 9787115572639
定价 149.80元
装帧其他
开本其他
纸张胶版纸
页数 244页
字数 305千字

【内容简介】: 随着人工智能技术的广泛应用，网络智能化近年来受到广泛的关注，已经成为下一代移动通信与未来网络的重要技术。阿尔法围棋（AlphaGo）之后，深度强化学习不断推陈出新，为网络中的决策问题提供了有效的潜在解决方案。本书系统介绍了网络智能化中深度强化学习的基本理论、算法及应用场景。全书共8章，针对互联网、移动通信网、边缘网络、数据中心等典型网络，阐述了网络管理、网络控制、任务调度等决策需求，深入论述了深度强化学习的模型构建与应用技术。第1章介绍了网络智能的需求与挑战；第2章介绍了先进的深度强化学习模型与方法；第3～6章论述了无线接入优化、网络管理、网络控制与任务调度等普遍网络管控任务中，深度强化学习技术的应用方法；第7章和第8章论述了深度强化学习在流媒体控制以及自组织网络等典型场景中的新研究进展。
本书可为高等院校计算机和通信相关专业的本科生、研究生提供参考，也可供对网络智能化与深度强化学习领域感兴趣的研究人员和工程技术人员参考。
【作者简介】: 戚琦，博士，网络与交换国家重点实验室副教授、硕士生导师、博士生导师。长期从事业务网络智能化和移动云计算方向的科研工作，近年来重点关注深度强化学习、分布式机器学习、联邦学习、轻量化神经网络等方面的前沿研究，取得了知识定义网络、边缘智能、手部姿态估计、草图检索等一系列研究成果。发表高水平学术论文70余篇，SCI索引期刊论文40余篇。先后主持2项国家自然科学基金目，1项北京市自然科学基金，3项基地自主科研项目，以及多项企事业单位合作项目，作为主研人承担重点研发计划、创新团队、创新群体、973等多个国家及省部级重大项目。
【目录】: 第 1章网络智能概述 1

1.1 概述 2

1.1.1 网络架构的持续演进 2

1.1.2 网络管理与控制的挑战 3

1.1.3 网络智能的兴起 4

1.2 网络智能的基础 7

1.2.1 大数据 7

1.2.2 算力支持 7

1.2.3 集中式控制 9

1.3 网络智能的现状 10

1.3.1 意图网络 10

1.3.2 自动驾驶网络 12

1.3.3 知识定义网络 14

1.3.4 标准化工作 17

1.4 网络智能的实现途径 18

1.4.1 监督学习 18

1.4.2 无监督学习 20

1.4.3 强化学习 21

1.5 网络智能的愿景与挑战 22

1.5.1 网络智能的愿景 22

1.5.2 网络智能的挑战 24

参考文献 25

第 2章深度强化学习方法 29

2.1 强化学习方法概述 30

2.1.1 马尔可夫决策过程 30

2.1.2 多臂赌博机 32

2.1.3 蒙特卡洛树搜索与时间差分方法 33

2.1.4 值迭代与策略迭代 35

2.2 深度强化学习 37

2.2.1 深度Q网络 38

2.2.2 策略梯度方法 40

2.2.3 策略梯度单调提升优化算法 44

2.2.4 最大熵算法 50

2.3 多智能体强化学习 52

2.3.1 独立强化学习及其涌现行为分析 53

2.3.2 多智能体通信 55

2.3.3 多智能体合作机制 56

2.3.4 多智能体建模与策略推断 59

2.4 分层强化学习 61

2.5 迁移强化学习 64

2.5.1 迁移强化学习框架 65

2.5.2 根据迁移设置的分类 66

2.5.3 根据迁移知识类型的分类 67

2.5.4 根据迁移目标的分类 68

2.6 多任务强化学习 69

2.6.1 多任务学习基本概念 69

2.6.2 多任务强化学习 70

2.6.3 基于多任务学习的迁移强化学习 71

2.7 逆强化学习 73

2.8 分布式强化学习 75

参考文献 77

第3章基于强化学习的无线接入优化 81

3.1 多信道无线接入 81

3.1.1 多信道无线接入概述 82

3.1.2 基于DRL的动态多信道无线接入 83

3.1.3 异构无线网络的多信道接入 87

3.2 异构无线网络的调制和编码 91

3.2.1 调制和编码问题概述 91

3.2.2 基于DRL的调制和编码 93

3.3 基站自适应能量控制 99

3.3.1 基站自适应能量控制内容概述 99

3.3.2 基站自适应能量控制问题引入 100

3.3.3 基于DRL的自适应能量控制 100

参考文献 105

第4章基于强化学习的网络管理 108

4.1 智能服务编排 108

4.1.1 NFV的资源配置 108

4.1.2 服务功能链映射 110

4.1.3 服务功能链选路 117

4.1.4 无线网络VNF的资源编排 122

4.2 智能网络切片 124

4.2.1 网络切片的需求与概念 124

4.2.2 网络切片的资源管理 127

4.2.3 无线接入网切片 128

4.2.4 核心网切片 133

参考文献 136

第5章基于强化学习的网络控制 141

5.1 智能路由控制 141

5.1.1 时间相关QoS的路由控制 143

5.1.2 边缘网络路由控制 147

5.1.3 带缓存的DCN路由控制 151

5.2 智能拥塞控制 158

5.2.1 多路径TCP控制 160

5.2.2 智能拥塞控制模型Aurora 164

5.3 智能流量调度 167

5.3.1 流量工程概述 168

5.3.2 智能流量调度 169

5.3.3 分布式流量调度 170

参考文献 172

第6章基于强化学习的任务调度 175

6.1 并行计算的任务调度 175

6.1.1 问题定义 176

6.1.2 基于RL的并行任务调度方法 177

6.1.3 基于DRL的并行任务调度方法 178

6.2 基于有向无环图的任务调度 182

6.2.1 分布式系统任务模型 182

6.2.2 边缘计算任务调度 183

6.2.3 云计算的任务调度 185

6.2.4 数据处理集群的任务调度 188

6.3 混合任务调度 192

6.3.1 多类型任务调度 192

6.3.2 任务调度相关的联合优化 195

参考文献 198

第7章基于强化学习的流媒体控制 200

7.1 超低时延的流媒体传输 201

7.1.1 超低时延的流媒体传输框架 201

7.1.2 码率自适应算法 204

7.1.3 基于强化学习的超低时延传输算法 206

7.2 个性化的流媒体传输 210

7.2.1 个性化用户体验 210

7.2.2 基于强化学习的个性化QoE设计 212

7.3 新场景下的流媒体传输展望 214

参考文献 215

第8章基于强化学习的自组织网络 218

8.1 网联自动驾驶 218

8.1.1 车载通信任务 218

8.1.2 车载资源分配 221

8.2 无人机网络概述 226

8.2.1 无人机通信资源调度 227

8.2.2 无人机公平效率覆盖 231

8.2.3 无人机传感数据收集 235

参考文献 238

名词索引 241

点击展开点击收起

— 没有更多了 —