智能控制与强化学习先进值迭代评判设计

全新正版未拆封

72.97 全新

库存2件

四川成都

认证卖家担保交易快速发货售后保障

作者王鼎赵明明哈明鸣任进

出版社人民邮电出版社

出版时间2024-03

上书时间2024-07-09

转角书檐

四年老店

已实名已认证进店收藏店铺

在售商品暂无
平均发货时间 41小时
好评率暂无

最新上架

国际货运代理实务王田田,王磊编 ¥23.33

鲜切花生产技术赵冰编 ¥41.00

流程控制广义韧性建筑的设计方法与实践胡越著 ¥271.18

工程招投标与合同管理李央编 ¥33.36

旧机动车鉴定与评估(第4版) 屠卫星编 ¥30.18

护理学(师)考试通关2000题 2025 刘月梅,刘颖编 ¥17.34

全国中学生物理竞赛决赛试题分类精编张元元编 ¥68.13

水轮机万晓丹,周晓岚,孙鲁兴著无译 ¥24.19

检测CBRN中的先进纳米材料 ¥69.78

商品详情

品相描述：全新

图书标准信息

作者王鼎赵明明哈明鸣任进
出版社人民邮电出版社
出版时间 2024-03
版次 1
ISBN 9787115633958
定价 139.80元
装帧平装
开本 16开
页数 236页
字数 262千字

【内容简介】: 在人工智能技术的大力驱动下，智能控制与强化学习发展迅猛，优选自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、很优跟踪、零和博弈等问题，以实现稳定学习、演化学习和快速学习为目标，建立一套优选的值迭代评判学习控制理论与设计方法。首先，对优选值迭代框架下迭代策略的稳定性进行全面深入的分析，建立一系列适用于不同场景的稳定性判据，从理论层面揭示值迭代算法能够实现离线很优控制和在线演化控制。其次，基于迭代历史信息，提出一种新颖的收敛速度可调节的值迭代算法，有助于加快学习速度、减少计算代价，更高效地获得非线性系统的很优控制律。结合人工智能技术，对无模型值迭代评判学习控制的发展前景也进行了讨论。本书内容丰富、结构清晰、由浅入深、分析透彻，既可作为智能控制、强化学习、优化控制、计算智能、自适应与学习系统等领域研究人员和学生的参考书，又可供相关领域的技术人员使用。
【作者简介】: 王鼎，男，北京工业大学教授、博士生导师，现任计算智能与智能系统北京市重点实验室副主任。北京市自然科学基金杰出青年项目获得者、科睿唯安(Clarivate)全球高被引科学家、中国科协青年人才托举工程入选者，主要研究方向为智能控制与智能优化、神经网络与强化学习，涉及复杂智能控制优化、人工智能理论基础。针对不确定系统优化控制中的共性难题进行了长期研究攻关，建立并逐步完善智能评判控制框架，并为工业复杂系统的智能优化控制提供了理论支撑。目前已在人工智能及相关领域的国际期刊和会议上发表学术论文120余篇，其中82篇被SCI检索(以第一作者发表在IEEE Transactions系列期刊和Automatica领域顶刊的论文共25篇)，已出版专著4本，申请和已授权发明专利9项。先后荣获吴文俊人工智能优秀青年奖、中国自动化学会自然科学奖一等奖、广东省自然科学奖一等奖等。先后担任人工智能及相关领域多个有名期刊的编委，包括：IEEE Transactions on Systems, Man, and Cybernetics: Systems、IEEE Transactions on Neural Networks and Learning Systems、Neural Networks、International Journal of Robust and Nonlinear Control、International Journal of Adaptive Control and Signal Processing、Neurocomputing、自动化学报。
【目录】: 第一章智能评判控制的优选值迭代方法概述
1.1 强化学习背景
1.2 自适应评判介绍
1.3 传统值迭代
1.4 广义值迭代
1.5 演化值迭代
1.6 加速值迭代
1.7 小结
第二章基于广义值迭代的线性很优调节与稳定性分析
2.1 引言
2.2 问题描述
2.3 面向线性系统的广义值迭代
2.4 迭代策略稳定性分析
2.5 仿真实验
2.6 小结
第三章具有稳定保证的非线性系统优化控制设计
3.1 引言
3.2 问题描述
3.3 面向非线性系统的广义值迭代
3.4 迭代策略稳定性和容许性分析
3.5 仿真实验
3.6 小结
第四章一种基于评判学习的非线性智能很优跟踪
4.1 引言
4.2 问题描述
4.3 面向智能很优跟踪的广义值迭代
4.4 基于神经网络的算法实现
4.5 仿真实验
4.6 小结
第五章一类非线性系统的事件触发很优跟踪控制
5.1 引言
5.2 问题描述
5.3 基于事件触发的近似很优跟踪
5.4 基于神经网络的跟踪控制器设计
5.5 仿真实验
5.6 小结
第六章基于演化值迭代的非线性很优轨迹跟踪
6.1 引言
6.2 问题描述
6.3 基于新型效用函数的广义值迭代
6.4 演化控制与稳定性分析
6.5 仿真实验
6.6 小结
第七章融合值迭代学习的非线性零和博弈性能分析
7.1 引言
7.2 零和博弈问题描述
7.3 面向零和博弈的广义值迭代
7.4 零和博弈的演化控制设计
7.5 仿真实验
7.6 小结
第八章具有可调节收敛速度的新型值迭代机制
8.1 引言
8.2 问题描述
8.3 加速值迭代算法性能分析
8.4 加速值迭代应用设计
8.5 仿真实验
8.6 小结
第九章基于加速值迭代的非线性系统轨迹跟踪
9.1 引言
9.2 问题描述
9.3 面向跟踪控制的加速值迭代
9.4 基于加速值迭代的演化控制
9.5 仿真实验
9.6 小结
第十章面向非线性零和博弈的快速值迭代学习
10.1 引言
10.2 问题描述
10.3 面向零和博弈的增量迭代机制
10.4 面向零和博弈的自励迭代机制
10.5 仿真实验
10.6 小结与展望