基于深度强化学习的作战任务规划技术研究
正版全新,极速发货,支持7天无理由退货,可开电子发票
¥
25.56
3.8折
¥
68
全新
库存29件
作者张永亮 ... [等] 编著
出版社中国原子能出版社
ISBN9787522117270
出版时间2021-12
四部分类子部>艺术>书画
装帧其他
开本26
定价68元
货号4211376
上书时间2024-12-30
商品详情
- 品相描述:全新
- 商品描述
-
内容摘要
作者简介张永亮,□,1982年出生,军队指挥学博士,计算机科学与技术博士后。现为陆**程大学副教授,主要研究指控理论与仿真、智能任务规划。先后获军队和省部级科技进步一等奖2项、军队科技进步二等奖1项、军队科技进步三等奖3项;获中国博士后科学□□面上一等和特别项目资助,主持装发领域□□、科技委国防科技创新特区、陆军十三五规划项目多项;参与国家自然科学□□、中国工程院院士重点课题、江苏省自然科学□□多项;出版著作5部,在军内外核心期刊发表论文60余篇。2018年被表彰为陆**程大学“科研先进个人”,荣立个人三等功1次。目录第1章概述1.1作战任务规划及其技术发展1.1.1作战任务规划的概念内涵1.1.2作战任务规划的功能定位1.1.3国外作战任务规划系统与技术1.1.4国内作战任务规划系统与技术1.2深度强化学习及其发展现状1.3基于深度强化学习的作战任务规划适用性分析1.4基于深度强化学习的作战任务规划面临的挑战1.4.1不完信息条件下的战场态势特征建模问题1.4.2作战任务规划行动决策空间维度灾难问题1.4.3基于DRL的作战行动序列奖赏函数设计问题1.4.4基于DRL的作战任务规划模型可解释性问题第2章基于分层强化学习的作战任务规划框架2.1基于分层强化学习的作战任务规划框架设计2.2基于层次任务网的作战任务分解2.3基于强化学习的作战任务规划模型2.3.1复杂战场态势特征表示的基本过程2.3.2作战任务规划中不确定性与对手建模2.3.3战场态势特征深度神经网络建模2.3.4作战任务智能规划的POMDP模型2.4面向作战任务规划的分层强化学习算法2.4.1HAM分层抽象机2.4.2MAxQ值函数分解2.4.30ption选项框架第3章知识引导的深度强化学习方法3.1基于知识与DQN的单智能体任务规划3.1.1基于规则的强化学习算法框架3.1.2智能战术决策中的MDP模型3.1.3基于产生式规则的战术知识3.1.4基于产生式规则的损失函数设计3.1.5基于产生式规则的作战任务智能规划仿真实验3.2基于综合势能的强化学习启发式探索策略3.2.1综合势能理论分析3.2.2综合势能模型构建3.2.3综合势能驱动的强化学习探索策略3.2.4基于综合势能的作战仿真实验设计3.3Actor-Critic框架下基于知识的多智能体协同规划3.3.1智能战术兵棋环境中强化学习的奖励函数设计3.3.2Actor-Crific框架下的多智能体协同作战算法3.3.3算法仿真实验验证与分析第4章数据驱动的多智能体博弈对抗协同规划4.1数据驱动的多智能体博弈对抗协同规划4.1.1作战实体博弈对抗算法设计4.1.2基于PPO的算法实验验证4.1.3仿真实验结果分析4.2基于逆向强化学习的陆战分队战术任务规划4.2.1基于深度强化学习韵陆战分队战术任务规划模型4.2.2基于IRL和DQN的陆战分队战术规划求解模型4.2.3实验方案总结第5章离线学习与在线博弈结合的作战任务规划与评估5.1作战想定设计与实验平台选择5.1.1实验总体设计5.1.2作战想定描述5.1.3陆战兵棋对抗平台5.2MCTS框架下基于深度策略网的在线行动规划5.2.1蒙特卡洛树搜索基本思想与模型5.2.2基于MCTS和深度策略网的行动序列生成5.3典型作战任务智能规划与分析评估5.3.1基于综合势能的智能任务规划算例分析5.3.2基于MCTS和综合势能的智能任务规划算例分析5.3.3多视角、全过程的作战任务规划评估与分析附录A“先胜1号”陆战智能兵棋推演平台Al接口A.1文档说明A.1.1功能描述A.1.2阅读对象A.1.3使用环境A.2接口设计框架A.2.1接口设计需求A.2.2接口设计框架A.3接口说明A.3.1算子介绍A.3.2算子控制接口A.3.3信息查询接口A.3.4分析工具接口附录B强化学习对抗赛算法设计说明基于Actor-Critic算法的混合智能战术兵棋模型设计基于PPO算法的兵棋强化学习基于规则优先级选择的智能兵棋规则算法设计基于规则和随机最近距离的算法设计基于博弈策略选择的规则驱动型智能兵棋模型设计基于先验知识及DQN算法的混合智能兵棋研究与实现实时态势驱动的智能战术兵棋算法模型设计与实现参考文献
— 没有更多了 —
以下为对购买帮助不大的评价